跳至主要内容

抗肿瘤药临床试验影像终点程序标准技术指导原则(2020.4征求意见稿)


抗肿瘤药临床试验影像终点程序标准
技术指导原则
(征求意见稿)



国家药品监督管理局
2020年4月
目录
一、前言 1
二、背景 2
三、临床试验影像的设计考虑 3
3.1 设立独立评估委员会的考虑 4
3.2 影像源数据的规范化 5
3.2.1 影像检查方式 5
3.2.2 扫描协议的标准化 6
3.2.3操作人员资质及培训 7
3.2.4 影像扫描设备管理的规范化 8
3.2.5 影像源数据规范化的其它考虑 9
3.3 影像评估数据的规范化 10
3.3.1 评估标准 10
3.3.2 评估频率 11
3.3.3 评估流程的设计考虑 12
3.3.4 评估者的资质及培训 14
3.4 其它设计考虑 17
四、实施 18
4.1 申请人职责 18
4.2 研究者职责 19
4.3 影像CRO职责 20
五、影像数据的质量保障 23
5.1 数据锁定及修改的考虑 23
5.2 审评数据清单 25
六、总结 26
参考文献 26
附件1 影像章程的规范化和科学性建议 28
附件2 上市申请影像相关资料清单 30

一、前言

抗肿瘤药是当前全球新药研发的热点之一,随着肿瘤治疗手段的逐渐丰富,患者的生存期不断延长,客观缓解率(objective response rate, ORR)和无进展生存期(progression free survival, PFS)等基于医学影像评估结果的替代终点,越来越多地被作为支持新药上市的关键研究的主要终点。目前临床影像学中影像处理、信息传输等已经具备了一定程度的标准化,并在临床实践中被广泛应用。临床或影像科医师对医学影像进行分析和诊断时,通常以主观判断及优势的病灶测量为主,不需要系统性的量化评估也能满足临床对影像诊断的需求。但在临床试验中,影像检查及评估过程的差异可导致相关测量误差增加、临床试验终点评估变异增大,最终影响临床试验结果,因而临床试验影像程序的标准化在以影像评估为主的临床试验中变得十分重要。

由于越来越多的关键研究采用了影像相关终点作为主要研究终点,而在影像评估的总体设计、实施过程和数据管理等方面,尚无相关技术要求或行业标准可循。因此,在该领域急需制定临床试验影像终点程序标准的技术指导原则,以规范行业操作,明确技术标准。

二、背景

当新药研发的关键研究采用影像相关终点作为主要研究终点时,为保障评估的客观性和独立性,通常会在临床研究中设置第三方独立影像评估。第三方独立影像评估是依据独立影像章程开展工作。影像章程具体描述试验特定的影像评估过程和标准,特别当试验的影像操作标准包含现有的医学影像实践标准外的额外要求,或试验的影像操作标准较为复杂时,更需要注意具体的操作细节,使影像评估具有科学性和可操作性,因此申办方需要起草并形成独立的影像章程。影像章程应描述影像检查可能涉及的偏倚和变异及其控制方法,以及如何在临床试验中良好地落实影像检查过程标准及影像评估标准,确保评估的客观性和独立性。良好的临床试验影像评估设计和严格依从章程实施评估是获得可靠的影像终点结果的关键要素。
合格的临床试验影像终点程序应满足以下要求:能客观地反映研究药物/治疗的疗效;在未来的临床试验和治疗中,评估结果稳定;可溯源。

本指导原则将以临床试验影像标准相关的设计、实施和数据管理三方面的考虑为逻辑,阐述临床试验影像终点程序标准化的审评考虑,并附相关影像章程的规范化和科学性考虑(附件1),以及上市申请时影像相关资料清单建议(附件2),为医药研发企业、影像合同研究机构(contract research organization, CRO)、研究者及各临床试验参与者提供临床试验影像程序相关标准的建议。

在临床试验影像评估等实施过程中,还应遵循人用药品注册技术要求国际协调会议(international conference for harmonization, ICH)所发布的E6 和E9 指导原则。
本技术指导原则旨在阐述药品技术审评机构当前对临床试验影像终点程序标准的评价考虑,不能涵盖在新药研发中遇到的所有情况。目的是提升临床试验影像的标准化和规范化,提高创新药物/治疗方法的疗效评价质量、确保疗效可信,为药物研发从业者在临床试验影像相关内容的设计、实施及申报提供参考。

三、临床试验影像的设计考虑

当影像学终点作为关键临床试验的主要研究终点时,在临床试验影像的设计层面,申办方首先应评估该终点的临床意义,与药品技术审评机构讨论,确定在关键研究中使用该终点的可行性。一旦可行,可进一步讨论临床试验影像设计层面的相关问题,包括主要终点是否选择独立评审委员会(independent review committee, IRC)评价、影像学检查方式和其它相关方案设计等内容。

3.1 设立独立评估委员会的考虑

与抗肿瘤临床试验中作为金标准的总生存期(overall survival, OS)相比,研究者在疗效评估时不仅具有影像数据,还可获得影像学外的临床数据。该因素常会影响到研究者对影像学资料的判读,特别在开放性设计的临床试验中,研究者通常对试验组受试者产生倾向获益的预期,由此可能导致研究者的影像评估结果出现潜在的偏倚或倾向性。

独立中心化的影像评估过程通常是充分盲化的,评估者不知晓所评病例的治疗信息(非单臂试验)和研究者的评估结果,即盲态独立中心评估(blinded independent central review, BICR),可提高影像评估的独立性和可信度,并与研究者的评估结果互为对比。因此,在一定程度上也可提高研究者评估的客观性。若能够充分证实影像评估数据在常规临床诊疗环境中有很好的一致性和可重复性,或在双盲随机对照的大型III期设计中,试验组疗效显著优于对照组,这种情况下独立影像评估也不是必要的。

拟支持注册的关键研究,存在以下情况时,建议使用独立影像评估:

⑴ 单臂设计的试验(当前须采用BICR评估);
⑵ 无法设盲、可能存在评估偏倚的试验;
⑶ 有效性统计假设/预期获益可能不十分显著的随机对照试验;
⑷ 影像源数据质量易出现偏差,需要设置IRC对影像源数据质量进行控制的试验;
⑸ 使用特殊的评估标准的试验,如需要特殊影像量化方法:少数罕见病如神经母细胞瘤间位腆代苄胍扫描(meta-iodobenzylguanidine, MIGB)或PET,或借助特殊软件处理影像数据,该标准或软件操作在实施时的一致性较难控制。

一项关键研究是否需要IRC,采用前瞻性或回顾性IRC,是否将IRC终点设置为主要研究终点,以及IRC的章程设计,例如采用同步评价,阶段性评价或者回顾性评价,须在关键研究方案设计时沟通明确。

3.2 影像源数据的规范化

3.2.1 影像检查方式

影像检查方法的选择,例如选择X线/CT/MRI/PET-CT等,是设计层面重点考虑的问题。由于检查方法与适应症及试验药物的作用机制密切相关,设计时应充分考虑影像检查方式对目标适应症和试验终点的适用性。如MRI或增强CT是肝细胞癌评效的首选方式,但肺癌评效通常采用增强CT,而不常采用MRI。

3.2.2 扫描协议的标准化

虽然常规临床医学的影像诊断已经具备了一定的标准化,但有时影像数据的质量仍不能满足临床试验的要求。多中心临床试验中,如果各中心影像数据质量的一致性较差,可能直接影响评估结果的准确性和可靠性。申请人须考虑如下扫描协议的标准化因素,保障不同研究中心的影像质量满足试验所需最低要求。

扫描协议的标准化应考虑如下因素:

⑴ 在各临床中心之间,影像检查手段在技术和性能上的差异,影像检查成本以及多中心的可行性;
⑵ 影像检查手段的性能特点差异,各研究中心或其它(第三方)影像检查机构间影像设备的性能特点差异;
⑶ 对影像检查技师的资质和试验所需的任何特殊技术条件;
⑷ 需在影像上做测量的,推荐使用模体和/或适当的校准标准对影像检查设备根据特定临床试验的需求进行定期校准验证,以保证各临床研究中心图像的质量以及一致性;
⑸ 任何临床试验设计相关的图像采集特征,包括受试者的摆位、影像检查的解剖覆盖范围、造影剂的使用、图像的采集时相、受试者是否需要麻醉以及影像采集设备的设置等;
⑹ 图像质量控制标准,包括必要时为复查影像检查获取可评估图像所规定的标准。

3.2.3操作人员资质及培训

在图像采集过程中,临床研究中心的影像技师有非常重要的职责,包括识别成像错误或不可接受的图像,以及必要时重复影像检查等。多中心研究影像采集的实施差异可能会影响成像质量和评估结果。因此,在设计层面申请人应评估影像采集实施过程的潜在差异,决定是否要求实施影像检查的人员具有相关资质或进行相关培训。具有特殊要求的影像检查手段,应在方案开展前对影像采集人员实施必要培训。

影像章程应说明影像技师在图像采集过程中的职责,包括推荐的技师资格,以及在必要时对图像质量做出初步评估的职责。在某些情况下,重新做影像检查对试验非常重要,应该尽量避免在治疗期因为图像质量欠缺而导致无法评估,所以必要时可以重新检查,患者增加少量的辐射剂量也是合理的。在某些情况下,如超声成像中,应对技师操控成像探头的要点进行详细说明。根据影像检查手段和技术的要求,章程可以描述或引用试验方案中所描述的培训部分,以确保图像采集的一致性。

3.2.4 影像扫描设备管理的规范化

影像源数据的质量是评估者实现准确评估的基础,尤其是需要进行量化评估的影像终点更依赖于影像扫描设备的精准度,故如前所述可通过影像模体等工具或可行的校准手段对参与扫描的设备进行定期检验,以保证各临床研究中心图像质量的精准度及一致性。非量化或量化权重较低的影像终点应提供符合国家标准的检测报告。

采用常规影像操作标准的临床试验,应在方案中详细说明如何执行这些标准。对影像过程中可能引入或增加的图像质量变异应考虑是否采纳超出常规的操作标准,如图像质量控制标准;另外,图像的存储对于试验的实施、监察和临床试验数据核查也非常重要。

章程应包括对图像采集、存储和传输的定期质量监察计划,以及利用模体对影像检查设备进行的定期检测,对可预期的相关质量偏离制定相应纠正计划。这类监察的重要性和特点因影像技术的特点而异,但至少应该包括某种形式的定期的由研究中心或第三方机构对影像检查设备做出的质量报告。

另外影像检查设备可能出现的升级或故障,以及影像相关的药物如造影剂在不同研究中心可能存在的差异;这类监察的重要性和特点因影像技术的特点而异,比如应用PET对药物疗效的量化评估。在实际操作中较难实施,往往研究中心没有足够的资源进行模体测试。因此,如果是用PET定性评估 如Lugano 5分法(Cheson, Fisher et al. 2014),评估是用患者本身纵膈血池和肝脏作对照,不一定要模体对设备校准。在影像检查过程比较复杂或是某种创新检查的试验中,我们建议研究中心按照特定标准进行图像的预采集,并提交给影像监察员进行图像质量的确认,以评估参与研究的中心的图像采集能力。

3.2.5 影像源数据规范化的其它考虑

影像源数据规范化的其它考虑,还包括采用国际通用的医学数字成像和通信标准,即医学数字成像和通信(digital imaging and communications in medicine, DICOM)格式图像。

DICOM影像数据在进行传输、展示及存储等操作时也需要遵守ICH和药物临床试验管理规范(good clinical practice, GCP)原则,对受试者的隐私进行充分保护,如在规定外但在怀疑疾病进展时采集的影像也应该上传,涉及患者隐私非评价必要的信息不能上传等。章程或附件中应详细说明对DICOM数据的处理标准和过程。

目前研究方案对是否传输不良事件的影像并没有明确的规定,应避免上传以保障IRC的独立性。

3.3 影像评估数据的规范化

影像评估数据的规范化是在设计层面对结果质量和可信度的重要保障。在设计层面评估数据的规范化考虑范围包括:是否选择了正确的评估标准,评估周期设置是否合理,评估流程设计的科学性,对评估者的资质和培训要求,以及其它的规范化设计考虑。

3.3.1 评估标准

影像评估标准作为影像临床试验个体评估转归结论最重要的依据,应在章程中详细明确的规定。影像评估标准可由个人或专家组,例如影像临床试验专家、临床医学/影像医学专家、影像物理师等共同制定;制定者应具备与临床试验指征相符的临床资质和相关专业学科领域的经验。

影像评估标准的确定可参考自身早期经验,或是以往类似临床试验中曾使用过的以影像学为主要终点的案例,尤其应注意已观察到的影像学方法中的问题。

影像终点疗效评估标准应根据不同适应症和药物作用机制的特点来确定,建议使用量化或半量化评估标准,并且所采用的标准应首选经充分验证的、国际通用且被广泛认可的评估标准(Sargent, Rubinstein et al. 2009),如RECIST 1.1标准(Eisenhauer, Therasse et al. 2009)、Lugano标准(Cheson, Fisher et al. 2014),和mRECIST标准(Lencioni and Llovet 2010)等。在部分适应症或药物的临床试验中可能选择其它评估标准作为探索性终点,例如免疫检查点抑制剂选用的iRECIST标准,颅内肿瘤选用的RANO标准(Wen, Macdonald et al. 2010),胃肠间质瘤选用的Choi标准(Choi, Charnsangavej et al. 2007)等,须在影像章程中明确试验所采用的评估标准,避免标准适用错误的情况出现。评估标准可根据临床试验适应症和预期影像学变化特征而确定,当临床试验终点指标的评估标准较复杂时,可引入相关专业学科的临床医师组成评审委员会的形式完成综合评估。对常用标准中容易产生歧义或导致偏倚的方面或是试验拟采用特殊的标准时,应当在方案和影像终点程序标准的设计中明确说明,避免出现对评估标准理解不统一,甚至适用标准错误的情况。随着治疗方法的改进,也许未来还会有其他类型疾病的特定评估标准出现。届时可根据具体情况特殊制定。

如果申请人需要对常规实践已接受的评估标准进行修订,或是有定制化的评估标准时,须提供充分的修订科学依据,与临床影像专家及药品技术审评机构沟通修订的合理性可行性。

3.3.2 评估频率

当医学影像相关终点作为试验的主要终点时,检查的时间和频次取决于:

⑴ 对目标适应症潜在变化趋势的了解,例如晚期恶性肿瘤常依据治疗周期的整倍数选择每6/8周进行疗效评价等;
⑵ 影像检查计划的可行性,患者的依从性,使用剂量的安全性;
⑶ 总体试验设计的特征,如系统性治疗与局部治疗。
在非单臂研究设计中,所有试验组中影像评估的频率还应考虑一致性的问题,非对称影像评估时间点在疗效评估中可能产生偏倚。对于使用时间-事件分析方法的主要终点,应当进行基线和充足频次的影像学评价,以确保对事件时间的精确捕捉。当研究设计了不同于常规的评估频率时,应与药品技术审评机构沟通,提供证据支持其合理性。

3.3.3 评估流程的设计考虑

为保障IRC评估结果的独立性、稳定性和科学性,须有严谨的操作章程。IRC的独立性是药品技术审评机构的关注重点。设计者可以根据目标适应症特点、试验设计和实际实施因素考虑章程的设计。要避免评估流程出现严重的科学性问题:如由一名技术员选择好靶病灶,由三名独立评估者根据技术员已选择的靶病灶再进行评估,由于技术员的选择偏倚,该章程将不能保障评估者评估结果的独立性;如三名评估者同时在一块大屏幕上评价目标病例,将难以避免讨论并影响独立性;如采用回顾性的IRC分析时,评估者在评估前已知道目标病例具有的影像采集次数/疗效评价次数,将影响评估者对最后一次影像评估之前疾病进展的独立判断,或评估者在案例评估前已知道了该案例有访视计划外的影像采集,将增加IRC评估者判定该病例疾病进展的可能;或使用回顾性IRC在分析时,IRC已获知研究者的评估结果,包括获知具体病例以及研究的总体结果,这将严重影响IRC评价的独立性。诸如此类问题必须在章程的设计时避免。

在保障IRC的独立性后,应关注评估流程的设计细节,以提高IRC评价稳定性和准确性。应有准确可量化的评价标准、符合资质的评估者、训练和质控等设计以保障IRC的评价结果稳定准确。如果影像评价采用的标准存在争议或在实践中存在较大自由度,则应尽可能明确其标准或细则,并加以培训,以提高评价结果的科学性。

IRC评估数据的稳定性是保证评估结果可信的重要指标之一,包括同一个临床试验在评估实施初期和结束时,例如按每1/3病例或事件数分析的不同阶段数据的稳定性;IRC评估者之间评估结果的稳定性,同一个评估者前后评估结果的稳定性,以及IRC的总体评估结果与研究者的总体评估结果之间差异的稳定性,包括试验组和对照组之间差异的方向和幅度是否稳定。评估的独立性不过度强调IRC与研究者在最终评估结果的一致性。

由于IRC没有患者的临床信息,单纯依靠IRC评估结果确定患者是否继续接受治疗的设计是值得讨论商榷的。如果采用前瞻性实时IRC评估,方案设计需要明确是否根据IRC的评估结果揭盲,以将IRC的评价结果及时地反馈给研究中心。采用回顾性的影像收集时,因所有影像数据已采集完毕,IRC无法对影像源数据进行质控,可能会降低其评估质量,应在设计层面权衡上述因素,明确影像传输时间及所采用的IRC评估为实时评估、阶段性评估还是回顾性评估。
本指导原则的附件1提供了对影像章程设计的规范化/科学性考虑。

3.3.4 评估者的资质及培训

在制定章程时,申办方/研究者应确定评估者的数量及评估者所需的背景资质。章程制定者应明确以下几点:

⑴ IRC评估者的利益冲突回避情况;
⑵ 评估者能够完成影像评估的必要的专业背景和/或技术知识范围;
⑶ 影像评估和/或评估过程设盲的重要性;
⑷ 评估者疲劳对临床试验的潜在影响以及使用替代评估者作为解决措施。因评估者疲劳引起的图像评估质量下降在临床医学中已有报道(Krupinski, Berbaum et al. 2012);
⑸ 评估者对评估任务所用时间的承诺,及评估者参与评估的可能性。
⑹ 对裁定评估者资质的考量,确定其能裁定评估者间的结果差异并决定最终评估结论。
章程对评估者的培训过程应做描述,特别要强调培训文件编制过程、任何特定的培训材料的使用,例如培训手册或培训图像、图像展示的培训以及任何图像评估标准应用的测试过程。章程应对培训影像资料的来源做出描述,例如从其他临床试验获得。另外,章程应预先规定,在培训后和整个试验过程中,是否会以某种标准对评估者进行资格认证。评估者培训手册是一份关键性文书,其包含更多评估者培训程序的细节,所以应与章程一同提交给药品技术审评机构审查。

申办方/研究者在制定评估者培训过程中应考虑以下条目的重要性:

⑴ 对影像评估主要目标的概述:除非影像评估过程中还涉及到临床信息的使用,一般来说,对影像评估者的培训只应强调和图像相关的影像评估过程的各个方面。该过程还应减少影像评估时可能会引入的偏倚,避免阅片者从某些图像特征中可了解到治疗分组情况,进而破坏临床试验设计中的盲化设置;
⑵ 对图像后处理、病变测量和其他图像评估的主要要求进行概述,评估者可以从以下培训中受益:计算机辅助判读、辅助测量和其他分析工具的使用、图像的测量和记录的过程,尤其是当此过程涉及独特的软件数据锁定和密码保护功能时。某些情况下,辅助评估过程的顺利实施需要评估者具备以下先决条件:特殊的评估标准知识,并能使用特殊的评估工具,例如实体瘤疗效评价标准(RECIST 1.1)的预期结果(Eisenhauer, Therasse et al. 2009)。章程应详细的描述图像后处理、病变测量和其他图像评估的主要要求,并当图像质量不利于必要的病变测量或其他软件工具的使用条件时,需对这些情况进行说明;
⑶ 确认某些特定评估的定义和/或标准,包括对影像病例报告表的使用:多数临床试验可能受益于对评估标准的预先定义,例如识别导致图像不可评的条件,而且这些标准可能不同于常用的临床标准。培训和对培训的认证含模拟影像评估可能对记录评估者的读片熟练程度很重要;
⑷ 对维持评估者评估能力措施的描述:一些影像评估的过程包括了在临床试验图像中混合了一些测试图像,定期对评估者的能力和一致性进行间断性测试。若评估者不能维持评估的能力效果,他/她可能会被替换为另一个经过培训的有资质的评估者。章程应对评估者的测试和重新培训或更换过程加以描述。

为保障评估质量,IRC的每一名评估者均须具备项目所需的相关评估资质,并进行项目相关培训或具有实施经验。同时建议IRC能够采用至少一名具备临床专业背景的质控员进行质控,以提高评估的科学性和全面性。中心影像评估也须参照IRC的经验,对评估者进行资质经验要求并开展培训。

在同一多中心试验中,研究者评估可能存在多种情况,例如部分中心采用研究医师评估,部分采用放射科医师评估。申请人应在设计层面考虑研究者评估的复杂情况,对评估者资质提出具体要求,并在项目实施前实施必要的培训。

3.4 其它设计考虑

在影像源数据的规范化方面,应在受试者数据隐私保护等方面具备相应考虑。在临床试验影像终点程序标准的设计层面,如下的考虑内容有助于提高影像评估的实施效率并利于核查:比如在与方案设计匹配的影像学内容,简单的可增设影像检查实施记录表及疗效评价记录表,或在研究者手册中明确影像相关内容;复杂的可在病例报告表(case report form, CRF)和电子数据采集 (electronic data collection, EDC) 系统中增设相应影像学模块。

影像相关检查结果的溯源是当前GCP核查的重要内容,申请人应考虑影像相关内容的设计清晰简要,提高临床试验数据核查中溯源的便利性。

四、实施

临床试验中影像数据的采集、存储、记录、评估和修订均须参照现行ICH E6的原则实施。本章节提醒不同的实施主体关注如下关键要素。

4.1 申请人职责

所有的IRC有关的文件,由申办方递交。申请人对递交的所有临床试验数据负责,包括临床试验影像数据产生及评价过程,具有保障临床试验影像章程良好实施,记录完整,结果可溯源的义务,并承担相应责任。以下内容提醒申请人在实施过程中关注:

申办方的监查员应按照临床试验方案和/或章程对临床试验影像的实施过程进行监查,包括是否按方案及章程要求开展了相应的影像学检查,以及是否超窗,记录是否完整,修改是否合规;并将所发现问题及时反馈给研究者或IRC。

申请人对所递交的临床试验数据全权负责,申请人应关注以下方面:

⑴ 从法规层面讲,影像数据与临床数据一样需要注重受试者隐私,符合ICH标准,相关数据记录务须完整,履行结果可溯源的义务,并承担相应责任;
⑵ 从执行层面讲,影像检查是否在既定窗期内进行了检查,影像数据的采集是否符合既定的设计标准,各时间点影像检查方式是否一致,扫描覆盖解剖区域是否完整,图像质量及增强扫描的时相是否符合设计要求,图像数据在评估时是否保持无损等;
⑶ 从监管层面讲,评估流程及遮盲措施是否符合设计规范,数据是否准确、真实、可溯源,数据锁定是否合理,锁定后是否存在变更记录,使用第三方独立评估时是否能够保证其评估的独立性。

若使用EDC系统,影像评估数据应在对独立评估者的病例报告确认后完成锁定,任何变更都应符合GCP要求进行留痕。

4.2 研究者职责

研究中心或第三方的影像科室应有专人负责临床试验影像相关事务。研究者应参照现行ICH E6 (GCP)指导原则,实施临床试验影像标准相关内容。具体包括:按照影像章程或影像扫描协议采集并储存图像;按照GCP原则,提供真实、完整和可溯源的评价记录,并对修订内容留痕;及时反馈申办方和/或第三方合同研究机构检查员的沟通/问询内容;配合临床试验数据核查等。

4.3 影像CRO职责

当IRC评价的替代终点指标为支持新药关键研究的主要终点时,IRC务必保障其评估流程的独立性。IRC实施方面的主要职能是数据的收集、质量保障及盲化独立评估,并有义务配合申办方和药品技术审评机构对相关记录进行核查。影像终点独立评估合同研究机构(CRO)应在实施过程中需注意以下方面:

⑴ 运营的质量管理体系应符合ICH E6 (GCP)相关要求,并能够支持临床试验影像终点独立评估的规范实施及保障数据质量;
⑵ 涉及临床试验计算机管理系统和EDC的,应以临床试验为单位,根据试验特定流程和需求,对软件工具/系统进行用户权限、流程和评估标准的充分测试、验证、风险分析及应对措施,以确保临床试验平稳运行。保存相关记录以备稽查所用。用于DICOM图像的展示、测量和或后处理软件建议具备国内和/或国际同等权威机构的认证证书方可用于影像终点的量化评估;
⑶ 有职责要求或协助申办方选择符合评估资质的独立评估者,并对其评估质量负责,包括对其进行试验特定标准的培训、测试及认证,以满足影像终点独立评估的专业性要求,必要时重复培训-测试-认证过程,以保证评估数据的质量和一致性。独立评估者的资质及培训可参照《评估者的资质及培训》章节;
⑷ 严格执行影像评估章程和/或影像采集协议对影像终点相关标准的设计。在独立评估者实施影像终点评估的过程中,不得对其终点结论的判断进行干预和/或诱导,否则涉嫌严重违规;
⑸ 在临床试验运营期间及试验结束后的5年内对原始影像数据、评估数据及输入至输出的全过程文件记录有保存、管理和维护的责任;
⑹ 独立影像评估实际包含两大职能:数据收集和独立评估,根据临床试验对数据的需求,IRC在实施不同类型的评估时应注意时效性的问题,从执行独立评估的方式与时效性的关系上可分为:
a. 回顾性批量数据收集及独立终点评估,可用在临床试验启动前未对影像终点标准进行独立评估规化设计的临床试验,对数据收集及评估的时效性根据申办方提交审批材料的进度而定,较易实施,这里不做详细说明;
b. 实时入组标准独立评估,用于需要对患者入组标准判断严谨性较高的临床试验,需要患者在入组前完成的影像检查,应根据试验方案在既定时间内完成数据的质量检查及评估,对时效性要求较高,需要临床研究中心的配合度较高;
c. 实时数据收集及质控后批量独立终点评估,用于多数对影像数据质量有要求但对独立评估结论的时效性不高的临床试验,此方式实施的可行性较高,但应注意数据收集和质量检查过程的时效性,因为需要考虑到可能出现的需要进行重新影像检查的情况以避免检查超窗,也需要研究中心的配合。

实时数据收集及质控后实时独立终点评估,用于独立评估作为治疗决策依据的临床试验,对数据收集和质量检查过程以及独立评估结论都有时效性要求的方式,实施时比较依赖于研究中心的配合度。

在实践中,医学影像诊断通常在图像采集后几个小时至数天内完成,但临床试验中的独立中心化影像评估可能需要更长的时间。

以下情况需要IRC及时地评估:

⑴ 受试者入组评估,例如方案规定纳入由IRC评估基线具有靶病灶的患者,对基线是否存在靶病灶的确认,需在受试者的入组前及时完成;
⑵ 临床试验中期分析评估;
⑶ 用于图像质量控制的评估;
⑷ 方案设计依据IRC评估结果考虑受试者的治疗决策。
另外,在实施中期分析或阶段性分析的临床试验中,时效性取决于申办方中期分析的时间表。

五、影像数据的质量保障

涉及临床试验影像终点标准的数据包括影像源数据(DICOM影像数据)和影像终点评估结论数据两部分。影像源数据又包括在各研究中心的受试者的原始影像数据,经过后处理的影像数据,研究者和/或独立评估者进行影像评估时在图像上所做的标记图像;影像终点评估结论数据则为评估者填写的病历报告表。

数据管理的核心考虑包括影像数据在传输、接收、变更过程中的留痕,以及评估结论数据的锁定及修改的原则,IRC评价质控不合格的考虑,基于变更而触发核查的可能情形以及支持技术审评及核查的影像数据建议。

5.1 数据锁定及修改的考虑

在临床试验某一随访时间点进行影像终点评估时,应对评估者产生的影像评估数据,包括病例报告表中所填信息和相应的评估者在图像上所做的任何标注,都应在完成评估后做锁定处理。常规情况下,数据锁定后不允许做进一步修改,除非有充足理由时,例如新增了影响本次疗效评价结果的关键影像数据,可以按章程修订结果,完整记录并保障可溯源及核查。对图像数据和评估结论数据所做的任何变更都应包含但不限于以下要素:对什么做了变更;变更的理由;变更者和变更的时间。对数据的锁定和任何可能的变更都应在章程中做详细说明。

应在章程设计时明确IRC评价过程中可能存在的质控不合格的情况及处理措施,而不是在出现问题后再修改章程的原则性条款。在项目实施过程中,IRC应对所推荐的评估者的专业表现负责,实时或阶段性评价评估者的专业水准及评估结论是否符合评估标准,并采取相应措施保障评估质量。

出现以下情况将导致数据无效甚至整个临床试验失信:

⑴ 无依据修订结果;
⑵ 干涉IRC评估独立性的行为,如诱导或迫使独立评估者对独立评估结论进行修改以符合申办方预期或与研究者结论一致的行为;
⑶ 隐瞒修改结果的行为;
⑷ 无可溯源数据。

不同的IRC评估者对某类影像结果可能存在一定的倾向性,例如对疾病进展病灶判定敏感,很多情况下评估结论的不同与正确与否无关,只代表不同评估者或同一评估者的不同时期对影像表象的解读有所不同。关键临床试验IRC和研究者在总体评估结果以及部分选定病例的评估结果通常会存在一定差异,此差异可来自于不同的评估者之间的测量误差,包括基线选择了不同的靶病灶,或不同评估者对同一病灶的测量差异等,和评价错误,包括采用了错误的评价标准,或明显的错判、漏判等。章程应明确规定被允许的总体差异的范围,通过优化流程、加强质控等措施尽可能避免评价错误的发生。在IRC的总体质控合格、结果可溯源的情况下,不能因上述原因否认原IRC评估结论。

目前仅在达到如下条件时,才考虑能否全部重评:

⑴ 在试验数据锁库前,申办方稽查发现独立评估者在评估过程中严重不遵守IRC规则或标准;
⑵ 申办方与IRC双方确认总体的评估结果已失信。
此时申办方应及时地与药品技术审评机构沟通,考虑能否重评。
提醒注意的是,考虑重评引入的不确定风险,包括重评对盲态的破坏和对IRC的干扰,重评存在将试验药物的疗效评价过高的系统性风险,重评结果可能被视为敏感性分析,尤其为拟支持注册的关键单臂试验。

5.2 审评数据清单

除非申办方/研究者特别说明影像终点标准章程是包含在临床方案中,否则我们默认影像章程是一个独立的、重要的评估结果文件,建议作为附件,附在研究方案之后,与关键研究方案一并提交讨论。在NDA申请时,将影像章程实施的具体结果与其他资料一并提交审查。提交章程和操作记录供监管结构审查有助于对试验数据完整性/综合性的确认,影像章程的有效执行对研究核查和数据质量评估都很重要。

监管结构对章程的格式没有特定的要求。在制定章程时,申办方/研究者应该根据试验的影像学检查目的、影像检查方法在各研究中心的具体实施细节来制定标准。并且,申办方/研究者也应明确影像学检查的关键要求,包括影像设备和图像质量,以及图像采集、显示、评估、存储和数据传输的过程。当前注册递交建议清单详见附件2。

六、总结

本技术指导原则旨在阐述药品技术审评机构当前对临床试验影像终点程序标准的评价考虑,期望通过对临床试验影像的采集和评价的规范化,以提高新药/治疗手段影像相关终点的评价质量、确保疗效可信。本技术指导原则尚不能涵盖临床试验影像采集和评价等过程的全部内容,鼓励研发从业者与药品技术审评机构及时沟通,持续完善本指导原则。

参考文献
Cheson, B. D., R. I. Fisher, S. F. Barrington, F. Cavalli, L. H. Schwartz, E. Zucca, T. A. Lister, A. L. Alliance, G. Lymphoma, G. Eastern Cooperative Oncology, C. European Mantle Cell Lymphoma, F. Italian Lymphoma, R. European Organisation for, G. Treatment of Cancer/Dutch Hemato-Oncology, O. Grupo Espanol de Medula, G. German High-Grade Lymphoma Study, G. German Hodgkin's Study, G. Japanese Lymphorra Study, A. Lymphoma Study, N. C. T. Group, G. Nordic Lymphoma Study, G. Southwest Oncology and I. United Kingdom National Cancer Research (2014). "Recommendations for initial evaluation, staging, and response assessment of Hodgkin and non-Hodgkin lymphoma: the Lugano classification." J Clin Oncol 32(27): 3059-3068.
Choi, H., C. Charnsangavej, S. C. Faria, H. A. Macapinlac, M. A. Burgess, S. R. Patel, L. L. Chen, D. A. Podoloff and R. S. Benjamin (2007). "Correlation of computed tomography and positron emission tomography in patients with metastatic gastrointestinal stromal tumor treated at a single institution with imatinib mesylate: proposal of new computed tomography response criteria." J Clin Oncol 25(13): 1753-1759.
Eisenhauer, E. A., P. Therasse, J. Bogaerts, L. H. Schwartz, D. Sargent, R. Ford, J. Dancey, S. Arbuck, S. Gwyther, M. Mooney, L. Rubinstein, L. Shankar, L. Dodd, R. Kaplan, D. Lacombe and J. Verweij (2009). "New response evaluation criteria in solid tumours: revised RECIST guideline (version 1.1)." Eur J Cancer 45(2): 228-247.
Krupinski, E. A., K. S. Berbaum, R. T. Caldwell, K. M. Schartz, M. T. Madsen and D. J. Kramer (2012). "Do long radiology workdays affect nodule detection in dynamic CT interpretation?" J Am Coll Radiol 9(3): 191-198.
Lencioni, R. and J. M. Llovet (2010). "Modified RECIST (mRECIST) assessment for hepatocellular carcinoma." Semin Liver Dis 30(1): 52-60.
Sargent, D. J., L. Rubinstein, L. Schwartz, J. E. Dancey, C. Gatsonis, L. E. Dodd and L. K. Shankar (2009). "Validation of novel imaging methodologies for use as cancer clinical trial end-points." Eur J Cancer 45(2): 290-299.
Wen, P. Y., D. R. Macdonald, D. A. Reardon, T. F. Cloughesy, A. G. Sorensen, E. Galanis, J. Degroot, W. Wick, M. R. Gilbert, A. B. Lassman, C. Tsien, T. Mikkelsen, E. T. Wong, M. C. Chamberlain, R. Stupp, K. R. Lamborn, M. A. Vogelbaum, M. J. van den Bent and S. M. Chang (2010). "Updated response assessment criteria for high-grade gliomas: response assessment in neuro-oncology working group." J Clin Oncol 28(11): 1963-1972.

•附件
附件1 影像章程的规范化和科学性建议
独立评审章程内容架构

专业术语和缩写表
1. 执行摘要/前言
2. 研究概述
如:方案编号/方案名称;适应症;研究目的;研究设计;入排标准;试验终点/影像终点,等
3. 职责
说明在项目中的职责
4. 图像采集、提交和处理
4.1. 中心资质认证
如:设备信息、技师等人员的基本资质
4.2. 图像采集标准
4.3. 图像提交说明
4.4. 图像数据处理原则
如:技术处理、质量检查、对方案/IAP偏离图像的特别说明、不符合评估条件的受试者,等
4.5. 质量监查和质量偏离纠正计划
5. 临床数据收集、提交和处理(如涉及)
数据清单、数据提交、数据处理-质量检查,等
6. (肿瘤)终点疗效评估标准
7. 盲态独立中心评估流程
7.1. 评估流程图
7.2. 访视点评估说明
如:评估者的职责、设盲、提供的图像和/或临床数据、测量和评估、数据锁定,等
7.3. 仲裁评估
如:评估者的职责、设盲、提供的图像和/或临床数据、测量和评估、数据锁定,等
7.4. 临床评估(如涉及)
如:评估者的职责、设盲、提供的图像和/或临床数据、测量和评估、数据锁定,等
8. 独立评审员的质量控制
如:独立评审员的资质和筛选;预防偏倚措施;利益冲突说明;独立评审员的培训;独立评审员更换的流程;评估稳定性分析,包括并不限于评估者组间和组内一致性分析。
9. 数据传输和保存
10. 评估质量保证措施
11. 参考文献

附件2 上市申请影像相关资料清单
上市申请提交文件列表建议
序号 文件名称 备注
1 独立评审章程  科学性核查依据
2 图像采集协议  数据标准核查依据
3 团队名单  责任人
4 研究特定流程  运营合规性核查依据
5 问题说明报告  
6 项目不符合(偏离)报告  
7 独立评审评估数据库  
8 评估结果稳定性/一致性分析报告  数据稳定性判断依据
9 独立评审总结报告  问题核查索引
10 影像标记数据  

评论