点击上方的 行舟Drug ▲ 添加关注
临床试验中疗效指标观察与测量相关问题的考虑
来源
中国新药杂志 2019 年第 28 卷第 24 期
作者
刘炳林,薛斐然
国家药品监督管理局 药品审评中心
摘要
疗效指标评价是临床试验最重要的研究内容之一。
而疗效指标的认真观察和准确测量则是保证临床试验有效性数据真实、可靠、准确、完整的重要因素。
本文对药物临床试验中疗效指标观察和测量相关问题进行了讨论。
其中包括临床试验设计中需要关注的疗效终点指标定义、疗效指标访视点和访视时间框架的设计以及疗效指标观测时间周期设计考虑的因素,访视点间隔与临床试验疗程的设计要求,每次访视的访视窗的设计和要求,每个观测时间周期内观测次数的设计和要求等。
本文还讨论了生存状态及相关临床事件类、量表类、实验室类、病理组织学类、影像学类等指标等观察和测量需要注意的问题,疗效指标的观测和收集方式方法、与疗效指标相关的基线取值以及疗效指本文还讨论了生存状态及相关临床事件类、量表类、实验室类、病理组织学类、影像学类等指标等观察和测量需要注意的问题,疗效指标的观测和收集方式方法、与疗效指标相关的基线取值以及疗效指标观测中的盲法要求等内容,以期对新药临床疗效指标的观察和测量设计和实施有所帮助。标观测中的盲法要求等内容,以期对新药临床疗效指标的观察和测量设计和实施有所帮助。
内容由凡默谷小编查阅文献选取,排版与编辑为原创。如转载,请尊重劳动成果,注明来源于凡默谷公众号。
关键词
药物; 临床试验; 方案; 疗效指标; 终点; 疗效评价; 观察与测量
正文
药物临床试验的疗效评价包括明确的疗效观测指标、疗效指标的观察、测量和收集方法以及评估受试者反应所采用的相关标准等[1]。
疗效观测指标是用于评价药物有效性的主要观察和测量工具[2]。
在药物临床试验中,疗效指标的观察、测量、采集、收集等是药物临床试验中疗效研究的最重要的过程之一[3]。
疗效指标的观察和测量是获取和收集疗效指标相关数据的基础。疗效指标认真观察、准确测量和评估是保证临床试验有效性数据真实、可靠、准 确、完整的重要因素,也是药物临床试验质量控制的重要内容。在药物临床试验中,适应证、试验目的、疗效观测指标不同,其观察和测量的方法可能不同。同一疗效观测指标,不同的临床试验目的、疗效评价方法、临床终点指标,可以有不同的观察、测量和采集、收集方法[4]。
有的疗效指标需要采集、制备、检 测、生成、显示、观察、测量、储存、解读和归档保存等多方面的复杂过程。笔者结合长期药品临床试验审评经验,对药物临床试验中与疗效指标的观察与测量相关的问题讨论如下。
1
临床试验方案中疗效指标观测的设计
药物临床试验质量是疗效指标观察和测量准确性和可靠性的重要保障。
质量源于设计,因此,在临床试验设计时,首先应根据临床试验目的和确定的疗效观测指标设计出合理的疗效终点指标。
在此基础上,再根据适应证、研究目的、药物作用、观测指标和疗效终点指标等,设计出合理的访视点和访视时间框架、疗效指标观测时间周期、访视点间隔与临床试验疗程、访视窗、每个观测时间周期内观测次数和每次观测需要注意的具体要求等。
这些都是保证临床试验有效性数据真实、可靠、完整、准确的重要因素,但也往往是在临床试验设计、实施等过程中最容易忽视的问题。
1.1 疗效终点指标的定义
疗效终点指标是通过统计分析用于反映特定研究中拟得出的反映临床疗效结局和精确定义的指标,是根据临床观测指标确定的一种用于评价临床试验中不同治疗组间疗效统计学比较结果的评价方法[5]。
疗效终点指标与疗效观测指标不同,但对疗效观测方法起到决定作用,因为同一个疗效观测指标,因为疗效终点设计的不同,其观测方法、时间设置等可能不同。
因此,在临床试验设计中,首先应该明确疗效终点指标。
例如,将死亡率作为主要疗效指标而无进一步的说明是不合适的; 对死亡率的评价可以比较某时点尚存人数的比例,也可以比较在某时域内的生存时间的总分布。
针对疾病复发事件,疗效指标可以是简单的二分类指标( 任何指定时间段内的复发) ,也可以是第 1 次复发的时间、复发率( 在单位时间内的复发数) 等。
在慢性病的疗效观测评价中,治疗期间的功能状态的评价也有多种方法,这种评价可以是比较开始和结束时机体的功能状态,比较整个试验期内所有观察结果计算所得的斜率,比较超过或低于指定界值的患者比例等方法来进行[6]。
这些疗效终点指标的确定,显著影响后续的疗效指标观测方法的设计,因此,在临床试验方案中需要首先确定疗效终点指标。
1.2 访视点和访视时间框架的设计
访视点是指拟参加或已接受参加临床试验的受试者与研究者和/或疗效指标评估、收集者等见面或其他方式的联系以收集或评估受试者相关指标信息约定的时间点。
每次见面或其他访视的联系可以称为一个访视点,每个临床试验中所有访视点的整体安排一般称为访视时间框架。
访视时间框架的设计除了有效性指标的收集访视点外,也包括受试者人口学信息、用药情况和安全性等其他信息收集的访视点。
访视时间框架一般根据适应证、临床试验目的、观测指标特点、临床终点指标、药物作用特点等因素确定。
访视时间框架包括每个访视点的总体时间安排、时间间隔、需要观察、测量和收集的指标和信息等; 临床试验访视点可以包括筛选期和导入期访视点、随机/基线访视点、中间访视点、治疗结束访视点和随访访视点等[2]。
但并不是所有适应证、研究目的和临床试验中各个访视点均需要疗效指标观察和测量,但至少应该有治疗后用于疗效评价的疗效指标的关键访视点的观察、测量和收集到的疗效指标的数据。
如临床疗效终点指标是评估治疗后与基线的变化值,则还需要有基线访视点的数据,如治疗抑郁症的 HMAD-17 评分变化[7]; 有的适应证需要观察和测量治疗结束后一定时间段后的疗效表现,如脑卒中超早期溶栓治疗,主要疗效指标是观测脑卒中发病 90 d 后患者残障残疾水平,这时应特别注意治疗结束后影响有效性指标评价的相关因素的限定[8]。
内容由凡默谷小编查阅文献选取,排版与编辑为原创。如转载,请尊重劳动成果,注明来源于凡默谷公众号。
1.3 疗效指标观测时间周期的设计
疗效指标的观测时间周期是指每次观察和测量疗效指标变化的时间间隔,是疗效指标变化的最小观测时间单位,如果每次疗效数据需要通过访视由研究者观测和记录,则与访视时间间隔一致; 如果由患者或其密切接触者等观测记录,也可以多次观测记录后,在与研究者访视时把观测记录的数据交给研究者,以减少访视次数、降低访视负担。
如观测记录每周内心绞痛的发作次数,每 4 周与研究者访视时把观察的 4 周结果交给研究者,观测记录过去的12 h 内出现咳嗽的轻重程度,治疗结束时访视点把整个治疗期间的观测记录的结果交给研究者。
疗效指标观测时间周期的设计需要结合适应证、临床试验目的和观测指标的特点、临床实际可操作性和实际应答负担等多种因素综合考虑。一般需要考虑以下因素。
1.3.1 应与患者疾病相关指标的病理生理变化周期一致
如糖尿病的主要观测指标为糖化血红蛋白,但由于糖化血红蛋白一般变化的生理周期为120 d 左右,因此其检测的间隔时间一般为 2 ~ 3 个 月,如果时间太短,则变化没有临床意义[9]; 另一个与病理生理观测指标相关的指标为骨质疏松症的骨密度检查,一般认为骨密度变化的生理周期为 6 个月左右,因此,观察骨密度变化时间周期应该以 6 个月为观测时点,如果观测周期短于 6 个月,则没有临床意义[10]。
再如,观测治疗痛经类的药物,应该注意根据月经周期来确定观察周期。
1.3.2应与使用量表的要求一致
现代临床试验中以量表作为临床试验的疗效评价指标的情况十分普遍,但需要注意不同的量表本身要求的观测时间的规定。
如用评价失眠使用的匹斯堡睡眠量表一般是要求观测和评估 1 个月内的睡眠情况。
其观测周期是根据量表设计时信度、效度和反应度等测量特性检测时规定的观测周期确定的,如果随意变化其观测周期,可能会影响量表的测量特点和准确性,因 此,其观测周期应该以 1 个月为一个观测周期[11]。
用于慢性前列腺炎评价的国立卫生研究院慢性前列腺炎症状指数( NIH-CPSI) 是评价 1 周内相关症状体征的变化[12]。
1.3.3 应考虑患者回忆的一般规律
临床试验中经常要求患者回忆其在过去的一定时间段内出现的症状频率、严重程度等。如过去的 1 个月内出现的偏头痛发作次数、过去 1 周内心绞痛发作次数、过去24 h 内疼痛的强度等。
这种要求患者依靠回忆来记录的症状等疗效指标,特别是如果需要他们必须回忆在之前较长一段时间情况,或者他们目前的状态与早期时间的情况比较,或在一段时间内他们的平均反应,可能会因为记忆模糊而不准确,也会增加患者的心理负担和不合作,影响数据的准确性、可靠性[13]。
因此,这种情况要求观察的时间周期不能太长。
同时,心理学认为,人类对体验的记忆由 2 个因素决定: 高峰时( 无论是正向的还是负向的) 与结束时的感觉,这就是心理学的峰终定律[14]。
根据这一定律,如果要求患者根据记忆对某一段时间的症状感受体验平均状况进行记录可能是不准确的,这时,可以要求患者提供回忆观测期内最差的( 或最好的) 表现进行记录。
1.3.4 应考虑临床可操作性和观测负担
如上所述,观察时间周期太长会出现较多问题,但也并不是观测周期越短越好,还需要考虑临床试验的可操作性和观测者的负担。
如果观测过于频繁,如要求每天多次测量记录可能会极大增加观测者的操作负担,出现大量的漏记脱落情况,同样影响数据的准确性和可靠性。
为此,设计合理的观测时间周期十分重要。有的临床试验因为观测指标负担过重而不得不调整疗效指标,如用于糖尿病评价主要指标现在一般使用糖化血红蛋白,并不是血糖指标与糖尿病的预后无关,只是因为糖化血红蛋白比普通血糖稳定,不需要反复测量,检测负担较轻,因此,现在选择糖化血红蛋白作为主要疗效指标。
将来随着可穿戴医疗设备的发展,血糖的实时检测在准确性、成本和负担等方面解决后,仍有可能使用血糖的实时数据作为糖尿病的主要疗效指标。
1.4 访视点间隔与临床试验疗程的设计
每次访视点间隔的设计需要考虑适应证、临床试验目的、主要疗效指标、给药方案、药物作用特点、临床操作实际和成本负担等因素合理设计。
临床试验期间的疗效指标需要多次访视的,其访视点间隔一般应该大于等于疗效指标的一次观测时间。
每次访视点间隔可以是相同的,也可以是不同的。
如果是观察疾病的痊愈时间或相关症状体征消失时间,可以在预计疾病开始痊愈或症状体征开始消失到结束的时间前后设计较为密集的访视点[2],以提高临床试 验 效 能; 如果是临床试验中设计了滴定给药[15],需要在规定的时间点进行疗效评价,一般根据疗效评价结果确定是否需要改变用药剂量等; 针对某些疾病,如治疗失眠的药物,由于患者初期用药具有适应现象,即开始换用一种药物时睡眠通常得到改善,而继续服用几天后疗效降低甚至完全失效[16],因此,一般应该在适应现象结束后再进行疗效评价。
临床试验疗程的设计也需要根据拟定适应证的发病规律、临床试验目的、药物用法用量、主要疗效指标和访视点间隔等因素合理确定。
多数情况下药物临床试验疗程大于一次访视点间隔和一次疗效指标的观测时间周期,如冠心病稳定型劳力性心绞痛,一次观测时间周期为 1 周内心绞痛的发作次数,而访视点间隔多数为 4 周 1 次,疗程可以设计为 8 周及以上[12]。
1.5 访视窗的设计和要求
访视窗是在临床试验中预先规定的,某一指标一次访视点允许发生的一个特定时间段,又称为访视时间窗。窗宽是规定的时间段长度,一般用天或其他时间单位来计。
一般药物临床试验中疗效指标的访视窗需要在临床试验设计时确定好,超出这一观测时间段的访视则称为超窗。
临床疗效指标观测时间窗的长短与疾病相关指标的特点、观测指标变异性、药物的作用特点和临床试验目的、疗效指标的定义等相关。
一般急性疾病或慢性疾病的急性发作,变化较快的指标需要的观测访视窗较短,反之,如果用于慢性疾病的观测指标,如果疗效指标变化较慢,一般观测访视窗较长,但即使较长者,一般多不超过 1 ~ 2 周。
内容由凡默谷小编查阅文献选取,排版与编辑为原创。如转载,请尊重劳动成果,注明来源于凡默谷公众号。
1.6 每个访视点观测次数设计的要求
对于疗效观测指标,如果是容易随患者的生理病理状态等因素变化的指标,有时需要进行多次的观察和检测。如血压值的测量,应该根据血压测量指南的相关要求[17],在休息 5 min 后,连续 2 ~ 3 次测量血压。
以其中 2 个接近的 2 个血压值的平均值为准( 包括基线取值和临床试验中及临床试验结束的取值) ,其他如有的功能测量值也会随患者的生理病理状态变化,如冠心病心绞痛的运动心电图检查,一般每次观测观察时点可能需要 2 次平板检查结果为准。
对于慢性心功能衰竭的 6 min 步行试验,一般也是要求多次反复测量以平均值为准。催眠药物临床试验要求[18],至少应该有 3 个、多次给药、连续若干夜晚进行的、随机、双盲、安慰剂对照、平行分组试验,采用组间比较方法对药物和安慰剂进行比较。
1.7 观测细节设计的具体规定
疗效指标不同,涉及测量的细节问题也完全不同。如果在临床试验设计时不做出规定,测量中会存在多种不同的理解和模糊情况,也会出现各种影响疗效评价的问题。
因此,在临床试验设计中应该有具体的规定。如眼部疾病,双眼出现病变时,要求测定那只眼睛; 包括皮肤科,出现多个皮肤病灶时,如何确定靶皮损问题; 其他如有的皮外科疾病病损是此起彼伏等出现的,可能有的开始消退,有的治疗期间才新出现,也应该确定是观测原来基线时的靶皮损改变,还是全部的皮损改变等都需要根据具体研究特点合理确定。
关于观测时间,为了提高观测指标的一致性,也可以指导性地提出具体回忆记录时间,如每天晚上8 点评价过去的 12 h 内季节性过敏性鼻炎鼻部症状( 鼻塞、流涕、喷嚏、鼻痒等) 轻重[19]; 有的观测时间周期较短的( 如 2 h 观测 1 次) 疗效指标评价还需要考虑夜间睡眠等对疗效评价的影响及临床可操作性。
如观察药物对发烧的疗效,要求使用普通体温计每 2 h 测量 1 次,但夜间睡眠期间往往很难做到,在临床试验设计时应该考虑这种情况下应该如何设计体温测量,并合理设计退热时间观测。
2
不同类型疗效指标观测中需要注意的问题
不同的类型疗效指标,有不同的观测方法和注意事项,由于涉及的情况较多,不能一一列举,这里仅针对几种常见类型的疗效指标讨论如下。
2.1 生存状态及相关临床事件类指标
生存状态是指患者疾病的最终或影响患者生存较大的严重疾病状态结局,如到死亡之前的生存期、出现影响生存质量较大的残疾、功能丧失和某些代表疾病严重发展和进展的重要临床事件等。包括死亡、生存率、生存期以及不可逆疾病和/或严重的疾病状态的发生情况。
如癌症的总生存期、急性心梗、脑卒中、终末期肾病、骨折发生率、癌症无进展生存期,因为疾病加重住院次数等。
一般是指疾病的最终结局和终末阶段,因为其代表了疾病的严重恶化和进展,因此,往往是对患者影响最大、最直接、医生和患者最关心、最想避免的临床事件[4]。
一般认为,改善生存( 状态) 为最重要的治疗受益概念。
如果以生存状态作为主要疗效指标,则需要明确其具体的定义和判别标准。对生存状态中涉及疾病状态的评断标准,如急性心梗的发作、骨折、脑卒中、终末期肾病的发生等,一般认为该类事件容易观察。
但实际上,临床试验实际操作中如果不对其进行更详细的定义,往往会出现多种争议的情况。
如脑卒中,确证是否需要出现神经功能缺损的症状,是否包括短暂性脑缺血发作,无神经功能缺损症状的腔隙性脑梗死,腔隙性脑梗死的确证是根据 MRI 还是 CT,如何区分是新发还是陈旧性等; 如果是终末期肾病,需要明确终末期肾病具体的执行标准,如果使用血肌酐或肾小球滤过率判断,由于血肌酐或肾小球率值会出现波动,需要明确限定在多长的时间内连续几次测量均达到规定的标准情况下,以第 1 次达到该标准的时间为依据; 如果观察的事件是因为病情加重的住院次数,则更需要严格规定,因为住院次数受多种因素的影响。
因此,需要特别注意与疾病变化不相关的因素对疗效评价事件的影响。
这类事件如果作为主要疗效指标往往可能因为各种非疾病变化的影响因素受到质疑。有时看似简单的事件计数,可能存在不确定的模糊情况,如记录头痛发作次数,如果患者在头痛持续期间睡着,醒后不再疼痛或醒后仍然疼痛,需要如何界定头痛的发作次数。如用于观测偏头痛发作频率的情况,可以做如下规定: 当偏头痛发作因为睡眠或暂时的缓解而终止,或一次发作后药物治疗基本成功,并且在发作停止后的 48 h 内再次出现,应记录为一次发作[20]。
2.2 量表类指标
临床试验中使用量表作为疗效评价指标十分普遍。包括患者报告的结局( patient-reported outcome,PRO) 量表,临床医生观测的量表,进行认知、运动等绩效量表等。
量表评价应该特别注意使用国内外公认、经过信度、效度和反应度等检测符合要求的量表。
在使用量表前,需要认知阅读量表使用指南,应该注意量表使用的适应证人群,包括疾病的病情、分 型、分类、分期等,如用于阿尔茨海默病的认知功能评价的 ADAS-cog,一般仅用于轻中度 AD 认知功能评价,而不适用于重度 AD[21]。
另外,还要注意使用量表的版本,因为有的量表往往有多个版本,不同版本有一定差别和适应范围,不同版本含有的测量条目可能不同,其计分标准,特别是总分也有所不同,在量表使用中也需要特别注意这些问题。
对于使用日记等 PRO 等量表者,应该有防止出现在提交日志表的访视期再补填过去遗漏内容的措施。
量表的使用资格和培训: 不同的量表对使用人员的资格要求不同,包括认知等相关功能、文化程度、语言表达能力、专业水平等。
有的量表使用需要进行资格认证,通过专业的测评考试,并取得资格证书。
还有的量表需要缴纳使用费,对于商业用途如新药临床试验,需要申办者缴纳一定的费用才能使用。
多数量表的使用需要有统一正规的培训。
目前临床试验中多数对量表使用的培训重视不够,甚至出现临床试验中填写的量表数据不符合基本逻辑的情况。
细节决定成败,量表的培训是控制临床试验质量,保证疗效指标观测数据准确性、完整性的重要因素。
培训不能走过场,应该有完整的培训计划、培训教材、培训课程、培训中需要解决的重点问题、培训后需要在不同情况的患者中练习,以期发现使用中存在的各种问题,特别是在具体执行中存在的认识和测量不一致问题,并对使用中的一致性进行检验。
最后还应该有培训后的考核和评估等。如针对急性细菌性皮肤和皮肤结构感染进行临床疗效评价。
临床试验中的临床疗效评价是对医生对皮肤病变大小的临床评估,以评价随机分组后从基线到 48 h 皮肤病变区域变化为临床终点。
临床医生应得到具体的指导:
① 研究人员中的谁应该负责测量。
② 他们要测量的皮肤病变的哪些方面( 例 如,仅红或红加硬结) 。
③ 同一个人是否应该在基线和治疗后同一个靶皮损进行评估并对比。
④ 具有多处皮损时,是测量全部的皮损,还是仅限定一处的靶皮损,如果限定靶皮损,靶皮损限定的标准是什么?
⑤ 皮肤病变测量应该如何进行( 例如,患者的身体位置和测量最长的长度和宽度等) 。
⑥ 用于测量的工具和标准。
⑦ 研究期间评估的特定时间点。此外,应详细说明进行皮肤病变测量所需的任何具体培训。
2.3 实验室检测类指标
以实验室检测指标为主的生物标志物经常作为药物临床试验有效性指标。针对该类指标的生物标本的采集、保存、运输、检测、数据管理等均需要按照2011 年原国家食品药品监督管理总局发布的《药物临床试验生物样本分析实验室管理指南( 试行) 》来执行[22]。其相关数据生成、保存等应该符合《临床试验质量管理规范》[23]要求的可溯源、可稽查、可检查等相关要求。
内容由凡默谷小编查阅文献选取,排版与编辑为原创。如转载,请尊重劳动成果,注明来源于凡默谷公众号。
2.3.1 检测生物样本的采集、保存和运输
不同的生物标志其采集条件有不同的要求,并特别注意饮食、药物、运动、时间、生活状况等因素对检测值可能的影响。
在提取生物样本时需要对以上因素进行具体限定。
在生物标本的运输方面也应该做到根据生物标本的具体情况,确保其在保存和运输过程中的稳定。
一般情况下,提取的生物标本应尽快检测,需要严格规定最长保存时间和保存条件等。
2.3.2 生物样本的实验室检测
作为多中心临床试验疗效指标的检测,首先应该注意检测生物标本一致性,特别注意血清、血浆和全血的不同。
尽量使用统一的检测设备、仪器、检测方法、检测试剂和操作规程等,必要时应该固定检测人员。
至少应该对检测方法、检测试剂进行统一。
特别是在我国检测方法尚不完全一致的情况更应该注意,如糖化血红蛋白的检测方法等。
2.3.3 检测标准的统一性要求
作为多中心临床试验疗效指标的检测,除了使用统一的检测方法和检测试剂外,还需要使用统一的计量单位,保证各中心使用一致的正常和异常值判断标准,有利于各中心统一的数据整合和统计比较分析,否则,不同中心数据无法直接进行统一的统计比较和分析,进而做准确可靠的研究结论。
在国际多中心研究中,更应该注意这些问题,因为不同国家人体生化指标等检测方法、检测试剂、计量单位和正常值范围有较大的差异。
在多中心临床试验中,如果条件允许,提倡使用统一的中心实验室进行检测,以减少不同中心间的检测偏倚。
2.4 组织病理学指标
使用临床组织病理学指标作为临床试验中的疗效指标,无论是主要疗效指标,还是次要疗效指标,可以参照 FDA《对于使用组织病理学及相关方法学来支持生物标志物资质鉴定的考虑行业指导原则》[24]的相关要求,对病理活检组织的提取方法、保存、制片及切片数、病理切片的制备规程和临床判断标准、判读方法做出十分具体的规定。
其生物标本的采集、病理片的制备过程应有原始记录,包括制成的病理切片合理保存,并应该符合《临床试验质量管理规范》[23]要求的可溯源、可稽查、可检查等相关要求。
2.4.1 病理组织活检的提取
临床病理活检组织的提取时间、部位、方向、次数等均需要有明确的规定。需要制定组织病理学穿刺活检的质量控制标准或操作规范,以尽量减少取样的误差。为了减少取样误差,需要增加取样的次数,一般不能少于 3 个部位。
如肝纤维化的研究[25],肝组织病理活检标本一般要求取样大于 15 mm 及 6 个汇管区( 最低要求) 。还要特别注意活检标本大小对结果判断的影响,而且注意活检组织的大小应为福尔马林固定后的长度,而福尔马林可致组织脱水造成比原活检取样缩短,因此,在病理活检组织提取时应该考虑这些因素。
2.4.2 组织病理切片的制备
提取的活检组织标本应及时固定,否则新鲜组织离体易自溶,同时固定后可使组织硬化,便于石蜡包埋、切片和染色。
标本组织的固定液、固定时间、固定温度、染色方法和操作方法等均应该制定严格的操作规范和标准,以减少因此引起的偏倚。
2.4.3 组织病理学临床判断标准,需要制定统一共识的组织病理学变化的判断标准
如肝纤维化病理活检纤维化分期[25] 可以使用 Ishak 纤维化评分、Ishak 炎症评分等。
2.4.4 组织病理学判断和评估
为了减少不同人员病理判断上的偏倚,尽量应该使用统一的读片中心进行盲法判读。同时,应该规定判读方法。
由于1 名病理学家读片,病理诊断一致性较差,因此,可以请 3 名病理学家独立读片,取其中较为一致的 2个结果作为最后结果,或者固定至少 3 位( 最好为单数) 具有高级职称的病理医生在规定的时间、地 点,分别、单独进行盲法读片,分别、单独做出病理报告,如报告结果存在不一致,应以多数意见作为最终结果[24],如果出现有争议的情况,还需要设置争议解决办法,如相关领域专家组成的盲态的独立终点仲裁委员会进行评断等。
另外,有的情况下,在保证盲法的前提下,病理学家也应与临床医生,尤其是临床研究医生合作,共同读片,这样也可减少病理诊断的错误。
2.5 影像学指标
临床试验中也常常使用影像学临床疗效终点。
这些成像包括静态的成像,如 X 线、CT、MRI、眼底照片等,也包括动态的视频图像,如胃肠镜检测视频等。
使用影像学终点作为临床试验中的疗效指标,无论是主要疗效指标,还是次要疗效指标,可以参照 FDA《临床试验影像终点过程标准行业指导原则》[26]的相关要求,对成像采集、显示、归档、传输和解读过程均应该标准化和规范化。
其影像学检查的记录应该符合《临床试验质量管理规范》[23]要求的可溯源、可稽查、可检查等相关要求。
2.5.1 临床成像的采集
临床成像的采集需要对采集人体条件、环境、设备等进行标准化和规范化。包括受试者摆位、成像的角度、成像覆盖的解剖结构、成像的时间安排、受试者镇静状态、造影剂的使用剂量、时间、成像设备的型号、检查中使用的设备相关参数、图像采集时扫描仪设置、操作人员的专业资质和操作规程等均需要统一和标准化。
应该制定图像质量控制标准,包括需要重复成像以获得可解读图像的标准等。多中心临床试验应该保证各种成像要求的一致性。
2.5.2 影像学指标成像的显示和归档
作为疗效指标的成像信息的显示、传输和保存也应该标准化,应该使用统一的格式进行采集和存储,保证存储的稳定性和不可更改性( 包括采集时间等) ,在文件的传输过程应该能够保证文件信息的完整性、稳定性和与原文件的一致性。
2.5.3 影像指标的判断标准和判读要求
如果使用影像学指标作为疗效指标,应该使用或制定国内外行业公认的影像学判断标准,以保证临床判读的一致性。
对影像学指标的判读人员应该有专业的技术资质要求和相关培训。
判读也应该设立多位专家进行判读,以多数专家一致意见为主,对存在争议的情况,也可以设置争议解决办法,如组成相关领域专家组成的盲态的独立终点仲裁委员会进行评断等。
另外,为了减少判读偏倚,多中心临床试验鼓励使用统一的读片中心进行判读。
同时,近年来,随着人工智能的发展,人工智能机器阅读的准确性逐渐提高,将来有可能进一步代替人工读片,也可以增加阅片一致性。
3
疗效指标观测中需要考虑的其他问题
3.1 疗效指标的观测和收集方式方法
疗效指标包括 临 床 结 局 评 价 和 生 物 标 志 物等[27]。
临床结局评价( clinical outcome assessment,COA) 是一种可能受到人的选择、判断或动机影响,并可支持治疗受益的直接或间接证据的评估方法。
临床结局评估是对患者感觉、功能状况的一种主观评估,有时是对治疗受益有和无的简单判断; 临床结局评估依靠患者、医生或观察者来执行、解释和报告。
根据疗效指标观测和收集方式的不同,一般把临床结局评估指标分为 PRO 指标,即直接来源于患者自我感受的症状和体征、功能损害观测、评估和判断得出的疗效指标,而无其他人员的影响;
观察者报告的结局( observer-reported outcome,ObsRO) 指标,即由与患者密切接触者直接观察到的患者相关症状、体征和功能等相关外在表现的观测、评估和判断得出的疗效指标,如患者的看护者、儿童的家长、老师等;
临床医生报告的结局( clinician-reported outcome,ClinRO) ,即临床医师根据观察和患者访视叙述、医学检查等内容观测、评估和判断得出的疗效指标; 绩效结局( performance outcome,PerfO) 指标,即患者执行某些功能( 如运动、感觉、认知功能) 等表现的优劣得出的疗效指标,如老年性痴呆的认知功能测量量表、慢性心功能不全的 6 min 步行试验、平板运行试验等。
如 PRO 指标可以使用患者日记方式,也可以使用手机 APP 等方式; 临床医生报告的结局( ClinRO) 多采用患者访视的方式来收集; 绩效结局 ( PerfO) 指标多需要患者到医院进行绩效测试来收集评估。
而生物标记物是可以客观测量和评价正常的生物学过程、致病的过程,或对治疗干预的药理学反应的指标。
生物标志物可以是生理、病理、解剖特征,或者是与正常或异常的生物学功能或过程相关的某方面测量。
典型的生物标记物通过实验( 如通过化学分析血脂中的低密度脂蛋白等) 或者仪器( 如血压计) 来测量取得的。生物标志物的收集和测量已在上述表述。
另外,随着现代科学技术的发展,疗效指标新的收集方式也在逐渐增多,如远程视频、手机 APP、可穿戴医疗设备收集等,这些新的疗效指标检测和收集方法不仅大大减轻了疗效评价的负担,而且可以提高数据收集的准确性和可靠性,有的原来不能收集到的数据现在可以得到更为详细的数据,如连续的体温检测、动态的血糖检测等。
但需要注意市场上很多收集临床试验数据的可穿戴设备还没有经过国家医疗器械的认证,收集的数据还达不到医疗级别,还不能作为可靠的医疗数据。
3.2 与疗效指标相关的基线取值
一般情况下,基线不需要疗效指标的观测,但在很多新药临床试验中,疗效的评价需要通过用药后和基线疗效指标的变化的组间比较来实现。
这种情况下,常常需要对基线期疗效指标进行观测。如高血压病的血压值、糖尿病的糖化血红蛋白、偏头痛的头痛发作频率、血脂异常的血脂数值等等。
而这些临床疗效观测值可能受到生活方式、心理因素、其他治疗药物和措施等多种因素的影响。
因此,药物临床试验一般需要通过筛选期和导入期( 包括洗脱期) 使受试者的病情基本稳定、相关指标基线取值稳定可靠,以减少临床试验中对药物有效性评价的干扰。
而导入期时间的长短和方式( 如是否需要洗脱) 需要根据疾病特点、观测指标、药物影响等多种因素合理设计。
但在临床试验实施中,由于长时间无治疗或安慰剂的导入期存在依从性差的问题,因 此,现有的临床试验导入期的设置往往达不到符合疗效指标特点要求,影响了基线取值的稳定性和可靠性,如治疗糖尿病使用糖化血红蛋白为主要疗效指标,虽然其生理变化周期为 3 个月左右,但临床试验的导入期一般很难设计 2 ~ 3 个月,在一定程度上影响了基线取值的稳定性和可靠性。
再如抑郁症临床试验前使用了百忧解等药物,由于其作用时间较长,其洗脱期可能长达 1 个月左右。有些疗效指标变异性较大和安慰剂效应明显。
为了保证基线数据的稳定性,减少纳入患者的安慰剂效应,提高临床试验效能,需要在患者导入期反复多次观测其疗效指标,选取疗效指标较为稳定的患者作为受试者进行随机分组。也可能使用多次测量的平均值作为基线取值。如前述的冠心病心绞痛的运动平板试验,纳入时的导入期,如果 2 次的运动平板试验变化在 10% 以内,则可以认为符合临床试验纳入要求。
3.3 疗效指标观测中的盲法要求
根据临床试验指标的不同,观测人员可以是患者,如 PRO 量表,也可以是医师、看护者,如果是生物标志物类如实验室指标、组织病理学指标、影像学指标等,观测人员也应该是具有相应技术资质的医学专业人员。
但无论是哪些人负责临床试验疗效指标的收集、制备、观测和判断,都应该在盲态下进行。
即使因为各种原因使整个临床试验无法达到盲法,但疗效指标的收集、观测和评估者也应该做到盲法操作。
另外,为保证盲法,疗效指标的观测人员尽量不同于临床试验的其他参与者,并尽量减少与其他临床参与者接触也是保盲法评价的重要措施。
同时,为了体现药物疗效的稳健性,建议不同的疗效评价指标使用不同的评价人员,如果不同疗效指标结论一致,则可以增加临床试验结论的可靠性。
4
结语
综上,药物临床试验中疗效指标的观察和测量是临床试验质量控制的重要因素,也是药物疗效评价准确、可靠的重要基础。
疗效指标的观察和测量涉及临床试验设计、观察、测量和收集方式方法、盲法操作等诸多方面,限于篇幅,现仅就其中的部分问题进行了讨论,希望对新药临床试验疗效指标观测的设计和实施有所帮助。
参考文献
详见 中国新药杂志 2019 年第 28 卷第 24 期
免责声明
本公众号发布的文章均为促进制药界同行的交流与学习;未用于任何商业用途。我们尊重原创作品。选取的文章已明确注明来源和作者,版权归原作者所有,如涉及侵权或其他问题,请联系我们进行删除。
内容由凡默谷小编查阅文献选取,排版与编辑为原创。如转载,请尊重劳动成果,注明来源于凡默谷公众号。
文章内容为作者观点,不代表本公众号立场。
文章信息源于公众号凡默谷,登载该文章目的为更广泛的传递行业信息,不代表赞同其观点或对其真实性负责。文章版权归原作者及原出处所有,文章内容仅供参考。本网拥有对此声明的最终解释权,若无意侵犯版权,请联系小编删除。
学如逆水行舟,不进则退;
心似平原走马,易放难收。
行舟Drug
每日更新 欢迎订阅+
医药大数据|行业动态|政策解读