2024年4月24日,源资科技携手思特尔(Cytel)成功举办了“高级临床数据统计方法与策略”线上研讨会。本次讲座特邀芝加哥大学生物统计学终身教授嵇元博士和齐鲁制药王战博士,共同为大家带来前沿临床数据统计方法的深度分享与讨论。
讲座主要内容
l 剂量优化研究中样本量估算的贝叶斯统计方法
l 肿瘤临床试验删失规则的最优策略选择
Q&A
Q1:这个新方法目前有应用的案例吗,监管机构对这个方法的态度如何?
有正在合作的案例,并没有实施完成的案例。这个方法比较新颖,文章也才上周刚刚发到网上。关于监管的态度,监管部门主要关心的还是I类和II类错误,而我们这个方法比较新,主要应用于早期的临床研究,而在早期临床研究过程中,I类和II类错误是申办方要关心的主要问题,对于监管来讲,只要这个统计方法逻辑是站得住脚的,根据既往的统计方法创新的经验,应该是没问题的。
Q2:了解到频率学派需要提前估计真实的疗效时,因为疗效的变异对样本量的影响很大,贝叶斯也需要提前估计evSidence,这个证据的变异是否对样本量也有很大的影响?
在频率学派来说样本量估计是很敏感的,一旦θ给错的话,都无法知道你是错还是对,其实大部分时候是错的,你不可能知道真实的数据,样本量大部分时候是算不准确的。
这个贝叶斯方法的好处就是不需要去猜真实的θ是多少,你只需要猜你可能看到什么样的显著数据,在临床试验开始之前,你可以去做一个可能有效的假设,试验做到一半的时候,已经有一定受试者了,可以根据现有的受试者数据,去估算一下最初的假设是不是靠谱的,如看到的数据符合当初的假设,就可以通过这个新的证据再去重新估算样本量,样本量可能会减少;或者是药如果没那么好的话,那会发现一开始估计的数据可能看不到那么好的数据,就要重新去评估样本量到底是多少;如果数据特别差的话,可能就要去考虑是不是早点把这个试验停下来,因为这个药没有很好的疗效。
贝叶斯方法可以做这件事情的一个很重要的原因,就是没有去假设真实的θ1和θ0是多少,也没有用一类错误和二类错误来计算样本量,所以在试验中间重新计算样本量的时候,不需要去管一类错误的penalty是多少,这是一个很挺重要的potential,尤其对早期临床的实际工作有很大帮助的。
Q3:一般在OS和PFS分析中,最大的删失数据比例是多少?我看到有的临床删失太多了,几乎都删失掉了。
一般在研究设计时,我们会要求收集到样本量*70%左右的PFS事件数、样本量*60-65%的OS事件数。实际会根据单终点/双终点研究设计、alpha分配规则做调整,部分瘤种生存期长、事件收集困难,要求的事件数也可以少一些,具体情况具体分析。
关于删失比例,以PFS终点为例,若最终分析需要70%事件数,则允许30%删失。但此处说的删失是广义的,包括①受试者脱落,②截止分析时受试者仍在随访、未发生事件 两种情况。您提到的删失,可能是狭义上的删失,即“受试者脱落”(包括失访、自行开始新抗、主动撤回知情等),一般我们会将其控制在10%以内,否则会导致试验分析的时间延后,或者是需要增加样本量。
Q4:现在临床实际应该多数按照删失处理的,目前齐鲁study是按照哪种处理的对于PFS为主要终点的study?
对于以PFS为主要终点的研究,CDE的指导原则是有明确建议的,因此我们对新抗和连续缺失肿评都做删失处理。
Q5:删失时间如何确定的?如何结合E9R1?
结合E9R1就是需要在估计目标的框架下进行试验设计,涉及临床研究问题和伴发事件处理2大块,我们一般会提前在方案中写清楚估计目标。
首先是临床研究问题,若我们关注的临床研究问题是试验组相对于安慰剂组的疗效,不包括后线治疗带来的影响,则对于新抗这个伴发事件,会采用假想策略,而不是疗法策略,删失时间取新抗前末次肿瘤影像学检查日期。
Q6:请问一般什么情况下需要在IND阶段跟监管确认删失规则?因为这种非常细节的内容很多时候不会在IND阶段讨论。
A现阶段监管机构基本都会要求申办方在方案中增加估计目标章节,开始新的抗肿瘤治疗在估计目标框架下属于伴发事件,需要在IND递交方案时明确伴发事件的处理措施,如:删失(假想策略)、不删失(疗法策略)
缺失≥2次肿瘤评估后PD或死亡不属于伴发事件,一般写在PFS删失规则的章节中,在估计目标框架下,可考虑是否增加不同删失处理的敏感性分析或补充分析。
Q7:如果研究中心评估PD换新药,但后续IRC评估是SD,因为肿瘤研究研究者很难处于盲态,会存在对照因新抗删失比例高风险,会不会新抗不删策略更好呢?
研究者和IRC阅片不一致是III期试验常见的棘手问题。如果采用删失处理,事件数收集不到,申办方需要延长随访时间或者是增加样本量,时间和成本都会增加;如果采用不删失处理,若新抗为市面上较好的免疫或靶向治疗,当使用新抗人数较多时,研究很可能类似于一项“头对头”研究,比较难检验出疗效差异。
个人的一些观点,我认为采用删失处理会更好,至少不会过分高估对照组的疗效。此外,这个问题的核心是如何管控受试者,降低删失率。若主要终点为IRC评估的PFS,可考虑在方案中明确更换新药的前提是IRC评估PD,而非研究者评估,否则会有大量受试者“脱落”。在实际执行层面,需要和运营、IRC机构讨论阅片传输的时限和频率,及时拿到IRC阅片结果,研究者一般不会愿意等待太长时间。