疑云重重:2000多项冠心病临床试验,近600人枉死?
pixabay.com
撰文|邸利会
责编|陈晓雪
● ● ●
明知药有效,还继续拿病人做临床试验?
最近由约翰·霍普金斯大学医学院和公共卫生学院发表在《英国医学杂志》(the british medical journal,the bmj)的一项研究引发热议。
2021年2月2日,约翰·霍普金斯大学医学院和公共卫生学院发表的一项研究指出,来中国大陆的2000多个关于他汀类药物的 “冗余” 临床试验,造成了3500例心血管事件,包括近600人的死亡。作者指出,冗余试验达到如此规模,亟需改革以保护病人。
这个研究指出,尽管中华医学会心血管分会早在2007年就发布了指南,强烈推荐他汀类药物作为冠心病的一线用药,但之后从2008年至2019年的11年间,中国大陆机构仍发表了2000多项、累计25万冠心病病人参与、声称是随机对照的临床试验,“研究” 他汀对冠心病的疗效。
这25万病人有约一半被分配到对照组,在试验中未接受他汀治疗,很多连安慰剂都没给。
当然,这些临床试验一方面符合 “预期”,肯定了他汀的疗效,可以降低心血管事件的发生率;但对照组里没有接受他汀的病人比在治疗组里接受他汀的病人多发生了近3500例心血管事件,包括近600例死亡。
也就是说,如果给与对照组的病人他汀治疗,这3500例心血管事件,包括近600例死亡本来是可以避免的。
论文插图显示作者如何通过文献筛选和阅读找到2000多项有关他汀对冠心病疗效的临床试验。
起初,在长达一年的时间里,作者搜索了数个中文和英文论文数据库,从7万多篇论文里,去除重复的论文;之后根据题目和摘要粗筛,去掉不符合研究要求的论文;全文阅读5000多篇,最后得到2577个符合研究需求的临床试验记录,而参与试验的病人总数更是超过25万。
在这2577项记录里,根据是否还在招募病人,作者进一步确定了2045项属于 “冗余” 的临床试验。这其中,有101486名作为对照组的病人没有得到他汀治疗,并因此发生了主要心血管事件(maces)3470例(包括559例死亡,973例新发或复发性心肌梗塞,161名中风,83例需血运重建,398名心力衰竭,1197名复发或恶化的心绞痛,以及99未指定的主要心血管事件)。
作者认为,在已经明确知道,且有指南推荐的情况下,继续做这样的 “临床研究”,剥夺了患者 “接受他汀治疗的权力,不仅浪费科研资源、对于临床诊疗毫无贡献,更严重违反临床试验伦理,对病人造成了严重的伤害。”
作者还发现,这些临床研究的论文通常以替代终点 (surrogate outcomes)作为终点,以达到缩短随访时间快速发表的目的。最终,这些论文发表在了以中文为主的期刊上,且没有任何一项在正规的临床试验注册系统登记注册过。
究竟是怎么回事?这些作者难道不知道他汀的疗效已经得到确认?
或者他们知道,却因为论文考核的压力,继续做了这样无谓的临床试验?
这些临床试验是如何得到批准,论文又如何堂而皇之的发表?
又或者,这些论文是找中介代写,由 “论文工厂” 批量伪造,那么也许相关的试验并没有开展,也没有死人?
《知识分子》第一时间联系到了该论文的作者贾元熙、温嘉珺,与他深入讨论之余,期望此事件能逐步水落石出。
《知识分子》:看到您的这个研究,我还是挺震惊的。怎么想起来做这么一个研究?
贾元熙:我们最初的目的是整理中国大陆发表的随机对照试验,通过一个横断面研究来分析这些试验的规模,特征,趋势,和存在的不足。在实施的过程中发现了大量的冗余试验,是一个突出的问题。
《知识分子》:临床试验很多,你们具体怎么选择了他汀治疗冠心病的?
贾元熙:涉及的临床试验的确很多,而且涵盖多种药物和治疗的疾病。我们没有人力物力全部整理一遍,所以计划找一个有临床意义的例子来引起大家的重视。他汀治疗冠心病的疗效早已板上钉钉,而且冠心病的患者没有及时降血脂可能会导致严重的临床后果,包括死亡。所以最终我们选择了他汀加冠心病的组合。
《知识分子》:你们花了多长时间去做这样的事情?
贾元熙:我们做了将近一年。因为试验量实在太大,每一篇都要通读全文和提取数据。以往国外类似的研究一般包括几十到几百个试验,很少见到上千的规模。
《知识分子》:我看你们选择是从08年开始发表的临床试验,也就是2007年指南发布以后一年的时间点,至少从这个时候开始,他汀治疗冠心病是有明确效果的了?
贾元熙:2008年是一个非常保守的时间点。
国际公认的发现冗余试验的方法是累积元分析(cumulative meta-analysis)。这个方法将多个试验按照发表的时间顺序整合起来。
比如2000年发表了2个试验,整合以后发现尚未确认他汀的疗效。2001年又发表了3个,这样一共有5个试验,整合以后仍未能确认他汀的疗效。2002年又发表了4个,在整合这9个试验以后发现他汀的疗效已经可以确认。
也就是说截止到2002年,这9个发表的试验提供的证据已经能够回答他汀治疗冠心病的疗效这一临床问题。2002年后发表的试验如果得出类似的结论,就很难再对证据做出额外的贡献,是没有必要的。
国内的随机对照试验在2002/2004年就足够支持累积元分析来确认他汀的疗效了(补充一句,因为国内外的试验可能会因为基因或者医疗体系的差异造成不同的结果,所以我们只考虑了国内的试验。如果同时考虑国外的试验,国内冗余的试验会更多)。
当然,这个方法也不是完美的。有一些极端的例子说明累积元分析的结论有被反转的可能,而且设计随机对照试验的研究者可能不了解或者没有时间精力进行累积元分析,即使对同一个累积元分析,不同的研究者可能也有不同的解读。
所以我们认为只依据累积元分析来判断试验是否冗余有一些激进,然后就想到了临床指南。临床指南应是循证的,基于现有的证据,由多学科的专家按照规范的流程共同制定,结论更具有公信力。
中华医学会于2007年3/4月发表了两项冠心病的指南,基于充分的证据,强烈推荐冠心病的病人使用他汀进行降血脂治疗。而且截止2007年3/4月,国内已经有接近400个随机对照试验得出了高度一致的结论,均支持他汀的疗效。所以我们认为用这个节点来界定冗余是更可信的。
在跟导师们的讨论中,我们又将时间点向后延展了一年至2008年,因为研究者需要时间来获知指南,熟悉指南的内容和停止现有的试验。所以最终我们选择了2008年3/4月作为界定冗余的节点。这个决定考虑到了各种可能性,是相当保守的。
温嘉珺:另外我们也根据不同时间点做了敏感性分析,发现即使从指南发表5年后开始计算仍有近2000例mace,包括近200例死亡可以避免。事实上从文章发表趋势也能看到2016年才达到高峰。
《知识分子》:在翻看这些研究的过程中,你情感上有什么变化或者触动么?
贾元熙:我们都是很郁闷的。我们没有想到能找到这么多冗余的试验。
温嘉珺:我们作者中有以前或者现在仍是临床医生的,看到初步结果时表示很震惊,也很痛心。
《知识分子》:你们分析的这些论文作者都来自哪里?有怎样的地域分布么?
贾元熙:我们没有统计,不过印象中大部分都是在基层医院做的,比如乡镇卫生院或者是县级医院,可能有一部分在市级医院,很少见到国家级的医院。地域分布我们没做过统计。
《知识分子》:你也知道国内有代发论文的机构,有没有可能根本这些试验本身就不存在?
贾元熙:出现这么多不应该做的试验,可能有三个原因:
一是这些试验本身确实是冗余的。
二是有些试验可能并不是真正的随机对照试验。
有些作者并不清楚真正的随机对照试验应该如何操作,仅仅把其他类型的研究描述成随机对照试验,而在发表的文章中作者提供的信息很少,我们很难判断。比如 “将100位冠心病病人随机分为两组……”,没有说明具体分组的方法。像这种情况,我们主观上无法判断作者使用的方法是真正的随机,还是伪随机或者非随机,只能从客观上认同作者的表述。国内随机对照试验的报告质量有待提高。
三就是刚才您提的论文工厂,也就是说整个试验都是伪造出来的,所有的数据都不可信。
作为科研工作者,我们默认论文的作者都是诚实的,每一篇论文都是作者辛勤工作的成果。除非有明确的证据,我们不会也不应随意怀疑论文的真实性。但是这个信念遭到了论文工厂的严重打击。有一些试验存在的问题太多,而且有固定的模式,有些可疑。不过重申一下,我们没有直接证据证明这2000多个试验里有多少是论文工厂生产出来的。
总之,这2000多个试验可能是以上这三种原因共同造成的。我们没有直接证据证明第二条和第三条,所以我们只能选择相信作者的表述,相信作者是有知识、有原则、有底线的。
《知识分子》:从头到尾你也没有去试图联系这些医院或者医生,是吧?
贾元熙:没有。首先,有些试验发表的比较早,比如13年、14年,我们不认为这些作者可以被联系到。再者,即使我们能联系到作者,我们也不认为会有人坦白文章是从论文工厂购买的。
温嘉珺:这些作者要么对病人造成了伤害,要么数据造假或者误报。考虑到这次我们发现的问题试验的规模,不管哪一种情况都应该引起重视。
《知识分子》:这些试验,病人的规模,大概是怎样的?
贾元熙:都不大,都是很小的规模,比如几十个人,很多都不到100人。多中心的大规模临床试验几乎没有。
《知识分子》:也都是分成两组,一个对照组,一个用药组?
贾元熙:绝大部分都是两组,一组接受他汀治疗,另一组没有接受。我们还见过更过分的试验设计,给一组病人多种药物的组合,比如一组同时接受他汀和低分子肝素治疗,另一组什么也没有接受。有一小部分是三组的,我们只考虑了没有使用他汀那一组。也就是说,不管这些试验各组的基础治疗是什么,组间的区别一定包括有没有接受他汀治疗。
《知识分子》:什么都不给是什么意思?连安慰剂都没给?
贾元熙:对,绝大部分都是这样。偶尔会有给安慰剂的,很少。不使用安慰剂和盲法的药物试验本身就有问题,我们称为安慰剂效应。这样的试验即使不冗余,结果也不可靠。
《知识分子》:你刚才说很多是县里面或者是乡里面,那有多少试验是经过伦理委员会批准的?
贾元熙:只有一小部分的试验提到了伦理委员会的批准。但是没有报告的也不能说就没有,也有可能是作者获得了批准,只是没有在论文里提及。
《知识分子》:你觉得这样一个临床试验做下来,要招募病人什么的,它的成本会有多大?
贾元熙:这些他汀的试验只有几十到几百个病人的规模。作者可以把自己科室里的病人随机分一下组,一组给与他汀,一组不给。他汀很多时候医保可以报销,对作者来说没什么成本。作者只需要收集和分析一下数据,把文章写出来投稿。
大规模的多中心随机对照试验是非常昂贵的,尤其在发达国家,动辄上千万甚至上亿美元,包括药物的费用(安慰剂有时候比试验药物更贵),管理协调的费用,人力费用等等。
《知识分子》:你觉得就这些临床试验,从设计各方面,最多的问题是什么?
贾元熙:问题是有很多的。我个人认为最大的问题是这些试验的论文里关键信息的缺失。我们主观上评价随机对照试验的质量非常依赖作者报告的信息。如果作者什么细节都没有报告,我们无法做出任何评价,只能望文兴叹。有时候我们可以通过联系作者获得更多的细节,但是这个方法成功率低,而且也不能保证获得的信息一定准确。
《知识分子》:我很好奇什么样的期刊接受了这些论文?
贾元熙:几乎都是中文期刊,大部分期刊的质量都不高。我们并没有发现有类似的文章发表在国内顶尖的期刊上。很多期刊的排版很差,甚至有错别字或者英文摘要翻译混乱的问题。
理论上说我们的研究完全基于发表的文章,数据是可以公开的(临床试验涉及病人的隐私,在原始数据的共享上有很多限制),但我们有顾虑。造成2000多冗余试验的原因有很多,各个层面,从国家到个人都有。如果把这些文章都公布出来,文章的作者们首当其冲。虽然他们本身是有责任的,但是让他们背负全部的责难也是不公平的。我们做这个研究的目的是揭露这种现象,引起大家的思考,改进我们的科研体系,而不是惩罚犯过错误的人。对这些杂志我们也是这个态度。
《知识分子》:但其实几个中文的论文数据库一查,也清楚了。
贾元熙:对。即使我们不公布数据,其他的研究者也可以根据我们的研究方法复制研究结果,找到这些试验。我们很详细地报告了检索和数据分析的方法。
《知识分子》:我其实还是想问这个问题,你觉得他们真的做过这样的临床试验?
贾元熙:这里面不能排除有一些是假的,但谁都不知道具体的比例有多少,到底哪一些是真的、哪一些是假的。这是中国临床试验一个大问题,就是真假难辨。
造假造成的危害也不可估量。如果有人证明了这2000多个试验都是假的,中国存在巨大规模的系统性造假,对中国临床科研的声誉将是致命的打击。以后还会有其他国家的研究者相信来自中国的研究么?国外的学术杂志都会戴着有色眼镜看我们,我们会被完全孤立。
虽然没有直接证据证明某些试验的真伪,有些统计学方法可以发现端倪,也就是间接证据,比如这个试验出现这种结果的可能性小于0.00001。遗憾的是,我们也做不到完全确认。
随机对照试验与基础研究不同。基础研究的可重复性相对高一些,如果严格按照同样的试验方案可以复制试验结果,可以用于分辨研究的真伪。随机对照试验招募的是病人,每个人都是不同的,所以每个试验都是独一无二的,即使严格按照同样的方案获得的结果也可能大相径庭。
《知识分子》:所以,你也不敢确定,到底这近600人最终是不是因为做临床试验死了?
贾元熙:从循证医学的角度上说,这2000多随机对照试验的确造成了这些不必要的死亡。但循证医学也是有假设的,比如我们假设所有的文章都是真实可靠的的,作者是负责任有底线的,除非有明确的证据证伪。如果这个假设不成立,我们研究的结论也不会成立。那样的话我们的研究反应出来的实际上是另外一个问题,也就是中国随机对照试验的真实性问题。
《知识分子》:其实只要追究的话,这些事情肯定还是会水落石出的?
贾元熙:是的,但是这个已经超出了我们的工作范畴,我们没有调查权和执法权。关于这一点,我还是要强调我们的立场。我们不想针对这些论文的作者。
我们很理解中国医生的处境,尤其是科研的压力。这些作者有责任,但不是完全的责任,单独指责他们并不公平。如果我们把这些作者公布出去,会对他们的工作和生活造成非常大的困扰,不是我们的初衷。
《知识分子》:中国医生发论文的压力确实很大。
贾元熙:比如在美国的话,有的临床工作者可以不做科研,只从事临床工作。但是国内的话大部分临床工作者都得做,为了职称,为了职务,为了收入。如果迫使很多没有兴趣没有能力或者没有时间做科研的临床工作者做科研写文章,会造成很多不良的后果。
温嘉珺:其实一个优秀的临床医生很可能对科研有自发的兴趣,我认为关键在于如何为他们匹配资源,而不是一刀切让科研成为临床的累赘。
《知识分子》:大部分 “冗余” 临床试验都是乡镇卫生院或县医院做的,这是我没想到的。
贾元熙:我们也很震惊,我们也非常怀疑这些基层医疗机构到底有没有伦理委员会。
《知识分子》:对于这些基层的医生来说,对他汀药物治疗冠心病这个事实本身是不是有认知?或者整个临床试验应该怎么设计,怎么做,可能完全都没有一个概念?
贾元熙:他们可能大部分并不熟悉科研方法,包括随机对照试验。而且临床实践能力与科研并不对等,很多人做科研是短板,治病救人却非常拿手,这就是好医生。我们不需要全部的临床工作者都从事科研,只需要一小部分有能力的、有兴趣的人同时从事临床工作和科研,或者只从事科研。临床工作者应该有选择的权力。
至于他们知不知道他汀的疗效就不太清楚了,因为我们没有在国内基层医院的工作经历。国家级的大医院肯定没问题。
《知识分子》:做临床试验其实是很专业的,需要很多专门的人,比如数据分析师等等。
贾元熙:临床试验需要很多人的通力合作,包括临床工作者,方法学专家,病人,医学后勤系统,伦理委员会,还有监管部门,是一项复杂的任务。但是国内很多随机对照试验的作者只有一个或者两个人,我们觉得有些不解。随机对照试验需要的参与者太多了,有人负责随机分组,有人负责给病人干预措施,有人负责评价结果,有人负责统计分析,有人负责后勤协助,大家分工应该是很明确的,为什么(国内一些论文)只有一个人或两个人?
《知识分子》:你可能也看到网上的一些评论了,有人说你们故意做这样的研究,是黑中国。
贾元熙:这几天我看网上有人骂我,说我就一直在黑中国,连我的课题一起骂上了(我的课题做的是关于中国随机对照试验在发表和报告方面存在的问题)。我觉得很多人误解了什么是 “黑”。“黑” 指的是污蔑,抹黑。我们的研究都基于事实和证据,并不是无端指责,所有的结论都是有数据支持的。
美国人早在上世纪80年代就发现自己国家的临床试验存在发表和报告的问题,比如发表偏倚,也就是说阳性结果的试验更容易发表,而阴性结果的试验不容易发表。基于这样选择性发表的试验整合的证据也是有偏倚的,会高估治疗措施的效果。所以他们提出了临床试验的强制注册来解决这个问题,要求试验的负责人在试验开始之前在统一的网站上注册试验。这样不管试验有没有发表,结果如何,研究人员都能从注册网站上找到这些试验。发现问题解决问题才能进步。我很不理解为什么发现问题的人一定要被指责。
《知识分子》:这些评论有没有让你们感觉到一些压力?
贾元熙:有。我们也不想这个事闹的特别大,对这些冗余论文的作者产生很大的压力。而且现在也有人开始骂我们了,我们也很无奈。不过我们很希望决策者能够看到我们的研究,能够有所行动解决这些问题,这也是我们做这个研究的初衷,希望能对中国的医学科研体系产生影响,提高中国医学科研的质量。我们也希望以后能有更多的科研工作者能提供更多的证据,为中国的改革和发展夯实基础。
温嘉珺:从评论来看,我们的文章引起了读者对最近一系列学术争议的共鸣。看到读者对科研持有的批判性思维,和正确的是非观,我们受到很大的鼓舞,更加坚定了我们未来科研的方向。
制版编辑 | 卢卡斯