预印本平台打开了“潘多拉魔盒”,ai能否弥补缺陷?
当学术发表中大量“水文”出现时,ai或许能够帮我们甄别论文的好坏,图片来自sciencemag
撰文 | 秦芳菲
责编 | 叶水送
新冠疫情让大部分研究者的科研工作停滞,但也带来了大量的关于新冠病毒的研究论文。据《自然》杂志报道,有关新冠病毒的研究文章,以每两周翻一倍的速度在快速增加,且没有任何减缓的趋势。
近日,《经济学人》的一篇文章则称,有关新冠病毒的论文喷涌,得益于预印本平台 “放水”。
此次新冠疫情,预印本平台biorxiv 和 medrxiv发表的新冠病毒研究文章数量最多,总共大约3000篇,它们的宗旨是:“研究结果尽快发表,这对政策引导和加速科研成果会有帮助,进而影响疫苗以及治疗方案的开发”。
新冠病毒相关预印版文章,图片截自nature.com
然而,预印本论文未经同行评审,就发表在可公开访问的服务器上,这使得读者很难判定论文的质量,而且预印本参差不齐的质量可能会带来大量问题,尽管它们最终发表时,通过同行评议可能会做出重大修改,但预印本论文对社会决策的严重影响可能已经产生。
上周,美国东北大学的计算科学家albert-lászló barabási提交给biorxiv的一篇文章遭到了拒稿。预印本biorxiv和 medrxiv创建者之一richard sever[1] 表示,他们发现有些文章质量有问题,尤其是一些计算模型模拟的文章,目前团队[2] 决定禁止此类文章发表。“我们不可能总是要验证这些药物的副作用,也不可能经过审阅评估出来到底他们的计算模型有没有道理。”sever表示。
barabási表示,他能理解这种应对措施是为了确保患者的[1] 安全,但并不同意这种k8凯发百家乐的解决方案,“很明确[2] ,新冠病毒营造了一个分享型的科学环境”,预印本平台的目标就是‘我们决定有趣的东西是什么,而不是审阅人’”。最终,他们还是把论文发在了另一个预印本平台——arxiv上。
不同的预印本平台有不同的审查措施和质量要求,如biorxiv 和medrxiv都有两步审查措施:
1)工作人员检测查重和完整度;
2)由科学界的志愿者或者学科专家检查非科学的内容,健康和生物安全风险——biorxiv主要找pi,在48小时内完成审查;medrxiv主要找健康专家,需要4~5天。
不过,他们[1] 强调文章的审查主要是看是否会带来危害,而不是评估文章质量,他们主要看论文的结论会否引发灾难性的社会影响,会不会出现类似:“疫苗会引起自闭症”、“吸烟不会引起癌症”等[2] 的结论。言下之意,这种明显有缺陷的预印本会被拒收。但在疫情期间,这种策略遭遇了很大的挑战,文章越来越多,出现的问题和冲突也越来越多。
图 预印平台快速的预审过程加快了新冠病毒研究文章的发表,图片来自nature.com
对于这些新的问题,目前正有一些尝试性的新的k8凯发百家乐的解决方案。
例如,[1] 最近《自然》杂志还报道了国外一家名为“scite.ai”的人工智能平台,可自动显示这些文章是被后续的研究支持,还是否定。
图 “scite.ai”的人工智能平台显示:支持,中立和反对
与传统引用工具不同,scite可显示出有多少篇研究与此研究结论一致,多少篇冲突、多少次被提及等。scite现在每天有1000用户访问,尽管访问数量还不大,但也许不失为一种潜在的k8凯发百家乐的解决方案。
图 scite.ai用不同的颜色显示新冠肺炎研究中,支持、中立与反对的研究的引用情况
不过,《自然》杂志的文章也指出了这项新技术的一些不足:scite应用范围还相对有限,它现在仅分析了1600万篇全文,但是web of science拥有超过5300万文章,超过1亿篇文章使用crossref注册。很多文章需要付费,因此scite并不能用。
对此,scite创始人josh nicholson表示,获得研究论文的全文权限是个挑战,现在他们正在考虑扩大论文范围,scite正在与各大出版商沟通合作事宜,“毕竟目前只有我们能够这么做,但我们确实需要有全文权限”。