Nature重磅:起底“论文工厂”,与学术欺诈作斗争

今日,Nature 杂志官网将一篇题为《打击制造伪科学的 “论文工厂”》(The fight against fake-paper factories that churn out sham science)的长文挂在了头版。
文章称,一些出版商发现了大规模的学术造假行为,且采取了多样化的应对措施以打击这种工业化的欺骗行为。Nature 杂志还用了大量的篇幅和笔墨来分析研究有关 “论文工厂” 的问题 —— 以及编辑们的应对方案。
图片
(来源:Nature)
何为 “论文工厂”?
2020 年初,Royal Society of Chemistry Advance (《皇家化学协会》,下文称 RSC) 期刊的执行主编 Laura Fisher 注意到,提交给该杂志的研究论文之间有着可疑的共通之处,一些来自不同研究机构、不同作者的论文却呈现着相似的图表和标题。
经过历时一年的调查,2021 年 1 月,Fisher 从期刊上撤回了 68 篇涉嫌学术造假的论文,另外两名 RSC 的编辑也因为同样的怀疑撤回了 1 篇论文。目前,15 位署名作者正在因此接受调查。RSC在其发表的官方声明中强调,作为这些期刊的出版商,RSC 也是这项“系统性研究造假”骗局中的受害者。
事实上,RSC 并不是唯一一家受到这项大规模学术造假事件影响的出版商,Nature 杂志的统计显示,自去年 1 月以来,各大期刊已经撤回了至少 370 篇公开与造纸厂有关联的论文,预计还会有更多的撤回。
在大量被撤回的文献背后,是令人咋舌的猜想:在隐秘的角落里,存在一种 “论文工厂”,根据订单大量伪造科研手稿。换言之,一些科学家正在从从第三方公司购买论文,以帮助他们的科研生涯,获得晋升。
而这些论文中所描述的实验是否真的进行过,并没有人知晓。有些 “论文工厂” 可能会有实验室作出真实的实验结果或图像,但这些图像往往可能被卖给多个作者,以代表不同的实验。因此,这些成品论文中所包含的数据往往是伪造或虚构的。
如何甄别 “论文工厂” 产物?
去年,来自期刊外部的调查者们加入到了对此类学术造假现象的大规模排查中。这些外部侦探们通过收集论文之间的相似性,标记了大量疑似来自 “论文工厂” 的文献,以便进一步调查和清理。Nature 杂志统计,迄今为止被这些“外部侦探”们列为“可疑”的论文总数超过 1300 篇。
这并非论文造假案例第一次进入公众视野。
图片
2018 年,德国海德堡 FEBS Press 出版社的形象完整性分析师 Jana Christopher 就发表了论文《科学图像的系统性加工》(Systematic fabrication of scientific images revealed),描述了这样一个有关 “论文工厂” 的细节。
Christopher 指出,在一组提交给不同期刊的 12 份手稿中,来自不同机构的不同作者都使用了 Western blot 技术。而这些实验图像都具有非常规则的间隔、光滑的轮廓、特别的形状等,创作者仅仅是将文字和图像稍加改动,使论文看起来略有不同。
期刊编辑们对这个问题尤为重视。2020 年 9 月,伦敦的出版伦理委员会 (COPE) 举办了一场专题研讨会,讨论关于 “论文工厂系统性地操纵出版过程” 这一现象。
图片
图 | Elisabeth Bik(来源:Nature)
论坛的特约演讲者 Elisabeth Bik 是一名来自美国加州的学术诚信分(打)析(假)师(人),曾任斯坦福大学助理研究员。
2020 年 1 月,Bik 与几名图像分析师共同发布了一份列有 412 篇论文的清单,在些论文中,Bik 的团队发现,其中免疫印迹实验(Westernblot)条带都是非常有规律的间隔,呈哑铃状或蝌蚪状,没有任何常规实验中会出现的的污迹,所有的条带都被放置在相似的背景上。这表明,这些实验数据是从其他来源复制粘贴的,或者是电脑生成的。
因此,Bik 和他的团队怀疑这些文章都是由同一个 “论文工厂” 系统性地产出的。
图片
该团队选择将这个可疑清单实名公之于众,随之而来的是一连串的媒体头条。令人心痛的是,其中有半数论文的作者来自中国院校的附属医院,包括:
济宁市第一人民医院: 101 篇
吉林大学中日联谊医院: 59 篇
青岛大学附属医院: 23 篇
临沂市中心医院: 16 篇
郑州大学第一附属医院: 16 篇
济宁医学院附属医院: 12 篇
而在 Nature 的这篇文章中,Bik 又指出,“自去年年初以来,中国医院又有 197 篇论文被撤回。”
图片
图 | 自 2020 年 1 月以来,独立调查人员和期刊已经标记出超过 1000 份可能与 “论文工厂” 有关的论文(来源:Nature)
除了对实验图像进行甄别外,发现错误的实验步骤也是论文打假的手段之一。Jennifer Byrne 是澳大利亚悉尼大学的一名分子肿瘤学研究员。她发现,一些声称要研究可能与癌症有关的未被研究的基因区域的生物医学论文中,列出了不正确的实验细节,包括错误的核苷酸序列和试剂等。因此,这些论文中所描述的实验结果根本不可能发生。但是,尽管这类论文的确通过改变研究中涉及的癌症类型或基因而对实验进行了修改,研究员很难论证它们是否来自 “论文工厂”。
2021 年 2 月,Naunyn-Schmiedeberg's Archives of Pharmacology 杂志声明其受到了 “论文工厂” 的波及。该杂志发表的社论中列举了 “论文工厂” 文章的重要特征,如:非学术电子邮件地址(Nature 指出,这在中国科学家的投稿中很常见)、作者在被询问时无法提供原始数据,以及糟糕的英语。本月,该杂志正在撤回 10 项研究,并称约有 5% 的投稿都来自 “论文工厂”。
“论文工厂” 产出的 “僵尸论文”
这样大规模流水线式的论文造假对整个科研学术届是毁灭性的,“因为它让科学和科学家看起来不可靠,”Christopher 说。
即使期刊编辑们仔细辨别并拒绝他们怀疑是伪造的手稿,也无法彻底扼杀虚假论文。毕竟作者们可以将这些伪造的手稿同时提交给多个期刊。
Christopher 就曾发现自己驳回的文章被刊登在《细胞生理学与生物化学》(Cellular Physiology and Biochemistry)杂志上,尽管她反复警告该杂志,这篇论文很可能是捏造的。
图片
许多期刊也已经改变了他们的编辑审查程序,以反击这样有组织的学术欺诈行为。例如,Elsevier 出版商旗下的一些期刊已经改变了征稿范围,以避开 “论文工厂” 代工论文泛滥的主题领域。还有出版商表示,他们的新政策会要求作者在提交文章时提供 Westernblot 的原始数据。但编辑们意识到,即使是原始数据也可能被伪造,尤其是当 “论文工厂” 发现提出这样要求的编辑越来越多时。
Byrne 还提出了另一种顾虑。她担心,哪怕仅仅是发表在期刊上,那些将基因与特定癌症联系起来的虚假研究,也可能会让后人在一个根本不存在的研究基础上深入挖掘。“人们死于癌症 —— 这不是游戏,” 她补充道,“文献应当被用来描述真实发生的工作。”
“论文工厂” 为中国学术界蒙上一层阴影
国家声誉需要每个人来捍卫,若是中国科研界的名声泥沙俱下,作为个体也很难独善其身。
2017 年,《肿瘤生物学》杂志曝出 107 篇中国论文被撤下的丑闻,在 2020 年 9 月的 COPE 整治学术造假论坛上,Bik 列举了其他需要编辑注意的危险信号,其中包括 “来自中国医院的论文” 和电子邮件地址似乎与任何作者姓名都没有联系的手稿。
而负责世界上最大的科学出版商爱思唯尔 (Elsevier) 出版服务的 Catriona Fennell 则指出,出版物中有组织性的欺诈问题其实并不新鲜,也绝不仅仅局限于中国。“我们已经从其他几个国家看到了工业化作弊的证据,包括印度、伊朗和俄罗斯等,”Fennel 去年告诉《自然》杂志。其他报道也提到了有关伊朗和俄罗斯 “论文工厂” 的案例。
然而,考虑到发表外国期刊论文的官方语言为英语,在中美关系日渐焦灼的今天,中国的科研人员们要获得世界范围的认可本就难上加难,这些被调查为 “论文工厂” 流水线化代工的行为无疑是为整个中国学术界蒙上了一层阴影
图片
图 | 由中国医院作者撰写的论文数量近年来在大幅增加(来源:Nature)
大量的问题论文导致一些期刊编辑开始抱有怀疑态度地看待从中国医院研究人员那里得到的投稿。《分子疗法》(Molecular Therapy) 杂志在 2021 年 2 月的一篇社论中写道:“这正在严重破坏中国科研论文可信性,并越来越让人怀疑该地区科学研究的切实性。”《欧洲药理学杂志》(European Journal of Pharmacology) 主编 Frank Redegeld 表示:“它们正在削弱我们对其他来自中国团队的手稿的信心。”
令人欣慰的是,2020 年 8 月,中国宣布将采取措施打击科研不端行为,其中就包括遏制代表他人伪造数据的独立承包商。中国学者对 Nature 指出,相信中国针对科研造假行为的措施正开始奏效。正如复旦大学研究科学政策的 Li Tang 直言,中国 “论文工厂” 及产物在未来会减少,但是论文代工这个问题并不仅局限于中国的科学研究。