本文作者:EVEE
昨日,知名撤稿观察网站 Retraction Watch 活跃撰稿人 Elisabeth Bik 在 Twitter 和国外学术交流在线平台 PubPeer 上对一篇发表在 Nature 的论文提出质疑,称其可能存在图像重复利用的问题。
图源:Elisabeth Bik 推特
该论文研究方向与新冠疫情相关,题为 The Pathogenicity of SARS-CoV-2 in hACE2 Transgenic Mice,由中国医学科学院医学实验动物研究所秦川团队联合中国疾病预防控制中心病毒病预防控制所、中国医学科学院病原生物学研究所、中国医学科学院医学生物学研究所的团队进行研究。[1]
图源:Nature
这篇研究在半月前(4 月 24 日)被Nature接收,于 5 月 7 日正式上线,谷歌学术搜索结果显示,该论文上线不到一周,已经被引用 9 次。
谷歌学术截图
Bik 对论文的 Figure 2A 提出疑问,她认为图中蓝色方框区域或许存在图片的重复利用的情况。
图源:PubPeer
随后,推特网友还指出,论文的 Figure 1 也存在不少问题,如图 1B、1C 的各组异常值完全相同,图 1E 的异常值则完全对称。
据悉,论文作者回应称:「不好意思,这是我们在提取大量实验数据时的一点小失误,不是蓄意造假,不存在主观意愿的学术不端。我们已经修改了图片,图片的修改不会对原论文结论有任何实质性的影响,感谢各位的监督,我们会继续努力,做出更多原创性的成果。」
但截至本文发出前,论文作者暂时未在 PubPeer 平台进一步回应,个中详情仍有待进一步进展。
有图有真相?PS 改变了这一点
尽管这一事件结果仍不明确,但论文图片问题也确实是科研界的老生常谈。
常言道,无图无真相。但在科研界,有时候有图也无真相。
2016 年,Bik 针对生物医学科学出版物中图片造假的情况进行了统计研究,分析了 1995 至 2014 年间,共 20621 篇科学出版物中的图片。[2]
图源:mBio
结果显示,其中 3.8%(770 篇)的论文都存在一定的图像问题,其中一半还涉及图片修改行为。
2018 年,Science 和 Retraction Watch 联合发布的一份报告中提到,在过去10年里,学术期刊撤回的论文数量增加了 10 倍,这些论文中,约有 1.7% 存在图像问题。[3]
图源:Science
同年,一项发表在 bioRxiv 预印本平台上的研究分析了来自 4324 本生命科学领域期刊的 76 万篇开放获取论文,并从中提取出 263 万张有效的图片,发现约有 9% 的图像存在高度重复。[4]
图源:bioRxiv
随后,该团队又在重复的图片中选取了约 4000 张可疑图片进行人工核查,认为在所有论文中,约 1.5% 存在学术不端的嫌疑,0.6% 确实存在图像方面的论文造假。
根据一项统计,发表一篇生命科学领域的研究论文,背后的科学成本约为 30~50 万美元,如此多的问题论文无疑给科学界造成了巨大的损失。
图源:rajlaboratory
而这一切,都与 Photoshop 这一修图利器的诞生存在一定联系。
美国诚信研究办公室(the United States Office of Research Integrity, 简称ORI)的一项数据显示,图片造假的情况在 1989 年来一直在恶化,而标志性的两个时间点是 1990年 和 1996 年。
也就在这两年,Photoshop 发布了的 Mac版和 PC 版。
图源:thenextweb
PS 软件的出现当然没有错,但落在不诚信的科研人员手里就成了造假利器。通过 PS,研究人员可以旋转、裁剪、调整大小和调整对比度的方式篡改图片,令人难以察觉。
与图片造假的科研人员相比,期刊编辑手上的工具则不那么好用。
不同于文字查重,在过去,图片审核工作往往只能靠人力完成,费时费力,以至于多数刊物都没有这项流程。
即使是 Nature 这样的顶级学术期刊,也只会对收到的稿件进行随机抽样检查,要求作者提供未编辑的图像作为参考。[5]
图源:Nature
一个自动化的论文图片审查流程,对解决论文图片问题显得尤为重要。2018 年,Nature 在线报道了一个研究人员开发的图片查重工具。[6]
图源:Nature
来自美国纽约雪城大学的机器学习研究员 Daniel Acuna 等人开发出一套算法,能利用人工智能(AI)识别学术论文中的图像造假,对论文图片进行查重。
这套算法的出现,似乎让学术规范机构在打击学术造假的征途上又下一城,但遗憾的是,Crossref(一个由大约 10,000 个商业和学术团体出版商组成的非营利性合作组织)的执行董事 Ed Pentz 谈到,由于技术还不成熟,尚未准备在其下的出版商范围内进行图像查重。
图像处理的适度范围在哪里?
2006 年,Nature 发表的一篇编辑评论认为,对图片的「美化」是一种歪曲和失实,略有瑕疵的图像更能反映真实的世界。[7]
图源:Nature
随后,Nature 发布了图像处理简明指南供作者们参考。
图源:Nature
这份指南提到,对于某些实验、领域和技术来说,一定程度的图像处理不可避免,但最终获得的图像必须正确表示原始数据且符合道德标准。
图源:Nature
科学并不是不接受合理化的图像处理,区分图片造假的关键在于是否歪曲事实,只要坚守科研诚信,不完美的科研图像也不会影响最终得出的试验结果。
回到本次事件,科研界是开放的,允许质疑和批评。学术真理越辩越明,而有他人关注、鞭策着自己的研究内容其实是一件好事。被质疑后,研究者也要拿出切实的证据来回应、反驳。
对于进行科研的临床医生来说,则要做好原始数据的保存,多多学习《关于科研活动原始记录中常见问题或错误的诚信提醒》。
图源:科学网
毕竟,学术打假是好事,原始记录保平安。我们期待来自研究团队的正式回应。(责任编辑:gyouza)
题图来源:参考文献 1 截图
参考文献:
1. Bao, L., Deng, W., Huang, B. et al. The pathogenicity of SARS-CoV-2 in hACE2 transgenic mice. Nature (2020). https://doi.org/10.1038/s41586-020-2312-y
2. Bik, E. M., Casadevall, A., & Fang, F. C. (2016). The prevalence of inappropriate image duplication in biomedical research publications. MBio, 7(3), e00809-16.
3. Brainard, J., & You, J. (2018). What a massive database of retracted papers reveals about science publishing’s ‘death penalty’. Science, 25(1), 1-5.
4. Acuna, D. E., Brookes, P. S. & Kording, K. P. preprint at bioRxiv http://dx.doi.org/10.1101/269415 (2018).
5. Spot checks. Nat Immunol 8, 215 (2007). https://doi.org/10.1038/ni0307-215
6. Butler, D. (2018). Researchers have finally created a tool to spot duplicated images across thousands of papers. Nature, 555, 18.
7. Not picture-perfect. Nature 439, 891–892 (2006). https://doi.org/10.1038/439891b
8. https://pubpeer.com/publications/0FD2B5E6B80FF1A63F834A964A309D#
扫码下方二维码参与问卷调研
赢纯银 DNA 戒指!