论文中的研究欺诈：关于研究数据的伪造和捏造

互推小编 2023-12-27

《论语》告诉我们“已所不欲，勿施于人；与朋友交，言而有信。”如果将这句话衍生到学术界，那么最多的可能场景之一就是论文中的欺诈。有人阅读了存在欺诈的论文是一种非常不愉快的经历，但被他人指控论文存在欺诈，这种经历更糟。

虽然总体来说，论文欺诈并不算常见，但研究人员被指控伪造和/或捏造研究并非闻所未闻。不像剽窃、重复出版或一稿多投等其他恶意的学术不端行为非常明显的，数据欺诈算是一种不容易被发现的隐式行为，但危害也是极大的，最直接后果就是论文中论点不可被验证，有些读者殚精竭虑都没能重复论文中的论证过程，最后才发现原来不是自己无能。

论文欺诈最棘手的部分是发现和识别真正的欺诈活动，即使是通过严格的同行审查程序，也不能避免这种行为的发生。即使是那些备受推崇的权威科技期刊也会接受了涉嫌研究欺诈的文章；另一方面，由于论文研究成果不能或不容易被重复，一些研究人员的职业和声誉受到了虚假指控的损害。即使虚假指控被澄清，媒体对指控与无罪释放的密集报道也可能对被指控的研究人员在科学共同体造成永久性伤害。

数据欺诈：伪造和捏造

而很多学术论文的撤稿都是由于数据欺诈而产生的。比如2016年7月，三名在新加坡大学就职并受到政府机构资助的科学家被发现涉及科研造假。三人分别为南洋理工大学教授Ravi Kambadur，新加坡国立大学杨潞龄医学院助理教授MridulaSharma和南洋理工大学前研究员Sudarsanareddy Lokireddy。此案被认为是新加坡历史以来最严重的学术造假案件。东窗事发的导火索是新加坡南洋理工大学博士Sudarsanareddy Lokireddy因伪造蛋白印迹数据而致使一篇关于肌肉生长抑制素蛋白功能的文章从 Molecular Endocrinology杂志上被撤稿，同时也使他的博士学位被褫夺。而其导师Ravi Kambadur及助理教授Mridula Sharma也因此被学校解聘。

卷入了号称2016年全球十大学术丑闻（论文撤稿篇）的南洋理工三巨头，图片来源：Chew Seng Kim， harvard.edu

2019年10月，老牌的生物学SCI期刊Biochem Biophys Res Commun撤稿了2018年刊发的一篇论文，因为这篇论文貌似研究了一个不存在的基因。

论文“欺诈”是与“剽窃”号称研究行为的两大毒瘤。剽窃可能是最常见的科研不端行为。研究人员必须注意引用所有来源并仔细说明。将他人的论文当作自己的论文使用或部分引用他人的论文而不注明来源构成剽窃，即使是无意中犯下的也是不允许的。在稿件审稿期过程中，投稿的论文手稿供同行审查时，研究人员必须认识到，他们所阅读的内容不能用于自己的目的，因为在该作品发表或公开之前，它们不能被引用。

而欺诈行为同样复杂，欺诈包括伪造和捏造。与剽窃（抄袭别人的思想或言词而不说出其来源）不同的是，欺诈不是从他人的研究成果入手，而是伪造和捏造自己的研究过程而取得所谓的研究成果。任何类型的研究欺诈通常都涉及公布研究结论，甚至是数据，这些结论或是伪造的，或是捏造的。因此一般来说，有两种不同类型的研究欺诈：捏造和伪造。显然，它们是相关的。然而，它们截然不同。

伪造和捏造有什么区别？

伪造是指改变或遗漏研究结果（数据），以支持主张、假设、其他数据等。伪造本质上涉及操纵或改变数据、研究材料、过程、设备，当然还有结果。这可能包括以研究不准确的方式修改数据或结果。例如，研究人员可能正在寻找一个特定的结果，而实际的研究并不支持他们的理论。他们可能会操纵数据或分析，使研究与预期结果相匹配。

捏造是指数据收集或实验运行过程中从未出现过的数据、观察结果或特征的构建和/或添加。例如，当一名研究人员声明某个特定的实验室过程已经完成，而实际上并没有完成，或者该研究根本没有进行，则可能会发生这种情况。例如以前的研究结果被复制并作为原始研究发表。

如果说伪造是“歪曲事实”，那么捏造就是“无中生有”。

显然，数据和研究的伪造和捏造都是极其严重的不当行为。主要是因为它们可能导致不准确的科学记录，而不能反映科学真相。此外，研究欺诈欺骗了研究的重要利益相关者，如赞助机构、资助者、雇主、研究读者和公众。

总之，涉及捏造、伪造和剽窃的科学不端行为的案例破坏了在科学共同体中，科学家在他人工作基础上的信任，也侵蚀了基于科研和客观证据做出决策的信任。如果相关研究机构无法或拒绝解决这类问题，那么将会破坏科学共同体的同行们在研究过程中的完整性，和研究社区的有序自治。

如何检测伪造数据

那么作为科学打工人，在阅读论文时如何检测伪造数据呢？有时很容易识别欺诈和捏造的研究。最直接的方法就是按照论文描述的论证过程进行重复性验证。比如，论文的读者意识到，严格按照研究条件，实验室没有能力获得和论文结论一样或相近形式的特定研究结果。或者从直觉上来看，实验的数据可能被认为过于“完美”，从而导致对捏造数据的怀疑。

在研究过程，一旦被投稿期刊研究涉嫌捏造或伪造，可能存在操纵数据的行为，那么一般来说，将受到投稿目标期刊的调查，以确定其意图是否是欺诈，或者是错误或疏忽。如果调查的事实属于前者，那么期刊编辑部门有权利和义务采取各类惩罚措施。比如直接拒稿（这是没得说），公布调查结果，函告所属出版集团和其他出版商，详细说明论文的问题、作者情况以及机构信息等等。这些措施对科研人来说将是一生也洗不净的“污点”。

另外，需要注意的是，大多数出版商对论文里图像处理有着极其严格的要求，并要求研究人员在进行论文投稿时提供原始的数据。

科技论文中的图像处理必须非常谨慎，因为相当常见的捏造常与被操纵的图像有关。应该注意的是，对图像有限的增强处理通常是可以接受的，但是任何增强都必须与实际数据相关，并且无论增强后的图像结果如何，都必须准确地表示数据。如果一幅图像被显著操纵，则必须在图片标题和/或手稿的“材料和方法”部分进行披露和详细说明。

2020 年9月12日，公众号“艾普蕾iplagiarism”公布的一个论文工厂造假窝案， 11 篇来自各个单位的论文共享了一块蓝色垫布和塑料直尺，图像来自于公众号“艾普蕾”（一块共享桌布折射出肆无忌惮地抄袭造假和贪婪暴掠的国外出版商）。

所以，科技论文中“图像处理”的“底线”是研究中的图像操纵是被允许的，只要操纵是为了提高清晰度，而不会增加、移除、修改、模糊或增强数据的特征。如果不消除或模糊原始图像中的信息，对亮度、颜色平衡和对比度进行微调也是可以的。

研究人员最可怕的噩梦可能是被控欺诈。当然，无意中的错误确实会发生，不幸的是，不论是否有意，它们可能都会被定性为学术不端行为。当然，应该明确的是，诚实的错误不被视为研究不当行为。毕竟科学研究也是一个试错过程，理论发展也需要不断地在错误中发展，渴求科学研究不出现差错也是不科学的。

无论如何，为了避免任何研究欺诈的指控，一个科研工作者需要确保自己的研究是100%准确描述（也许认知会有偏差，但对既然有偏差的认知要如实描述），并且任何方法和过程都是准确表达的。确保所有可能被增强的图像都被说明并标注出来，并在提交时包含原始图像。作者在研究过程中，应该保存所有原始数据的记录，因为如果被怀疑伪造或捏造，科技期刊或其他调查机构对作者要求审查研究信息时，可以提供报告无缺陷的数据和记录，以供相关部门分析和审查。

对于审稿过程中，如果作者发现了自己论文一个意外的错误，应撤回论文或撤回论文中研究的某些步骤。

科研工作者必须格外小心，以确保他们的数据和研究不会被怀疑通过伪造和捏造进行欺诈。但是科研打工人也不需要过分顾虑，通过对所有研究、数据、分析和结论保持透明和诚实，即可做到这一点。记住，研究的目的是为了增进科学共同体的集体知识，而不是支持期望的结果，这是确保研究完整性的关键。

清代金缨的《格言联璧·持躬》中有句话为“内不欺己，外不欺人。”，这个应该是科研工作者们在撰写论文时需要注意到的。

参考文献：1.https://mp.weixin.qq.com/s/kZBqzChkB6d2kG1xwzjg3g

作者简介：晨星，男，湖北武汉人，副高职称，理学博士，高级程序员，IAMG（国际数学地球科学协会）会员，省级医学人工智能与大数据专委会委员，部级行业智库特约研究员。

更多科研干货与资讯，请关注我！