“论文数据造假”再成热点，不只是“编造数据”那么简单

文章
写作
能见度
伦理

最近，围绕“耿同学”举报论文数据异常的讨论，在中文互联网引发了很大的关注。很多科研人员、医学生、博士生，甚至普通公众都参与了讨论。有人愤怒，有人怀疑，也有人开始重新审视一些问题。

更新于2026年5月12日

我其实越来越觉得，关于学术不端的问题，真正值得讨论的，已经不只是某一个具体个案是否存在问题，而是这类事件为何会不断重复出现，以及它为什么总能触动整个科研共同体最敏感的神经。

因为所有科研人员都知道，科学研究最核心的基础，并不是论文数量，也不是影响因子，而是“数据是否可信”。

一旦这一点开始被怀疑，整个科研体系都会受到影响。

数据造假，并不只是“编造数据”那么简单

很多非科研背景的人提到“论文造假”时，第一反应往往是凭空编造实验结果。但真正做过实验的人都知道，现实中的学术不端其实远比这复杂。

在国际科研伦理定义中，学术不端通常包括三类：伪造、篡改和剽窃。其中最危险、也最常见的，往往并不是极端的“完全虚构数据”，而是那些介于灰色地带之间的操作。

例如，只保留“符合预期”的重复实验；删除离群数据点；人为调整图像对比度；重复使用显微镜图片；为了得到统计学显著性而不断更换分析方法。这些行为很多时候并不会让研究者觉得自己是在“造假”，因为他们往往会认为：“实验方向本来就是对的，我只是让结果更清晰一些。”

但问题在于，科学研究最忌讳的，恰恰就是研究者开始主动干预结果。

2009年发表于 PLOS ONE 的一项调查曾对2000多名科研人员进行匿名统计，结果发现，大约2%的研究者承认自己曾直接伪造或篡改数据，而接近三分之一的人承认存在“值得怀疑的研究行为”。（来源：Plos One）

后者其实才是科研界真正长期存在、但又最容易被忽视的问题。因为很多科研诚信问题，并不是从一次严重造假开始的，而是在一次次“应该没关系”的自我合理化中逐渐发生的。

生物医学领域，为什么总是重灾区？

如果观察近些年的撤稿案例，会发现生物医学领域始终是问题最集中的区域之一。很多人会认为这是因为该领域“不规范”，但实际上，更深层的原因在于生物医学研究本身就具有极高复杂性。

无论是Western blot、流式细胞术、动物实验，还是显微图像分析，都存在较大的技术解释空间。与此同时，这类实验的重复成本又非常高，外部研究者往往很难真正完整复现实验过程。

换句话说，一篇论文即使存在问题，也可能在几年内完全不被发现。

这也是为什么近十年来，国际期刊开始越来越重视图像审查、原始数据检查以及统计异常分析。很多出版社甚至会在正式送审前，先进行图像完整性检测，以识别是否存在重复拼接、局部复制或者异常修改。

与此同时，有研究显示，越来越多的论文撤稿，并非源于“实验失误”，而是与明确的人为操纵有关。（来源：PMC）

早期人们普遍认为，科学错误主要来自技术限制，但现在学界已经逐渐意识到，部分问题实际上来自研究过程中的主动干预。

这也是为什么“可重复性危机”这些年会成为全球科研界反复讨论的话题。因为当大量研究结果无法被重复验证时，人们开始意识到，问题可能并不仅仅出在实验技术本身。

评价体系急待优化

过去几年“论文工厂“大规模撤稿”等关键词，确实频繁出现在媒体报道中。尤其在生物医学领域，一些期刊曾一次性撤回数百篇涉及虚假同行评审、第三方代写或数据问题的论文。(来源：撤稿观察)

本质的问题在于：高强度、强指标导向的科研评价体系，本身就更容易催生学术不端。

过去二十年，中国科研产出增长速度极快。论文数量、基金规模、国际发表量都出现了爆发式增长。但与此同时，“唯论文”“唯SCI”“唯影响因子”的评价体系，也在一些阶段被过度强化。

很多科研人员其实都经历过类似压力：博士毕业要求SCI、医院晋升要求SCI、职称评审要求SCI、科研奖励与论文数量直接挂钩。在这样的环境里，论文逐渐不仅是科研成果，更变成了一种生存指标。

当“必须发论文”成为现实压力时，一部分人就会开始寻找捷径，而这也是论文工厂能够产业化的重要原因。

不过，另一个同样重要但经常被忽视的事实是，中国近年来其实也在进行非常大规模的科研诚信治理。某种意义上说，撤稿数量的增加，并不一定意味着问题变得更多，也可能意味着监督机制开始发挥作用。

科研共同体真正害怕的，其实是“信任崩塌”

很多年轻科研人员第一次看到撤稿新闻时，会下意识觉得：“这只是某篇论文的问题。”但实际上，科研界真正担心的，从来不是单篇论文，而是整套科学信任体系受到侵蚀。

科学之所以能够不断积累，本质上依赖的是一种默认前提：研究者提交的数据是真实获得的。

因为没有任何一个科学家，可以亲自重复世界上所有实验。大家之所以引用别人的研究、在前人基础上继续推进，是因为默认这些结果至少是真实观察到的。

如果这种信任开始被持续破坏，影响的就不仅仅是论文本身。

错误的数据可能进入Meta分析，影响后续实验方向；无法重复的结果可能浪费大量科研经费；而在医学领域，更严重的问题甚至可能影响临床判断和患者治疗。

这也是为什么如今越来越多期刊开始强调：

原始数据公开
开放科学
实验预注册
数据透明
可重复性验证

因为科学最终真正依赖的，并不是“漂亮结果”，而是结果是否经得起验证。

最后

坦率地说，现在做科研并不容易。论文压力、经费竞争、毕业要求、职业晋升，这些都是真实存在的。

但科研这个行业有一个非常特殊的地方：很多能力都可以慢慢积累，唯独信誉一旦受损，很难真正恢复。

实验失败可以重做，论文被拒可以重投，研究方向错了也可以调整。但如果被确认存在学术不端，职业声誉往往会长期受到影响。

而且今天的科研环境，已经和十年前不同了。图像查重、AI分析、PubPeer、数据审查工具正在迅速普及。很多过去可能不会暴露的问题，现在几年后依然可能被重新发现。

所以对于年轻研究者而言，比“如何尽快发论文”更重要的，也许反而是建立一套长期可信的研究习惯：规范保存原始数据、完整记录实验过程、正确理解统计学边界、接受负结果、避免为了“好看”而调整数据。

因为科学研究最终不是为了“制造正确答案”，而是为了尽可能接近真实。而真实，有时候并不会那么漂亮。

撰稿人

AJE 美国期刊专家

标签

论文数据

订阅邮件

订阅我们的邮箱后可提前获得AJE作者资源的文章，享受AJE服务的折扣，以及更多的优惠

AJE提供一系列科研支持服务，助力论文成功发表！

AJE为您提供英文论文润色、学术论文翻译、期刊选择、文稿排版等一系列学术服务，我们希望可以帮助您充分发挥您的研究潜力，助力您成功将论文发布在国际期刊上。