
最近,围绕“耿同学”举报论文数据异常的讨论,在中文互联网引发了很大的关注。很多科研人员、医学生、博士生,甚至普通公众都参与了讨论。有人愤怒,有人怀疑,也有人开始重新审视一些问题。
我其实越来越觉得,关于学术不端的问题,真正值得讨论的,已经不只是某一个具体个案是否存在问题,而是这类事件为何会不断重复出现,以及它为什么总能触动整个科研共同体最敏感的神经。
因为所有科研人员都知道,科学研究最核心的基础,并不是论文数量,也不是影响因子,而是“数据是否可信”。
一旦这一点开始被怀疑,整个科研体系都会受到影响。
数据造假,并不只是“编造数据”那么简单
很多非科研背景的人提到“论文造假”时,第一反应往往是凭空编造实验结果。但真正做过实验的人都知道,现实中的学术不端其实远比这复杂。
在国际科研伦理定义中,学术不端通常包括三类:伪造、篡改和剽窃。其中最危险、也最常见的,往往并不是极端的“完全虚构数据”,而是那些介于灰色地带之间的操作。
例如,只保留“符合预期”的重复实验;删除离群数据点;人为调整图像对比度;重复使用显微镜图片;为了得到统计学显著性而不断更换分析方法。这些行为很多时候并不会让研究者觉得自己是在“造假”,因为他们往往会认为:“实验方向本来就是对的,我只是让结果更清晰一些。”
但问题在于,科学研究最忌讳的,恰恰就是研究者开始主动干预结果。
2009年发表于 PLOS ONE 的一项调查曾对2000多名科研人员进行匿名统计,结果发现,大约2%的研究者承认自己曾直接伪造或篡改数据,而接近三分之一的人承认存在“值得怀疑的研究行为”。(来源:Plos One)
后者其实才是科研界真正长期存在、但又最容易被忽视的问题。因为很多科研诚信问题,并不是从一次严重造假开始的,而是在一次次“应该没关系”的自我合理化中逐渐发生的。
生物医学领域,为什么总是重灾区?
如果观察近些年的撤稿案例,会发现生物医学领域始终是问题最集中的区域之一。很多人会认为这是因为该领域“不规范”,但实际上,更深层的原因在于生物医学研究本身就具有极高复杂性。
无论是Western blot、流式细胞术、动物实验,还是显微图像分析,都存在较大的技术解释空间。与此同时,这类实验的重复成本又非常高,外部研究者往往很难真正完整复现实验过程。
换句话说,一篇论文即使存在问题,也可能在几年内完全不被发现。
这也是为什么近十年来,国际期刊开始越来越重视图像审查、原始数据检查以及统计异常分析。很多出版社甚至会在正式送审前,先进行图像完整性检测,以识别是否存在重复拼接、局部复制或者异常修改。
与此同时,有研究显示,越来越多的论文撤稿,并非源于“实验失误”,而是与明确的人为操纵有关。(来源:PMC)
早期人们普遍认为,科学错误主要来自技术限制,但现在学界已经逐渐意识到,部分问题实际上来自研究过程中的主动干预。
这也是为什么“可重复性危机”这些年会成为全球科研界反复讨论的话题。因为当大量研究结果无法被重复验证时,人们开始意识到,问题可能并不仅仅出在实验技术本身。
评价体系急待优化
过去几年“论文工厂“大规模撤稿”等关键词,确实频繁出现在媒体报道中。尤其在生物医学领域,一些期刊曾一次性撤回数百篇涉及虚假同行评审、第三方代写或数据问题的论文。(来源:撤稿观察)
本质的问题在于:高强度、强指标导向的科研评价体系,本身就更容易催生学术不端。
过去二十年,中国科研产出增长速度极快。论文数量、基金规模、国际发表量都出现了爆发式增长。但与此同时,“唯论文”“唯SCI”“唯影响因子”的评价体系,也在一些阶段被过度强化。
很多科研人员其实都经历过类似压力:博士毕业要求SCI、医院晋升要求SCI、职称评审要求SCI、科研奖励与论文数量直接挂钩。在这样的环境里,论文逐渐不仅是科研成果,更变成了一种生存指标。
当“必须发论文”成为现实压力时,一部分人就会开始寻找捷径,而这也是论文工厂能够产业化的重要原因。
不过,另一个同样重要但经常被忽视的事实是,中国近年来其实也在进行非常大规模的科研诚信治理。某种意义上说,撤稿数量的增加,并不一定意味着问题变得更多,也可能意味着监督机制开始发挥作用。
科研共同体真正害怕的,其实是“信任崩塌”
很多年轻科研人员第一次看到撤稿新闻时,会下意识觉得:“这只是某篇论文的问题。”但实际上,科研界真正担心的,从来不是单篇论文,而是整套科学信任体系受到侵蚀。
科学之所以能够不断积累,本质上依赖的是一种默认前提:研究者提交的数据是真实获得的。
因为没有任何一个科学家,可以亲自重复世界上所有实验。大家之所以引用别人的研究、在前人基础上继续推进,是因为默认这些结果至少是真实观察到的。
如果这种信任开始被持续破坏,影响的就不仅仅是论文本身。
错误的数据可能进入Meta分析,影响后续实验方向;无法重复的结果可能浪费大量科研经费;而在医学领域,更严重的问题甚至可能影响临床判断和患者治疗。
这也是为什么如今越来越多期刊开始强调:
- 原始数据公开
- 开放科学
- 实验预注册
- 数据透明
- 可重复性验证
因为科学最终真正依赖的,并不是“漂亮结果”,而是结果是否经得起验证。
最后
坦率地说,现在做科研并不容易。论文压力、经费竞争、毕业要求、职业晋升,这些都是真实存在的。
但科研这个行业有一个非常特殊的地方:很多能力都可以慢慢积累,唯独信誉一旦受损,很难真正恢复。
实验失败可以重做,论文被拒可以重投,研究方向错了也可以调整。但如果被确认存在学术不端,职业声誉往往会长期受到影响。
而且今天的科研环境,已经和十年前不同了。图像查重、AI分析、PubPeer、数据审查工具正在迅速普及。很多过去可能不会暴露的问题,现在几年后依然可能被重新发现。
所以对于年轻研究者而言,比“如何尽快发论文”更重要的,也许反而是建立一套长期可信的研究习惯:规范保存原始数据、完整记录实验过程、正确理解统计学边界、接受负结果、避免为了“好看”而调整数据。
因为科学研究最终不是为了“制造正确答案”,而是为了尽可能接近真实。而真实,有时候并不会那么漂亮。
