
这些年,我发现科研圈里关于“论文自引”的讨论越来越极端。一边的人认为,只要引用了自己的论文,就是在“刷引用”;另一边的人则觉得,自己的过去工作本来就是当前研究的基础,不引用反而不专业。但真正让我意识到这个问题比想象中复杂得多,是后来我开始认真读一些文献计量学的研究之后。我慢慢发现,学界其实从来没有一个统一的“安全线”。
自引本身,并不是问题。真正的问题在于:你的自引,到底是在延续研究脉络,还是在刻意制造学术影响力的假象。而这两者,在现实科研中,边界往往没有大家想象得那么清楚。
很多年轻研究者第一次投稿时,会特别害怕引用自己的论文。他们总觉得这样会显得“不客观”,甚至担心审稿人认为自己“太自恋”。但实际上,如果你正在持续研究同一个方向,自引几乎是不可避免的。比如你前一篇论文建立了一个方法,后一篇论文利用这个方法做应用研究;或者你过去开发了数据库、算法、动物模型,那么后续工作引用之前的论文,本质上是在告诉读者:这个研究不是突然冒出来的,它建立在一条连续的研究链条之上。
从学术写作角度来说,这其实反而是一种研究成熟度的体现。有时候,如果你明明用了自己以前提出的方法,却故意不引用,审稿人甚至会质疑:“为什么不承认已有工作?”我自己后来在审稿时,也越来越少去单纯关注“有没有自引”,而更关注这些引用是否真的帮助读者理解研究背景、方法来源和研究逻辑。
学界平均自引率,其实比很多人想象得高
真正有意思的是,很多人以为“自引率超过10%就危险”,但真实世界的数据并不是这样。一项经典研究分析了多个学科的引用模式后发现,整体平均自引率约为9%,但不同领域差异非常明显:自然科学大约15%,社会科学约6%,人文学科甚至只有3%左右。也就是说,不同学科本来就不应该用同一套标准去衡量自引问题。(来源:Journal of Information Science)
后来的一些研究则进一步发现,在很多研究密集型学科里,作者自引通常会落在10%–20%的区间。美国 EPA 的一份文献计量分析甚至引用 Garfield 和 Sher 的经典观点,认为研究型学科中的作者平均会有约20%的自引,而约10%–30%的引用可能都属于作者自引。(来源:EPA)
这些数据其实说明了一个很重要的问题:自引率本身,并不能脱离研究背景单独判断。很多时候,自引率反映的并不是“学术道德”,而是你的研究领域到底有多窄。
为什么有些领域天然更容易“高自引”
这一点我后来感受越来越明显。比如做冷门疾病研究的人、研究特殊材料体系的人、长期维护一个队列的人,或者开发某种非常小众算法的人,他们很可能本来就是这个方向最核心的研究者之一。在这种情况下,他过去的论文天然会成为当前研究的重要基础。有些方向,全世界可能就几十个团队,那你不引用自己,还能引用谁?
Clarivate 曾经分析过 5876 本 SCI 期刊的自引情况,结果发现大多数期刊的自引率低于20%,平均值约为12.41%,中位数约为9.04%。更重要的是,他们特别强调,高自引率很多时候并不意味着“操纵”,而可能只是因为研究主题本身高度专门化。(来源:Clarivate)
这也是为什么我越来越觉得,讨论自引时,不能脱离具体学科和研究场景。一个做热门方向、每年几万篇论文的领域,和一个全球只有少数团队研究的小方向,本来就不可能用同样的标准去衡量。
真正危险的,其实是“策略性自引”
但另一方面,我也确实见过一些明显“不自然”的自引。比如无论写什么主题,都大量引用自己的论文;或者明明和当前研究关系不大,却依然硬塞进参考文献里;甚至有些作者会在引言部分堆砌大量自己的旧文章。这种情况,其实已经超出了“研究连续性”的范畴,更接近于一种引用操纵。
近年来,Clarivate 每年都会因为异常自引而暂停部分期刊的影响因子。而 COPE也明确把“过度自引”视为一种需要警惕的出版伦理问题。
我自己越来越认同文献计量学界现在的一种观点:完全没有自引,和极端自引,其实都不正常。因为真正长期做研究的人,不可能和自己的过去工作彻底切断联系;但如果你的学术影响力主要靠自己引用自己来维持,那也说明外部学界可能并没有真正接受你的研究。
比“比例”更重要的,其实是“必要性”
如果让我现在给一个比较现实的经验判断,我会觉得,在大多数正常科研场景下,5%–15% 的作者自引其实非常常见;到了20%左右,在很多领域仍然可以接受;但如果长期稳定超过30%,就需要开始警惕是否存在刻意堆砌;而超过40%–50%,通常已经会引起文献计量学上的关注。
不过我现在越来越不喜欢只看数字。因为真正重要的问题其实是:这些自引,到底是不是“必要”的。如果删掉这些自引,文章逻辑会不会断?读者还能不能理解研究背景、方法来源和理论脉络?如果答案是“不能”,那这些引用显然是有价值的。但如果删掉之后对论文表达完全没有影响,只是少了几个引用数,那它大概率就属于“装饰性引用”。
而审稿人其实通常是能看出来的。
切勿陷入“自引焦虑”
很有趣的是,我发现最容易陷入“自引焦虑”的,往往是博士生和年轻 PI。他们会特别担心:“我引用自己,会不会显得不够客观?”但真正成熟的科研共同体,其实并不会把“合理自引”等同于“不严谨”。相反,一个长期稳定推进某条研究路线的人,本来就应该形成连续的研究链条和引用网络。
真正危险的,从来不是你引用了自己。
