
在计算机、深度学习等方法快速迭代的领域里,很多作者在投稿后可能会收到这样一句评价:“The proposed method does not achieve state-of-the-art performance.” 这句话之所以令人沮丧,并不是因为它在技术上一定错误,而是因为它常常被作者理解为一种“终局判断”——仿佛只要不是 SOTA,这项工作就失去了发表价值。
事实上,从大量真实的评审案例来看,“不是 SOTA”更多是一种评价视角的提示,而不是对研究本身的否定。真正需要作者思考的,并不是如何证明自己勉强接近榜单顶端,而是:审稿人为什么会在你的论文中使用“SOTA”作为主要评判标准。
在同行评审中,SOTA 并不只是一个数值概念。它往往承载着审稿人对论文定位的整体判断。如果审稿人认为你提交的是一篇“性能驱动型”的方法论文,那么他自然会用最新、最强的方法作为参照系;一旦你的结果未能超过这些方法,“not SOTA”就成为一种非常直接的表达方式。这种评价方式,在快节奏更新的领域中尤为常见,但它并不总是公平,也并不总是与你的研究初衷相匹配。
时间差导致审视角度不同
一个在实际评审中反复出现、却很少被系统讨论的情形是:作者的研究是在相对稳定、主流的基线上展开的,而审稿人却已经将评估标准无意识地推向了更新一代的方法。很多科研人在 2022 或 2023 年确定课题方向时,所选用的基线方法在当时完全合理,也被领域广泛接受。但当论文真正进入审稿阶段时,领域内已经出现了 2024 或 2025 年的新模型,它们在性能上显然更强。
如果此时负责评审的是一位高度“近线”的同行,甚至是这些新方法的直接参与者,那么他很容易基于最新文献体系来审视你的工作,并得出“性能不如现有方法”的结论。从逻辑上看,这样的比较并非完全错误;但从科研实践的角度看,它忽略了研究工作的时间背景和启动条件。你的工作并不是在与未来的方法竞争,而是在既定技术框架下提出新的设计或思路。
理解这一点,并不是为了否定审稿人的专业性,而是为了帮助作者在回应中重新建立语境。如果你不主动澄清研究的出发点和目标,审稿人就会默认你在参与一场并非你本意的 SOTA 竞赛。
谨慎回应,别闹情绪
在面对这类审稿意见时,很多作者的第一反应是解释甚至辩解,试图强调“我们的性能也并不差”。但在实际评审沟通中,这种策略往往效果有限。相反,更成熟、也更有效的回应,通常从承认对方指出方法的优秀之处开始。
如果审稿人提到的工作在性能上确实更强,直接承认这一点,并表达对其方法设计的认可,反而有助于建立理性、专业的交流氛围。尤其是在同行评审中,审稿人提到的方法,很可能正是其本人或其团队的成果。在这种情况下,回避或轻描淡写,容易被解读为不理解领域进展;而清楚地引用并说明“该方法在性能上具有显著优势,我们也将在后续工作中考虑其设计思想”,是一种非常稳妥的表达。
这种承认并不意味着你在放弃自己的工作价值,而是在向审稿人传递一个重要信号:你清楚地理解当前领域的技术格局,也清楚自己这项研究在其中所处的位置。
问题的关键,从来不是你是不是 SOTA
真正值得作者思考的,并不是“我有没有跑赢最强模型”,而是一个更根本的问题:你是否在论文中,把自己的工作描述成了一项以性能突破为核心目标的研究。如果在摘要和引言中反复使用“outperforms existing methods”“achieves superior performance”之类的表述,那么审稿人自然会用 SOTA 的标准来评估你;一旦结果未能满足这一预期,负面评价几乎是必然的。
但大量研究工作的真实价值,并不体现在榜单位置上,而在于它们是否提出了新的问题视角、新的结构设计,或为某一具体问题提供了不同于既有方法的解决路径。如果你的工作属于这一类型,那么在回应审稿意见时,最重要的一步并不是争论性能差距,而是明确指出:这项研究的核心贡献并非追求绝对性能最优,而是方法层面的创新与思路层面的拓展。一旦研究目标被重新界定,SOTA 就不再是唯一的评判尺度。
当性能不是最优时,评价维度本身需要被扩展
在实际科研和应用中,性能指标只是评价方法的一个维度,却常常被过度放大。很多方法在主指标上略逊一筹,但在模型规模、参数量、计算复杂度、推理速度或资源消耗方面具有明显优势。这些因素在真实部署环境中,往往比微小的性能提升更具现实意义。
如果论文中尚未系统呈现这些差异,那么审稿人的“SOTA”评论,反而提供了一个重新组织论证的契机。通过补充实验或更清晰的分析,你可以向审稿人展示:在特定应用场景或资源约束条件下,你的方法并不是“次优选择”,而是更合理、更可行的方案。这种论证并不是转移焦点,而是让评价回到多维度、真实世界的问题背景中。
让你的创新站到更强的基线上
如果你提出的创新模块本身具有较好的通用性,那么还有一种回应方式,往往具有很强的说服力:将该模块迁移到审稿人提到的更强基线上进行验证。哪怕只是一个简化实验,也足以用来回答一个核心问题——你的设计是否具有泛化能力。
这样的实验并不是为了立刻追平或超越 SOTA,而是为了证明你的方法并非依赖旧基线的偶然改进,而是一种可以被更先进模型吸收和利用的设计思想。对很多审稿人而言,这类证据往往比单纯的性能比较更具说服力,因为它直接指向了研究工作的长期价值。
最后
包括计算机科学相关领域,如果你仔细回顾发展史你就会发现,许多后来被广泛引用、深刻影响领域发展的工作,在发表当时并不是 SOTA。它们之所以重要,并不是因为赢得了当年的性能竞赛,而是因为改变了后来人思考问题的方式。
当审稿人指出“结果不是 SOTA”时,与其把它视为终结性的否定,不如将其理解为一种提醒:你需要更清楚地界定自己的研究位置,并帮助审稿人理解这项工作的真正价值。能够冷静、清晰、专业地完成这一点,本身就是科研训练中极为重要的一部分。
回复模板
注意,该模板是基于假设审稿人的核心意见是:The proposed method does not achieve state-of-the-art performance compared with recent methods.
正文:
We thank the reviewer for the insightful comment and for pointing out the recent method(s) that achieve stronger performance on this task. We fully acknowledge that these approaches indeed represent more advanced results in terms of absolute performance on the benchmark.
We would like to clarify that the primary goal of our work is not to pursue state-of-the-art performance, but to explore a new design perspective for addressing [briefly restate the specific problem]. Our main contribution lies in the proposed [module / framework / mechanism], which introduces a different modeling strategy compared to existing approaches, rather than optimizing performance on a specific benchmark.
While our method does not outperform the most recent models in terms of [main metric], it demonstrates competitive performance under the same experimental settings and shows clear advantages in terms of [e.g., model complexity, parameter efficiency, computational cost, inference speed, robustness, etc.]. We believe these properties are particularly relevant for [specific scenarios, such as resource-constrained or real-world applications].
To further address the reviewer’s concern, we have added [additional analysis / discussion / experiments] in the revised manuscript (see Section X), which provide a more comprehensive comparison and better highlight the strengths and limitations of our approach. We have also revised the introduction and conclusion to more clearly position our work as a methodological contribution rather than a performance-driven study.
We appreciate the reviewer’s suggestion and believe that this clarification improves the overall presentation and positioning of the paper.
