谷歌推出PaperBanana：可自动生成NeurIPS级别的论文插图

文章
写作
出版
研究过程

PaperBanana 并不是一个“给你一句话就出图”的通用绘图工具，而是一项研究型工作：作者提出了一个多智能体框架，系统性地探索——学术插图是否可以被自动化生成，并且达到论文可接受的质量水平。

更新于2026年2月3日

如果你认真写过论文，大概率都会对一件事有共鸣：论文插图，真的很耗人。模块怎么分？箭头该不该画？颜色会不会太花？什么配色？是不是又要为了一个示意图在 PowerPoint、Illustrator 和 LaTeX 之间来回折腾好几轮。

前阵子，Google推出了Nano Banana Pro，着实让科研人振奋了一次，不过，我想很多人实践过都知道，这一个图像生成工具，在生成学术插图上，很多时候会出错，出图率不是很高。

想看Nano Banana Pro生成论文插图教程的小伙伴可以看看我们之前的热门文章：实用指南！用Nano Banana Pro制作论文插图，附Prompt

也正因为像Nano Banana Pro这样，它不是专门为学术插图而训练的，所以准确性不高也在所难免，那有没有一款像Rubriq那样专门针对学术论文润色的专用工具呢？

最近我看到的一项很有吸引力的工作——PaperBanana，正是试图从这个非常“科研人日常”的问题入手，探索：学术论文里的插图，是否可以被系统性地自动生成？

PaperBanana 是什么？

我看到研究团队在arxiv上发布了预印本，详细的看了一遍PaperBanana的原理。

在正式介绍之前，有必要先泼一盆冷水。PaperBanana 并不是一个面向普通科研作者、即开即用的插图生成工具。你不能指望输入一段方法描述，就立刻得到一张可以直接投稿用的精美 Figure。

更准确地说，PaperBanana 是一项研究型工作。作者真正关心的，不是“画得好不好看”，而是：

能不能把论文插图这件事，拆解成一套可建模、可评估的流程
哪些环节适合交给模型，哪些环节必须由作者把关
插图生成的“质量”，是否可以被相对客观地评价

这一点很重要。因为只有当“画插图”被当作一个严肃的研究问题，而不是演示 Demo，我们后续讨论自动化、可靠性、可复现性才有意义。

它试图解决的，其实是一个结构化问题

在很多人的直觉里，论文插图是一件“偏艺术”的事情，很难标准化。但 PaperBanana 的作者给出了另一种拆解方式。

在他们的设想中，一张论文插图通常包含三个核心层次：

语义层：论文里真正想表达的科学内容
（例如：模型结构、流程顺序、模块关系）
结构层：这些内容如何被组织成图
（模块、箭头、层级、布局）
视觉层：最终呈现方式
（形状、颜色、排版风格）

PaperBanana 的工作重点，主要放在前两层，而不是一味追求“画得像人一样好看”。换句话说，它更关心的是：图有没有把论文说清楚，而不是漂不漂亮。

作者在X上分享的，利用PaperBanana优化润色人工绘制的图表对比

多智能体（Multi-agent）

在技术实现上，PaperBanana 使用了一个多智能体协作（multi-agent）的框架。

简单说，它不是让一个模型“从头画到尾”，而是把任务拆给不同角色，例如：

有的 agent 负责理解论文文本，抽取关键信息
有的 agent 负责规划图的整体结构
有的 agent 再将结构转化为可视化描述或代码

这种设计思路，其实和很多科研作者的真实工作流程是接近的：我们写论文时，本来也不是一步到位画出最终插图，而是反复在“想清楚—画草图—修改结构”之间迭代。从研究角度看，这种分工式设计，也更有利于后续分析每个环节的失败原因。

PaperBanana生成的方法图和统计图示例，展示了自动生成学术插图的潜力

作者是如何“评估”插图生成效果的？

插图生成最棘手的问题之一在于：什么叫“画得好”？PaperBanana 并没有简单用“好不好看”来评价结果，而是尝试引入多维度评估，例如：

插图是否覆盖了论文中的关键信息
结构是否合理、逻辑是否清晰
是否存在误导性或信息缺失

这些指标并不完美，但至少传达出一个清晰信号：作者更关心插图是否“科学上可靠”，而不是“视觉上惊艳”。

对科研写作来说，这是一个相对务实、也更值得肯定的取向。

什么时候能用上？

我估计这是大家最关注问题，从目前情况来看，PaperBanana 仍然只是一项研究原型，不是一款马上面向普通科研作人的即用型工具。它在方法层面已经跑通，技术上“能用”，但使用门槛很高，缺乏稳定的输入方式、交互设计以及对真实期刊插图规范的适配。因此，对大多数实验或应用型研究者来说，短期内大概率是指望不上了。

但从长远来看，PaperBanana 的价值不在于它什么时候能被你直接拿来画图，而在于它为“论文插图自动生成”提供了一套可研究、可拆解的技术路径。AI工具发展迅速，说不定不用等太久，PaperBanana就能飞入寻常百姓家了，让我们拭目以待。

撰稿人

AJE 美国期刊专家

标签

论文插图论文插图制作

订阅邮件

订阅我们的邮箱后可提前获得AJE作者资源的文章，享受AJE服务的折扣，以及更多的优惠

AJE提供一系列科研支持服务，助力论文成功发表！

AJE为您提供英文论文润色、学术论文翻译、期刊选择、文稿排版等一系列学术服务，我们希望可以帮助您充分发挥您的研究潜力，助力您成功将论文发布在国际期刊上。