科研数据可视化需要遵循的10个基本原则

文章
写作
能见度
研究过程

这篇文章提出了10个非常具有实践意义的原则，从“在画图之前如何思考”，到“具体如何选择图形、使用颜色、表达不确定性”，再到“如何评估图表是否有效”，构建了一套完整的数据可视化逻辑。今天，我们结合科研写作的实际场景，把这些原则重新梳理一遍，看看哪些问题，可能正出现在你的论文里。

更新于2026年4月3日

这些年，越来越多期刊开始要求作者提供图形摘要，甚至会在社交媒体上优先传播论文中的图表；另一方面，读者的阅读习惯也在发生变化——在信息过载的环境中，很多人往往先看图，再决定是否阅读全文。换句话说，图表已经从“辅助说明”，逐渐变成科研传播的核心入口。

正是在这样的背景下，来自路易斯安那州立大学的研究者 Stephen R. Midway 在 Patterns 上发表了一篇综述(来源：Principles of Effective Data Visualization)，对当前科研图表存在的问题进行了系统总结。这篇论文的一个重要出发点是：尽管可视化工具越来越丰富，但科研人员普遍缺乏系统的数据可视化训练，导致大量图表在表达上存在偏差甚至误导。

更值得注意的是，这种问题并不罕见。早在上世纪的研究中就发现，顶级期刊中的图表存在错误的比例并不低；而在今天，随着软件门槛降低，图表制作变得更加容易，但“表达质量”却未必同步提升。很多图的问题并不在于“画错了”，而在于没有把信息讲清楚。

这篇文章提出了10个非常具有实践意义的原则，从“在画图之前如何思考”，到“具体如何选择图形、使用颜色、表达不确定性”，再到“如何评估图表是否有效”，构建了一套完整的数据可视化逻辑。

今天，我们结合科研写作的实际场景，把这些原则重新梳理一遍，看看哪些问题，可能正出现在你的论文里。

从“画图”到“表达”

大多数科研人员在处理数据可视化时，习惯直接打开软件，从“选图类型”开始。但一个常被忽略的事实是：图表本质上是信息的表达，而不是软件操作的结果。在真正动手之前，作者首先需要明确的不是“用什么图”，而是“我要表达什么”。

这篇论文提出的第一个原则——“Diagram First”，强调的正是这一点：先定义信息，再设计图形。例如，你是想展示组间差异，还是变量关系？是强调趋势，还是突出分布？这些问题如果没有在一开始被理清，后续无论使用多高级的软件，最终呈现的图表都很难清晰。

在实践中，一个非常有效但被低估的方法，是在纸上先画出草图。这个过程看似简单，却能避免软件带来的路径依赖，让作者真正从“表达逻辑”出发，而不是被默认图形模板所限制。

图选错了，比不画更糟糕

在所有可视化问题中，用错图是最常见也是影响最大的错误之一。论文将常见图形归纳为几类：用于比较的图（如柱状图）、用于分布的图（如直方图、箱线图）、用于关系的图（如散点图），以及用于组成的图（如堆叠图）。这些分类看似基础，但在实际论文中经常被混用。

其中最典型的例子，是用柱状图展示均值。很多生命科学论文习惯用“mean ± SD”的柱状图来表示结果，但这种做法实际上隐藏了数据分布信息，同时由于柱状图从零起点绘制，容易夸大或弱化差异。研究指出，这类图表的信息密度非常低（low data density），在传递数据特征方面效率不高。

相比之下，箱线图、小提琴图，甚至简单叠加散点的方式，都可以更完整地呈现数据结构。因此，一个关键的转变是：不要从“我习惯用什么图”出发，而要从“数据本身需要怎样被理解”出发。

Principles of Effective Data Visualization论文插图

真正提高说服力的，不是统计量，而是数据本身

在很多论文中，图表呈现的是“处理后的数据”，而非数据本身。例如只给出均值和误差，却不展示原始数据点。这种做法在形式上是规范的，但在信息传递上是不完整的。论文中特别强调：“尽可能展示数据” 。

这一点在小样本研究中尤为重要。当样本量较小或数据波动较大时，仅依赖统计量很容易造成误解。相比之下，在箱线图或柱状图上叠加原始散点，可以显著提高透明度，让读者直接看到数据分布，从而增强结论的可信度。

从审稿人的角度来看，是否展示原始数据，往往直接影响对研究严谨性的判断。

颜色从来不是“装饰”，而是编码

颜色是科研图表中最直观的视觉元素，但也最容易被误用。很多作者在选择颜色时更多考虑“美观”，而忽视了其信息属性。事实上，颜色在可视化中承担的是“编码”的角色，每一种颜色都在传递某种含义。

论文将常见配色方式分为三类：

用于表示数值变化的渐变色（sequential）
用于表示两极差异的发散色（diverging）
以及用于区分分类变量的定性色（qualitative）

合理使用这些配色逻辑，可以显著提升图表的可读性。

与此同时，还需要考虑两个实际问题：一是图表在黑白打印时是否仍然可读，二是是否对色盲读者友好。这些细节虽然常被忽略，但在高水平期刊中往往是默认要求。

不展示不确定性，本质上是在“隐瞒信息”

数据的不确定性是科学研究的基本属性，但在图表中却经常被弱化甚至忽略。论文指出，不展示不确定性不仅是不完整的，还可能具有误导性。常见的误差表示方式包括标准差（SD）、标准误（SE）和置信区间（CI），但它们的含义完全不同。

一个常见误区是，将误差条的重叠与否直接等同于统计显著性。然而，这种判断在统计学上并不成立。误差条只是对不确定性的表达，而不是显著性的直接证据。因此，在图表中不仅要展示不确定性，还需要在图注中明确说明其含义。

当数据变复杂时，不要堆叠，而要“拆开”

面对多变量或多组数据，很多作者倾向于在一张图中叠加所有信息，结果往往适得其反。论文提出了一种更有效的策略——“small multiples”（分面图），即将数据拆分为多个结构一致的子图，每个子图只改变一个变量。

这种方法的优势在于，它通过统一的视觉结构，让不同条件之间的比较变得直观且不可避免。尤其在时间序列或多组实验中，这种设计往往比复杂叠加更清晰。

图注，才是图表真正的“说明书”

在很多论文中，图注被当作附属说明，往往写得非常简略。但研究发现，超过三分之一的图表在脱离正文时无法被独立理解。这说明一个问题：图注没有完成它应有的功能。

一个高质量的图注，应当具备“独立性”。也就是说，即使读者只看到图和图注，也能理解图表的核心信息、变量含义以及主要结论。这不仅是写作规范，更是提高论文可读性的关键。

数据可视化原则的整体流程框架，图源：https://www.sciencedirect.com/science/article/pii/S2666389920301896

把图交给别人看

在论文写作过程中，图表往往是在最后阶段完成，很少被单独评估。论文建议一个简单但非常有效的方法：让他人只看图，而不看正文，然后判断他们是否理解 。

这个过程能够真实模拟读者的阅读体验，也更容易暴露表达问题。相比完整的论文审阅，这种方式成本更低，但对图表质量的提升却非常直接。

撰稿人

AJE 美国期刊专家

标签

信息图

订阅邮件

订阅我们的邮箱后可提前获得AJE作者资源的文章，享受AJE服务的折扣，以及更多的优惠

AJE研究推广服务，轻松传播您的科研成果

我们的研究推广服务将帮助您快速轻松地传播您的研究成果。我们将为您的研究成果设计易于获取且引人注目的短视频、信息图、海报等。