你的定性研究样本量真的够了吗?从“数据饱和”到“理论饱和”的重要转变

许多研究实际上停得太早了。研究者往往在达到数据饱和之后便停止数据收集,却忽略了更重要的目标——理论饱和。而这两者之间的差距,往往决定了一项研究究竟只是停留在描述现象的层面,还是能够真正产生有价值的理论贡献。

更新于2026年6月4日

你的定性研究样本量真的够了吗?从“数据饱和”到“理论饱和”的重要转变

对于许多刚开始接触定性研究的研究生和青年科研人员来说,最常见的问题之一就是:“我到底需要访谈多少人?”这个问题看似简单,却长期困扰着整个定性研究领域。与定量研究不同,定量研究可以通过统计功效分析、效应量和显著性水平等方法预先计算样本量,而定性研究并不存在一套公认的数学公式来告诉研究者应该访谈多少人。因此,当审稿人、伦理委员会或者基金评审要求研究者解释样本量合理性时,很多人都会给出同一个答案:“我们达到了数据饱和。”

长期以来,这几乎成为定性研究领域最常见、也最容易被接受的解释。然而,2025年发表在Journal of Global Marketing期刊上的一篇方法学论文却提出了一个值得所有定性研究者认真思考的问题:达到数据饱和,真的意味着研究已经完成了吗?

作者Weng Marc Lim认为,许多研究实际上停得太早了。研究者往往在达到数据饱和之后便停止数据收集,却忽略了更重要的目标——理论饱和。而这两者之间的差距,往往决定了一项研究究竟只是停留在描述现象的层面,还是能够真正产生有价值的理论贡献。

什么是数据饱和?

在定性研究方法课程中,“数据饱和”几乎是每位研究者都会接触到的概念。简单来说,当新的访谈不再产生新的编码或新的主题时,研究者便认为研究已经达到饱和状态。换句话说,后续受访者提供的信息不断重复,已经很难再出现新的发现。(来源:Sample Size in Qualitative Research: Moving from Data Saturation to Theoretical Saturation

这种理念之所以广泛流行,并非毫无依据。许多经典研究确实发现,核心主题往往会在较早阶段出现。例如Guest等人的研究显示,在一个包含60次访谈的研究项目中,大多数主要主题在前12次访谈时就已经出现,而部分关键主题甚至在前6次访谈中就已经浮现。Hennink及其同事也发现,在较为同质化的受访群体中,大约9次访谈便能够达到编码层面的饱和。

正因为如此,许多研究者逐渐形成了一种惯性思维:既然主要主题已经出现,而且后续访谈不断重复相同内容,那么继续访谈似乎没有太大意义。然而,作者指出,这种判断其实隐藏着一个重要问题——主题的重复并不意味着研究者已经真正理解了这些主题背后的机制和逻辑。很多时候,研究者只是发现了现象,却还没有解释现象。

数据饱和只能告诉你“发生了什么”,却不能告诉你“为什么发生”

整篇论文最核心的观点可以概括为一句话:数据饱和关注的是描述性充分性,而理论饱和关注的是解释性充分性。

这两个概念看似接近,实际上却代表着完全不同的研究目标。

当研究者达到数据饱和时,他们已经能够比较完整地回答“有哪些现象”“有哪些观点”“有哪些经历”这样的问题。例如,一项关于博士生选择导师的研究可能发现,受访者反复提到学术声誉、研究方向匹配、实验室资源以及职业发展机会等因素。如果这些主题不断重复出现,研究者就可以认为已经识别出了主要影响因素。

但问题在于,真正重要的研究问题往往并不是“有哪些因素”,而是“这些因素为什么重要”。为什么有些学生把资源放在第一位,而另一些学生更重视导师的人格特质?为什么国际学生与本土学生的决策逻辑不同?这些因素之间是否存在优先级关系?在不同学科背景下,它们是否发挥着不同作用?

这些问题已经超出了简单的主题识别,而进入了理论解释的层面。

作者认为,很多定性研究在刚刚开始触及这些深层问题时就停止了数据收集。因此,虽然论文中能够列出大量主题和分类,但理论框架往往比较浅显,难以解释复杂现象背后的运行机制。对于以理论贡献为目标的高水平期刊而言,这类研究通常很难产生真正有影响力的学术价值。

为什么仅仅依赖数据饱和存在风险?

作者特别强调,过度依赖数据饱和可能带来几个严重问题。

首先,数据饱和出现得往往比研究者想象得更早。尤其是在样本较为同质化的情况下,新编码停止增长并不困难。研究者很容易因为后续访谈不断重复已有主题,而产生一种“研究已经结束”的错觉。事实上,这种重复更多反映的是主题覆盖已经比较完整,而不是理论已经足够成熟。

其次,数据饱和无法保证研究具有足够深度。Hennink等人的研究提出了一个非常重要的区分:编码饱和与意义饱和。他们发现,研究者通常在大约9次访谈时便达到编码饱和,但真正理解主题背后的意义、细微差异和复杂关系,往往需要16至24次访谈。

换句话说,研究者可能已经知道受访者在说什么,却还没有真正理解他们为什么这样说。

此外,在跨文化研究、多地点研究或国际比较研究中,数据饱和尤其容易产生误导。一项涵盖132次访谈、横跨多个研究地点的研究发现,在单个地点内识别主要主题并不困难,但如果希望发现跨地点共享的高层次模式,则往往需要20至40次访谈。

对于今天越来越普遍的国际合作研究而言,这一点尤为重要。如果研究者仅在单一情境中达到数据饱和,便试图提出具有广泛适用性的理论结论,那么其外部有效性往往值得商榷。

理论饱和:高质量定性研究真正追求的目标

与数据饱和不同,理论饱和并不关注是否还有新的主题出现,而是关注新的数据是否还能改变或扩展已有理论。

作者将理论饱和定义为:新增数据已经无法显著增加新的理论洞见,也无法实质性修改现有理论框架时所达到的状态。

这个定义看似简单,却代表着研究思维的重要转变。

很多研究者习惯将理论饱和理解为“没有新信息出现”,但作者引用Low(2019)的观点指出,这种理解在逻辑上其实并不成立。因为在现实世界中,新的信息几乎总是可能出现。理论饱和真正关注的并不是是否存在新信息,而是这些新信息是否足以改变研究者已经建立起来的理论解释体系。

那么,研究者如何判断自己是否接近理论饱和?

论文引用Nelson提出的概念深度(Conceptual Depth)框架,认为研究者至少需要关注几个方面:概念是否具有足够广度、是否能够体现细微差异、是否形成复杂而稳定的关系网络、是否能够与现有文献形成呼应,以及研究结论是否具有可信度。

这些标准共同指向一个核心问题:研究者是否已经真正理解了研究对象,而不仅仅是记录了研究对象。

信息力量理论:样本量从来不是人数游戏

这篇论文还重点讨论了近年来越来越受关注的“信息力量”理论。传统思维习惯把样本量理解为人数问题,但信息力量理论认为,真正决定样本量需求的并不是人数,而是每个样本所能提供的信息价值。

如果研究目标明确、受访群体高度聚焦、已有成熟理论指导分析、访谈质量较高,并且研究者能够开展深入分析,那么每位参与者都可能贡献大量高价值信息。在这种情况下,即使样本数量较少,也可能足以支撑研究结论。

反过来,如果研究问题非常宽泛、参与者差异巨大、理论基础不足、访谈内容较浅,那么即使收集了大量访谈,也未必能够形成令人信服的理论解释。

这也是为什么我们经常看到一些发表在顶级期刊上的定性研究只有十几位受访者,而另一些拥有数十名甚至上百名受访者的研究,其理论贡献仍然有限。真正重要的从来不是样本数量,而是信息质量以及理论发展程度。

那么,定性研究到底应该访谈多少人?

虽然作者反复强调样本量不应被机械化理解,但论文仍然整理了近年来的重要实证研究,为研究者提供了一些具有参考价值的经验范围。

对于同质化样本且研究目标较为聚焦的深度访谈研究,数据饱和通常出现在9至17次访谈之间。

如果研究目标是达到理论饱和,那么样本量通常需要进一步增加。根据Hennink等人的研究,理论饱和往往出现在16至24次访谈之间,大约是数据饱和所需样本量的两倍。

对于跨地点研究或跨文化研究,作者建议将20至40次访谈作为规划参考,因为只有达到这一规模,研究者才更有机会识别不同情境之间共享的深层规律。

不过,作者始终强调,这些数字只是规划阶段的参考值,而非固定规则。真正决定何时停止数据收集的,应当是研究目标、理论发展状况以及信息力量,而不是预先设定的人数。

审稿人真正关心的,从来不是你访谈了多少人

对于许多科研人员来说,最现实的问题往往来自投稿环节。很多论文在回复审稿意见时都会写上一句:“Data saturation was achieved after 15 interviews.”然而,作者指出,越来越多的方法学研究已经开始质疑这种简单化表述。

审稿人真正关心的其实不是样本量数字本身,而是研究者如何做出停止数据收集的决定。研究者是否持续监测新信息的出现频率?是否记录了编码增长过程?是否在达到数据饱和之后继续开展理论抽样?是否主动寻找负面案例和边界条件?是否能够提供清晰、可审计的决策过程?

换句话说,审稿人希望看到的是一个严谨的研究逻辑,而不仅仅是一个访谈人数。

因此,这篇论文提出的五步框架实际上给研究者提供了一种更具说服力的样本量论证方式:先明确研究目标,再基于经验范围规划初始样本,随后持续监测新信息出现情况,在达到数据饱和后继续评估理论发展程度,并最终透明地报告整个决策过程。

从“访谈多少人”到“为什么停止访谈”

读完整篇论文后,我认为作者最重要的贡献并不是提供了一组新的样本量数字,而是改变了我们思考样本量问题的方式。长期以来,定性研究者习惯问:“我需要访谈多少人?”但作者实际上在提醒我们,真正值得思考的问题应该是:“我是否已经获得足够的信息来支撑我的理论解释?”

当研究目标只是描述现象时,数据饱和或许已经足够;但当研究目标是解释机制、发展理论、理解复杂社会现象时,数据饱和往往只是起点,而非终点。

许多研究者在访谈进行到第10次、第15次的时候,开始感觉听到的内容越来越重复,于是认为研究已经结束。但从理论发展的角度看,最有价值的发现往往恰恰出现在这个阶段之后。因为此时研究者已经掌握了主要主题,能够把注意力从“发现新主题”转向“理解主题之间的关系”。

这或许正是这篇论文希望传递给定性研究者的核心信息:达到数据饱和并不难,真正困难的是达到理论饱和。

而两者之间的距离,往往决定了一篇研究究竟只是记录世界,还是能够解释世界。

撰稿人
标签
学术研究
目录
订阅邮件
订阅我们的邮箱后可提前获得AJE作者资源的文章,享受AJE服务的折扣,以及更多的优惠

查看 "隐私协议"

Nature实验数据显示:使用AJE润色服务,稿件接受率大增!

来自Nature的实验数据表明, 使用AJE的润色服务之后,来自中国的稿件接收率提高了50%。