什么是分类偏倚?实例解析

虽然分类偏倚是由多层因素构成的,理解起来很有挑战性。如果去发现和避免它?本期AJE将通过实际的案例,去帮助大家去理解。

更新于2024年3月8日

什么是分类偏倚?实例解析

分类偏倚(Classification Bias)概述

当研究开始时未充分记录影响结果的变量时,就会出现分类偏倚。在试验中对参与者的状态进行错误分类可能会导致所研究的风险因素/暴露与相关结果之间的关联不准确。

如何检测分类偏倚

在回顾性观察研究中,研究人员会回顾具有某种危险因素或暴露的参与者群体及其与某些结果的关联。检测分类偏倚会提出以下问题:在研究中,参与者因其风险因素/暴露而被分类,那么结果是否会因此产生偏倚?

有时会要求参与者回忆他们与风险因素/暴露或结果的关系。根据记忆获取信息可能会产生很大的混淆,因为记忆可能并不可靠,尤其是在询问参与者 "过去一年你吃过几次红肉?"等具体情况时。

如果参与者高估或低估了自己的红肉消费量(暴露量),研究结果就会出现偏差。在这种情况下,研究中就会出现回忆偏差,因为参与者的回忆不准确。

两种分类偏倚

分类偏倚主要有两种类型:干预措施的非差异性分类和差异性错误分类。让我们分别进行分析。

干预措施的非差异性分类偏倚

当干预措施的状态被随机错误分类,且与结果无关时,就会出现干预措施的非差异性错误分类。两组受无差别误分类的影响相同,参与者的行为不会直接导致这种偏差。

当干预措施被无差别地错误分类时,结果通常会偏向于无影响的方向,或者说是零假设,从而更有可能在研究结果方面发现组间无差异。

干预措施的差异化错误分类

干预措施的差异分类错误是指由于参与者之间的非随机差异模式而导致干预措施的状态分类错误。与非差异分类不同的是,在非差异分类中,各组之间的错误分布相等,而在差异分类中,一组的错误比例较大。

直接导致这种分类错误的是参与者或研究人员的行为(如果他们错误地、不成比例地将参与者归入不同组别)。如上所述,在回顾性研究中,最常见的是通过回忆偏差造成的不同分类错误。在这种情况下,结果可能偏向或偏离空值,这取决于被错误分类的参与者比例。

分类偏倚实例

请看下面这个假定的例子,它说明了干预措施分类中的偏差以及误分类偏倚的两种亚型:

研究人员调查了过去 10 年中经常食用高糖饮食是否与肥胖有关。研究对象有 1000 多人,其中 500 人有肥胖症,500 人没有肥胖症。与未患肥胖症的人相比,患肥胖症的人可能记得更经常吃高糖食物。也许他们更清楚含糖量高和含糖量低的食物,因为他们更了解肥胖与高糖饮食有关的社会观念。

相比之下,没有肥胖症的参与者不太可能记得自己经常吃高糖饮食,因为他们的体重指数是正常的,因此他们不太关心所吃食物的含糖量。因此,体重正常的参与者可能低估了他们在过去 10 年中摄入的高糖食物量。在这种情况下,由于没有肥胖症的受试者错误地回忆了他们摄入的糖分,而受试者是否摄入高糖饮食的分类取决于结果(肥胖症),因此出现了不同的错误分类。换句话说,那些肥胖的人因为肥胖而更准确地回忆起他们摄入的糖量。

在同一项研究中,研究人员还考察了过去 10 年中抗焦虑药物的消费与肥胖之间是否存在关系。有肥胖症和没有肥胖症的参与者都不认为抗焦虑药物与肥胖有关。

两组受试者都认为很难回忆起他们服用抗焦虑药物的数量,并且对这些数字的估计也不正确。因此,两组受试者都存在回忆偏差。在这种情况下,缺乏准确的估计是随机的。两组人在回忆信息时都会出现一些错误,因此错误分类是非差异性的,因为它并不取决于暴露或结果。

最后

这种类型的偏差是由多层因素构成的,理解起来很有挑战性。重要的启示是,研究参与者可能对研究中调查的关联回忆不清。如果研究组之间回忆这些关联的方式存在系统性差异,而这种差异又与暴露或结果有关,从而导致研究组被错误分类,那么就可能产生偏差,使结果偏离其真实估计值。

撰稿人
标签
分类偏倚实验偏差
目录
订阅邮件
订阅我们的邮箱后可提前获得AJE作者资源的文章,享受AJE服务的折扣,以及更多的优惠

查看 "隐私协议"

分享与AJE的故事,赢取千元大奖!

我们邀请您分享与AJE的点滴回忆,展现AJE如何助您一臂之力,共同见证学术之路上的每一个重要时刻。我们准备了丰厚的礼物感谢每一位参与者。快来参与吧,期待您的精彩故事!