临床研究的类型以及严格评价

本文AJE将介绍如何评估研究结果的可靠性,包括研究方法、研究设计和潜在错误的评估。试验应避免随机误差、系统误差、测量误差和设计错误,使用p值进行显著性检验。然而,研究中经常存在人为错误,导致文献中出现不一致和矛盾,因此需要对研究结果进行严格评价(Critical appraisal)。

更新于2024年1月3日

临床研究的类型以及严格评价

"A study shows…"

这句话以及类似的说法常用于公开的讨论中,表示一项研究毫无疑问地证明了某种效果。然而,一项研究的结果和结论绝不能照单全收,其可靠性取决于研究方法。要了解研究是否可信,必须对研究进行严格评价,以评估研究方法上的缺陷是否会影响研究结果,使其估计偏离事实。严格评价(Critical appraisal)包括评估研究的设计和潜在错误,以确定其中一个或两个方面是否存在弱点,从而削弱结果和结论的有效性。

要评估旨在改善人类健康的研究的真实性,就必须了解如何设计和开展临床研究的基本原理。医疗保健研究通常从临床前研究(pre-clinical studies)开始,临床前研究在实验室环境中使用各种模型进行,包括细胞培养、无脊椎动物和/或脊椎动物。临床前研究展示了生物系统和疾病过程是如何运作的,并为我们了解干预措施是否安全提供了基础,以便开展涉及与人体直接相关的临床研究。

临床研究旨在通过研究疾病的发病频率、风险因素、潜在过程、自然病史、现有治疗方法和预后因素来识别和治疗疾病。为了确定这些因素,需要对两组或更多组进行测试并相互比较。

临床研究的类型

可以进行多种类型的临床研究--根据研究目的的不同,有些研究比其他研究更适合--但主要有两类:

1) 干预试验:研究人员通过向参与者提供干预措施来预防或治疗疾病,如准实验试验和随机对照试验。

2)观察性研究,研究人员观察人群或个体,但不进行干预,包括生态研究、横断面研究、队列研究和病例对照研究。

为了治疗疾病,临床医生需要根据病人过去的反应来预测未来病人对治疗的反应。临床研究为医疗服务提供者提供了必要的知识基础,以进行预测并了解治疗或风险因素与结果之间的关系。为了预测人群未来对干预措施的反应,研究人员会进行抽样调查,即把更大人群中的一小部分纳入试验。研究需要有正确的动力,这意味着根据以前的预测或假设的预测,样本量要足够大,以检测出将进行比较的群体之间的差异。与研究整个人口相比,抽样能以更少的资源更快地对干预措施进行测试。通过抽样,可以进行统计推断,目的是从样本平均值估算出人群平均值,从而进行临床预测。

误差类型

为确保估算结果尽可能真实地反映大样本人群的情况,试验必须避免错误和偏差。存在四种误差:

1. 随机误差,纯属偶然。

2.系统误差,也称为偏差,涉及试验的内部有效性以及研究是否正确回答了研究问题。系统误差是指来自研究人员和/或参与者的因素,这些因素系统的改变了结果,使其偏离了真实值。

3. 测量误差,源于研究人员,是指在测量干预暴露、风险因素和结果时出现的误差。

4. 设计错误,与结果的外部有效性有关,涉及研究人员提出的问题是否正确。常见的设计错误包括研究错误的样本、进行错误的比较或使用错误的分析方法。

理想情况下,试验不会出现系统误差、测量误差和设计误差,所有这些误差都可归因于人为行为。鉴于随机误差的发生纯属偶然,这些误差应该是唯一可能影响试验结果的误差。随机误差通过使用 p 值进行显著性检验来评估。

p 值是观察到的差异完全由偶然性(或换句话说,随机误差)造成的概率。例如,p 值小于 0.05 意味着观察到的组间差异归因于随机误差的概率小于 5%。

假设在理想情况下,如果试验不存在系统误差、测量误差和设计误差,那么观察到的组间差异可视为真实的估计值,从而增加对试验结果和结论的信心。

存在人为错误的研究结果

不幸的是,理想的情况很少发生。相反,在研究中经常会发现人为错误,导致文献中出现大范围的不一致和矛盾。例如,在比较同一课题的随机对照试验和观察性研究时,文献中的差异就很明显。

对维生素抗氧化特性的研究表明,在观察性研究中,维生素与全因死亡率、癌症和心血管疾病呈反向关系。然而,当进行多项随机对照试验来测试相同的关联时,抗氧化剂补充剂的保护性质就消失了。采用类似试验设计的研究之间也会出现不一致。

对 37 项随机对照试验的重新分析表明,62% 的结果在重新审查后发生了变化,包括对应接受治疗的患者的重新解释,以及治疗效果的方向、幅度或统计意义的变化。同样,在 49 项引用率较高的原始临床试验中,有 16% 的后续研究与原始研究相矛盾,16% 的后续研究显示治疗效果较弱。出现矛盾的原因可能是在进行、报告和分析方法上出现了错误。对 250 项对照试验的重新分析表明,当试验采用的隐藏方法不当或未能充分报告隐藏方法时,治疗效果会被高估(P < 0.001)。

由于存在这些不一致和矛盾之处,因此不能对这些试验报告的结果抱有信心。在最有可能混淆结果的错误类型中,系统性错误(偏差)是最常见和最有害的。偏差的定义是 "偏离真相"。 因此,如果研究存在偏差,获得的结果就会偏离对真实结果的准确估计,从而得出错误的结论。

评估系统误差

为了评估系统误差,需要对研究进行严格评估,以确定研究中是否存在以下类型的偏差:

临床研究的类型以及严格评价

有许多 "评估工具 "为评估上述偏差领域提供指导。这些工具是由各种循证医疗组织创建的,例如 Cochrane, Scottish Intercollegiate Guidelines Network (SIGN), Critical Appraisal Skills Programme (CASP), Centre for Evidence Based Medicine (CEBM)等。每种类型的研究设计都有相应的评估工具,其形式包括核对表、量表和基于领域的评估工具,这些工具为评估试验中可能限制其内部有效性的偏倚提供了指导。

我们在上期内容中分享了《使用RoB2工具评估偏倚风险的简单方法》,感兴趣的读者可以去看看。

撰稿人
标签
临床研究研究误差严格评价结果Critical appraisal
目录
订阅邮件
订阅我们的邮箱后可提前获得AJE作者资源的文章,享受AJE服务的折扣,以及更多的优惠

查看 "隐私协议"

AJE是Nature首选的润色机构,解决论文语言问题更靠谱!

AJE为您提供英文论文润色、学术论文翻译、期刊选择、文稿排版等一系列学术服务,我们希望可以帮助您充分发挥您的研究潜力,助力您成功将论文发布在国际期刊上。