临床研究的类型以及严格评价

文章
研究过程
能见度

本文AJE将介绍如何评估研究结果的可靠性，包括研究方法、研究设计和潜在错误的评估。试验应避免随机误差、系统误差、测量误差和设计错误，使用p值进行显著性检验。然而，研究中经常存在人为错误，导致文献中出现不一致和矛盾，因此需要对研究结果进行严格评价（Critical appraisal）。

更新于2024年1月3日

"A study shows…"

这句话以及类似的说法常用于公开的讨论中，表示一项研究毫无疑问地证明了某种效果。然而，一项研究的结果和结论绝不能照单全收，其可靠性取决于研究方法。要了解研究是否可信，必须对研究进行严格评价，以评估研究方法上的缺陷是否会影响研究结果，使其估计偏离事实。严格评价（Critical appraisal）包括评估研究的设计和潜在错误，以确定其中一个或两个方面是否存在弱点，从而削弱结果和结论的有效性。

要评估旨在改善人类健康的研究的真实性，就必须了解如何设计和开展临床研究的基本原理。医疗保健研究通常从临床前研究（pre-clinical studies）开始，临床前研究在实验室环境中使用各种模型进行，包括细胞培养、无脊椎动物和/或脊椎动物。临床前研究展示了生物系统和疾病过程是如何运作的，并为我们了解干预措施是否安全提供了基础，以便开展涉及与人体直接相关的临床研究。

临床研究旨在通过研究疾病的发病频率、风险因素、潜在过程、自然病史、现有治疗方法和预后因素来识别和治疗疾病。为了确定这些因素，需要对两组或更多组进行测试并相互比较。

临床研究的类型

可以进行多种类型的临床研究--根据研究目的的不同，有些研究比其他研究更适合--但主要有两类：

1) 干预试验：研究人员通过向参与者提供干预措施来预防或治疗疾病，如准实验试验和随机对照试验。

2）观察性研究，研究人员观察人群或个体，但不进行干预，包括生态研究、横断面研究、队列研究和病例对照研究。

为了治疗疾病，临床医生需要根据病人过去的反应来预测未来病人对治疗的反应。临床研究为医疗服务提供者提供了必要的知识基础，以进行预测并了解治疗或风险因素与结果之间的关系。为了预测人群未来对干预措施的反应，研究人员会进行抽样调查，即把更大人群中的一小部分纳入试验。研究需要有正确的动力，这意味着根据以前的预测或假设的预测，样本量要足够大，以检测出将进行比较的群体之间的差异。与研究整个人口相比，抽样能以更少的资源更快地对干预措施进行测试。通过抽样，可以进行统计推断，目的是从样本平均值估算出人群平均值，从而进行临床预测。

误差类型

为确保估算结果尽可能真实地反映大样本人群的情况，试验必须避免错误和偏差。存在四种误差：

1. 随机误差，纯属偶然。

2.系统误差，也称为偏差，涉及试验的内部有效性以及研究是否正确回答了研究问题。系统误差是指来自研究人员和/或参与者的因素，这些因素系统的改变了结果，使其偏离了真实值。

3. 测量误差，源于研究人员，是指在测量干预暴露、风险因素和结果时出现的误差。

4. 设计错误，与结果的外部有效性有关，涉及研究人员提出的问题是否正确。常见的设计错误包括研究错误的样本、进行错误的比较或使用错误的分析方法。

理想情况下，试验不会出现系统误差、测量误差和设计误差，所有这些误差都可归因于人为行为。鉴于随机误差的发生纯属偶然，这些误差应该是唯一可能影响试验结果的误差。随机误差通过使用 p 值进行显著性检验来评估。

p 值是观察到的差异完全由偶然性（或换句话说，随机误差）造成的概率。例如，p 值小于 0.05 意味着观察到的组间差异归因于随机误差的概率小于 5%。

假设在理想情况下，如果试验不存在系统误差、测量误差和设计误差，那么观察到的组间差异可视为真实的估计值，从而增加对试验结果和结论的信心。

存在人为错误的研究结果

不幸的是，理想的情况很少发生。相反，在研究中经常会发现人为错误，导致文献中出现大范围的不一致和矛盾。例如，在比较同一课题的随机对照试验和观察性研究时，文献中的差异就很明显。

对维生素抗氧化特性的研究表明，在观察性研究中，维生素与全因死亡率、癌症和心血管疾病呈反向关系。然而，当进行多项随机对照试验来测试相同的关联时，抗氧化剂补充剂的保护性质就消失了。采用类似试验设计的研究之间也会出现不一致。

对 37 项随机对照试验的重新分析表明，62% 的结果在重新审查后发生了变化，包括对应接受治疗的患者的重新解释，以及治疗效果的方向、幅度或统计意义的变化。同样，在 49 项引用率较高的原始临床试验中，有 16% 的后续研究与原始研究相矛盾，16% 的后续研究显示治疗效果较弱。出现矛盾的原因可能是在进行、报告和分析方法上出现了错误。对 250 项对照试验的重新分析表明，当试验采用的隐藏方法不当或未能充分报告隐藏方法时，治疗效果会被高估（P < 0.001）。

由于存在这些不一致和矛盾之处，因此不能对这些试验报告的结果抱有信心。在最有可能混淆结果的错误类型中，系统性错误（偏差）是最常见和最有害的。偏差的定义是 "偏离真相"。因此，如果研究存在偏差，获得的结果就会偏离对真实结果的准确估计，从而得出错误的结论。

评估系统误差

为了评估系统误差，需要对研究进行严格评估，以确定研究中是否存在以下类型的偏差：

有许多 "评估工具 "为评估上述偏差领域提供指导。这些工具是由各种循证医疗组织创建的，例如 Cochrane, Scottish Intercollegiate Guidelines Network (SIGN), Critical Appraisal Skills Programme (CASP), Centre for Evidence Based Medicine (CEBM)等。每种类型的研究设计都有相应的评估工具，其形式包括核对表、量表和基于领域的评估工具，这些工具为评估试验中可能限制其内部有效性的偏倚提供了指导。

我们在上期内容中分享了《使用RoB2工具评估偏倚风险的简单方法》，感兴趣的读者可以去看看。

撰稿人

AJE 美国期刊专家

标签

临床研究研究误差严格评价结果 Critical appraisal

订阅邮件

订阅我们的邮箱后可提前获得AJE作者资源的文章，享受AJE服务的折扣，以及更多的优惠

AJE是Nature首选的润色机构，解决论文语言问题更靠谱！

AJE为您提供英文论文润色、学术论文翻译、期刊选择、文稿排版等一系列学术服务，我们希望可以帮助您充分发挥您的研究潜力，助力您成功将论文发布在国际期刊上。