临床预测模型|2.预测模型的研究设计相关问题（一）

发表于 2024-02-19 阅读次数：本文字数： 4k 阅读时长 ≈ 7 分钟

在之前的很多篇推送中，我们探讨了很多关于临床预测模型的内容。接下来，我们将结合统计大神Ewout W. Steyerberg的著作—Clinical Prediction Models, A Practical Approach to Development, Validation, and Updating，对临床预测模型的理论和实践进行系统的学习。

在这次的内容中，我们将系统了解预测模型的研究设计相关问题。

在本章中，我们主要学习预测研究设计中的几个问题，包括选择队列研究所需要的受试者或患者以及来自单一中心、来自注册登记或随机对照试验的病例的优势和局限性；预测模型中选择预测因子和结局变量的问题；此外，还有一个重要的问题是研究需要多大规模（样本量）才能支撑足够的统计学检验效能。

预后研究

预后研究本质上是纵向研究，最常在患者队列中进行，随着时间的推移对患者进行随访以观察结局（或“事件”或“终点”）的发生。这个队列的定义是基于一个或多个特定的特征，比如患有某种疾病、居住在特定地方、年龄在一定范围内，或者仅仅是活产。几种队列研究类型可以用于预后模型的开发，最常见的可能是单中心回顾性队列研究。例如，识别医院病历记录中特定日期范围之间的患者，并对这些患者的病历资料向前追溯。

针对预后研究的研究设计

回顾性设计

回顾性研究设计的优点包括其简单性和可行性。由于在单个中心的病人记录通常可以轻松地搜索，特别是在现代医院信息系统或电子病历的帮助下，因此它是一个相对成本较低的设计。一个局限性是正确识别病人，这必须在事后完成。如果某些信息缺失或记录不正确，这可能导致选择性偏倚。同样，预测因子的记录必须是可靠的，才能用于预测建模。最后，结果评估必须是可靠的。对于硬性终点如存活情况来说，这可能相对简单，因为一些死亡情况将从医院记录中知晓。但是，为了完整评估存活状况，通常还需要从全国统计局获得额外的生存状态确认。其他结果，例如与功能状态相关的结果，在我们希望进行分析的时间点可能不可用。最后，单中心研究可能受到样本量的限制，这是预测研究中的一个关键问题。

示例：预测食管癌的早期死亡率

对 1997 年 1 月 1 日至 2003 年 12 月 31 日期间在同一机构接受治疗的 120 名患者进行了回顾性分析。患者接受姑息治疗，这意味着治疗可以缓解症状，但不会改变病程。患者由于吞咽困难植入了食管支架。作者研究了 30 天死亡率，大概出现在约 10%（n = 12）的患者中。预测因素是营养状况（低血清白蛋白水平、低BMI）和体能状态（WHO 等级）。

前瞻性设计

在前瞻性研究中，我们可以更好地设定纳入和排除标准。研究者与研究人群一起随着时间推移（因此被称为“前瞻性研究”）。在前瞻性研究中，我们可以使用清晰一致的预测因子，并在预定义的时间点评估患者预后。因此，前瞻性队列研究优于回顾性系列研究。纯粹用于预测模型的前瞻性队列研究很少见。更常见的设计是将预测研究应用于随机临床试验 (RCT) 的数据，或前瞻性前后试验的数据。优点在于患者选择明确，预测因子记录前瞻性，通常会进行质量控制，并且对终点进行前瞻性评估。临床试验的样本量通常相当大。然而，来自 (随机) 试验数据的限制可能在于患者的选择。临床试验通常会使用严格的纳入和排除标准，这可能会限制由此开发的模型的普遍性。另一方面，RCT 通常会在多个中心进行，有时来自多个国家或地区。多中心设计的优势在于，需要就预测因子和结局的定义问题达成共识，并且会提高研究结果的可推广性。这与单中心研究形成对比，后者仅反映特定环境中的关联。一个争论的话题是，我们是否应该只使用来自随机分配到常规治疗或安慰剂（“对照组”）的 RCT 患者。如果我们结合随机分组，我们假设没有特定的亚组效应与预后模型相关。这通常可能是合理的。治疗的预后影响通常比其他预测因子的预后影响小。如果预测模型旨在支持治疗决策，最简单且相当合理的方法是将治疗作为主要效应纳入。

示例：预测食管癌的长期死亡率

在另一项食管癌结局研究中，来自 RCT（“SIREC”，n = 209 ）的数据与其他前瞻性收集的数据（n = 396）相结合。研究者研究了支架置入和放疗姑息治疗后的长期死亡率。作者结合了年龄、性别、肿瘤长度、转移和 WHO 表现评分，提出了一个简单的预后评分。

注册登记研究的设计

预测性研究通常利用登记数据进行，例如癌症登记数据或保险数据库。这些数据的收集虽然是前瞻性的，但最初目的并非用于预测研究。数据细节的不足可能限制了预测性分析。例如，美国著名的癌症登记系统 (Surveillance, Epidemiology and End Results, SEER) 包含癌症发病率、死亡率、患者人口统计学特征和肿瘤分期等信息。它已与 Medicare 数据库链接，以获取关于合并症和治疗 (手术、化疗、放射治疗) 的信息。社会经济地位通常基于可用区域的中位收入，属于汇总数据。SEER-Medicare 数据库不包含详细的PS信息，而这对于医疗决策和生存期评估至关重要。此外，SEER数据库中的肿瘤分期可能存在一些测量偏差。由于通常没有提前确定的评估，与回顾性研究类似，基于登记数据的预测性分析存在着同样的限制。因此，研究结局通常仅限于生存率，尽管有时也可以从中推导出其他不良事件。利用登记数据进行预测性研究的优势包括样本量大、患者具有代表性 (尤其是基于人群的癌症登记)。大型数据库可用性高，尤其适用于研究少数预测因素与生存期之间的预测关系。

食管癌的手术死亡率

研究者使用SEER-Medicare数据库分析了1327例食管癌手术患者的30天死亡率。预测因子包括年龄、合并基础疾病（心脏、肺、肾、肝和糖尿病）、术前放疗或联合放化疗，以及相对较低的医院容量。研究者将上述因素合并为一个简单的预后评分，在另一个登记处和一个医院系列中完成了模型的验证。

巢式病例对照研究

有时候，前瞻性设计的巢式病例-对照研究是进行预测研究的高效选择。当研究结局相对罕见时，病例-对照设计尤其具有吸引力，例如乳腺癌的发病率。例如，如果30天死亡率为1%，那么只需要研究所有死亡患者的预测因素就足够了，而对照组只需要研究4%的人（1:4的病例-对照比例）。选择随机选取的对照组与病例进行比较。然而，在巢式病例对照研究中，评估预测因素是回顾性的，这是该研究方法的一个局限性。如果开发了一个预测模型，则必须在最终计算概率时调整平均结局的发生率，而回归系数可能基于病例-对照研究。

示例：大血管手术的围术期死亡率

一个有趣的例子是分析接受大血管手术患者围手术期死亡率的研究。研究人员通过详细回顾所有病例（死亡患者）和部分对照组（存活患者）的病历资料，确定了预测因素。对照组患者的手术时间紧靠病例组之前或之后，从而实现了病例与对照组的 1:2配比。

诊断研究

诊断研究最常采用横断面研究设计，将患者的预测性特征与潜在诊断联系起来。研究组依据特定症状或体征定义，这些症状或体征使受试者疑似患有特定(目标)疾病。通常，受试者将在短时间内接受相关测试，以确定是否存在目标疾病。

横断面研究设计和多变量建模

理想情况下，诊断研究应考虑一组定义明确的疑似患有特定疾病的患者，例如急性心肌梗死。此时，该诊断研究类似于预后队列研究。队列由被怀疑患有 (而非实际患有) 疾病的患者定义。研究结局是潜在的诊断。因此，这样的研究可以被认为为是横断面研究，因为预测因果-结局关系是在一个时间点上进行研究的。几种特征可能预示潜在的诊断。对于模型，我们应该首先考虑简单的特征，例如人口统计学特征、从患者病史中获得的症状和体征。接下来，我们可能会考虑简单的诊断测试，最后是侵入性或昂贵的检查。诊断 (存在或不存在目标疾病) 应通过金标准来明确诊断。金标准检测的结果最好在不了解预测变量和诊断测试值的情况下进行解释。这样的盲法可以防止信息偏倚或纳入偏倚。诊断评估中常见的一个问题是所有预测特征的注册不完整。此外，并非所有患者都可能完成所有诊断检查，尤其是当他们被认为患目标疾病的风险较低时。此外，如果所使用的测试作为金标准而被选择性地进行，则可能导致结局评估不完整。这些问题在常规实践数据进行的诊断分析中尤为突出。因此，这种情况下前瞻性研究将更有用武之地，因为它们可以采用预先制定的方案进行系统诊断检查和金标准测试。

示例：肾动脉狭窄的诊断

研究者回顾性分析了接受腹主动脉造影检测隐匿性肾动脉狭窄的患者的心脏病学数据库。在开发队列中，635例患者中有128例观察到狭窄。如果患者因怀疑狭窄而接受血管造影，这20%的患病率可能被高估了。

病例对照研究

诊断研究有时会根据参考测试确定的目标疾病是否存在来选择患者，而参考测试则按照常规治疗进行。因此，没有参考标准的患者不会被选择。事实上，这相当于进行了病例-对照研究，其中病例是患有目标疾病的人，对照是未患病的人。这种设计存在一些局限性，特别是与所选患者对所有疑似患病患者的代表性相关。这与嵌套病例-对照研究不同。选择偏倚是另一个重要的限制。事实上，现在已经有了关于诊断研究中可能出现的偏倚的实证证据，特别是当病例-对照设计中包含非连续性患者、非代表性患者（严重病例与健康对照组相比）以及数据是回顾性收集的时候。

诊断急性阑尾炎

C反应蛋白 (CRP) 常用于辅助诊断急性阑尾炎。对于 CRP 较高的患者，手术和病理结果作为参考标准。而 CRP 较低的患者通常不会立即手术，而是通过临床随访观察病情发展，再决定是否为阑尾炎。由于 CRP 水平升高不一定是由阑尾炎引起，轻微感染也可能导致 CRP 升高，但这类感染本身可能自行消退。因此，仅通过随访判断 CRP 较低患者是否为阑尾炎可能会漏掉一些真实患病者，导致 CRP 的诊断准确性被高估。

下期再见！

供稿：圆圆

编排：Roger不言

往期推荐

临床预测模型|1.预测模型的应用有哪些？

-------- 本文结束感谢阅读 --------