前篇文章 ,我们介绍了临床预测模型的相关概念和流程概述。今天我们以具体的研究主题来介绍SCI文章的统计分析流程。
选题与数据
我们以“老年胃癌患者的预后”为主题开展研究,选择某公开数据库的患者为研究对象。数据提取及数据预处理过程忽略。最终确定研究题目为:“Development and Validation of Nomograms to Predict Cancer-Specific Survival and Overall Survival in Elderly Patients With Gastric Cancer”
统计方法
对于分类变量以频率(%)进行描述,并采用卡方检验对各组进行比较。采用单因素Cox回归进行变量的筛选,并以多因素Cox回归构建模型。以Nomogram进行模型可视化,分别采用ROC曲线、校准图和DCA进行模型的综合评价。采用K-M曲线进行生存情况的分析,以Log-rank检验比较差异性。以p<0.05被认为具有统计学意义。
数据纳排流程图
本研究以某公开数据的胃癌患者为研究对象,研究时间段为2010-2015年,详细的数据纳排流程如下图:

结果
临床特征
2010至2015年间共有7561名患者参加了这项研究。所有患者被随机分配到训练组(N=5293)和验证组(N=2268)。两组数据均未显示出显著的统计偏差,结果如表1所示。
表1 老年胃癌患者的临床特征

单因素和多因素Cox回归分析
单因素Cox回归模型首先用于训练集,以分析和筛选与患者生存相关的因素。再以多因素Cox回归模型筛选与老年GC患者的OS和CSS相关的独立危险因素。分析结果见表2和表3。
表2 训练集OS的单因素和多因素分析

表3 训练集CSS的单因素和多因素分析

1、3、5年的OS和CSS的Nomogram
基于多变量Cox回归模型,构建了预测老年GC患者1、3、5年的OS和CSS的Nomogram。

Nomogram的验证
分别以ROC曲线、校准图和DCA评价模型的区分度、一致性和临床适用性。



Nomogram的临床应用
以ROC曲线找到最佳Cut-off值,将患者划分为高风险和低风险人群,并以K-M曲线比较生存率情况。

此外,分别对高风险和低风险人群,以K-M曲线来比较不同手术方式对预后生存率的影响。

以上就是该临床预测模型完整的统计分析案例,只需要补充上完整的文字描述即可形成一篇完整SCI论文了。
后记:
预后模型的研究离不开“随访数据”的内容,但是临床上仅靠医生手工随访获取的数据是非常有限的,然而缺乏随访数据就限制了预后模型的研究和文章发表。该如何突破这层障碍呢?行之有效的方法就是重视患者的随访,加强随访的深度和质量,将随访数据与院内数据进行完美的结合,使临床医生真正受用更全维度的科研数据。
聚焦于肿瘤随访10余年,深入一线深切关注诊后随访的客户痛点,打造出医院电脑端-医生APP-患者微信的“三位一体”随诊平台的西部天使(北京)健康科技有限公司(以下简称:易随诊),专注于肿瘤专科随访、随诊,具有丰富的经验,打通了院内就诊和院外随访数据,不仅实现了医院、医生和患者的互通,解决患者的就诊、复诊等问题,还可以为临床医生的科研提供丰富的科研数据。