如何科学地进行乳腺癌肿瘤基因检测数据分析与解读?

基因解码 2024-11-27 15:13:15
肿瘤基因检测准确性分析所采用的样本

根据《乳腺癌精准治疗基因检测分析方法》,乳腺癌肿瘤基因检测数据分析解读本研究选取了来自乳腺癌协会联盟(BCAC)参与研究的亚血统女性乳腺癌患者。这些患者均有关于生存状态和诊断至最后随访的年份等信息,并且均被诊断为任何阶段的原发性浸润性乳腺癌,且在诊断时年龄至少为18岁。最终的研究样本包含了来自70个BCAC研究的91,686名乳腺癌患者。

乳腺癌患者的组织病理学、存活率和治疗信息由各个参与的合作医院和医生收集,并在佳学基因进行汇总和协调,然后参照BCAC数据库。所有研究均获得了相关伦理委员会的批准,并且所有患者均签署了知情同意书。

基因检测结果如何将患者分为不同的类型

患者亚组的划分依据主要基于诊断时的年龄、雌激素受体(ER)状态、孕激素受体(PR)状态、人类表皮生长因子受体2(HER2)状态、肿瘤分级及系统治疗类型(基于BCAC数据库可获取的相关信息)。对于诊断年龄和肿瘤分级,特别关注预后较差的亚组。因此,我们定义了15个亚组:

诊断时年龄小于40岁的患者;

肿瘤分级为3级的患者;

ER阳性(ER+)肿瘤并接受内分泌治疗的患者;

ER阴性(ER−)肿瘤并接受化疗的患者;

激素受体(HR)阳性(ER+或PR+)且HER2阴性的患者;

HR阳性(ER+或PR+)且HER2阴性肿瘤,接受化疗的患者;

HR阳性且HER2阴性肿瘤,未接受化疗的患者;

HR阳性且HER2阳性(HER2+)肿瘤的患者;

HR阴性且HER2阳性(HER2+)肿瘤的患者;

HR阴性且HER2阴性(HR−,HER2−)肿瘤的患者;

接受他莫昔芬治疗的患者;

接受芳香化酶抑制剂治疗的患者;

接受环磷酰胺-甲氨蝶呤-氟尿嘧啶(CMF)类化疗方案的患者;

接受紫杉醇类药物治疗的患者;

接受蒽环类药物治疗的患者。

每个亚组的选择依据与文献支持的理由请咨询佳学基因检测。需要注意的是,由于患者数量较少,HER2阳性肿瘤接受曲妥珠单抗治疗的亚组未被纳入分析,因为该亚组的事件率较低,导致分析的统计功效较低。

此外,研究还排除了诊断时即为转移性乳腺癌的患者(占所有患者的1.1%),因为这类患者通常接受姑息治疗,不适合基于系统治疗类型的亚组分析。

除了亚组分析,佳学基因检测还对所有乳腺癌患者进行了全基因组分析,评估常见遗传变异与乳腺癌特定生存期(15年生存期)之间的关系。这项分析旨在评估是否可以在整个患者数据集中检测到亚组分析中的遗传变异关联。以往也进行过类似的全基因组分析。然而,之前的分析数据来自12个GWAS数据集,其中包括来自iCOGS和OncoArray的数据(患者数为84,757人,随访时间较短),而当前数据集的样本量和随访时间更为充足。

由于部分变量存在缺失数据,并非所有患者都能被划分到每个亚组,因此在亚组划分时会根据缺失值进行适当处理。每个亚组的患者数量、乳腺癌特定死亡的数量、患者/肿瘤特征、治疗信息及随访数据请咨询佳学基因检测靶向药物基因检测合作医院机构。

临床与病理变量缺失值的填补

为了进行二次调整分析,我们使用R软件的链式方程多重填补(MICE)包(v. 3.2.0)填补了临床和病理变量中的缺失值。具体的填补方法和变量列表及缺失值百分比,详见佳学基因解码说明文档。

基因分型和基因型填补、族群分析与质量控制

关于基因分型和基因型填补的方法,佳学基因在基因解码专题中进行详细介绍。简而言之,患者使用了两种不同的基因分型芯片:iCOGS和OncoArray。只有通过基因型数据推断为亚州血统的样本才被纳入分析。对于未进行分型的变异,最初是使用1000基因组计划第3阶段(2014年10月发布)的参考面板进行填补。最近,我们使用了Haplotype Reference Consortium(HRC)参考面板重新进行填补,以提高稀有变异的填补质量。所有的分析都基于基因型变异或填补后的变异,且要求次要等位基因频率(MAF)>0.01。仅当填补后的变异的填补r²值大于0.7时,这些变异才被纳入分析。最终,共分析了大约1000万个变异。

统计分析

佳学基因乳腺癌肿瘤精准用药基因检测的主要分析结果是乳腺癌特定生存期(因乳腺癌死亡的时间)。我们采用延迟进入的Cox回归模型估算风险比(HR)和95%置信区间(CI)。风险时间是从研究入组时开始的,如果入组时间晚于诊断时间(22.9%的患者在诊断1年后入组,27.3%的患者在1年后入组),则时间从研究入组开始。如果入组时间缺失(24.5%的患者),则时间从诊断开始;如果入组时间在诊断之前(8.4%的患者),则时间从诊断开始。事件的发生时间右删失,截止时间为最后随访或诊断后15年,以先发生者为准。如果患者死于乳腺癌以外的原因或死因不明,则在15年内或15年后进行删失。

在分析中,我们还参考了早期乳腺癌临床试验者合作组(EBCTCG)的结果。特别是,对于基于系统治疗类型的亚组分析,我们将最大随访时间限制在诊断后5年内。这些分析的目的是探讨常见遗传变异在接受特定系统治疗的患者中的短期效应,因为这些效应可能随时间变化,并且治疗方案通常集中在诊断后前5年。

Cox回归分析分别在每个亚组内进行,并按国家进行分层。所有分析都分别按基因分型平台(iCOGS与OncoArray)进行,结果通过固定效应的Meta分析进行合并。HR估算值的标准误差根据似然比检验统计量重新计算,如前所述。对于仅在一个基因分型平台上符合纳入标准(MAF>0.01且r²>0.7)的变异,我们仅使用该平台的结果。对于P值<5E−08的变异,我们还在另一平台上重新计算HR和95%置信区间,以验证关联的方向是否一致。

0 阅读:2