GBD数据库也是近几年的大热门数据库了,它以其全面性、标准化、动态更新、多领域支持和开放性等优点,成为全球健康研究和政策制定的核心资源。但说实话,单独做GBD数据分析想发高分还是有难度的,选题要精彩,还不能缺乏创新点,数据也要分析的具体透彻才行。但如果你不是很擅长GBD深入挖掘,建议可以尝试结合其他分析手段。
该研究由暨南大学研究团队发自“Advances in Nutrition”期刊,核心内容是研究全球碘缺乏症(ID)的负担,并利用XGBoost模型和SHAP分析技术对1990年至2050年的趋势进行分析和预测。

研究背景
碘是人体必需的微量元素,对甲状腺激素的产生、新陈代谢、生长发育和神经发育至关重要。碘缺乏可能导致甲状腺肿大(goiter)、甲状腺功能障碍、认知障碍,甚至在极端情况下导致克汀病(cretinism);全球疾病负担研究显示,碘缺乏对全球健康有显著影响,尤其是在亚洲地区。
研究思路
1、本研究作者使用了XGBoost模型和SHAP(Shapley Additive Explanations)分析技术。XGBoost是一种机器学习算法,能够处理复杂的非线性关系,而SHAP则用于解释XGBoost模型的预测结果,使模型更具可解释性。
2、研究数据来源于GBD 2021,覆盖1990年至2021年,涉及204个国家和地区。
3、研究还使用了社会人口指数(Sociodemographic Index, SDI)和碘盐覆盖率数据。
主要结果
1、1990年至2050年全球范围内的ID数量和ASR

2、1990年、2021年和2050年全球按性别和年龄组分列的身份证人数和比率

3、990年、2021年和2050年全国ID的ASR

4、1990年至2021年和2021年至2050年国家层面ID ASR的EAPC

5、年龄、时期和出生队列对全球ID发病率、患病率和DALY率的影响

6、原始XGBoost模型中预测ID发病率的特征的SHAP汇总图和相关性图

7、原始XGBoost模型中预测ID患病率的特征的SHAP汇总图和依赖图

8、1990年、2021年和2050年全球和区域水平上SDI与ID ASIR、ASPR和ASDR的加权相关分析,以事件病例、流行病例和DALYs为权重

文章小结
尽管XGBoost+SHAP模型在预测碘缺乏症趋势方面表现出色,但研究也指出了一些局限性,例如模型的“黑箱”特性和数据的局限性;未来的研究可以通过纳入更多变量(如社会经济因素、医疗保健获取和环境因素)来提高模型的准确性和适用性。