肌酐老弟,我又来把你竖起来当靶子了。没办法,谁让你树大招风呢

近几年,肾病学界忽然刮起了一股AI风(AI,Artificial Intelligence,人工智能)。
我当年学医时,AI还没这么火。
我记得1997年IBM研发的「深蓝」,第一次战胜国际象棋冠军卡斯帕罗夫,肾病学界没有丝毫动静。
2016、2017年,谷歌的「阿尔法Go」接连战胜围棋冠军李世石、柯洁后,就有医学家开始投入其中了。
到2020年,「阿尔法Fold」获得了蛋白质结构预测大赛冠军,首次把AI风刮到了生命科学领域。从此,近5年来的国内外各大医学会议,就再也离不开AI了。
近两年活跃起来的ChatGPT,以及我国风头正盛的DeepSeek,无疑是把AI发展到了新的高度。
AI看病,能干啥?
话说AI在医学领域的应用,目前主要在于诊断,判断一个人被诊断为某种疾病「是不是」。
目前还只能做「是不是」这样的判断题,无法做「是什么」、「怎么治」这样的问答题。
这两天我心血来潮,把我们一位住院患者的病历,发给DeepSeek和ChatGPT,让它们帮助诊断,不出所料,二位仁兄都回答得一塌糊涂。它俩要是到病案室上班,要被扣工资的。
不过还是有潜力,如果能把每种疾病的「是不是」进行逻辑整合,未来真有可能答上来「是什么」。
好,前言不多说了,我们来看下今天的主题:
AI模型:Logistic,诊断糖尿病肾病的可靠性高达98%,堪比肾活检!
这几天(2025年2月6日-9日),世界肾脏病大会在新德里召开,我国学者分享了糖尿病肾病诊断AI——Logistic模型的研究结果。

该研究纳入了多家医疗机构的397例糖尿病肾病患者,应用Logistic模型进行诊断。
结果发现:Logistic模型诊断的「接受者操作特征曲线下面积」,高达98%!
关于「接受者操作特征曲线下面积」,这是一个综合了灵敏度和特异度的指标。解释起来比较麻烦,可能有很多朋友也不愿意看,基本上可以把它理解为:98%的情况下,Logistic模型能诊断出糖尿病肾病。
98%是什么水平呢?
作为对比,还是拿出我们的「劳模」——肌酐。肌酐诊断肾功能损害的接受者操作特征曲线下面积,是82%.
其实82%也并不算差了,医学上,大多数的指标都在70%-90%之间。如果是60%,那这个指标是不合格的,因为我就算纯粹闭着眼瞎蒙、五五开,还能蒙对50%呢!如果超过90%,那就胜过大多数的医学指标了。
所以AI做到的这个98%,已经挺好了。
要做到这点,其实也并不复杂,无非是给模型喂足够多的样本,让它不断地调整参数。只要喂得样本足够多,诊断水平自然会升高。
这很像肾科小医生的成长过程,不断地经历更多患者、积累经验,诊断水平也就上来了。
这AI比医生强吗?
也不一定,把喂给AI的那些视网膜检查结果,喂给医生,医生的水平也会高起来。当你在肾科看得病人多了、疑难杂症多了,诊断糖肾还算不上难题。
而且医生不仅会看Logistic模型看的那些视网膜检查结果,还会综合其他相关检查,来避免误判。医学是一个很难通过「暴力运算」来解决的学科。
AI和医生相比,各有各的强项:
AI的优势,是判断单一病种的速度极快;
医生的优势,是分析多病种、规划治疗方案的能力更强。
对于医生来讲,AI相当于一台更加强力的检验设备。诶对了,写到这我发现,我不该把DeepSeek和ChatGPT安排到病案室的,该把它俩安排到检验科。
那AI诊断能取代肾穿刺活检吗?
随着诊断手段的丰富,活检的必要性在下降,AI确实取代了活检的一部分功能。
但也不能说AI诊断能够完全取代肾穿刺活检,毕竟活检除了判断单一病种之外,还有筛查多病种、评价损伤程度、损伤部位的作用。
至于要不要做活检?AI就做不了判断了,还是得靠医生。