随着人工智能技术的飞速发展,医疗语言大模型在全球范围内迅速崛起,成为推动医疗行业变革的重要力量。腾讯优图实验室通过结合深度学习和大数据技术,开发了一系列医疗人工智能(AI)解决方案。这些解决方案不仅助力疾病预测和个性化治疗,还在临床辅助决策中发挥了重要作用。
2024年中国国际服务贸易交易会期间,国家卫生健康委员会百姓健康频道(CHTV)于9月13日在北京举办了“2024首都国际医学大会的平行论坛——数智医疗与医学人工智能创新论坛”。在该论坛上,腾讯优图天衍研究中心主任、专家研究员吴贤博士以“从深度学习到大模型,医学自然语言处理上的一些尝试”为主题进行了主旨报告。吴贤博士的报告深入探讨了医学大模型在医学自然语言处理中的创新应用,展示了腾讯在这一领域的最新研究成果和应用实例。
吴贤博士
医疗AI的全流程嵌入——从诊疗到决策
当前,医疗AI不仅限于单一环节的优化,而是通过全面覆盖诊疗全流程,实现从初诊到随访的智能化管理。吴博士以腾讯优图实验室面向医生的AI临床助手为例,指出:这种智能化管理的核心优势在于其能够通过深度学习技术,对海量的医疗数据进行分析和学习,从而在疾病预测、检查报告自动生成、用药推荐等方面提供精准的辅助。而更加全面的算法体系不仅能够为医生提供决策支持,还能在一定程度上优化诊疗流程,提高医疗服务的效率和质量。
以合理用药为例,吴博士介绍,通过构建逾4万种处方集、用药画像和组合用药方案,AI临床助手能够为医生提供智能的用药方案推荐。这不仅有助于减少药物不良反应的发生,还能提高治疗效果,实现个性化治疗。同时,AI算法引擎服务能够为医生提供多维度的数据分析和决策支持,进一步优化治疗方案。
在医疗效率和准确性的提升方面,AI技术的算法体系扮演着关键角色。吴博士提到,天衍研究中心自研的疾病预测模型MedBert已实现了对近3000种疾病的广泛覆盖,其预测疾病的准确率高达96.39%。这一高准确率的实现,得益于算法体系对海量医学数据的深度学习与分析。通过构建合理的算法模型,AI临床助手能够精准地预测疾病发展,为医生提供强有力的决策支持。
同时,基于1000万合理用药规则构建的算法模型,AI临床助手能够进行多维度的分析,及时提醒医生潜在的用药风险。这不仅确保了患者用药的安全性,也提升了治疗效果。此外,AI临床助手还能进行全面医学术语提取,精准提取病症、体征、检验检查、药品等10余种医学实体类型,构建90万个医学术语节点和400万个医学术语关系,为医生提供更为全面和准确的医疗信息。
从数据到模型:医学大模型的构建与应用
医学大模型如何在现代医疗中发挥关键作用?吴博士指出,数据的力量不容小觑,它是构建高效、准确的医学大模型的基石。天衍研究中心极为重视医学大模型研发流程中的数据规模和质量,以及微调过程的严谨性。正是这些“细节“共同决定了大模型的性能,以及其在实际医疗场景中的应用效果。
吴博士强调,腾讯医学大模型的研发始于对庞大数据集的筛选与整合,其训练数据不仅包括了1000亿字的医学预训练数据,包括医学教材、论文、医学百科和药品说明书等,还涵盖了结构化数据,如天衍医学知识图谱(Jarvis-KG),包括医疗通用知识图谱、术语知识图谱和业务知识图谱等,其医学知识覆盖率达98%。此外,吴博士团队采用了3000万个问答对实现了模型数据的微调,覆盖了患者、医生和药企三个场景数据。这对于提升模型在实际医疗场景中的应用效果至关重要,确保了模型能够在多样化的医疗对话中提供准确的信息和建议。
强化学习数据的引入是提升模型性能的关键,在这一过程中,吴博士团队使用了超过36万组数据。针对不同医学问题,微调后的基座模型针对每个问题生成了5条不同的回复。然后,邀请专业医生对这些回复进行评分,模型则根据评分来优化其生成策略。这样的训练方式,不仅提高了模型的预测准确性,还增强了其在复杂医疗场景下的适应性和灵活性。
在实际应用场景中,腾讯医学大模型展现了其强大的实用性和广泛的适用性。吴博士具体介绍了几个典型的应用场景。例如,在科室导诊中,模型通过患者主诉智能推荐相应科室和医生,优化就医流程;在医生推荐环节中,模型匹配患者病情与医生专长,确保患者获得专业治疗;而预问诊功能通过智能问卷提前搜集病情信息,辅助医生诊断;医患对话自动生成则提升沟通效率,模型根据患者问题自动构建医生回复内容。多方加持下,医患双方的诊疗效率得到了极大提升。
此外,腾讯医学大模型的准确率已可以轻松通过临床执业医师考试,能协助医务人员自动生成病历和出院小结,还可化身智能客服,回答医药知识和院务方面问题,为患者提供“一站式”服务。对于医药企业,大模型可以协助其更好地理解医疗市场需求、药物定位以及潜在的研究方向,从而提升内部效率和市场响应速度。
迎接挑战,医学大模型的未来
在医学大模型的发展道路上,挑战与机遇并存。其中,幻觉问题是医疗AI领域面临的重要挑战之一。吴博士表示,为了解决这一难题,腾讯AI采取了基于医学实体和知识图谱的医学推理方法,即通过识别疾病、症状、药物、检查等关键医学实体,并构建知识图谱,从而提高推理的准确性,减少幻觉问题的产生。
此外,天衍研究中心还采用了一种创新的方法——挖掘关键的“知识种子”。这些知识种子是与医学问题高度相关的知识点,它们作为大模型推理的“锚点”,帮助模型在讨论中保持在正确的轨道上,从而得出更可靠的解析和答案。吴博士强调,这种方法在提高医学大模型的准确性和可靠性方面发挥了重要作用。
在中文场景下,医学大模型的应用也面临着更多的挑战。由于中文医疗数据的规模和质量与英文数据存在差距,这给模型的训练和应用带来了额外的困难。吴博士表示,其团队通过构建和利用大型中文医学知识库,增强模型对中文医疗术语和概念的理解能力。并且,他们还开发了专门针对中文医疗场景的算法和模型,以提高模型在中文环境下的准确性和适用性。
此外,在医学场景训练、医学专业性评估、多模态等方面,医学大模型均面临着挑战。吴博士强调,持续的技术创新和严谨的科学研究是推动医学大模型发展的关键,天衍研究中心将继续在数据质量、算法优化、跨语言能力等方面进行深入研究,以期为医疗行业带来更多创新和价值。
从吴贤博士的报告中,我们得以窥见医疗AI领域的发展脉络与未来蓝图。当前,医学大模型正以其强大的数据处理能力和深度学习能力,在疾病预测、个性化治疗、智能导诊等方面发挥着重要作用。通过严谨的训练流程和微调、强化策略,医学大模型能够在确保高准确率的同时,提供更加人性化和精准化的医疗服务。面向未来,我们有理由相信,随着技术的不断进步和数据资源的日益丰富,医疗AI将更加深入地融入医疗实践,为患者带来更高质量的医疗服务,为医生提供更强大的辅助决策工具。
撰文:梨九二审:清扬三审:碧泉编辑:半夏