2022年11月30日,美国人工智能公司OpenAI发布了一款名为ChatGPT的大型语言模型,引发了全球的关注和热议。ChatGPT不仅能够与人类进行流畅的对话,还能根据用户的输入生成各种类型的文本,如诗歌、故事、代码、论文等。ChatGPT的出现,被认为是人工智能领域的一次重大突破,也为各行各业带来了新的机遇和挑战,尤其是在医疗健康领域。
在ChatGPT上线的第一周年之际,让我们回顾一下过去一年中,ChatGPT在医疗健康领域的一些重要事件和影响。
一、ChatGPT通过了美国医学执照考试(USMLE)
这一成就,显示了ChatGPT在医学领域的强大能力,也为医学教育和医疗服务提供了新的可能性。例如,ChatGPT可以作为医学生和医生的学习助手,提供个性化的教学和辅导,也可以作为医疗咨询和诊断的工具,为患者和医生提供专业的建议和参考。
Med-PaLM是基于ChatGPT的改进版本,专门针对医疗领域的数据和任务进行了优化和训练。Med-PaLM可以处理多种类型的医疗数据,如电子病历、医学图像、医学文献等,也可以完成多种类型的医疗任务,如病情预测、诊断推理、药物发现等。
根据《华尔街日报》消息,今年 4 月起,谷歌的医疗大模型 Med-PaLM2 已在美国梅奥医院(Mayo Clinic)等医疗机构进行实测。Med-PaLM2 是第一个在 MedQA 测试集中达到“专家”水平的 AI 大模型。2023年7月12日,谷歌和谷歌旗下人工智能公司DeepMind的研究人员在Nature上发表一项研究,提出了MultiMedQA评估基准,用于评测大语言模型在临床知识方面的表现,还详解了谷歌医疗大模型Med-PaLM的进化过程。结果研究人员发现,大语言模型构建的AI医生在很多方面与人类医生相当。
Med-PaLM 2 在美国医疗执照考试(USMLE)的MedQA 数据集上得分达到 86.5%,比前一代 Med-PaLM 提高了 19%以上。在 1000 多个实际医疗场景问答中,MedPaLM 2 在 9 项基准测试中,有 8 项表现良好,相较于人类医生回答更受认可。和普通医生的回答相比,MedPaLM 2 有 72.9%的回答被认为是和医生回答相对一致的。这表明,Med-PaLM已经达到了医学领域的专家水平,可以为医疗决策和研究提供强有力的支持和辅助。
三、微软收购了Nuance,推出了基于GPT-4的AI临床笔记软件
2022年3月,微软以 197 亿美元完成对Nuance的收购,Nuance是一家专注于医疗和企业领域的语音技术公司,其产品包括Dragon Medical One(一款医疗语音识别软件)和DAX(一款AI临床笔记软件)等。微软收购Nuance的目的,是为了加强其在医疗领域的布局和竞争力,也是为了利用其与OpenAI的合作关系,将GPT-4这一最先进的语言模型集成到Nuance的产品中。
2023年5月,微软和Nuance联合发布了一款基于GPT-4的AI临床笔记软件,名为DAX 2.03。DAX 2.0可以通过语音或文本的方式,自动记录和生成医生和患者之间的对话内容,以及医生的诊断和治疗计划等,从而减轻医生的文书负担,提高工作效率和质量。DAX 2.0也是医疗行业第一款结合GPT-4模型的应用,展示了语言模型在医疗领域的巨大潜力和价值。
2023年5月,医联宣布推出了第一个国产医疗大模型MedGPT。MedGPT是基于ChatGPT的改进版本,专门针对中文的医疗数据和任务进行了优化和训练。医联方面表示,medGPT采用大模型技术,基于医疗知识图谱为模型提供丰富,准确,结构化的医疗知识,并收集整理接近20亿条真实医患沟通对话,检验检测和病例信息进行深度训练学习,同时利用医生真实反馈进行强化学习,用以保障模型的推理质量,准确性与可靠性。
医联medGPT首次突破了AI医生无法与真实患者连续自由对话的难点,并在医疗问诊场景中支持多模态的输入和输出,在疾病的预防、诊断、治疗、康复四个重要环节全面实现智能化。
为了验证MedGPT的性能,医联与四川大学华西医院进行了合作,对比了MedGPT和华西医院的专家医生在回答医学问题方面的表现。结果显示,MedGPT的平均得分为88.7%,而华西医院的专家医生的平均得分为89.3%,两者相差不大。这说明,MedGPT已经达到了国内医学领域的专家水平,可以为中国的医疗决策和研究提供高效和可靠的服务和辅助。
两位来自美国的医学教授于2023年9月6日在Cureus杂志发文表示,ChatGPT在医学文献中的指数级增长,截至 2023 年 8 月已累计超过1000篇。这些论文涵盖了从基础医学,到临床医学,到公共卫生,到医学教育等各个方面,展示了ChatGPT在医学科研中的多样性和广泛性。这些论文不仅展示了ChatGPT的能力,也表明了它对医学界的影响,以及对患者护理和医疗保健系统的贡献。
MediSearch是由硅谷一家创业公司研发的一款基于 LLM 和搜索的智能医生,这家创业公司团队正式员工只有两人。但是这家公司却得到了全球最著名的孵化器YCombinator 的投资和孵化。其核心技术是基于ChatGPT的API,结合了医疗知识图谱和医疗本体等技术,实现了对医疗数据的深度理解和智能检索。用美国医师资格考试的数据集 USMLE,来评测同类产品的精度,MediSearch 排名第一。用 MedQA 数据集,来做类似的横向对比测试, MediSearch 名列第二,榜首是 Google MedPalm。
MediSearch的特点是,它不仅可以根据用户的输入,返回相关的医疗文献、数据、图像等信息,还可以对这些信息进行分析、总结、评价、引用等操作,为用户提供更有价值的内容和服务。
GPT-4V (ision) 是 OpenAI 最新的多模态基础模型。相较于 GPT-4,它增加了图像与语音的输入能力。微软作为OpenAI的合作伙伴,发布了一份研究报告,探讨了GPT-4v对医疗领域的影响。
该研究通过案例分析评估 GPT-4V (ision) 在多模态医疗诊断领域的性能,一共展现并分析共计了 128(92 个放射学评估案例,20 个病理学评估案例以及 16 个定位案例)个案例共计 277 张图像的 GPT-4V 问答实例。涵盖了 17 个医学系统,包括:中枢神经系统、头颈部、心脏、胸部、血液、肝胆、肛肠、泌尿、妇科、产科、乳腺科、肌肉骨骼科、脊柱科、血管科、肿瘤科、创伤科、儿科。图像来自日常临床使用的 8 种模态,包括:X 光、计算机断层扫描 (CT)、磁共振成像 (MRI)、正电子发射断层扫描 (PET)、数字减影血管造影 (DSA)、 乳房 X 射线照相术、超声波检查和病理学检查。
2023年9月,一则关于ChatGPT救命的新闻引发了社会的广泛关注和讨论。新闻报道,美国一位名叫艾米的妈妈,为了给她4岁的儿子查出病因,3年来跑遍了全国17位专家,却始终没有结果。她的儿子患有一种罕见的遗传性疾病,导致他的身体无法正常代谢蛋白质,从而引发了一系列的症状,如发育迟缓、肌肉萎缩、智力障碍等。由于这种疾病的基因突变非常复杂,目前的医学检测手段无法准确诊断。
在绝望之际,艾米在网上看到了关于ChatGPT的介绍,决定尝试一下。她通过ChatGPT的网站,输入了她儿子的病历、基因检测报告、症状描述等信息,请求ChatGPT给出一个可能的诊断。没想到,ChatGPT在几分钟内就给出了一个答案,指出了她儿子的病因是一种名为“肌酸激酶缺乏症”的罕见疾病,这种疾病是由于肌酸激酶基因的突变导致的,目前没有特效的治疗方法,但可以通过饮食控制和营养补充等方式缓解症状。
艾米非常惊讶和感激,她立即将ChatGPT的诊断结果拿给了她儿子的主治医生,医生经过进一步的验证,确认了ChatGPT的诊断是正确的。艾米说,她很感谢ChatGPT,它给了她一个明确的答案,让她不再为儿子的病情感到迷茫和无助,也让她有了更多的希望和信心。
2023年10月,《波士顿环球报》发文探讨AI在心理健康领域的影响。报道指出,数百万人通过AI生成的虚拟伴侣缓解了孤独和心理压力,应用如Replika、AI Dungeon、ChatGPT颇受欢迎。美国的“孤独感病毒”成为公共卫生问题,心理健康服务短缺。现存问题是,人们对AI治疗性关系的需求广泛存在,但心理健康状况复杂,且尚无追踪机制。报道引用用户案例,如凯特通过Replika找到安慰,杰克通过ChatGPT与莉莉互动。心理学家认为AI可作为有效的心理干预,提供情感支持,但伦理学家担忧可能导致心理依赖和失真。报道呼吁保持理性,避免过度依赖AI,平衡虚拟与现实关系,追求真正的幸福和满足。
ProGen是一家专注于蛋白质设计和工程的创新型企业,其目标是利用人工智能技术,创造出具有特定功能和性能的新型蛋白质,为医药、农业、能源等领域提供新的解决方案。ProGen的核心技术是基于ChatGPT的改进版本,将蛋白质的氨基酸序列视为一种自然语言,利用大型语言模型的技术,对蛋白质进行建模和生成。ProGen可以根据用户的输入或需求,生成符合特定条件和目标的蛋白质序列,如稳定性、可溶性、亲和性、催化性等,也可以对已有的蛋白质序列进行优化和改进,提高其功能和效率。
ProGen的创始人兼首席执行官,一位名叫约翰的生物学家,表示,ProGen是受到了ChatGPT的启发,他认为,蛋白质和语言有很多相似之处,都是由基本的元素组成的复杂的结构,都有其内在的规律和逻辑,都可以表达出丰富的信息和意义。他说,ProGen的目标是利用ChatGPT的方式,探索和挖掘蛋白质的无限可能性,创造出更多的生物奇迹和价值。
最后,AI大模型对医疗的改变刚刚开始,任重道远。虽然目前AI大模型在医疗领域已经取得了一些进展,但相比医学领域的广度和深度,这仅仅是开始。要将AI大模型真正应用到复杂的医疗场景,路还很长,任重道远。
AI大模型在医疗研究创新方面已经开始发挥巨大的作用。AI大模型具有学习和推理能力强、知识积累快等优势,这为医疗创新提供了新的思路和可能。如果与医学专业知识和临床经验相结合,AI大模型在药物设计、病理分析、精准诊疗等方面具有巨大的创新潜力。
AI在安全、合规、幻觉等方面还需要优化。当前AI大模型还存在安全隐患、结果偏差、推理不可解释等问题。这对医疗健康领域提出了更高的要求,需要在安全性、可解释性、可靠性等方面不断优化AI模型,确保其应用的安全性和有效性。
人类健康的改善需要AI的更大创新。AI大模型与医疗健康的结合,最终服务和价值体现在人类健康的改善上。需要医疗和AI两大领域的密切合作与共赢,也需要AI在医疗创新等方面有更大的突破,为人类健康提供有力支持。
大语言模型(LLM)|ChatGPT相关文章(以下点击可阅读):
ChatGPT来写基金申报材料到底靠不靠谱?
什么?写提示词就能发医学高分论文!北京大学肿瘤医院:《高级提示词作为催化剂:增强大型语言模型在胃肠道癌症管理中的作用》
顶刊 | 解放军总医院:基于生成对抗网络的主动脉和颈动脉非造影 CT 血管造影
Nature:AI 如何重塑科研范式
GPT-4V在医疗领域全面测评(178页,128个案例)
目前最好的医疗大语言模型居然是……
医疗AI与GPT | 梳理全球医疗大模型
AI大语言模型在医学文本提取结构化信息中的应用
1个小时利用ChatGPT完成神经外科领域的完全虚构的论文!AI写论文的逼真程度令人震惊
精选32篇AI大模型&GPT+医学的论文(免费领取)
以色列一对师生借助ChatGPT,1小时完成1篇论文糖尿病论文
利用ChatGPT,这位医生4个月内完成16篇论文,且已发表5篇!医生科研开启加速模式!
Nature新规:用ChatGPT写论文可以,列为作者不行
AI论文 | ChatGPT在放射医学领域的应用探索
AI论文 | ChatGPT在医学中的应用概述:应用、优势、局限性、未来前景和伦理思辨
AI论文 | GPT-4 对诊断罕见眼病有什么作用?
AI论文 | 从临床和科研场景分析ChatGPT在医疗健康领域的应用可行性
AI论文 | ChatGPT可以撰写研究文章吗?以人群层面疫苗有效性分析为例
北医三院:ChatGPT用于用药咨询行不行?
北京协和医院:大型语言模型在重症医学中的应用与挑战
ChatGPT在PubMed上的发表数量超过1000篇:展望未来之路
Nature:大语言模型构建的AI医生,比人类医生更出色
GPT辅助论文降重教程,100%降至13%(实用指令,赶紧收藏)
国自然基金委:在各科学部设立科普类项目!面青地等将科普成果列入项目成果;资助强度较大项目,应围绕项目开展科普工作
2023年国自然医学科学学部人工智能及大模型相关课题项目汇总
科研之心,致力于探索AI大模型与科研结合。科研之心为您提供最新的AI资讯、最实用的AI工具、最深入的AI分析,帮助您在科学研究中发掘AI的无限潜力。
欢迎关注,保持交流!