点击蓝字
关注我们
AI TIME欢迎每一位AI爱好者的加入!
2023年3月22日,由国际科技信息中心主办,AI TIME承办的SCITIC论坛“细胞,基因和人工智能:探索医学研究的未来”完美收官。SCITIC论坛由国际科技信息中心倾力打造,围绕深圳“20+8”产业集群相关方向与研究领域,邀请国内外青年学者、科研与产业界专家进行技术前沿与产业趋势内容分享,旨在通过前沿领域输出和观点思辨来探讨各领域的未来发展以及互相之间的交叉与融合。
本期活动是国际科技信息中心SCITIC论坛系列直播活动的第四期,邀请到了加拿大魁北克省人工智能研究中心(Mila)副教授唐建、苏州大学研究员,博士生导师王后禹、中国人民大学高瓴人工智能学院助理教授,博士生导师黄文炳。三位嘉宾从细胞和基因的角度,带领观众了解和讨论人工智能技术对医学研究的认识和应用所带来的改变。本次活动共吸引了线上约1.8万人次观看,引发了观众对医学人工智能的热议。
唐建:Generative Biology: Towards Building the “ChatGPT” in Biology
人工智能与生物科学这两项革命性技术的深度融合,为全新药物分子的生成带来了巨大机遇。一方面,生成式人工智能近年来取得了重大突破;另一方面,以高通量基因测序、编辑和合成为代表的生物技术为生物分子理解提供了海量数据,开创了人工智能的新时代。在本次报告中,唐老师首先介绍了人工智能与生物技术的背景知识,然后重点分享了自己对如何在生物学中构建生成式人工智能或“ChatGPT”的想法和思考,最后介绍了自己在这个领域所做的一些研究工作,让大家以一个全新的视角认识了生物学中的“ChatGPT”。
王后禹:用于临床诊断的硅基SERS-AI芯片
基于硅纳米材料独特的光学特性、良性的生物相容性和丰富的表面化学特性,新型的硅纳米结构已被广泛应用,比如低成本、高灵敏的SERS传感器、可重复和敏感的硅基SERS传感平台等。因此,硅纳米薄膜芯片可以作为一个有前途的工具,用于生产大规模和可靠的数据库,并且在未来有可能帮助人工智能在快速和准确的临床诊断中做出决策。王老师在本次分享中介绍了硅基SERS芯片的研究背景,并基于课题组目前的研究工作,带领大家回顾硅基表面增强拉曼散射(SERS)-人工智能(AI)芯片在传感应用领域的最新进展,让广大观众感受到了SERS-AI芯片的强大魅力。
黄文炳:面向分子系统的图神经网络模型设计
生命科学中的药、蛋白质、抗体、RNA等物质分子具有特定的空间几何结构,构成了一类重要的数据形态——几何图。与社交网络中的拓扑图不同,几何图中的节点占据了一定的空间位置,需要满足某些内蕴的物理性质,比如对称性,导致传统的图神经网络难以处理几何图。近年来,等变图神经网络由于有效嵌入了对称性,具有良好的解释性、泛化性和通用性,在分子系统表示上得到了广泛应用。黄老师在本次分享中首先讲述了数理等变图神经网络的发展概况,然后介绍课题组近期在分子动力学模拟、分子结构表示学习、小分子生成、抗体设计与优化等重要科学任务上的应用情况,最后展望ChatGPT影响下图机器学习的潜在研究方向。
Debate
1
未来人工智能会代替医生吗?
由人工智能带来的医疗事故谁来负责呢?
王后禹:因为我的背景是化学和材料,对于算法这个领域不是特别熟悉,我们只是把它作为工具,ChatGPT目前这么火热,也是因为大家把它作为一个工具。比如说我不会写代码,然后我问ChatGPT,他能够很快地将代码告诉我,这也就意味着有很多的工作有可能被人工智能所代替。医生分为两大类,一类是临床做手术的医生,另一类就是针对体检结果做出诊断的医生,那其实诊断这种工作是可以由人工智能去代替的,比方说用人工智能去分析诊断结果的正确性,当然目前可能只是作为主治医生的一种参考。但是未来是否会有像这ChatGPT类似的人工智能的出现去代替医生做出诊断结果,我相信是能够去代替一部分工作的,但是这又会涉及到一些伦理和法律方面的问题。比如说在出现医疗事故时,人工智能的诊断结果也有可能会出错,那关于责任人的判定问题,我觉得未来随着人工智能技术的发展,国家也会出台相应的政策和法律。
黄文炳:我觉得人工智能替代医生是为时过早。医生有很多种,临床手术的医生被人工智能替代在可见的未来可能不会那么快,我觉得更多是成为助手。就以ChatGPT举例,很多报告的生成或者文字式的建议可以依靠它来完成,未来它就像一个APP一样既可以为医生所用也可以为病人服务。在我们国家医生相对患者来说是比较少的,但是有了AI之后可以减轻医生的负担,但目前来看并不能替代医生核心的专业能力,更多是作为一个助手的角色。医生可以通过ChatGPT简单地处理一些病例,这样的话可以省出更多的时间去研究更难的病例。同时ChatGPT对于病人也是如此,可以将病人的检测报告转变成文字,为病人的疾病治疗提供一些建议。关于AI是不是会带来一些医疗事故,以ChatGPT搜索参考文献为例,我们会发现某些情况下是不靠谱的,但这又是很容易被专业人士分辨出来的,所以我认为ChatGPT更多地像一个助手,然后通过医生或者病人的评价就能知道它是否靠谱,这样的话在很大程度就能够减少医疗事故的发生。
赵俊杰:之前我做过一篇文章,是探究疫情前后大家对人工智能医生看法的一个问题,我们的整个研究结果发现其实大家对人工智能的包容度还是蛮高的,大家比较能接受AI医生。但是就像刚刚黄老师提到,AI可以作为助手但不能完全依赖AI。
唐建:我觉得这个问题应该区分应用场景,一方面比如将机器人应用在外科手术中,这个还是有必要的,另一方面是让机器人去做疾病诊断,我觉得目前是不太可能的,只能说充当一个辅助医生进行诊断的角色。
2
打造类似ChatGPT的生物基座
大模型会面临哪些挑战?
黄文炳:我觉得这肯定是一个非常有价值的研究,而且不能因为挑战的存在而忽略问题的存在。就像前面唐老师讲的打造类似ChatGPT的生物基座大模型,如果真能打造出来,那我想其影响力就不只是用工业革命来定义了,我相信每一个从事AI相关领域或者做基础科学的人,都会有这样一个美好的愿景。但会面临哪些挑战?所以我们就在思考ChatGPT的成功点在哪里,目前来看更多还是在NLP领域。NLP这种数据是海量存在的,因为经过信息化革命之后产生了电脑和互联网,这样的话就产生大量的轨道数据,给它提供了很好的训练素材,这是其中一点。其次,ChatGPT是人工定义的NLP,所以词典的大小最多就是常用的几千个单词,它的维度并没有那么大。第三,它的应用场景更多还是信息空间,一旦跟物理等领域打交道的时候,就会存在很多问题。所以以ChatGPT类比,推测可能会面临的挑战。我想第一点,是数据的获取并没那么好;第二,物理空间的维度要远远大于信息空间的维度,它不是一维的,是二维三维甚至四维时空,并且很多理论都是未知的;第三,它如何与物理世界形成交互去提高自己的学习能力,人类又该如何去进行多维度的评价体系。我想这三个挑战是我认为的打造类似ChatGPT的生物基座大模型会面临的挑战。
王后禹:我相信目前面对的一些困难在以后是能够克服的,因为任何技术都有一个发展过程,就像在ChatGPT之前如果大家谈到人工智能只会突然想到Alphago,但它距离人类还是有一定距离的。人工智能的概念在上世界五十年代就提出来了,直到2010年左右渐渐火起来,包括图像识别、自动驾驶等各种技术,本质上其实是算法的突破和硬件的发展。当软件和硬件相结合,在两者相互匹配共同发展的情况下,未来的一些挑战是能够克服的。我们在科研过程中还是将AI作为一种工具,比如说在芯片领域,我们的卡脖子技术并不是芯片本身,而是芯片加工的设备,我们目前没有能力去生产非常高尖端的这种光刻机,我们缺的是光刻机的制备技术,但我相信总有一天是可以突破。所以人类未来的发展是有一定过程的,即使面临众多挑战,未来肯定也是能够突破和发展的,这是我的一些观点。
唐建:就像前面提到的一样,在生物领域中数据是异构的,包含的噪点也比较多,并不像文本、图像、代码那么干净。如果数据是来自不同实验室或医院,测量的仪器也会有不一样的准确度标准,如果只是简单地将其合并在一起,会存在不同程度的差异。此外,现在生物领域的数据量也是很大,增长速度很快,是可以超过摩尔定律的,这是我认为的几点挑战。
赵俊杰:谢谢老师们的分享。刚才老师们分别提到了算力以及参数的问题,想请各位老师谈谈,关于AI的可解释性,在生物基座大模型中这个问题会不会更加突出?
黄文炳:我觉得可解释性是个伪命题,在使用ChatGPT的过程中,我们并不了解它的内部结构,但是在跟他聊天的过程中一旦输入输出能够达到我们对性能的要求,就不太会关注可解释性这个问题,但并不意味着这个研究不重要,我觉得只要未来大模型能够达到一定标准,可解释性的研究就不会特别迫切,这是我的一个观点。
王后禹:我认为这也是一个伪命题。在我们材料或化学领域经常会问到一个问题,比方说我们用计算器去模拟各种各样的东西,专家会问有没有通过真正的实验进行验证。如果是比较简单的实验可以亲自去做,但是非常复杂的实验做起来是很困难的,那我觉得面对生物方面的复杂体系时,是可以用人工智能作为工具去代替人类的。就像在科研论文中,去对每个观点进行验证是不太现实的,所以我也认为可解释性相对来讲是个伪命题
3
Word可一键生成PPT,GPT-4
植入微软Office全家桶,全球
打工人似乎要被革命了,打造
类似ChatGPT的生物基座大模型,
是否会导致相关岗位人员的就业
危机?会改善传统的医疗服务模式吗?
王后禹:我个人觉得每个新技术的出现都会对于原有的体系有一个冲击,对就业人员造成一些危机,但同时也会带来一些新的就业机会和促进新领域的产生。目前GPT-4植入Office,不确定它能够促进哪些新产业的出现,但我相信只要有利于生产力发展,那一定会有大量新增的机会。未来当在化学、物理、生物等一系列的行业中出现类似ChatGPT这样的大模型时,就是产业革命的到来,是一定会对以前的产业秩序造成破坏的,同时也会带来大量新的机会。
黄文炳:我非常认同王老师的观点,但我觉得最重要的问题是小学和中学的教育问题。我认为我们应该去反思现在的教育方式,不能再通过死记硬背、强行灌输的方式,我们更应该思考未来要教育什么样的人,应该培养什么样的能力,这才是我们应该关注的。第二点,从真正的底层逻辑方面出发,我们应该探讨,该不该把ChatGPT这种人工智能技术引入到教育中,教育问题是大家未来更多关心的问题。
唐建:像现在通用领域的ChatGPT定义是比较明确的,ChatGPT为了理解自然语言或者图像,它涉及的应用也基本上是跟数据相关的下游应用,比如文字方面的新闻媒体创作、代码编写以及图像创作等。而打造类似ChatGPT的生物基座大模型,生物里面的ChatGPT却不是很好定义的。当像ChatGPT这种生成式人工智能应用在生物领域中会有多种可能性,比如说生成蛋白质的基因序列,肯定是能够对药物设计有一些帮助。我们可以通过让ChatGPT学习医学文化,让它对疾病的了解更加深入。生物领域中的数据类型很多,包含文本、多组学数据和序列结构数据等等,所以我认为打造类似生物领域的ChatGPT是不太好定义的,即使想法上可以融合,但是真正意义上的实现还是一个很具有挑战性的难题。
4
数据的隐私安全性与人工智能模型
的可解释性问题一直是大家重点关
心的,人工智能与医疗领域细胞、
基因的结合会使安全性和隐私性问题
更加突出,在这一类问题中,当前
面临的挑战以及解决方案有哪些呢?
王后禹:关于数据的隐私安全性,不单单是人工智能,有些信息大家是鼓励公开的,但一旦涉及个人的隐私问题就会比较复杂,隐私当然需要被保护。所以说对于这个问题需要区别对待,有些信息大家是希望共享的,因为只有共享了才能够推动科学的发展和促进一些问题的解决,而在某些特定环境下比如说个人隐私也是需要去保护的,这是我的一些见解。
黄文炳:我觉得隐私问题比可解释性更重要。比如联邦学习在获得数据的前提下能完成一个统一模型的训练,我觉得这是一个很好的趋势,所以我觉得在大模型大数据的背景下,联邦学习也是一个帮助大家更好地保护隐私的研究热点,这类研究的需求会更加迫切。
唐建:其实我们也会用一些病人的多组学的数据,但我们会把病人的个人信息隐藏,我们主要观察的是宏观信息,是将多个病人信息合并后得到的一些启发和知识,比如说将细胞基因对上的一些数据进行匿名化处理后再实验,我认为这是可行的。
5
脑神经类疾病一直是医疗领域的
重点,人口老龄化也是国家重点
关注的问题,人工智能在脑神经
疾病的病理研究中有哪些机遇和挑战?
赵俊杰:比如阿尔兹海默症,现在还没有一种针对性的药物或者一种可行的方案能够治愈这种疾病,想请各位老师聊聊对于这类疾病,在这种人工智能的时代,能够带来哪些好的解决方案呢?
王后禹:刚才我的报告里面讲到了偏重于淋巴瘤的切片,如果去医院的话,各种的检查和病理分析会耗费较多的时间,会导致后续的治疗相对滞后,那么脑神经类疾病或病理的研究就有可能借助人工智能实现精准快速的诊断。关于阿尔兹海默症这种脑神经疾病,我觉得最大的问题到现在它的致病机理还没有完全清楚,针对性的治疗就更加困难了,所以关于医疗诊断首先肯定是要把最原始的致病机制分析清楚,才能去更好地进行治疗。
黄文炳:我认为在脑神经疾病的病理研究中机遇和挑战是共存的。我也希望未来的医学家、科学家或者病理学家能够通过一个途径将积累的数据放在平台上共享,这样就可以提供一个底层的研究基础。但是共享平台的隐私问题也非常重要,如果能在隐私保护很好的前提下,这个平台能提供很多脑神经类或其他疾病的数据,对研究人员来讲也是一个新的机遇。当然还有包括如何去跟交叉领域的研究者合作交流,我认为这是研究工作之外的一些挑战。
唐建:我觉得生物制药一直以来就是比较大的难点就是对疾病构造的一个理解,随着基因测序要多组学数据的发展,其实是给我们提供了很好的方式去理解细胞或是器官的功能,这样的话又能帮助我们更好地对疾病进行建模。疾病建模的一个重要应用就是发现新的药物靶点,这是目前的一个研究难点,但是现在多组学的数据就为我们更好地去理解疾病背后的成因提供了一个较好的机会。
国际科技信息中心是致力于打造数据与知识双轮驱动的认知智能平台,涵盖基础设施、科技文献、科技数据、科技情报、高端智库和智能服务等体系。
SCITIC论坛由国际科技信息中心倾力打造,围绕深圳“20+8”产业集群相关方向与研究领域,邀请国内外青年学者、科研与产业界专家进行技术前沿与产业趋势内容分享,旨在通过前沿领域输出和观点思辨来探讨各领域的未来发展以及互相之间的交叉与融合。
往期精彩文章推荐
记得关注我们呀!每天都有新知识!
关于AI TIME
AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。
迄今为止,AI TIME已经邀请了1000多位海内外讲者,举办了逾500场活动,超500万人次观看。
我知道你
在看
哦
~
点击 阅读原文 查看回放!