tingzhushaohua

北大“人工智能前沿与产业趋势”课程整理03

第十二讲：IBM谢国彤-个性化、循证的智慧医疗

第十二讲：IBM谢国彤-个性化、循证的智慧医疗

IBM全球有12家研究院，除了南极洲，每个大洲都有IBM的研究院，整个医疗研究团队是全球性的。

在2011年，IBM推出了Watson系统，能够与人类进行智能问答竞赛。从2011年到现在，已经过去六年了，我们的体会是把一个通用的人工智能系统应用到行业不是简单的事情，不是说你有一个通用的算法，结合行业的数据一跑，就可以出来一个结果，就可以应用去改变这个行业。这是一个很美好的梦想，但是现实要比这个复杂。

IBM做医疗，核心只想解决一个问题，就是怎样利用数据挖掘和人工智能的技术，从海量的医疗数据中挖掘出证据，利用这些证据给患者提供循症的个性化医疗服务。这其实不是一个非常独特的vision，因为数据分析技术从诞生的第一天就跟医疗有关系，现在很多人工智能的基础、概率论的发明其实最早就是用来解决欧洲的疫苗接种问题。所以，数据分析和医疗从第一天起就是关联在一起的。但是这件事为什么到现在又成为一个热门的话题，成为一种可能？我个人认为有两个主要原因：一是计算机算得快了，算得过来了。二是数据在那，有东西可算。

一是算得过来

就计算机而言，图灵那篇论文证明了计算机是能做出来的，然后冯·诺依曼从工程上提出了冯·诺依曼架构，证明了计算机是怎么做出来的。这个工作基本上是在二战前后，1950年左右。半个多世纪过去了，计算机最核心的计算部件CPU并没有什么本质的变化，跟当年冯·诺依曼和图灵设想的没有太大变化，只不过是我们做的更小了，集成度更高了，所以它的计算能力更强了。但是最近几年，计算能力方面，CPU的计算技术有了突破性发展。

1.类脑芯片

不光是IBM，中科院、其他一些公司都在做这方面的工作。类脑计算芯片的核心想法完全突破了冯·诺依曼通过加法器的那一套框架，而是从神经元的角度做了一个芯片。在这个芯片里，没有我们在通用的CPU中看到的东西，而是一个一个的神经元，神经元之间通过突触连接。这样的架构天生就是一个神经网络，利用这样架构的计算机去完成基于神经网络的算法，比如CNN或者DNN的算法，有天生的优势。

目前，一个芯片上有上百万个神经元，神经元之间的连接叫神经突触，可以达到两亿五千多万个。这样一个非常复杂的芯片功耗非常低，只有70毫瓦。70毫瓦是什么概念？一部智能手机的功耗大概5瓦，它的能耗是你手机的百分之一，是一台笔记本电脑的千分之一。所以设想一下，一个拥有上百万神经元、几亿个神经突触的芯片可以做得如此之小、如此之低功耗，可以运行模式识别或者深度学习的task，然后可以放在各种各样的传感器上。这样的话，大家想到边缘计算，所有的事情都成为了可能。所以，这是计算芯片技术的一个大突破，类脑芯片用人脑的神经元架构去构造芯片。

2.计算机架构上的突破

现在很多人在讲量子计算，IBM、谷歌、中科院、其他很多科研机构都在进行这方面的探索。IBM在这个领域已经超过30年。在量子计算机里，核心叫量子Qbate，Qbate特别神奇的一点是它可以既表示0，又表示1，就是大家讲的类似“薛定谔的猫”等的一些概念。所以，一个一位的Qbate就可以同时表示0和1，而且是带概率分布的。如果是两位的Qbate，它就可以同时表示00、01、10和11，它可以表示一个二维的个向量，而且同时表示四个状态。所以，大家可以想像，如果是一个64位的Qbate，它可以表示一个64维的向量，同时表示2的64次方的状态，它带来的计算能力的突破是不可想象的。

IBM在2017年3月份推出了一个名为IBMQ的量子计算机，听起来很萌萌哒。我当时看到图片的第一感觉是好像看到了四五十年代的传统主机，大得像一间房子。目前这个机器在IBM位于纽约的研究院总部。目前这个计算机只有五个量子位，是一个很小的量子计算机。但它主要是实现了一个技术上的突破，可以保证五个量子位有稳定的输出。IBM新的计划是推出一个有50个量子位的量子计算机，其实我一开始也不太理解为什么要做50个，后来我查了一些量子计算的文章，说目前49位的量子位从理论上推算可以达到现在所有超级计算机的计算水平。所以，如果能够做到50位，你就可以beat目前所有的超级计算机。所以，这个比类脑芯片会更远，它可以预见的未来是非常可观的，以后所有的算法设计，所有的软件，如果有无限的计算能力来支撑，很多的想法都会完全不一样。

二是医疗数据的爆炸

从计算能力跳回到医疗本身，第二个因素就是医疗数据的爆炸。这是医疗界关于什么叫医疗数据的调研，或者说从IBM视角来看，医疗数据分析包括什么。简单地说，它包括三大类数据：临床数据、基因数据和大健康的数据。临床数据简单地说就是医院产生的数据，一个人去医院，会做检验、开药、拍片子，这都是医院产生的数据，有一个测算说临床数据对人健康的影响是10%；基因数据是人与生俱来的数据，有很多研究说它对人类健康的影响有30%。所以，有很多人在做基于基因的诊断，包括肿瘤的治疗。当年女神安吉丽娜·朱莉做乳腺切除，就是因为她经过基因测序发现有一些遗传上的变异，所以进行了治疗；大健康的数据就是目前在医院和基因之外的所有跟健康相关的数据，包括人的饮食、运动、工作，包括人在社交媒体上发泄的一些情绪。这些因素全部都是大健康的数据。

从医疗数据分析来说，就是要从海量的医疗数据中寻找医学证据，然后利用这些证据，提供更加个性化、基于证据的临床治疗。

从IBM的视角来看，有了计算能力，有了数据，目前可以做三件事情：1、做一个医疗数据云，把医疗数据先存起来。2、做分析，对这些医疗数据进行深度的计算和分析，把它变成模型，变成一些API。3、做解决方案，针对不同类型的医疗领域的客户，做这些客户能够使用的具体的软件和解决方案。

做一个医疗数据云，把医疗数据先存起来

稍微再说细一点，在医疗云里要解决两个问题：一是解决多模态医疗数据的存储问题。医疗数据是多模态数据，有结构化很好的数据，比如化验单、处方；它还有一些半结构化的数据，比如住院小结、入院的首页，这样的病例里有大段的文本；它还有完全无结构化的，比如医疗影像；它还包括基因测序这样的数据，一个人的测序有几万个基因，有各种各样的变异组合；它还包括时间序列的数据，比如在医院的ICU里，一个人插着各种各样的仪器去测量血压、心率、脉搏等各方面的流数据。这些数据是不同模态的，有些数据适合用关系型的数据去存储，有些数据适合用时间序的数据库去存储。所以，目前没有一种单一的数据模型能够覆盖这种多模态的医疗数据，如何有好的云平台去处理多模态的医疗数据，是要解决的第一个问题。

第二个问题是安全和隐私问题。我们知道存在很多关键信息泄露、信用卡信息泄露。医疗数据是个人非常隐私的数据，保护这些数据是云平台一定要做好的。所以，在欧美一些国家都有针对医疗数据保护的法规，根据这个法规，所有的医疗数据大概有20几项关键的隐私数据，比如姓名、住址、电话、身份证号等，这样的关键信息在进行数据管理时，必须要打马赛克，去隐私化。同时，要对数据进行强加密，即使数据被泄露，也是不可解密的。同时的话，对所有数据的访问，都有一套严格的访问控制，通过这样的方式，来保证数据的安全性。

做分析，对这些医疗数据进行深度的计算和分析，把它变成模型，变成一些API

分析层方面，简单而言做两件事情。第一件事情是对多模态医疗数据的分析，不管是结构化病例数据、影像数据，还是文本数据、时间序列数据，目前不存在一种单一的技术能够对所有的数据进行完美的分析。所以，目前针对不同类型的数据有不同的分析方法，有一些适合用深度学习的方法，有一些适合用时间序列的方法，有一些适合用回归分析的方法或者分类的方法、聚类的方法。用不同的方法来分析不同类型的数据。

第二点，分析与医疗领域相关，医学里有一些特定的问题，不是去分析照片是谁，而是分析数据里疾病风险的因素是什么，怎样做疾病的预测和预防，怎样对患者进行精准分析，可以对患者进行个性化的治疗或者有不同的治疗方案时哪种方案对患者反应比较好，包括影像识别怎样把影像中间的病灶自动发现。这些信息都有非常强的医学知识，医学知识跟分析技术的结合是要解决的核心问题。

做解决方案，针对不同类型的医疗领域的客户，做这些客户能够使用的具体的软件和解决方案

从解决方案的角度来看，医疗是一个非常复杂的行业，有医院、医生、药厂、医疗设备制造商、健康管理机构、医疗保险公司，但是它们的诉求不一样，所以你不可能做出一个可以满足所有人需求的解决方案。所以，你必须要利用底层的云平台和分析技术针对不同类型的客户作出不同的解决方案。

在这个解决方案里，我们有针对医院这样的医疗机构的解决方案，包括像肿瘤的个性化治疗、Oncologyand Genomics、医学影像的分析；有针对药企的，比如帮助药企做新药的发现和上市药物的有效性、安全性各个方面的分析；有针对慢性病管理的，帮助健康管理机构对常见的慢性病人群，比如高血压、糖尿病、慢性肾病、多种并发性慢病的患者进行管理的解决方案；也有针对医疗保险机构的，帮助医疗保险机构更合理地按照价值来付费，进行疾病管理。这些都是IBM不同的解决方案。

目前的平台上，IBM通过过去两年的收购，已有超过两亿美国人的医疗保险数据，有超过一亿美国人的电子病例数据，有超过十亿张医学影像的片子，有美国几十个州的慢性病管理数据，这些数据全都在目前的云平台上。把这些数据关联在一起做分析，就会发现非常有价值的，从任何单一数据源都无法发现的一些insight或者evidence，可以用来支持各种各样的应用。

接下来，介绍一些具体案例。第一个我想介绍的是沃森个性化肿瘤治疗助手。

1.沃森个性化肿瘤治疗助手

首先，肿瘤是一个非常恶性的疾病，目前针对很多肿瘤没有什么好的办法，但它同时又是危害非常大的。以中国为例，我们中国每年新发的肿瘤大概超过四百万。以胃癌为例，全世界每年新发的胃癌大概超过40%是中国人。同时，肿瘤的治疗又是一个很困难的事情，一方面在于这个疾病本身比较困难；二是这个疾病里面的治疗方法层出不穷，各种靶向药物、各种新的治疗方法反复出现。一个肿瘤医生要想当好医生，需要读超过一万篇文献，每个月跟肿瘤相关的新的科研文献超过一万篇，医生读得过来吗？这是不可能的。所以，这个解决方案核心的技术是自然语言理解技术，让机器代替人去读书。这个系统读了两千多万篇文献，从这些文献中做自然语言的理解，去抽取里面的疾病、症状、诊断、治疗，包括患者病情之前的关系，构成一个非常复杂的知识图谱。基于这样的知识图谱，它能实现的功能其实很简单：面对一个患者，这个系统会自动地从这个患者所有的病例信息里自动抽取上百项关键信息，这些信息会在介入后台的知识图谱进行很复杂的推理过程，最后它会给出推荐多个治疗方案和不同的治疗方案跟患者的契合程度。这样可以帮助肿瘤科医生更好地用最新、最好的治疗方案给患者提供个性化治疗。Watson Genetics从基因维度切入，与前面的解决方案一起解决肿瘤治疗。

肿瘤本质上是一种基因变异导致的恶性疾病，医生就想能不能直接用一些药物打靶，靶向作用到那些变异的基因上来控制肿瘤。所以，这个系统它做的事情也很简单，它拿到一个患者的二代测序结果后，通过分子的profiling，把患者所有的变异基因找到，进行很复杂的治疗通路分析。这个通路分析是通过在几千万份文献中学习各种药物、靶向、基因变异、蛋白质作用过程等方方面面构成的一个很复杂的网络。它通过在网络上进行推理，给出相应的靶向药物治疗的推荐。前一阶段有一个新闻报道，日本东京大学有一个患者得了非常罕见的白血病，医生没有见过，没有办法确诊，甚至做出了误诊。借助这个系统，医生很快找到了患者可能得的白血病是什么，同时推荐了一些靶向药物，挽救了患者的生命。

Watson系统先读了很多书，包括三百本期刊、二百多本教科书、几千万文献。这就是一个实际系统使用的界面，来了一个患者系统会推荐，每一行是一个治疗方案。绿色、红色、紫色，绿色的是最好的，包括放疗、化疗、手术治疗、药物治疗等各种不同的治疗。同时，每一种治疗方案，系统会提供更多的信息，比如这个治疗方案的愈后、存活率、毒性等情况。所有这些信息不需要医生提前手工录入，而是由系统自动地从几千万份文献中利用自然语言理解技术，把这些关系的信息抽取出来，构造成一个智库。然后，这些信息在给患者治疗时，会推送到医生面前。其实在很多医院，面对肿瘤治疗等疑难杂症，都会请很多专家，每个专家给出自己治疗的意见，包括这个方案的优缺点。这个系统就相当于是一个读了所有最新文献的专家，把不同的治疗方案，包括它的副作用，包括不同治疗方案、药物之间的相互作用，可以生成一本三四十页的报告提交给医生，帮助医生作出最好的判断。它不是代替医生，而是帮助医生作出一个针对患者最有利的治疗方案。

2.医学影像分析

第二个想介绍的案例是现在在医学AI里非常火的医学影像分析。影像极大的推动了医疗的发展。最早期，医生看病主要靠一个听诊器，后来出现了X光，然后出现了核磁、超声等各种各样的诊断设备。这些影像设备可以帮助医生更好地看到患者体内的信息，甚至包括病理，通过组织切片，用高倍显微镜看到细胞层次的变化，利用这样的信息可以作出更加准确的判断。

影像对医学的作用确实太大了，所以在2003年，发明核磁共振的两个物理学家和化学家竟然得了诺贝尔医学奖。核磁共振极大的颠覆了医疗的诊断和治疗。

从影像角度来看，影像也是多模态数据。有比较常见的二维影像，比如眼底影像、皮肤癌影像，或者消化道的影像；还有三维影像，通过CT或者核磁用切片扫描的方式，一次对人体进行上百次的扫描，生成完整的三维影像，这样也能很好地用来做各种诊断和治疗；还有一类是病理影像，主要做很多肿瘤的治疗，它是要从患者的疑似肿瘤部位取一个组织进行切片，放在高倍显微镜下，是几万乘几万像素的高分辨率影像。往往一张病理影像的片子就有3到4G的大小，这样的影像可以又快又好地提高医疗水平，但它的分析同样是一个很困难的问题。你如果想约做一个核磁或者做一个CT，在协和医院你可能需要约一周，甚至一个月的时间。机器可以不休息，但是人要休息，人看不过来，这就是现在影像分析面临的一个很大的问题，三甲医院的医生有大量的片子看不过来。同时，CT、核磁等，一个患者就是几百张，更可怕的是消化道影像，有很多现在已经有胶囊机器等新的医疗设备，吞到肚子里面，一次拍一个视频出来。做一次检查，可以生成的影像的帧数大概在三万到五万张，有病变的部位不超过30张，从3万张中找出30张相当于大海捞针，需要医生花大量的时间过滤无效的片子。所以，如何利用识别技术自动地发现病兆，提高医生看片的效率，是影像技术进步最迫切的需求。

机器看片原理很简单，就是先模拟医生看一些视觉上的特征，用一些比较经典的影像分析或者模拟识别的方法，通过观察病变部位的位置、大小、颜色、边缘形状等视觉特征，判断这个到底是不是一个恶性的肺结节或者是不是某一种皮肤癌。另外，计算机可以在像素层级上看像素的灰度变化，利用卷积网络在像素层级上进行计算。所以，它可以比人看得更细致。你可以通过构建一个多层的神经网络，很好地从这些像素中间提取隐含的特征信息，利用这样的信息来做判断。

再往前走，影像科医生无法再进一步识别，从计算机的角度来说，它可以看多模态的数据，而不仅是影像数据，还可以看病例信息和基因测序结果。多模态的信息融合在一起，可以达到更好的效果。我们做过很多实验，用影像分析叠加一些其它模态的数据，比如病例数据，从病例数据里面获知患者的黏性、病史、治疗史，提取关键信息，最后作为病变识别的依据，用这样的数据融合，诊疗精度可以提高10%以上。

3.真实世界证据分析

给大家介绍的第三个案例叫“真实世界证据分析”。这个词有点拗口，真实世界证据它对应的词叫做RCT（双盲随即对照临床实验）。RCT是目前公认的一个“金标准”，判断药物或治疗是否有效，必须要做RCT实验来证明药效或治疗方法的效果。*这样的一个实验平均要花十年以上的时间，资金支出会达到十五亿美元。而且成功率不超过10%，大量RCT做到一半就放弃了。RCT非常耗时、耗力、耗钱。*真实世界状况就是跟它做对应的，RCT实验一般它会组织几百个人分组进行实验积累数据，每天生成大量医疗数据，以中国为例，一年就诊的人次接近70亿，相当于是全国人民每年平均就诊5次。这70亿次就诊产生了大量临床数据，但这些数据都散落在各家医院，并没有很好的用于数据分析。这些信息是可以被用来做真实世界证据挖掘的，利用真实世界的信息挖掘出来的数据，不管是用于疾病治疗，还是用于疾病预防都是非常有价值的。

真实世界数据的作用就是输入、输出，把真实世界的数据，如：病例、医保以及疾病等级数据输入进来，输出各种模型，例如：中风病人再中风的预测模型，心梗病人的死亡风险预测模型，某种药物的疗效模型，这样的模型通过一个pipeline得到的。我们发现两点有趣的事情，第一，可以有一个通用的pipeline去解决真实世界数据分析的问题，因为这个过程重复性很强，包括前期导入数据、数据整理、患者群构建、特征抽取、建模、模型的验证等等。

第二，这个分析我们做过各种各样不同的病种，有心血管病、糖尿病、肿瘤等。不同的疾病所需要的分析很多是通用的，比如疾病风险预测分析、患者相似性分群分析、治疗有效性分析或是一些患者依从性分析。这样的分析都可以变成一些可以用的模块，作为一些插件，在这个平台上来做模型的生成。其实简单地说就是一个咖啡机，你把数据放进来就会生成咖啡，但是里面有很多参数，你是要调整的，你是要喝美式、拿铁还是摩卡，你要进行调整。包括这里面有很多参数要调整的，但过程是相通的。

举两个例子，这里就涉及到一些医学知识。第一是我们做的疾病风险预测的例子，这个例子想干什么，这个数据库里面有45000个心梗的病人，每个病人有超过八百个变量去描述这个病人包括他的基本信息、治疗信息、临床信息各种各样的信息。那这个医生想知道哪些因素会导致这个患者出现院内死亡，患者院内死亡可能性是多少，这个就是疾病风险预测的典型例子。这个风险模型以前是有的，TIMI模型是医学界公认的目前已知最好的心梗病风险预测模型，它的性能AUC大概是0.76，利用我们的方法，我们把AUC做到0.87。同时，我们发现了24个新风险因素，有很多风险因素是非医疗性质的，比如社会性因素或就诊医院因素。比如，和配偶生活是一个非常好的保护性因素，就是家庭幸福的人治愈可能性更高。

医生常常也做这类分析，他们一般会有自己的假设，从800个量里面挑出15个/20个，然后从4400万个人里面挑出一千个人，用经典统计方法去做单变量多变量的回归，去看是不是有显著性，这是目前医学统计常用的方法。但是用这种人工智能方法去做时，我们就会用很多新的一些方法，比如做新的特征抽取。举个例子，我们会用共生的模式挖掘，去看这个患者既有高血压又有糖尿病共病，会不会是一个更加有意义的风险因素。这些因素以前医生不会考虑，是我们通过一些挖掘的方法得到的。包括一些共症共治，比如病人同时服用A药B药进行治疗，可能是一种很好的保护性因素，以前不会考虑A加B，或者A加B加C这样的问题。还有包括一些生理指标，比如说血压当前值是多少，如果这个病人血压高压是150，他是从90连续涨上来的还是一直持续到150，还是从180掉下来，医生不管，医生只通过一个时间来做判断，其实数据时间序列的信息没有很好的利用起来，这些都是用人工智能的方法，不管用RN建模或者其他分析的方法，可以很好的捕捉到数据之间时间序列的信息，利用这样的信息可以做更好的预测。

我们最后发现我们把所有的因素，我们不光发现哪一些因素有影响，同时每个因素的权重包括它的分类都列出来了，医生就会说这个病人因为病情太严重导致死亡的，还是治疗不给力导致死亡的，同时每个病人都会按照风险排一个序，横坐标是一个病人的患者号，所以高风险、中风险和低风险所有病人一目了然，这样可以帮助医生更好对病人进行管理。

第二，我介绍一个叫“患者精准分群”的分析。这个也是精准医疗里面非常重要的，什么叫精准？有两个极端，一个极端观点认为每个人都是不一样的，因为每个人的基因都不一样，每个人基因变异也不一样。“个体化治疗”要个性化到每一个“个体”，这是很好的理想，但是现在做不到。另一种观点就是人群治疗，基于一个人群的定义，比如说二型糖尿病，这就是一个定义。医生只考虑“二型糖尿病应该怎么治？”的问题。目前很多精准医疗就是希望在这两个极端之间找到中间状态，以中国为例，心血管病患者2.6个亿，糖尿病患者一亿。这一亿人肯定是不一样的，但肯定不是一亿种情况，怎样在中间找到一个更好的合理分群并进行个性化治疗。这里我们做了一个针对房颤病人的案例，房颤就是心房颤动，它是一种叫心脏慢性指征，本身无害的，但患有这样的疾病，会导致很多恶性心血管事件，包括心梗（心肌梗塞）、脑梗（中风）。我们拿到了大概两万人的数据，每个病人有超过1600个特征进行描述，医生要做的事就是要判断这个病人是高危，还是低危。如果高危，怎么治疗，是不是要对患者进行中风预防。如果这个治疗就这么简单也就罢了，但是很多治疗都是有危害性的，用药过量会适得其反。所以，医生每天都会面临“生死抉择”。这是个问题对医生来说，按照经验，他们知道有些病人不该吃的我给他吃了，但是很不幸，我用以前的模型还不够精准，他发现不出来那些不该吃的病人。所以，我给分了五群。这里就看出来这五群患者将来中风的发病率有显著的不同。有一群人其实属于过度治疗，这群人被传统方法认为是高危，其实并不高危，只不过他以前的模型没有办法捕捉到这个细微的区别。

同时，又发现这群人适用某种药物，针对此类人群，吃这个药物中风发病率是9%，否则发病率就近18%。所以，这一群人对于某种治疗方案反应特别好，而这个治疗方案在所有人群众其实没有显著差异。所以，这就是一个精准的分群方法，能帮助从病例数据中挖掘出更精准的患者分群，然后去帮助医生做个性化治疗。其实分群也不是新方法，但传统上分群是无监督的，很多结果在临床上没有意义。我们一些核心方法，利用结局驱动的方法，我们可以把患者按照中风的发病率区分开来。这个方法，
第一，会判断哪些因素对患者聚类是特别重要的。同时，每个因素的权重是多少。利用这样一个方法，就可以把患者分得特别开，同时，可以去看每个不同人群对不同治疗方案的反应。同时，我们来看一下这个系统是怎么样去工作的。一开始能看到各种各样的数据。这个数据集，可以看到不同的列，大概有一千多列的数据。如果选中了这个数据，到下一步它就会出现各种分析方法，每一块是一个分析方法，有疾病预测分析的，有患者分析的，还可以看分群的过程，一个宏观的分析流程是什么。

如果你选中了这样一个分析模块，你就选中了数据集，选中了分析方法，有一些参数可以调整，比如说想分几个群，用什么方法分群，关注点是住院、死亡还是中风等。分析任务生成后，送到后台运行后就可以看运行结果了。这是第一步，你会看到所有数据项，包括数据分布，这都是在做分析之前做的数据探索，去了解数据的样子，关键结局有没有，人群是什么样的。然后，就可以看到分析结果，这个分析结果包括这里边每个点表示一个人，不同的颜色表示他被分到不同的群，这是那五群人。然后，包括这五群人在不同的观念信息上的一些分布，比如患者之前是否得过中风，有没有糖尿病及治疗有效性等。所有的这些信息都会呈现出来，帮助数据科学家很好地理解。这个过程看起来很简单，其实整个做这样一个分群，是经过大概70个步骤，每个步骤完成了从数据的治理、人群的构建、特征的提取方方面面的过程。通过这样的一个过程，最后得出来一个患者精准分群的模型。它也从此形成了一个模板，有类似新数据要做分析，用这个模板就可以得到分析结果。这里很快的给大家分享一下针对结构化变量的定义，做这种真实世界证据挖掘的工作。

4.认知决策

第四个我想介绍的叫“认知决策”。其实这个决策知识也不是新话题，从人工智能诞生的第一天起就有了，专家系统其实无非就是想去怎么样把专家的知识变成一些计算机可以去执行的规则。上世纪50年代，斯坦福就做了一个针对医学专家系统，当时他们做了几百套规则，针对血液病的治疗，可以给血液病患者进行诊断和治疗。这就是前面的第一步，如果各位有了解过医疗，里面有很多像医疗指南、临床路径，这都是医生总结出来的规律和知识。但只从书本当中学到的知识是有缺陷的，往往学习到的知识比较抽象，实际使用时会有各种各样的问题。以尿病治疗为例，你可以看到当这个指南告诉你这个病人血糖控制的不好，而且目前使用了双胍类的药物，还控制不住，他应该用双胍类和磺脲类联合治疗。指南只能告诉你这些，怎么联合？选择哪种双胍类药物？选择哪种磺脲药物？

医生需要的是一个可操作的action信息，指南很难提供。我们开始尝试另外一条路径，就是用数据驱动的，用机器学习的方法，不管用哪种模型，都可以去做这种基于数据的推荐。简单地说，类似的病人都是怎么治的？治完之后效果如何？以此为基础，就可以得到治疗方案。这样的结果，好处是所有知识都是从数据中学习出来，所有推荐是接地气的。但缺点在于，数据往往都是有局限性的，知识是从这个数据上学出来的。

第二点，很多计算机的模型是“黑盒子”。对医生来说不可解释，不能得出像水晶球一样的模型，模型可以告诉我们质量方案，但不告诉我为什么。在这个过程中就发生了一个真实的例子，分析几万糖尿病患者超过五年的数据，我们发现最好的办法就是上胰岛素，这个效果最好，降糖最快。医生说，你这不是开玩笑吗？没有尝试，我们这个治疗一二三四线，胰岛素是最后的，我一线、二线、三线药物控制不住的时候才会这样。

这里有一个生物逻辑在前，生理生物学的逻辑在背后的问题。计算机分析的结果，效果最好、最明显的就是胰岛素治疗。后来我们发现这个过程特别像一个医生的成长过程，一开始是读书，能把理论框架和非黑即白的知识都把它挖掘出来。但是，真实世界很复杂，医疗不是非黑即白的，面对一个患者的时候，往往有多种选择，每一种选择它都有优缺点，并不存在一个单一的“最好选择”。每一种选择应用到患者身上，效果也不确定，这个患者有效，那个患者无效。所以，好医生毕业后，通过大量病例学习，临床实践，在自己的脑子里边构建了一个概率模型。他知道这个情况可以有这几种选择，哪种选择有效的可能性大，这恰恰是计算机非常擅长的。

所以，我们最后做出来的这样一个概率模型，方法就是用这种指南和临床知识作为骨架，从数据中学习各种从疾病的筛查、诊断、治疗、愈后相关的这些概率模型，把它作为血肉添加到这个骨架上，它就变成一个非常完整的临床决策知识库。

再给大家介绍一个例子，这是一项技术，这个技术它到底能怎么用？我们一开始把它用到了慢性病管理领域。因为中国现在慢性病患者超过三亿，包括2.6亿高血压、一亿糖尿病，一亿呼吸系统疾病，还有很多慢性肿瘤患者。这些患者靠的是约一百万的社区医生来进行管理，现状是“管不过来”。这些医生一年接受两天的上课培训，帮助他们去了解最新的治疗的方案。他们一个人至少管理20种疾病，这对他们来说是一个巨大的挑战。

我们从计算机角度能帮他做什么？我们选择了两个场景，一个场景是做这种疾病的预防，我们去帮助医生们把那些有并发症风险的高危患者尽可能地挑出来。以糖尿病为例，一个糖尿病患者可以出现超过30种并发症，如何及早发现那些还没得中风、没得心梗、没肾衰竭的糖尿病患者，并让医生去进行一些预防。这样既能降低病人痛苦，也能降低医疗成本。第二块就是治疗。一个是防，一个是治，在治这个角度，我们怎么样利用临床指南的知识和我们从几十万、上百万的糖尿病患者治疗的既往的数据中间挖掘出来的这些证据，真实世界的证据结合在一起，针对当前患者最好的治疗方案。

5.医疗自然语言处理

医疗自然语言处理可能是我今天要分享的最后一个例子了。这个里面，它核心的技术是什么或者它解决的问题是什么呢？它要解决的问题就是疾病管理，我刚才也提到了，在中国慢性病患者有三亿人，而高血压的发病率大概是20%。所以，一个拥有五百万人口的城市就有一百万的高血压患者，按照规定这些患者都要被随访管理，会有人问他最近你血压高了没有，降压药有没有按时吃，血糖是不是也有变化，并把这些信息收集起来，然后基于这些信息来进行一个风险的评估和及时的干预。如果发现他血压特别高，可能医生就会督促他进行一些血压的管理，发现他血糖也升高了，那可能也得降点血糖。这些是靠什么来完成的？在一个有五百万人口的城市有一百万的患者要去进行这样的随访，怎么可能随访得过来？医生是不可能做到的，所以现在就招很多护士，包括一些提供健康管理方面的机构来培训这些护士。但是这依然是对人工需求量很大的一个工作。所以，在这里我想说的是，我们可以利用两项关键技术来解决这个问题。

第一个技术是对话技术。我们不是做一个通用聊天机器人，而是做一个像是虚拟护士一样的机器人。这个“虚拟护士”能够执行“护士”的随访的过程，对高血压、高血脂、高血糖病人，进行自动随访，并采集相应的信息，如果系统发现这个病人有情况的话，能够生成预警。

第二个技术是QA技术，也就是问答技术。在中国有很多类似于春雨、好大夫这样的医患沟通网站。在这些网站上面有大量的患者在问问题，其实很多问题都与饮食、运动、作息、药物的副作用、药物之间不良反应有关，但这些并不是核心诊断和治疗的关键所在，那么，这些问题就可以靠人工来回答。同时，我们也能用QA的技术来做患者教育，帮助患者最及时地找到可信赖的信息。这块我给大家看一个演示，就是这个系统是怎么工作的？它的核心技术是怎样的？这个核心技术我挑了一个应答技术这块。它里面想解决的核心问题很简单，是说你的知识库里面的知识或者问题往往都是写得比较规整的，都是医生或者是护士整理出来的，很好的。但是，患者问的问题是五花八门的，比如病名字写错的、药名字写错的。你想大爷大妈能用什么样的词？各种俚语、口语都会有。你怎么样去做这个QA这个核心技术？这是里面一个非常核心的技术，所以在这里面我们不同层级都用了深度学习的技术，包括用CNN做问题分类，做问题的相似性匹配。最后可以达到一个比较好的Top1的效果。

我给大家看一个我们在微信上做得小视频，一个工具，这个工具，这是患者，这是机器人。他就在问，你最近长胖了吗？最近测血糖了吗？基本信息问完之后，它会给一个报告，一个建议说你该怎么样做。这个时候，患者就会有问题，我能吃什么东西吗？或者是说我吃这个药有什么问题吗，这时候系统就会用QA的技术来自动回答问题。它不是那种通用聊天，而是模拟一个护士在跟患者沟通。包括他会跟患者说，你最近吃什么药了吗？而这个用药的列表也是患者个性化的，因为不同的患者吃的药不一样。患者会回答说吃了或者没吃，或者为什么。经过这样一个过程之后，系统在后台会自动地生成随访报告。这个随访报告里面包括当次回访采集到的体重、血压、血糖等信息，也包括这个患者用药的依从性、患者问的问题，通过这个报告，疾病管理师能更好地对患者进行疾病管理。同时，这个系统也具有决策功能。当它发现有风险的时候，会及时地通知患者和医生，让他去医院就诊或者是对患者进行及时的干预，避免酿成大祸。

做医疗的时候，一定要把医学的知识和靠谱的分析手段结合在一起，很谨慎地选择数据，选择人群，选择你要分析的任务。

Q&A

1.神经网络芯片和CPU、GPU或者说FTGA在整个在定位上与神经网络芯片的区别？
大家可以看到，除了CPU之外，现在有GPU、FPGA这样的专用芯片，可以辅助CPU做计算的过程。这类脑芯片它的定位，我觉得它不是要来代替计算型任务的，CPU该干的事儿还是CPU干，类脑芯片它并不是要取代现在计算机能干的事儿。你可以从它的设计来看，它本身就是一个神经网络，是靠神经元和突触，很多普通的计算任务它不擅长，但是它擅长的workload是 neural network 这样的workload。所以，首先从任务上来看，它就和经典的CPU、GPU或者FTGA有一个任务上的切割，这是第一点。

第二点，它特别强调的是低功耗。所以，低功耗就会主要偏向S端，就像这种边缘计算。可以想象有很多物联网或者传感器这样的场景，它可以把这个训练好的模型运行在这样的芯片上。然后，这个芯片你可以想象到。我听说他们当初最早做得是一些机器昆虫实验，机器昆虫绕着IBM硅谷研究院飞，功耗特别低，可以飞好久，可以采集风、湿度、温度等信息。做出这样的东西之后，它可以把有限的计算推送到远端，你可以在远端就做一些事情，又不需要耗那么大量的计算。这样的话，站在边缘计算这个角度，我觉得它可以发挥更好的价值。

2.医疗数据质量问题？
首先关于医疗数据质量问题，我稍微多说两句，因为和我打交道的医疗数据比较多，医疗数据的质量有好有坏，影像数据相对来说质量较好，因为国内一般用的都是国外的标准，所以影像数据的质量比较好。那有一些数据，像病例数据，疾病登记库的数据，往往都是某个学科，比如说像中风，或者高血压，或者权威机构，国家级中心花很大的力气，经过三年、五年去收集的数据，这样的数据一般都在来自于3—5万人，每个患者大概都在1500—2000个变量，这些数据质量也非常高。还有一类数据是医疗保险数据，医疗保险数据它的质量也很好，因为它有连续性，就是不管你是在A医院看的，还是在B医院看的，最后通过医疗保险，能把所有的数据关联起来，这是它的优点。当然它也有缺点，它的缺点就是它只有结果式的信息，没有过程信息，它知道你抽了血，它不知道你抽完血，血糖是多少？就目前来看，病例数据又细分为住院病例和门诊病例。住院病例是质量比较高的，因为很多医生的科研是基于住院病例上面的再加工，所以他会花很多力气去做，包括一些医学院的学生，每天下午就会在住院科录病例，这些病例比较高。病例比较差的是门诊病例，因为在门诊每个病人停留基本上不超过5分钟，医生没时间去做这个事情，他也不觉得这个数据有科研价值，所以呢，这个是数据质量确实是良莠不齐的，所以刚才你也提到在开始做这个方面时，要选择一个好的数据的级和一个好的问题。如果你一开始选了一个特难的问题或是选了一个特烂的数据级，肯定不会有什么好的结果。不是说人工智能不好，有时候可能是医疗价值不好，可能是你的问题和你的数据没有选对。

那回过头再讲，针对这种大量的稀疏的数据，其实目前也有一些技术上的探索，也就是做这种数据的萃取，在传统的统计里面，有很多数据补全的方法，去对这种缺失的数据进行补全，但是在医疗上可能医生觉得这个数据你补了之后，就不是真实数据了，不可信。但是呢，现在有很多尝试这种数据萃取的方法，比如我给你一百万个数据，我从这一百万的数据里面能不能提炼出十万人是连续性比较好的数据，这里面其实还和目前比较火的GANs网络有关系，现在有一些人尝试。这个数据是生成的数据，但是我用的这个数据是从上百万、上千万的数据中间，用数据分布原生成的数据，我用这个数据去训练模型，可以训练出来一个靠谱的模型，所以有很多人做这方面的尝试。我觉得不管是从数据质量还是你选择好的数据题，或者是咱们国家自然的数据质量都在提高。另外一点，有一些技术手段，可以弥补数据质量的缺失。

3.医疗创业？
医疗健康已经占到GDP的18%，在中国占6%，当然，中国还有很大的空间。6%已经不得了，中国50万亿的规模，6%就是3万亿，所以一年3万亿的市场，这里面的机会非常多。

目前以沃森命名的IBM的事业部有三个，第一个是2011年打败了人类智力问答竞赛选手的一个系统，它的定位其实是通用智能。其他两个事业部一个致力于怎么样把人工智能技术应用到医疗领域，另一个是把人工智能技术应用到物联网领域。从目前来看，我并不能代表公司讲它将来的业务发展，但是目前这三个部门的定位，就是这样。

4.IBM做了很多研究，我们看到也是卓有成效的，现在哪些成果已经被广泛使用了？另外，在中国这边，有哪些应用是真正落地的？
IBM在美国目前落地的东西更多一些，沃森健康成立于2015年，到现在不过两年的时间，目前我刚才讲的那些解决方案，其实都有具体的落地，包括肿瘤的治疗、基因的治疗。像肿瘤治疗，中国有20家医院在用，包括在美国、泰国、印度、新加坡就是很多地方都有在使用这样的技术。像沃森的基因治疗，在美国大概有十几家顶尖的肿瘤机构，包括亚洲的东京大学等都在使用这个解决方案来进行基因的治疗。

IBM也宣布了，世界很多知名药企，都在使用IBM的技术或者上市药物的一些分析进行新药的研发。刚才提到的针对慢性病管理，美国有二十几个州，包括在英联邦国家，如爱尔兰、澳大利亚，也都在使用疾病管理的一些技术。

中国的话，国内顶尖的医疗机构都跟IBM研究院有很多合作，包括专注在心血管领域的，脑血管的、糖尿病的、呼吸系统疾病和消化道疾病的这样一些医院。关于这些合作我们有很多论文发表，在最近十个月，我们跟我们的合作伙伴一起，在人工智能的国际会议上、医学期刊上、医学信息学的国际会议上陆陆续续发表了15篇文章。这就是我们的科研合作。

另外一方面，就是让他变成临床。在临床方面有两个事情，一个是糖尿病的管理系统，这个已经在厦门市20家社区使用了。另外，在上海有一家医院很快会宣布使用疾病风险预测技术。患者以前去医院抽完血，出个报告就结束了，但是现在会利用疾病风险预测模型把患者抽血的数据和他在医院里面其他的病例数据结合在一起，给患者做一种心血管的风险和预测，如果发现这个患者是低风险的，就不会告诉患者这个预测，患者拿着化验报告就可以走了。如果患者是高风险的，系统会给他自动生成一个增值的报告，告诉他他的风险是什么，风险因素是什么，应该做一些什么样的事情，来规避这个风险。这是上海一家非常好的三甲医院，目前已经在开始使用了。

你可能感兴趣的:(启程,人工智能,趋势,北大,英伟达,医疗)

山东大学小树林支教调研团青青仓木队——翟晓楠山东大学青青仓木队
过了半年，又一次启程，又一次回到支教的初心之地。比起上一次的试探与不安，我更多了一丝稳重与熟练。心境、处境也都随着半个学期的过去而变得不同，半个学期中，身体上的，心理上的，太多的逆境让我变得步履维艰，曲曲折折，弯弯绕绕，我仿佛打不起精神，没有胃口，没有动力。感觉走的不顺畅的时候，支教这个旅程，给了我力量。自告奋勇承担起队长这一职务的我，从组织时的复杂和困难的经历，协调各种问题，从无到有，和校长和队
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
4招写出高价值文章 zhiliner
文章写得泛泛是因为思考得不够深，思考得越深文章会越有价值。拿到一个主题一定要去深入挖掘事件背后的东西，比如人物困境以及趋势性的东西。写作过程中有几个深度思考的方法一、解剖，让旧素材焕发新意作为一个写作者，我们能够做的最大贡献，就是给出自己看世界的角度。解剖其实就是把这个话题相关的信息都列出来，详细的列出来，看清楚它的内部。我们看到一个老话题或者一段旧素材的时候，不要只看这个素材或者话题本身，一定要
社保应该缴15年还是25年？那种方式最划算？袋鼠观保保险规划师
社保无论是缴费15年还是25年，影响最大的就是养老保险和医疗保险，缴费时间越长越有利！1.养老保险真的交满15年就够了吗？要知道，社保缴费时长，直接影响到退休后能拿多少养老金，而且交得越久，退休领得越多。我拿深圳作为例子，想拿到养老金必须满足两个条件：只要达到一定的退休年龄，养老保险累计交满15年就可以拿到养老金了。那如果多缴了20年、25年甚至30年，是不是浪费了？实际上，缴满15年只是刚好可以
逻辑思维的过程与力量解晓萱
之前我对逻辑思维的了解停留在，讲话时有逻辑，辩论时条理清晰。今天看了《开讲了》里面关于大学生质疑易中天老师的视频，听到易中天老师的回答，忽然对逻辑思维有了稍微深刻的理解。图片发自App逻辑学对我们太重要了，不仅仅是学习备考，更重要的是生活和事业及交流的选择及过程。偏激的起点和性格有关，更和逻辑思维水平有关。视频里，易中天老师评价北大学生逻辑时讲到：“他的逻辑环节是没问题的，但是逻辑起点错了，所以他
现金贷“租系统”产业崛起：租金3000，本金10万，一月回本 Dayon
最近，地下现金贷的全面崛起，已成了不可阻挡的趋势。大量民间资本开始涌入，民间高利贷、炒房团、土豪的钱，都裹挟其中。而地下现金贷的入门门槛正在不断降低，一条新的产业链开始崛起：租现金贷系统。现在，只需要10万本金，花3000元租个系统，两个人的团队，一个月就能回本。大量的小本金玩家进场了，为了急速获利，他们甚至将利率调到1600%以上。业内人士称，真实的现金贷用户，现在大概只有200多万。整个行业几
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
绝招曝光！3小时高效利用ChatGPT写出精彩论文 kkai人工智能 chatgpt 人工智能 ai 学习媒体
在这份指南中，我将深入解析如何利用ChatGPT4.0的高级功能，指导整个学术研究和写作过程。从初步探索研究主题，到撰写结构严谨的学术论文，我将一步步展示如何在每个环节中有效运用ChatGPT。如果您还未使用PLUS版本，可以参考相关教程。**初步探索与主题的确定**起初，我处于庞大的知识领域中，寻找一个可深入研究的领域。ChatGPT如同灯塔，通过深入分析最新研究趋势和领域热点，帮助我在广阔的学
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
信息系统安全相关概念(上) YuanDaima2048 课程笔记基础概念安全信息安全笔记
文章总览：YuanDaiMa2048博客文章总览下篇:信息系统安全相关概念(下)信息系统安全相关概念[上]信息系统概述信息系统信息系统架构信息系统发展趋势：信息系统日趋大型化、复杂化信息系统面临的安全威胁信息系统安全架构设计--以云计算为例信息系统安全需求及安全策略自主访问控制策略DAC强制访问控制策略MAC信息系统概述信息系统用于收集、存储和处理数据以及传递信息、知识和数字产品的一组集成组件。几
程序员如何在AI时代保持核心竞争力 nfgo chatgpt 人工智能
程序员如何在AI时代保持核心竞争力随着AIGC（如ChatGPT、MidJourney、Claude等）大语言模型的相继涌现，AI辅助编程工具逐渐普及，程序员的工作方式正在发生深刻的变革。AI不仅能够自动生成代码，还能优化、调试、甚至提出解决方案。这一趋势让许多人担心：AI会不会最终取代部分编程工作？然而，也有人认为AI是提升效率的得力助手。那么，程序员在这个AI崛起的时代该如何应对？是专注某个领
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
研究表明，中年人“失业”成为了趋势，关键原因有这4点舒山有鹿
01在职场中，一直存在这么一个定律——35岁中年失业定律。很多人都特别疑惑，35岁还未到中年期，为什么人们会把“中年”跟“失业”挂钩呢？有句话，说得很现实：“35岁之前辞职，叫跳槽；35岁之后辞职，叫失业。”一般来说，35岁失业和40岁失业的本质是差不多的。只要他们还未升到管理层，便被单位辞退，就证明他们只能“另谋出路”了。况且，随着环境的愈发复杂，行业问题的频频发生，线下商业的不景气，那中年人找
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
2020年 12月3日渥太华阴一生守望一人
今天结课了。全面备战，准备期末考试了。最近看到纽约州立阿尔伯尼法学院和西奈山医学院有一个联合生命科学的硕士学位，有点心动，打算考完试以后找教授和相关负责人问一下。新闻方面，中国第一次实现了外太空运载器发射，嫦娥今天正式启程返家了。这也预示着我们面对载人登月又踏出了自己坚实的一步。同时，我们继美国之后在同一年制造出了量子计算机“九章”。“九章”量子计算机可以以200秒的速度计算出当前最强大超级计算机
左手向娱，右手专精，永远年轻永远收割健身小白每天学点经济学
“来源于《互联网那些事》（ID：hlw0823)"不知道从什么时候开始，身边的人都像住进了健身房，朋友圈的人不是在健身房，就是在去健身房的路上。《2022国民健身趋势报告》显示：我国7岁及以上年龄人群中，每周至少参加1次体育锻炼的人数比例为67.5%。在有意识主动参与健身的人群中，平均每周进行1-3天健身人群占经常参加体育健身人群总数的75%，平均每周进行3天以上体育健身的人群占比25%。现在年轻
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
Rust是否会取代C/C++？Rust与C/C++的较量 AI与编程之窗源码编译与开发 rust c语言 c++内存安全并发编程代码安全性能优化
目录引言第一部分：Rust语言的优势内存安全性并发性性能社区和生态系统的成长第二部分：C/C++语言的优势和地位历史积淀和成熟度广泛的库和工具支持性能优化和硬件控制丰富的行业应用社区和行业支持第三部分：挑战和阻碍学习曲线现有代码库的迁移成本生态系统和工具链的完善度社区和人才培养行业应用和推广法规和标准化第四部分：未来趋势和可能性行业趋势教育和人才培养兼容和共存行业标准化企业支持和应用开源社区和生态
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
全视通智慧病房系统旧病房改造方案 2301_78035670 解决方案人工智能大数据
一、背景介绍在当今医疗技术日新月异的时代，智慧病房作为医院现代化建设的重要一环，正逐步从概念走向现实，深刻改变着患者的就医体验与医护人员的工作模式。智慧病房的改造背景，根植于医疗需求的日益增长、技术创新的不断推动以及对医疗质量与效率的不懈追求之中。二、医疗需求的深刻变革随着人口老龄化的加剧和慢性病患者数量的激增，医疗资源分配不均、医患沟通不畅、患者照护效率低下等问题日益凸显。传统的病房管理模式已难
番茄畅听邀请码汇总一览(2024六个邀请码扭亏)常见的获取收益凌风导师
听书app是今年的一个流行趋势，番茄畅听听书还可以赚钱规范：目前在网络上有很多违规的邀请码番茄畅听邀请码：4593357008、4425504881或4510119158，它的主要特点是提供海量的小说和广播节目，同时也具备一些社交互动的功能。在番茄畅听中，填写邀请码是一种常见的获取收益的方式。没错，就是4425504881！妇女节快要到来,番茄畅听邀请码邀请码是【4593357008】【44255
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
孩子初三马上毕业，学习成绩不好，想读3+2大专，有前途吗？英语时代
目前，我国高等教育出现了“强者恒强、弱者恒弱”的现象，清华北大等一批985高校(现在叫一流大学)，基本上处在象牙塔之顶，无论是学校平台、师资力量、学生水平还是企业的认可度，都可以说是面面俱到，学生们享受着我国最好的教育资源，将来的就业质量都非常高，之后再反馈给母校，母校名气更大，生源质量更好，一直如此，良性循环！而地方院校，例如地级市大学／学院等，基本上在各个方面都不如上述顶尖院校，因为学校基础薄
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
张鑫溢：1.25黄金白银TD行情分析，日内多空如何操作？附后市操作策略 AA李钜溢
格止盈止损，严格把握点位，严禁重仓操作！做行情，首看趋势，其次看点位，最后是时间。我们强调的是对行情的理解和观察。无论操作是对还是错，都必须要有操作的理由。有理由的操作，无论对错及时检讨，这才是真正投资，否则，都只会沦为赌博。我们安稳赚钱，把握机会，我们稳健获利，控制仓位做好良性循环投资，切记，不要带着情绪。黄金行情走势分析：现货黄金上周五连续第二天下跌，因全球收紧防疫限制措施促使投资者避险，推升
Matlab在工业机器人中的运用,基于MATLAB的工业机器人建模与仿真.docx weixin_34518801
摘要：机器人运动系统作为机器人系统中最重要的组成部分之一，其重要性不言而喻，因为它影响着机器人的主要性能，因此为了提高机器人的质量，对机器人进行运动学分析和仿真是不可或缺的。本次毕业设计主要对KUKA机器人的三维仿真进行了一系列的分析，主要是以下几个内容：(1)研究了机器人运动学仿真的背景意义及发展趋势。(2)通过对齐次坐标变换理论的研究,说明了KUKA机器人结构及参数,并且建立了相应的D-H参数
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s