181.5种常见的机器学习方法。
(1)线性回归linear regression: 一种流行的回归算法,从样本特征的线性组合,linear combination中学习模型。
(2)负数几率回归,logistic regression: 它是一个分类学习模型。
(3)决策树(decision tree)学习: 一个可用于决策的非循环图(graph)。
(4)支持向量机。
(5)K近邻,k-Nearest Neighbor,KNN : 一个非参数化的学习算法。
182.机器理解数据的本质是建立从数据到知识库中的知识表示(实体、概念、关系)的映射或机器解释,现象的本质是利用知识库中实体、概念、关系来解释现象的过程。
183.2020年1月12日,谷歌宣布,已经成功利用一台54量子比特的量子计算机,实现了传统架构计算机无法完成的任务。世界将迎来量子计算加人工智能时代,这条新闻刊登在nature杂志150周年版的封面上。
184.当今世界上最强大的超级计算机需要计算1万年的实验中,量子计算机只用了200秒,可怕的算力!
185.人工智能会加速量子计算,量子计算也会加速人工智能。各种社会现象原来背后的数学逻辑将被破译出来,各种经济大数据背后隐藏的概率也将被破译出来,生物体都是一套生化算法将彻底被破译,量子计算将是人工智能未来的算法。
186.人工智能研究的难点是对认知的解释与建构,而认知研究的关键问题则是自主和情感等所谓主客观现象的破解。
187.构建神经网络模型取决于正确的框架,如TensorFlow、PyTorch等。
188.目前研究机器学习的人很多,但很少有人研究知识表示和推理,这应该是人工智能最核心的内容。
189.有了知识图谱就能进行计算机建模。
190.认知计算是用来构建模拟人脑思维过程的系统,使人工智能进入可理解可解释的新阶段,大脑是理解模拟计算的,计算机是理解数字信号的,自然语言处理NLP就是要计算机理解自然语言,利用NLP的函数来训练,提高对智能体的理解及解释能力,知识图谱技术有希望成为大脑,它是实现认知智能的关键技术,知识图谱完成从数据到知识,最终服务于智能应用的转变过程。知识图谱就是一种大规模的语义网络或大规模的自然语言处理,知识图谱技术有希望成为大脑,它是实现认知智能的关键技术,知识图谱完成从数据到知识最终服务于智能应用的转变过程。
知识图谱的技术链:多元异构数据→知识获取(1.从数据中提取知识要素如概念、实体及其关系等,2.直接采集自然语言:语言、文字、词句、篇章、网络、语义等)→知识融合(完成数据与知识的融合、知识与实体的衔接)→知识表示→知识推理→知识赋能。
NLP的缺陷是不理解常识,要建立常识库,困难太大了,IBM沃森医疗人工智能提出了具人(Embodiment)概念,与现场医生进行沟通以取得共识,来弥补缺乏常识的缺陷。
191.图形神经网络是近年来迅速发展起来的源于机器学习的一个分支,但图形神经网络发展至今还没有公认的基准数据集(可以更好地评估模型性能等指标)。斯坦福大学Jure leskovec教授在 Neur IPS 2019大会上宣布了开源开放图形基准,这是朝着图形神经网络建模统一基准迈出的重要一步。
192.微软将卷积神经网络的深度增加到152层。
193.外媒报道机器学习架构之争:Pytorch与Tensorflow谁更有胜算?Pytorch攻势凶猛,程序员正抛弃Tensorflow,Pytorch特点有:简洁性易用的应用程序接口卓越性能。
194.2019年6月美国政府公布国家人工智能研发战略规划2019版,确定八大国家人工智能研发战略。
1) 对人工智能研究进行长期投资。
2) 开发人与人工智能协作的有效方法。
3) 明确并解决人工智能的伦理法律和社会影响。
4) 确保人工智能系统安全可靠。
5) 开发可共享的公共数据环境,用于人工智能训练和测试。
6) 开发衡量和评估人工智能技术的基准和标准。
7) 更好地了解国家人工智能开发人员的需求。
8) 加强人工智能领域的公私伙伴关系,加速人工智能的发展。
195.最近德国政府对工业4.0制造业智能化目标进行解释,将人工智能应用到制造业,实现智能化及智能化管理智能工厂智能物流。
196.从感知走向认知要解决业务问题,从单个业务场景、单点单向业务全流程演进,要建立统一的知识图谱,来实现知识融合推进人工智能落地。
197.人工智能资深专家吴恩达认为2019年自然语言处理(NLP)取得飞跃。Deep mind研究员Sebastian ruder:NLP的突破以便让计算机理解,将彻底改变人工智能。
198.为什么人工智能需要可解释性?
假如人工智能将来应用到实践中,那么人类必须知道计算机是如何想的?也就是说人类要知道机器的工作原理。
199.量子计算是通过叠加原理和量子纠缠等次原子粒子的特性,来实现对数据的编码和操控。
200.目前深度学习人工智能不能脱离5个条件:1.数据充足,2.确定性,3.完全的信息,4.静态,5.特定领域的单向任务,当然随着人工智能的发展,这些限制最终将被克服。
201.2018年11月,美国宣布:对人工智能芯片、机器人、量子计算、脑机接口、生物技术等进行出口管制(EAR)。
2020年1月3日,美国宣布:限制人工智能出口中国,限制出口某些地理空间图像软件这类软件只用于训练深度卷积神经网络的软件自动分析地理空间图像的软件。
航拍地图3d地图无人机自动驾驶的软件,特别是GUI可能受影响,像tensorflow,pytorch等提供图像处理的框架,特别是这些开源的框架不受限制。
202.以色列初创公司Binah.ai开发出新的人工智能算法,在视频聊天中通过观察人脸的颜色变化它就能检测心率和血压水平等关键生命体征并可能用于远程医疗服务,可将医疗保健从医院转移到家庭中。
203.苹果近日已约2亿美元的价格收购了初创公司Xnor.ai。Xnor成立于2017年,目前致力于研究低功耗人工智能技术,2019年开发了,可以在一块装有硬币大小,太阳能面板的设备上运行AI芯片,据悉苹果欲将Xnor的技术整合到未来的iPhone机型中以改进siri。
204.亚马逊发布开源代码库——Auto Gluon,旨在使开发者对许多决策进行自动化,过去诸如超参数调整之类的任务,需要手动执行,使科学家预测超参数(表示构建AI模型对所做的选择)将如何影响模型训练。另外过去由人监督的任务,它涉及复杂的工程,要求开发人员为其开发的模型,以便确定最优设计。现在Auto Gluon可以通过自动调整选择来生成仅需三行代码的模型,以便很好地完成上述以手工来做的特定任务。
205.据称Pytorch之父Soumith Chintala总结2019年AI技术发展预测,2020年AI发展趋势。他表示2019年机器学习领域几乎没有突破性进展。Deep mind的Alhpa Go,对强化学习的贡献是突破性的,但其结果很难在现实世界的实际任务中实现。Pytorch和Tensorflow等机器学习框架的强化改变了研究者探索的思路和做研究的方式,这些框架是研究者的建设,比之前快了一两个数量级,从这个角度看这是一项巨大的突破。
206.2019年谷歌和脸书的开源框架都引入了量化用以提升模型训练速度。Chintala预测,2020年Pytorch的JIT编译器和神经网络硬件加速器等工具的重要性和采用范围将迎来爆发。从Pytorch和Tensorflow中可以看到框架的融合趋势框架之中的下一站是编译器xlA(TensorFlow)、TVM(陈天奇团队)、Glow(PyTorch),大量创新即将出现。未来几年会看到如何更智能的量化,更好的融合,更高效的使用GPU以及如何针对新硬件执行自动编译。
207.Chintala预测说,2020年AI社区将用更多度量指标衡量AI模型的性能,而不仅仅是准确率,社区将注意力转向其他因素,如创建模型所需的电量,如何向人类解释输出结果,以及如何使AI更好地反映人类想要构建的社会,回顾过去五六年,我们只关注准确率和原始数据,例如是英伟达的模型更准确,还是脸书的模型更准确,他认为2020年我们将以更复杂的方式思考如果模型不具备良好的可解释或满足其他标准,那就算准确率高出3%又怎么样呢?
208.《哈佛商业评论》中文版近期在其人工智能专项调研报告中评选出了全球AI公司5强,依次是谷歌,苹果,微软,百度和亚马逊。报告从AI技术进展,产品多样性和商业化落地等多个角度,对5家公司进行了对比分析,其指出,尽管中国已经在AI领域有了巨大进步,但在基础技术上中国和美国仍存在差距,另外报告指出在2020年商业化落地将会成为AI发展的核心关键词,在下一阶段人工智能最具潜力的落地场景有三个分别是医疗手机和互联网,因为这三个场景天然具备数据属性,除此之外,金融证券工业消费和政府行业也是目前AI巨头开发较多,落地前景可期的领域,总体而言AI商业化落地,还有很大的可拓展空间。
209.IBM沃森健康与安德森癌症中心合作,从2011年至2016年(6年间),在对癌症治疗提出建议方面有635个案例,尝试采用AI技术与医疗行业融合应用,但在医疗效果上出现了正负对立的评估,据安德森方面谈花掉了6200万美元,双方于2016年终止了合作。
查阅双方合作,没有采取通过知识驱动和数据驱动融合建立统一的知识图谱大数据语义网络来推进,希望在这方面达到认知水准的AI技术还处于预研阶段。只有通过知识获取、知识融合、知识表示、知识推理、数据与知识驱动结合,建立统一的知识图谱(大规模语义网络),才能高水平的推动AI应用落地。
需要指出,2019年自然语言处理(NLP)在发展过程中出现飞跃,将语言模型变成精准语言,而且研究人员还研发人工智能知识增强的语义理解框架,可针对任务进行微调预训练(如百度的ERNIE模型、谷歌的BERT模型、微软的MT-DNN模型等)。NLP虽然做了很大改进,但NLP的缺陷是机器无法识别常识问题,而要建立常识库非常困难,IBM在建设知识工程时,要求研发人员和现场的临床医生(或现场操作人员)进行沟通取得共识,以补充解决机器无法识别常识·问题使人工智能真正进入认知阶段。
210.按大数据建立起来的深度学习AI系统是不可理解、不可解释的。溯根求源:大脑是模拟的,机器(计算机)是数字的,深度学习将数字输入大脑,大脑是不识别的,而大脑中模拟的思维逻辑传到机器,机器也是不识别的,所以采用深度学习算法技术难以做到脑机交互,而深度人工智能如果得不到大脑支持,将在暗箱操作中变得不可理解、不可解释,难以创造如同人类的自主思维、创意和情感。
认知计算是用来构建模拟人类思维过程的系统。
知识图谱是实现认知智能的关键,有希望成为“大脑”。它基于知识表示进行逻辑推理,真正把数据驱动和知识驱动及知识推理结合起来,知识图谱是一种大规模语义网络(或自然语言处理NLP)。
2019年NLP取得了飞跃式发展,提高了语言转变(如从模拟讯号转变为数字讯号)的精准度(使大脑思维的模拟讯号变成机器能够识别/理解的数字讯号),从而推动计算机建模。
同时又在专门语料库上利用知识增强语义理解框解推动对NLP的微调,进一步提高语言转变的精准度。
但机器最大的问题是缺乏常识,而建立常识库又非常困难,这个问题仍然阻碍了机器/计算机对自然语言的理解。
IBMWatson在探索医疗人工智能认知计算过程中就遇到了缺乏常识带来的困扰,在痛定思痛后,他们提出了具人(embodiment)概念,必须与现场临床医生沟通、取得共识、统一行动,以弥补研究人员常识之不足(将基础理论和常识结合起来),才能完成医疗防治的任务。
211.IBM总裁、CEO罗睿兰(GinniRometty)将于今年4月6日退休,她着手进行IBM第三次转型(转型为云计算服务供应商),但至今未见成功。
IBM历史上另两次转型为:
(1)上世纪50年代,第一次转型,由小托马斯-沃森(ThomasWatsonJr)主持,主营业务由制表设备转向计算机,
(2)上世纪90年代,第二次转型,由郭士纳(LouisGerstner)主持,由大型主机转向软件和服务。
罗睿兰主持的第三次转型,转向混合云策略遇到亚马逊的狙击,后来她又增加的基于医疗人工智能的数据分析工具Watson(为此向新成立的Watson业务集团投资10亿美元),最近美刊评论:“Watson也没有好到哪里去,被客户批为IBM未总现承诺”。
212.谷歌在《nature》上宣布:
谷歌研发人工智能乳腺癌检测系统,检测乳腺癌的能力已经超过专业放射科医生。
与美国放射科医生相比,采用“谷歌AI医疗辅助”后,人工智能检测乳腺癌结果的误诊率低5.7%,而漏诊率低9.4%.
谷歌用数万张乳腺X线影像样本训练(深度)神经网络,直到它构建一个判别式乳腺癌的追踪模型。
有了这个模型,谷歌AI、阿里AI、或其他AI如果运用“谷歌AI医疗辅助”都能在极短时间内从X线影像识别出乳腺癌病症,相比以前人工识别效率大大提高。
乳腺癌是女姓常见的癌症之一,2018年全球约62.7万名女姓死于乳腺癌,约占女性癌症死亡人数的15%。
专业医生对乳腺X线影像的分析准确率一直相对偏低,容易发生误诊和漏诊现象,现在有了“谷歌AI医疗辅助”,医生进行乳腺癌诊断的效率和准确率将大大提高。
213.谷歌AI在医疗领域搞的风生水起
(1)在诊断方面:谷歌AI将担任“诊断专家”,提高珍断准确率,为医生治疗提供决策参考。以往只能通过医生的肉眼去看X光、CT、超声、MR等影像,才能给患者给出诊断结论,现在AI能够更快、更准确地识别医学图像,如:AI乳腺癌检测系统,AI师癌检测系统。
谷歌AI创造了肺癌检测技术:机器能够自动读取CT扫描结果,以识别出肺癌的病兆,比平均拥有8年经验的放射科医生做的更好,发现肺癌的几率高出9.5%,分析出图像中的疾病迹象,降低误诊风险,从而降低病人死亡的风险。
(2)在研发方面:谷歌AI正在转向基因医疗科学领域
谷歌最新AI—AlphaFold,成功根据基因序列预测了生命基本分子—蛋白质的三维结构。
为了开发AlphaFold,谷歌用数千种已知蛋白质训练(深度)神经网络,成功预测蛋白质的三维结构。
谷歌AI开始进入基因科学和生物科学领域,未来它可能逐渐取代目前最优秀的医生,用基因治疗的方法,重塑人类体内一切组织和器官的活性。
(3)在治疗方面:谷歌AI将担任“虚拟医生”,协助医生查验处方,帮助医生做手术,最终取代医生。
未来,谷歌AI将让手术机器人成为主刀医生的帮手以至取代主刀医生。
再往后,谷歌AI将开始大规模破译和改造人体内的“生命软件”(被称为基因的23000个“小程序”),通过重新编程,帮助人类运离疾病和衰老。
214.Alphabet(谷歌母公司)旗下三大主力企业:Google、Ⅴerily、DeepMind,采用深度学习算法,训练其神经网络模型,进军AI医疗。
对多种疾病,覆盖癌症、糖尿病、心脏病、帕金森症、慢性疾病及老化问题进行AI医疗研究,采用经过预先训练的深度神经网络模型,建立强大的国际合作伙伴网络(包括美、英、印、泰等国),收集全球患者数据并在临床环境中测试算法,超越药房和医院,建设虚拟诊所和AI医疗保健站,创建未来诊所,兴起“明日的梅奥诊所”。
215.谷歌医疗AI采用的是训练深度神经网络的技术,DeepMind的AI专家认为,我们需要更多时间探索如何训练神经网络以及如何整合提升深度学习所能实现的所有功能。
216.我们无法理解现有的深度学习算法,我们期望可以设计既能理解又能保证有效的新算法。
现在用来理解深度学习的常用方法是隐式的正则化方法,然而显式正则化方法可能是更好的选择。
当前深度学习存在一个非常核心的挑战就在于需要很大规模的数据才能实现泛化(通用化),学术界很难收集这么多做数据,只有工业界、互联网才有可能。如果希望深度学习模型减少对数据的依赖,就需要理解如何用较少的数据来实现深度学习模型的泛化。
为什么采用过参数化(OverParametrized)的深度学习模型能实现泛化?过去的传统观点是:数据数量远超过参数数量时模型才能泛化,现在深度学习时代认为,成功的模型应该有更多的参数、更少的数据量。
—摘自斯坦福大学马腾宇博士去年在京发表的报告
217.深度学习模型不可理解、不可解释
人工智能的发展要重点解决可解释性问题,人工智能研究的难点是对认知的解释与建构,而认知研究的关键问题则是自主、创意和情感等所谓主客观现象的破解。
利用大规模语义网络或NLP函数来训练、提高对任务的理解和可解释能力。
目前NLP的缺点是不理解常识,或计算机最大问题就是缺乏常识。做常识库难度太大!现在的问题是如何攻克这最近的50米!
218.国家卫健委表示,面对新型冠状病毒疫情,基层医疗卫生机构要充分运用信息技术手段进行疫情防控。作为AI“国家队”的科大讯飞,充分发挥在AI方面的技术优势,助力各行各业投入战“疫”,科大讯飞医疗事业部迅速成立新冠攻关团队,辅助构建基层疫情防线,协助基层医生进行疫情筛查防控和防疫知识宣教,科大讯飞智医助理已随访安徽、湖北、浙江、北京等15个省市387万人,分析242万份基层门诊病历,并向公共防疫部门提供分析报告。
219.PyTorch正在成为OpenAI深度学习标准化的框架。
OpenAI选择PyTorch的主要原因是为了在GPU上大规模提高研发生产力。
近来选择Tensorflow或Pytorch作为部署深度学习框架的争论很激烈:
业界普遍认为,Pytorch较易上手,广为学者和科研人员所用,其特点是快速实现、验证自己的想法,而不太注重兼容、部署等问题;Tensorflow的生态更有利于快速部署。
眼下,许多工业界项目纷纷转投Pytorch,而Tensorflow在工业界的地位没有那么牢固,当学术界也疯狂朴向Pytorch时,对新模型的适配工作自然会倾向于Pytorch了。
220. 浙江省疾控中心2020年2月1日宣布,利用阿里达摩院人工智能算法技术,对新冠病毒快速检测有了重大突破!
这是属于防治新型冠状病毒五个方面应急科研攻关项目之一。首次将原本数小时的疑似病例基因分析缩短至半小时!
新型冠状病毒是有史以来基因组序列最长的病毒之一,全长29847bp,而且它隨时可能发生变异!
传统局部检测早已不大适用此次浙江采用全基因组检测技术,能有效防止病毒变异产生的漏检达摩院科学家更针对性研发多个人工智能算法比对模型,大大提升了检测效率,并为后续疫苗与药物研发打下基础。
221.由浙江大学、中科院物理所、中科院自动化所、北京计算科学研究中心组成的联合研发团队,开发出一款具有20个超导量子比特的量子芯片,该项成果发表于《科学》杂志上,在一颗1平方厘米的芯片上配置20个超导量子比特,并与周边的同类沟通,从相干态发展为全局纠缠态,再次刷新世界纪录,标志着中国在量子领域的研发又有新的进展。
量子比特数(全局纠缠)是衡量量子计算机性能的重要指标,当量子比特数超过50时,在处理某种特定问题时将展现出超级计算机的运算能力,这项研究成果也标志中国在量子计算技术研究上同样在世界上保持领先,并为人工智能+量子计算开辟发展前景。
更多推荐
《评人工智能如何走向新阶段》后记
《评人工智能如何走向新阶段》后记(再续1)
《评人工智能如何走向新阶段》后记(再续2)
《评人工智能如何走向新阶段》后记(再续3)
《评人工智能如何走向新阶段》后记(再续4)
《评人工智能如何走向新阶段》后记(再续5)
《评人工智能如何走向新阶段》后记(再续6)
《评人工智能如何走向新阶段》后记(再续7)
《评人工智能如何走向新阶段》后记(再续8)
《评人工智能如何走向新阶段》后记(再续9)
《评人工智能如何走向新阶段》后记(再续10)
《评人工智能如何走向新阶段》后记(再续11)
《评人工智能如何走向新阶段》后记(再续12)
《评人工智能如何走向新阶段》后记(再续13)
《评人工智能如何走向新阶段》后记(再续14)
《评人工智能如何走向新阶段》后记(再续15)