不到现场,照样看最干货的学术报告!
嗨,大家好。这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频——足够干货,足够新鲜!话不多说,快快看过来,希望这些优秀的青年学者、专家杰青的学术报告 ,能让您在业余时间的知识阅读更有价值。
人工智能论坛如今浩如烟海,有硬货、有干货的讲座却百里挑一。AI未来说·青年学术论坛自 2019 年 1 月 19 日启动以来,论坛已连续举办十二期,累计吸引上万人报名参加,报名群体遍布全国三十多个省份,境内外十三个国家,四百余所高校和科研院所。第十二期AI未来说·青年学术论坛(百度奖学金博士生特别专场)已于2020年1月5日下午在北京市百度科技园 K6 报告厅举行。UIUC罗宇男博士为大家带来报告《AI-assisted Scientific Discovery in Interdisciplinary Research》。
罗宇男是伊利诺伊大学厄巴纳-香槟分校计算机科学系的博士生,师从 Jian Peng 教授。研究兴趣主要涉及人工智能在计算生物学等多个交叉学科的应用。
报告内容:罗博士团队结合 AI 与各学科的交叉研究工作。主要包括三方面:AI 与新药发现、AI 与生物技术,以及AI 与智慧农业。
AI-assisted Scientific Discovery in Interdisciplinary Research
药品的价格昂贵,一定程度上是因为药物研发是一个高成本、长周期、低成功率的过程。近些年有一种药物研发的新策略叫老药新用,是指发掘已上市的药物能否有新的适用病症。老药新用一般需要经过长期反复尝试,或是在偶然的场合下才能发现。罗博士的团队希望利用现有的海量生物数据,结合 AI 技术,从而更多、更高效地发现老药新用的例子。团队在现有的数据基础上挖掘了大规模的医药生物关联关系,构建了药物与蛋白、药物与所治疗的疾病、药物与副作用之间的关系网络。基于该网络设计了一个机器学习模型,结合网络算法降维、去噪,再结合矩阵填充技术,针对药物和蛋白之间的作用关系进行预测,取得了优越的预测准确率。团队进一步利用现有的所有数据训练模型并进行预测,在模型的前一百个药物和蛋白作用关系预测结果中,有大约80%的预测 都可以在最近几年的科研文献中得到印证。对于剩下20%未在文献中找到印证的药物蛋白作用关系预测,团队进一步与药物学家进行合作,开展生物实验,并证实了模型所预测的多个药物-蛋白作用关系的确是存在的。比如,一种药物最初上市是用于治疗高血压,而模型预测其还能用于抗炎症的靶点蛋白,这一预测也得到了生物实验的验证。
2018 年诺贝尔奖颁发给了一种叫做蛋白质定向进化的生物技术,这项技术的目的是想提升现有蛋白质的某种功能或者性质,类似于自然界的优胜劣汰过程,这种技术通过在自然界已经存在的蛋白质随机引入新的突变,经过每一轮的迭代进行淘汰和筛选,最后进化出我们想要的某种功能蛋白,比如活性更高的酶和催化剂等等。这本身是一项很好的技术,但每一轮迭代都需要随机地引入大量新突变,带来了很大的实验工作量。能不能用 AI 来推荐突变,从而指导生物实验并使实验过程更高效呢?
罗博士的团队设计了一套 AI 辅助的实验框架,实验中迭代的每一轮都用 AI 模型预测蛋白质序列中哪些位置突变成哪些氨基酸能够更大概率地提升蛋白质的性质,然后生物学家再根据次预测进行实验,并反馈给AI框架,反复迭代下去,进而极大地减少了实验的工作量。具体应用中,该模型还考虑了生物性质,如利用现有自然界蛋白质序列训练无监督语言模型,从而推断出哪些突变大概率是有害的,哪些突变是自然界中存在的可能性较低的;又如根据蛋白质序列比对中的协同进化规律,利用概率图模型来推断出蛋白质序列中的高阶约束关系,从而预测突变对蛋白质结构稳定性和功能完整性的影响。这一模型还能用于探索提高催化剂和酶的活性,帮助发现活性更高的酶和催化剂。
在智慧农业中经常用到卫星数据,而现有的卫星图像数据无法兼顾分辨率和时效性——高分辨率的卫星环绕速度慢,环绕速度快的卫星分辨率低。为了帮助对农田进行实时监测,罗博士的团队开发了一套卫星数据融合算法,把不同分辨率、不同拍摄频率的数据融合在一起,生成了一套每天都有的高清图片。基于这些卫星图像数据,团队还开发了一系列 AI 模型,如用计算机视觉的模型预测农田面积,预测农田用水量,预测今年收成等。团队还设计了在线可交互的平台,供农业从业人员实时监测。
罗博士说,他关注交叉学科研究,也把计算机技术和人工智能技术运用到了健康、生物、化学和农业不同的交叉学科当中,解决了一些重要的科学问题。未来,还希望更多地研究这样的科研问题,让计算机科学不仅在其学科自身发展,更能走出去解决民生等问题。
AI未来说*青年学术论坛
第一期 数据挖掘专场
1. 李国杰院士:理性认识人工智能的“头雁”作用
2. 百度熊辉教授:大数据智能化人才管理
3. 清华唐杰教授:网络表示学习理论及应用
4. 瑞莱智慧刘强博士:深度学习时代的个性化推荐
5. 清华柴成亮博士:基于人机协作的数据管理
第二期 自然语言处理专场
1. 中科院张家俊:面向自然语言生成的同步双向推断模型
2. 北邮李蕾:关于自动文本摘要的分析与讨论
3. 百度孙珂:对话技术的产业化应用与问题探讨
4. 阿里谭继伟:基于序列到序列模型的文本摘要及淘宝的实践
5. 哈工大刘一佳:通过句法分析看上下文相关词向量
第三期 计算机视觉专场
1. 北大彭宇新:跨媒体智能分析与应用
2. 清华鲁继文:深度强化学习与视觉内容理解
3. 百度李颖超:百度增强现实技术及应⽤
4. 中科院张士峰:基于深度学习的通用物体检测算法对比探索
5. 港中文李弘扬 :物体检测最新进展
第四期 语音技术专场
1. 中科院陶建华:语音技术现状与未来
2. 清华大学吴及:音频信号的深度学习处理方法
3. 小米王育军:小爱背后的小米语音技术
4. 百度康永国:AI 时代的百度语音技术
5. 中科院刘斌:基于联合对抗增强训练的鲁棒性端到端语音识别
第五期 量子计算专场
1. 清华大学翟荟:Discovering Quantum Mechanics with Machine Learning
2. 南方科技大学鲁大为:量子计算与人工智能的碰撞
3. 荷兰国家数学和计算机科学中心(CWI)李绎楠:大数据时代下的量子计算
4. 苏黎世联邦理工学院(ETH)杨宇翔:量子精密测量
5. 百度段润尧:量子架构——机遇与挑战
第六期 机器学习专场
1. 中科院张文生:健康医疗大数据时代的认知计算
2. 中科院庄福振:基于知识共享的机器学习算法研究及应用
3. 百度胡晓光:飞桨(PaddlePaddle)核心技术与应用实践
4. 清华大学王奕森:Adversarial Machine Learning: Attack and Defence
5. 南京大学赵申宜:SCOPE - Scalable Composite Optimization for Learning
第七期 自动驾驶专场
1. 北京大学查红彬:基于数据流处理的SLAM技术
2. 清华大学邓志东:自动驾驶的“感”与“知” - 挑战与机遇
3. 百度朱帆:开放时代的自动驾驶 - 百度Apollo计划
4. 北理宋文杰:时空域下智能车辆未知区域自主导航技术
第八期 深度学习专场
1. 中科院文新:深度学习入门基础与学习资源
2. 中科院陈智能:计算机视觉经典——深度学习与目标检测
3. 中科院付鹏:深度学习与机器阅读
第九期 个性化内容推荐专场
1. 人民大学赵鑫:基于知识与推理的序列化推荐技术研究
2. 中科院赵军:知识图谱关键技术及其在推荐系统中的应用
第十期 视频理解与推荐专场
1. 北京大学袁晓如:智能数据可视分析
第十一期 信息检索与知识图谱专场
1. 人民大学徐君:智能搜索中的排序-突破概率排序准则
2. 北京邮电大学邵蓥侠:知识图谱高效嵌入方法
3. 百度宋勋超:百度大规模知识图谱构建及智能应用
4. 百度周景博:POI知识图谱的构建及应用
5. 百度冯知凡:基于知识图谱的多模认知技术及智能应用
留言 点赞 发个朋友圈
我们一起分享AI学习与发展的干货
推荐文章阅读
ACL2018论文集50篇解读
EMNLP2017论文集28篇论文解读
2018年AI三大顶会中国学术成果全链接
ACL2017 论文集:34篇解读干货全在这里
10篇AAAI2017经典论文回顾
长按识别二维码可添加关注
读芯君爱你