GAIC 大会预热之三——从进化计算到物的进化(下)

Neil Zhu,ID Not_GOD,University AI 创始人 & Chief Scientist,致力于推进世界人工智能化进程。制定并实施 UAI 中长期增长战略和目标,带领团队快速成长为人工智能领域最专业的力量。
作为行业领导者,他和UAI一起在2014年创建了TASA(中国最早的人工智能社团), DL Center(深度学习知识中心全球价值网络),AI growth(行业智库培训)等,为中国的人工智能人才建设输送了大量的血液和养分。此外,他还参与或者举办过各类国际性的人工智能峰会和活动,产生了巨大的影响力,书写了60万字的人工智能精品技术内容,生产翻译了全球第一本深度学习入门书《神经网络与深度学习》,生产的内容被大量的专业垂直公众号和媒体转载与连载。曾经受邀为国内顶尖大学制定人工智能学习规划和教授人工智能前沿课程,均受学生和老师好评。

进化计算的应用

将进化原理嵌入计算机算法的假设可以创造出强大的机制来解决困难、理解不足的问题,这个现象被很多的证据证实。进化算法求解器已经证明了可以针对若干个科学和技术领域中困难的问题给出高质量的解,并且有比传统优化和设计方法更好的特点。

一个有说服力的例子是设计领域的,为 NASA 空间技术 5 (ST5)飞行器设计的 X-band 天线。正常的处理方法非常耗时也需要大量人力投入,对专家知识尤其依赖。进化算法方法不仅能够发现有效的天线设计,而且可以随着需求变动而快速调整设计。这些天线中的一个就被实际制造出来并部署在 ST5 飞行器上,因此成为了宇宙中第一个由计算机进化出来的硬件。这个项目同样展示了进化方法相较于手工设计的一个优势。进化算法生成并测试成千个完全新的解,很多都是非同寻常的结构——人类天线设计专家是不可能想到的。进化算法同样在其他的航空学和航空航天工业工程任务上取得了成功。这个领域中的问题一般都有很复杂的搜索空间和多个矛盾的目标函数。基于群的方法如进化算法已经证明了在解决这样的组合挑战上是有效的。我们给这样的问题取了个名字——多目标进化算法改变选择函数来显式地奖励多样性,所以他们会发现和维护高质量的代表了目标函数之间的不同平衡的解——技术上讲,它们近似了 Pareto 最优状态(Pareto Front)的多样化节段(diverse segment)。很多例子可以在生物信息学中发现。例如,通过挖掘 ChEMBL 数据库(包含了有药物特征的生物活性分子),化学结构的变换的集合被识别出来,可以在自动药物设计应用中被用做突变算子。这些结果尤其是在处理多靶向的如多聚药理学中,展现了清楚的利益。这个例子漂亮地讲述了其他方法或者已有的知识,可以轻易地加入或者适应在进化计算的框架中。

数值和组合优化是进化算法的重要应用领域。黑盒优化是一个特别有挑战性的问题,其中目标函数的特性(相较于分析方法)更需要数值方法,而梯度信息仅仅可以由采样解来近似。一个系统化的实验研究在一系列人造的黑盒优化问题上对比了数学规划和进化计算,这些问题有着不同的计算时间和消耗的资源。这些结果表明数学规划算法——设计成提供搜索初始时的快速过程——超过了进化算法如果评价的最大数目很低的时候,但是如果计算预算增加时情况就反过来了。终极情形下,研究表明进化算法 BIPOP-CMA_ES 是能够找到很多类的函数的嘴有点,有着更高的精确度和更快的时间性能。进化策略的实力(尤其是非常成功的 CMA-ES 变体)对真实场景中的工业级的黑盒优化问题被大家广泛讨论。从学术研究和工业应用的数年的证据表明进化策略的利基性已经通过非常有限的计算资源的有多少解可以让他们的适合度被评估优化任务已经形成。尽管这个发现和传统的经验不同,其实存在这一个放大的支持。

机器学习和建模是另一个显著的领域,这里进化算法也证明其左右,尤其是在当前很多方法依赖于(暴力的)贪心算法和局部搜索算法来改良和优化方法。例如,神经进化方法使用进化算法来优化神经网络的结构、参数或者同时进行两者的优化。在机器学习的另外分支里面,使用进化计算来设计算法也是非常有效的技术,比如说归纳决策树。另外,进化算法也用在了预测问题上。例如,解决预测一个蛋白质三级结构的问题,算法可以设计成进化一个自动预测器的关键部分——具有用来估计一个结构的能量功能。当前最佳的方法被能量项的线性组合的限制了,而遗传规划方法轻易地通过更加丰富的语法适应了表示。遗传规划算法找到的最优的能量函数取得了显著的预测指导。这个算法能够自动发现最有效和最无效的能量项,而不需要任何有关这些项和预测误差的关系。

对物理实体的控制器的设计,如机器或者机器人,已经被看做是另一个成果丰富的领域。例如,集装箱起重器操作的控制策略可以使用一个物理起重器进化来确定适合度值。控制器的进化同样可能在原处进行,例如机器人群众,而不是之前那种运作阶段发生。进化机器人是特别具有挑战性的应用,因为这里有两个进化计算分支不会遇到的问题:相当弱的和带噪声的可控制设计细节和目标特征之间的关联;解需要在大量可变条件上表现很好。一般在进化计算中,存在着三步的评价链:基因型到表型到适合度。对于机器人,这个链增加了一步:基因型到表型到行为再到适合度。这四步的链中,机器人形态和控制器形成了表型。然而,这个行为应当被看做是表型,因为它是将要被评价的实体。而且,行为依赖于很多外部的因素,产生了一个对机器人来说不可预估的环境。尽管如此,因为自适应移动机器人的手工设计是非常困难的,进化方法具备较大的潜在优势。这些优势包含了连续和自动设计的可能性、制造和部署有着非常不同的形态学和控制系统的机器人。一些研究表明了这种方式的好处,用人工进化自动产生的机器人控制系统跟用其他设计方法产生的设计更加简单或者高效。在所有例子中,机器人刚开始表现出没有协调好的行为,但是在几百代之后已经能够在大量的实验的条件下达到足够高效的行为。

当前最优的一些算法,横跨应用在很多的问题领域,都是通过混合进化搜索和已有算法设计的,特别是局部搜索方法。这种混合的方法可以被看作,把“终身学习”加到了进化的过程中。我们逃离了自然进化的束缚(比如说后代学到的特点信息将能够被立即写入到基因型之中),而且可以进行个体和社会学习的新颖类型的实验,所以说,memetic 算法的理论和实践已经成为了进化计算的一个重要领域。当在增强的方法系统化地在好的解附近搜索时,这样的混合方法通常比纯粹的进化算法(通过突变进行的随机搜索)要好,能得到更好的更快的解。例如,细胞抑制的问题(决定发布的统计表中哪些数据细胞用来保护应激)就是用图的划分、线性规划以及进化优化对感染细胞考虑的序列的这种方式解决的。这样给出了可以保护已发布的统计表在一个确定的规模上,这个比之前方法获得大小要增加了几个阶。Memetic 算法解决真正困难的问题上方法中属于非常好的技术。

你可能感兴趣的:(GAIC 大会预热之三——从进化计算到物的进化(下))