深度学习原理与实践(开源图书)-总目录, 建议收藏,告别碎片阅读!
当今科技日新月异,行业巨头一不小心就成了不适应环境的恐龙,面临彻底出局的危险。2000年初的移动手机功能机时代向智能手机时代过渡的战国时代,给我们一些生动的案例,大而不死,赢者通吃,强者恒强,定位理论,品类创新等传统经济理论几乎都不能解释诺基亚、摩托罗拉的暴死。从事计算机业的苹果公司重新定义了智能手机,从事互联网行业的雷军重新定义了智能手机的销售模式。智能手机快速的革命演绎充分说明致命的战略对手和颠覆者不是来自原有行业,不同行业的创新者和挑战者带来的跨界降维攻击才是最致命的,原有规则重来定义,原有优势成为枷锁。人工智能时代,更是野蛮创新者和挑战者的钻石时代。人工智能时代能够从更好的维度发现问题解决问题,一些原有规则和原有优势均显得幼稚和不堪一击。
传统的新闻门户,高级编辑采编新闻,渠道合作转载新闻,利用搜索引擎和推荐技术做新闻分发,用户按板块阅读新闻。一切看似如此优雅和高效,岁月精美,新闻门户还能赚个垄断广告利润,高级编辑还能搞些灰色收入,所有同行技术和模式都相似。但野蛮创新者和颠覆者随时会出现,特别是互联网行业。
今日头条最早把人工智能技术大规模应用于信息(新闻)分发的公司。基于人工智能的个性化推荐算法基于用户的喜好去智能分发内容,这个算法的原理是根据用户登录账号的不同(微信、微博等),智能去解读用户喜好,进入头条后通过观察用户浏览习惯进行二次计算。这种创新的方法,促进信息与知识交流的效率与深度。今日头条的野蛮生长,短短几年成为估值500亿美金的超级独角兽,今日头条的成功,让百度新闻,腾讯新闻,凤凰新闻等纷纷改变策略: 开放创作管理体系,鼓励自媒体加入创作;引入智能推荐算法,第一时间把用户感兴趣的内容,主动推送到用户面前。今日头条想扩大战果,争夺视频短视频的风口。当然打破旧格局也会伴随一些乱象,比如文章质量低、视频质量低、版权问题、人工智能的法律和伦理问题,但困境就是机遇,是能级再次提升的核心动力。
计算机芯片业2000年以前成熟了,市场格局相对稳定,英特尔和AMD的垄断已经事实形成,计算机芯片业像一潭死水,垄断者享受高薪和其他劳动福利。英伟达给计算机提供图形处理单元(GPU), 中高端游戏玩家才会配置独立的图形处理单元,其市场容量相对有限。2000年以后我们进入移动计算时代,英特尔,AMD和英伟达在这个时代像不适应环境的恐龙,核心业务多数年份都是零增长或负增长,新的核心业务迟迟无法成功,即使在2009全球量化宽松,货币大水漫灌的情况下,他们的股票也是一潭死水。
2010年以后,英伟达的GPU能够给人工智能的海量计算提供充足的算力,一下子枯木逢春。英伟达的芯片能够给智能汽车等行业提供人工智能芯片解决方案;给云计算集群服务器提供人工智能云解决方案;给超算中心提供异构计算芯片(弱弱的说一句,中国的超算领先,英伟达芯片背后有功劳)。英伟达成为人工智能的算力旗舰之后,一飞冲天,成为智能时代的超级明星。
2000年以后我们进入移动计算时代,高通和联发科垄断了移动芯片市场,苹果和三星自产自销高端移动芯片。众多的国产智能手机公司,成为没有核心技术的整机手机公司。华为计划做手机之后,其战略委员会预见了移动芯片的重要,外购高端移动芯片的同时,也在储备自家的移动芯片,以其在核心技术上有话语权和杀手锏。
当然海思的移动芯片基础薄弱,应用处理器使用的ARM的标准IP核心;图形处理单元(GPU)使用的ARM的标准Mali核心; 操作系统使用的Google开源的Android系统; UI等用户体验比国内的魅族和OPPO等公司体验还要差点。再上述等等劣势的情况下,海思的移动芯片也找到了核心突破口,如今逆袭行业,华为手机出货量在2018年赶超苹果成为世界第二。海思的移动芯片在基础研究上广泛投入,在基础创新上成果显著:(1) 利用人工智能和操作系统底层技术,优化了Android底层文件系统,破除了Android使用一年后必然卡顿的魔咒,并承诺3年不卡顿; (2) 加强摄像头技术的基础研究,主打双摄概念,深度成像和人工智能相机等特色功能;(3) 利用底层优化技术和人工智能技术,将图形处理单元(GPU)的效率提高了50%,实现了游戏效果的逆袭。
反观其他国产手机,在基础研究上毫无突破,将主要经历放在攒硬件、生产工艺、用户体验、品牌推广上。华为海思利用基础创新和人工智能创新,问鼎王者似乎是一种必然。
汽车行业是一个百年的成熟行业,特斯拉以纯电动和自动驾驶闯入这个红海行业,掀起了一场创新风暴。自动驾驶对传统汽车业的降维攻击才刚刚开始。在全球每年都超过数百万的人死于车祸,根据世界卫生组织的数据显示,仅中国每年都有20万人死于车祸。而在汽车事故中,因为超速、疲劳驾驶、酒驾以及注意力不集中等原因造成。特斯拉的自动驾驶可以解放我们的双手,Autopilot的安全性是人类司机的两倍,自动驾驶比人类驾驶更安全或者可以避免车祸。
Model S和Model X具有5级自动驾驶的硬件即Autopilot 2.0系统。这一全新系统将包含8个摄像头用于覆盖360度可视范围,对周围环境的监控距离最远可达250米。车辆配备的12个超声波传感器完善了视觉系统,探测和传感软硬物体的距离则是上一代系统的两倍。全新的增强版前置雷达可以通过冗余波长提供周围更丰富的数据,雷达波还可以穿越大雨、雾、灰尘,甚至前方车辆进行检测。
当今科学界已经四分五裂,就像巴别塔中的亚社会都说着自己的俚语,只能看到几个相邻的亚社会。终极算法会给出所有学科的统一思想,并有潜力提出一套新的万有理论。 – 佩德罗.多明戈斯《终极算法》
佩德罗.多明戈斯在《终极算法》中将机器学习领域按照核心思想和价值观的不同划分为:符号学派、联结学派、进化学派、贝叶斯学派、类推学派。多明戈斯还认为每个学派都有其核心理念以及其关注的特定问题,每个学派都已经找到该问题的解决方法,而且有体现本学派的主算法。
符号学派认为:所有的信息都可以简化为操作符号,就像数学家那样,为了解方程,会用其他表达式来代替本来的表达式。符号学派利用已有的数据和知识,结合动态的数据和知识,利用逆向演绎才发现的新的知识。
联结学派认为:学习就是大脑所做的事情,因此我们要做的就是对大脑进行逆向演绎。大脑通过调整神经元之间连接的强度来进行学习,关键问题是找到哪些连接导致了误差,以及如何纠正这些误差。联结学派的主算法是反向传播学习算法,该算法将系统的输出与想要的结果相比较,然后连续一层一层地改变神经元之间的连接,目的是为了使输出的东西接近想要的东西。
进化学派认为:所有形式的学习都源于自然选择。如果自然选择造就我们,那么它就可以造就一切,我们要做的,就是在计算机上对它进行模仿。进化主义解决的关键问题是学习结构:不只是像反向传播那样调整参数,它还创造大脑,用来对参数进行微调。进化学派的主算法是基因编程,和自然使有机体交配和进化那样,基因编程也对计算机程序进行配对和提升。
贝叶斯学派认为:所有掌握的知识都有不确定性,而且学习知识的过程也是一种不确定的推理形式。那么问题就变成,在不破坏信息的情况下,如何处理嘈杂、不完整甚至自相矛盾的信息。解决的办法就是运用概率推理,而主算法就是贝叶斯定理及其衍生定理。贝叶斯定理告诉我们,如何将新的证据并入我们的信仰中,而概率推理算法尽可能有效地做到这一点。
类推学派认为:学习的关键就是要在不同场景中认识到相似性,然后由此推导出其他相似性。如果两个病人有相似的症状,那么也许他们患有相同的疾病。问题的关键是,如何判断两个事物的相似程度。类推学派的主算法是支持向量机,主算法找出要记忆的经历,以及弄明白如何将这些经历结合起来,用来做新的预测。
备注: 该小节取材自佩德罗.多明戈斯《终极算法》P58-59