《百面机器学习》读书笔记(十四)-人工智能的热门应用

全部笔记的汇总贴:《百面机器学习》-读书笔记汇总

这一章较之前的十三章略微有些区别,这一章直接将知识点进行罗列出来,而不再是以问题的方式来导出,可能也是应为这一章的内容比较浅显易懂吧。

一、计算广告

广告是当今互联网商业变现最重要的模式之一。在介绍计算广告的常用算法模型之前,先对互联网广告的主要产品类型和商业模式进行介绍。这里按照互联网广告的商业模型,将其分为合约广告、竞价广告、程序化交易广告等类型。

  • 合约广告一般在门户网站和视频网站中较为常见,例如,Hulu广告收入的绝大部分来自于合约广告。
  • 竞价广告最重要的形式是搜索广告。搜索广告的标的物是关键词,每个搜索广告可以对一些特定的关键词进行出价。
  • 程序化交易广告能够让广告主更加灵活地选择自己的受众群体和曝光时机。

不同类型的广告在广告系统设计上有所区别,比如合约广告一般不需要考虑广告的实际效果,所以没有CTR模块;程序化交易广告需要对接广告交易平台等第三方信息,所以需要更多的数据对接模块。但总体来说,广告系统的整体架构是通用的。
《百面机器学习》读书笔记(十四)-人工智能的热门应用_第1张图片

  • 用户画像是计算广告学的核心组成部分之一,在合约广告、搜索广告、程序化交易广告等产品形式中广泛存在。在合约广告中,广告主可以根据自身品牌的受众群体指定合适的定向条件,以节省成本;搜索广告和程序化交易广告可以根据用户的画像对该用户对各广告的点击率和转化率进行更精确的预估,从而优化整体的投放效果。
  • 点击率预估是效果类广告中最重要的算法模块之一。为了优化广告效果,首先要对广告展示之后的效果(即点击率、转化率等)有一个准确的判断,才能据此进行合理的选择与投放。在搜索广告中,一般通过广告的点击数量进行效果的评估和结算,因此点击率预估的准确性在效果优化中起到非常关键的作用。
  • 在点击率预估时,通常要对负样本进行采样,这是因为在点击率预估的二分类问题中,点击数通常要远远小于总曝光数(PC端展示广告的点击率一般在0.1%~1%之间),这将导致正负样本严重不均衡。
  • 抽取与用户、上下文、广告主、创意等相关的各维特征,并对这些特征进行组合。这一步听起来是一个比较简单的过程,但是实际上非常重要,里面包含着各种学问。尤其是在传统的机器学习模型中,特征工程的好坏将对模型的效果产生决定性的影响,并花了算法工程师大部分的时间。
  • 进行完特征抽取与组合,并选择一个合适的模型后,我们就可以对模型进行训练了。模型的训练与调优过程也蕴藏着许多经验与知识。例如,在线上进行实时点击率预估的时候,我们通常希望模型被全部加载到内存中,从而保证服务的响应时间。因此,需要在模型的稀疏性和预测效果之间进行一个折中,对模型的稀疏性有一定的要求。
  • 模型训练完成之后,就需要对其效果进行合理的评估了。模型评估主要分为离线评估和在线评估两个阶段。离线评估的任务是设计合理的实验和指标,使得离线评估的结果和将来上线之后的结果尽量吻合。
  • 广告检索阶段的任务是根据查询、受众等定向条件检索出所有满足投放条件的广告。例如,根据查询的模糊匹配,要求将与该查询文本在语义上相近的广告尽可能地召回,供下一阶段广告排序和选择算法使用。
  • 不同的广告业务场景在此步骤中的决策方式是不同的。对于合约广告来说,我们的目标是满足合约中规定的每日曝光数量要求(当曝光数量不足时会受到惩罚),并不涉及点击率预估,因此广告的排序和选择问题可以被建模成带约束的优化问题。

二、游戏中的人工智能

  • 第一款成功下棋的软件诞生于1952年,记录在道格拉斯的博士论文中,玩的是最简单的Tic-Tac-Toe游戏。
  • 从AlphaGo到AlphaGo Zero
  • 德州扑克中的“唬人”AI
  • AI电子竞技

三、AI在自动驾驶中的应用

为什么要做无人驾驶?

  • 安全:当然,目前自动驾驶还远远没有达到完美。但是随着算法和传感器技术的进步,人们相信在不久的将来,自动驾驶将超过人类司机的驾驶安全率。
  • 方便:自动驾驶可以将驾驶员从方向盘后面解放出来,在乘车时进行工作和娱乐。
  • 高效共享:Uber、Lyft和滴滴等共享出行的巨头,都在积极研究自动驾驶,因为共享出行最大的成本来自于司机的时间。
  • 减少拥堵:如果说前面这些优点还有赖于自动驾驶的大范围普及的话,那么减少拥堵这个优点,就可以说是立竿见影了。根据伊利诺伊大学的沃克教授的一项研究,在一个人工驾驶的车队中,只要加入一辆自动驾驶汽车,就可以将车队行驶车速的标准差减少50%,使得行驶更加稳定和省油。

自动驾驶这个词最早来自于飞机、列车、航运领域的辅助驾驶系统。它的广义的定义为:自动驾驶是无须人工的持续干预下,用于自动控制交通工具行驶轨迹的系统。

自动驾驶的支撑技术可以分为以下3层。

  • 上层控制:路线规划,交通分析,交通安排。
  • 中层控制:物体识别,路障监测,遵守交规。
  • 底层控制:巡航控制,防抱死,电子系统控制牵引力,燃油喷射系统,引擎调谐。

人工智能的很多应用场景有较宽松的容错性,例如扫地机器人撞到障碍物,可以退后再找路径;Siri的语音识别错了,用户多说几遍就行了。然而自动驾驶应用,则要求更加严苛的安全标准。因为汽车中的人工智能算法出错,带来的损失是无法挽回的。

四、机器翻译

机器翻译是计算语言学的一个分支,也是人工智能领域的一个重要应用。机器翻译,即通过计算机将一种语言的文本翻译成另一种语言,已成为目前解决语言屏障的重要方法之一。

五、人机交互中的智能计算

人机交互(Human computer interaction),顾名思义,是研究人(用户)和计
算机之间交互方式的学科,是人通过交互界面的一系列输入和计算机提供的输出
反馈来完成一项任务或者达到一个目标的过程。

人机交互也可谓人工智能集大成的方向。在人机交互的过程中,语音识别、图像识别让机器能够理解人类的输入信号;各类预测模型、增强学习模型帮助机器做出有效且理性的判断,并使其具备学习的能力;智能控制类方法让机器完成人类指定的动作或者进行有效的反馈。可以说人机交互中蕴含着人工智能的方方面面,人机交互的高速发展意味着人工智能水平的整体进步。

你可能感兴趣的:(#,The,Quest,for,ML,读书笔记,机器学习,人工智能,百面机器学习)