到目前为止,几乎所有由神经网络创造的经济价值都基于其中一种机器学习:监督学习。
在监督学习中,输入一个x,习得一个函数,映射到输出y。
监督学习的神经网络应用:
1)房地产预测房价
2)在线广告推荐
很可能今天通过深度学习获利最大的就是在线广告,给网站输入广告信息和用户信息,网站会考虑是否给你看这个广告,神经网络在预测你是否会点击这个广告方面,已经表现得很好了。通过给用户展示最有可能点开的广告,这就是神经网络在很多家公司赚取无法想象的高额利润的应用方式。
3)计算机视觉领域
输入一个图像,想输出一个指数,可能是从1到1000,来表明这张照片是1000个不同的图像中的某一个,可以用来给图像打标签。
4)语音识别
可以将音频片段输入神经网络,它可以输出文本。
5)机器翻译
深度学习可以让你输入一个英文句子,直接翻译得到一个中文句子。
6)无人驾驶技术中心
输入一幅图像,汽车前方的一个快照,一些雷达信息,基于这些,训练过的神经网络可以告诉你路上其他汽车的位置,这是无人驾驶系统的关键组件。
神经网络创造的这么多案例中,你要机智地选择x和y,才能解决特定问题,然后用这个监督学习过的组件嵌入到更大的系统中。
可以看出稍微不同的神经网络应用到不同的地方也都行之有效:
1)在房地产预测房价、在线广告推荐中均可应用通用标准的神经网络架构
2)图像领域中,经常应用的是卷积神经网络(CNN)
3)对于序列数据,经常使用循环神经网络(RNN),如音频中含有时间成分,音频是随着时间播放的,所以音频很自然地被表示为一维时间序列;语言,英语、汉语、字母、单词都是逐个出现的,所以语言最自然的表达方式也是序列数据。自然语言处理通常使用更复杂的循环神经网络(RNNs)
4)无人驾驶这种更复杂的应用,有一张图片可能需要CNN架构去处理,雷达信息这些,需要一些定做的(custom)更复杂的混合(hybrid)神经网络结构。
标准的、CNN、RNN结构都是什么呢?
RNN非常适合处理一维序列数据,其中包含时间成分。
机器学习被应用于结构化数据和非结构化数据。
结构化数据:基础的数据库
如预测房价,有一个基础的数据库或数据列,意味着每个特征都有着清晰的定义。
非结构化数据:如音频、原始音频、图像、文本。想要识别图像或文本中的内容,这里的特征可能是图像中的像素点,或者是文本中的单个单词。
从历史角度看,非结构化数据与结构化数据相比,让计算机理解起来更难。但人类进化到现在,很擅长理解音频信号和图像。文本是一个更近代的发明,但人们真的很擅长解读非结构化数据。神经网络兴起过程中,最令人兴奋的事情之一就是,多亏了深度学习,多亏了神经网络,计算机能更好的地解释非结构化数据,和几年前相比的话。这给我们创造了很多令人兴奋的应用机会,语音识别、图像识别、自然语言处理,现在能做的事情比两三年前要丰富多了。因为人们生来就有能力理解非结构化数据,神经网络在非结构化数据上的成功,尤其是媒体上有了很多成果。
神经网络在很多短期经济价值的创造是基于结构化数据的,比如更好的广告系统,更好的获利建议,有更好的能力去处理很多公司拥有的海量数据库,并用这些数据准确预测未来趋势。