Google 迷人的深度梦想:就像机器服用了致幻剂丨数据工匠简报(9.05)

Google 迷人的深度梦想:就像机器服用了致幻剂

Google 迷人的深度梦想:就像机器服用了致幻剂丨数据工匠简报(9.05)_第1张图片

上周五晚上,在旧金山教会区(Mission District)的一处老式电影院里的艺术画廊里,谷歌图形学专家 Blaise Agüera y Arcas 向大约 800 名极客潮人发布了一场精彩演讲。他演讲时站在一块曾经挂着电影屏幕的墙旁边,用投影设备在这块墙上展示了距今五百年前文艺复兴时期德国画家 Hans Holbein 的一副双重人像画作。画作里有一个扭曲的人类头骨,根据 Blaise 的解读,Hans Holbin 不太可能直接画出这个奇怪的人类头骨,而是利用镜子或是透镜组将头骨的影像投射到画布上,然后勾勒出头骨的轮廓。「他使用的是当时最先进的技术,」Blaise 评价道。

通过这一事例,Blaise 想表达的是我们人类利用科学技术来创作艺术已经有好几个世纪的历史了,在这一点上,现在的我们与过去并没有那么不同。Blaise 通过这样的方式来为画廊里的每件由人工神经网络创作的展品做介绍,这种由计算机硬件与软件结合的神经网络与人类大脑的神经元网络相似。去年,谷歌的研究人员研发了一种全新的用于艺术创作的人工神经网络,这周末,谷歌将这套人工智能系统投入到为期两天的展览之中,其生成的图片为一家致力于将艺术与科技结合的非营利组织——灰色领域艺术基金会(Gray Area Foundation for the Arts)——筹得了 84,000 美元。


Google 迷人的深度梦想:就像机器服用了致幻剂丨数据工匠简报(9.05)_第2张图片

为什么我不是R方的粉丝

Google 迷人的深度梦想:就像机器服用了致幻剂丨数据工匠简报(9.05)_第3张图片

人们通常喜欢用 R2 作为评判模型拟合好坏的标准。与 MSE 和 MAD 不同,R2 不只是模型误差的函数,它的定义中还隐含了两个模型的比较:一个是当前被分析的模型,一个是所谓的常数模型,即只利用因变量均值进行预测的模型。基于此,R2R2 回答的是这样一个问题:“我的模型是否比一个常数模型更好?”,然而我们通常想要回答的是另一个完全不同的问题:“我的模型是否比真实的模型更差?”

通过一些人为构造的例子我们可以很容易发现,对这两个问题的回答是不可互换的。我们可以构造一个这样的例子,其中我们的模型并不比常数模型好多少,但同时它也并不比真实的模型差多少。同样,我们也可以构造出另一个例子,使得我们的模型远比常数模型要好,但也远比真实模型要差。

与所有的模型比较方法一样,R2 不单是被比较模型的函数,它也是观测数据的函数。几乎对于所有的模型,都存在一个数据集,使得常数模型与真实模型之间是无法区分开的。具体来说,当使用一个模型区分效能很低的数据集时,R2 可以任意地向零趋近——即使我们对真实模型计算 R2 也是如此。因此,我们必须始终记住,R2 并不能告诉我们模型是否是对真实模型的一个良好近似:R2 只告诉我们,我们的模型在当前的数据下是否远比一个常数模型要好。

Google 迷人的深度梦想:就像机器服用了致幻剂丨数据工匠简报(9.05)_第4张图片

机器学习算法比较

Google 迷人的深度梦想:就像机器服用了致幻剂丨数据工匠简报(9.05)_第5张图片

机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启发式学习方式来实验。通常最开始我们都会选择大家普遍认同的算法,诸如SVM,GBDT,Adaboost,现在深度学习很火热,神经网络也是一个不错的选择。假如你在乎精度(accuracy)的话,最好的方法就是通过交叉验证(cross-validation)对各个算法一个个地进行测试,进行比较,然后调整参数确保每个算法达到最优解,最后选择最好的一个。但是如果你只是在寻找一个“足够好”的算法来解决你的问题,或者这里有些技巧可以参考,下面来分析下各个算法的优缺点,基于算法的优缺点,更易于我们去选择它。

Google 迷人的深度梦想:就像机器服用了致幻剂丨数据工匠简报(9.05)_第6张图片


以上简讯由数据工匠提供,感兴趣的小伙伴可以通过扫描简报后的二维码链接原文,更多数据科学资讯尽在数据工匠,扫码关注Datartisan数据工匠公众号!如果你看到什么与“数据科学”有关的好文或者信息科技优质的文章,可以随手转发给我们,让更多热爱数据科学的小伙伴一起成长!


Google 迷人的深度梦想:就像机器服用了致幻剂丨数据工匠简报(9.05)_第7张图片

你可能感兴趣的:(Google 迷人的深度梦想:就像机器服用了致幻剂丨数据工匠简报(9.05))