那些年,我们读过的计算机书籍竟然都是儿童读物 | 大数据害人不浅

那些年,我们读过的计算机书籍竟然都是儿童读物。

引子

今天在给过年屯本书的时候,发现了一本大数据的书,这本书看上去不错:

那些年,我们读过的计算机书籍竟然都是儿童读物 | 大数据害人不浅_第1张图片

但是就是还差点邮费,于是我就习惯性的点上了『黄峰达的亚马逊』。一个个的点开不同分类的推荐书籍,直到:

那些年,我们读过的计算机书籍竟然都是儿童读物 | 大数据害人不浅_第2张图片

这一瞬间,我惊呆了。

那些年,我们读过的计算机书籍竟然都是儿童读物 | 大数据害人不浅_第3张图片

!《Hibernate实战(第2版)》居然是本儿童读物

接着,我点开了下拉菜单,整个人都不好了

那些年,我们读过的计算机书籍竟然都是儿童读物 | 大数据害人不浅_第4张图片

那些年,我们读过的计算机书籍竟然都是儿童读物 | 大数据害人不浅_第5张图片

那些年,我们读过的计算机书籍竟然都是儿童读物 | 大数据害人不浅_第6张图片

前三页居然都是儿童读物,你 TM 是在逗我么?

那些年,我们读过的计算机书籍竟然都是儿童读物 | 大数据害人不浅_第7张图片

这应该不是算法问题吧,点开一看,宝宝惊呆了:这是未来儿童的生活知识。

那些年,我们读过的计算机书籍竟然都是儿童读物 | 大数据害人不浅_第8张图片

(看最后一行)


过去的儿童只能从ta父母的杯子,懂得 Java 这几个字母,现在的儿童就会大有出息——个个写代码了。

我猜:大概是为了在排行版上有一个好的排名?

大数据真要命

很早以前,我研究过一段时间的机器学习与推荐算法。后来不学了,因为对于机器学习来说:重要的并不是算法而是数据。人才在不同的公司之间流动,大部分的通用算法都会被公开出来的,而算法本身是依赖于数据的。没有大量的数据,光有一个深度学习算法,能干什么?

那些年,我们读过的计算机书籍竟然都是儿童读物 | 大数据害人不浅_第9张图片

再回到我们的这个问题里,亚马逊的推荐算法算是比较简单的——主要是数据量一大,复杂的算法模型都不适合。而如果你的数据本身是有问题的,那么你的算法再好,有什么用?????

那些年,我们读过的计算机书籍竟然都是儿童读物 | 大数据害人不浅_第10张图片

当数据出错的时候,我们就需要手动去过滤数据,如将邮件标记为非垃圾邮件——利用朴素贝叶斯算法。这时候,我们才有可能能保证,邮件不会被标记为垃圾邮件。

错误的未来

有一天,你在 百度 上搜索了一个大数据(截图来自谷歌),然后打开了其中的一个链接。

那些年,我们读过的计算机书籍竟然都是儿童读物 | 大数据害人不浅_第11张图片

自那以后,百度联盟、淘宝联盟,给你推荐的就是大女,就变成了这种画风:

那些年,我们读过的计算机书籍竟然都是儿童读物 | 大数据害人不浅_第12张图片

吓死宝宝了,被我们家 花仲马 看到了要怎么解释清楚?

正确的未来

正确的推荐应该是,2333~~~

那些年,我们读过的计算机书籍竟然都是儿童读物 | 大数据害人不浅_第13张图片

这才叫相关推荐!

或者:机器人的电影里多了一部:『人类清除计划』。

那些年,我们读过的计算机书籍竟然都是儿童读物 | 大数据害人不浅_第14张图片


0?wx_fmt=jpeg


数据表明,昨天的那篇《18 副为程序员定制的对联,总有一副适合你...流泪》中的:送产品版(开战版)特别爱欢迎

上联:去他大爷,十个需求,九处修改,八个扯淡,七番六次急忙上线

下联:改你妈逼,五日凌晨,四点加班,三里灯火,两排一个猝倒桌前

横批:你行你来


你可能感兴趣的:(那些年,我们读过的计算机书籍竟然都是儿童读物 | 大数据害人不浅)