熟练运用数据分析的大侦探是如何炼成的

您是一个数据分析的菜鸟么,您想成为一个大侦探么,您想在数据中发现蛛丝马迹吗?您想在数据中发现事实的真相么?给您推荐一本书《菜鸟侦探挑战数据分析》。

这是日本德岛大学的教授石田基广写的一本数据分析的入门书,日本人写的科技书一贯严谨认真,但是缺乏幽默感,但是这本书却颠覆了我之前的看法,活泼生动,幽默有趣。

本书以将知识融入故事的形式,讲述了大数据相关的案例。故事的主人公俵太,入职征信所,职务是“侦探”,他在天羽小姐的指导下从零开始学习数据分析。天羽小姐是数据分析的专家,为人霸道,俵太三天两头就要受点打击。这时候,逸子小姐——天羽的助手,就会站出来,将数据分析的相关知识手把手传授给俵太。读完这本书,你就会发现,我们身边随时发生的各种问题都可以用“数据分析”来解决。下面挑三个案例来展示一下。

案例一

新开张的店举办抽奖促销活动,广告说平均每100人就能有一个人中一等奖。一周之内,每天都有100人抽了奖,1周内开出了5个一等奖。可是100人*7天,应该开出7个一等奖才对啊,这个店是不是有欺诈行为呢?

天羽小姐采用概率分布的知识和直方图的方法展示,证明了这家店的无辜。

案例二

有一家饭馆,一段时间内在网络上收到了很多恶评,店主怀疑是小A所为,到底是不是他呢,如何圈定网络上的恶意中伤者呢?

天羽小姐采用了文本挖掘的知识,将文章进行词素分析,将获取到的词统计频数,用电脑来判断文本的相似性。就好像已知一个人的笔体,判断未知的文本是否出自该人之手一样。这里应用到了散点图和双标图,以及主成分分析的知识。

另外,利用文本挖掘,还可以从网络上就某一主题,或某一事件,查看不同人群(不同年龄、不同职业、不同性别)的看法或者观点哦。

案例三

商业街上的一家百元店经常遭遇小偷,那么如何预测小偷的行为,如何找到小偷呢?

这里逸子小姐,将某一时段内的盗窃金额情况用时间序列图、自相关图表示出来,发现了盗窃的时间规律,又联想到某高中放假的时间规律,从而猜测出罪魁祸首。后来又通过逻辑回归分析的方法,来判断高中学生放假情况和盗窃的关系。

里面还有一些案例,就不一一列举了,总之,文章将统计学的知识融入到故事中,深入浅出的解释数据分析的相关问题,故事悬念迭出,让人不忍释手。

如果您只想对数据分析有个大致的了解,通读本书就足够了,如果您想实际动手做出结果,本书还给出了实际的数据,对应的R语言的函数,以及Studio安装等,可以为您在数据分析方面更上一层楼。

另外,本书人物塑造有些二次元风格,读时让人不由想起日本的动画片或者漫画的某些情景,估计会是直男的最爱。

你可能感兴趣的:(熟练运用数据分析的大侦探是如何炼成的)