2016年12月我加入了超级个体专栏。通过学习专栏我已经知道大数据和人工智能是未来的趋势。我也在分析自己的工作在将来是否会被人工智能取代,答案是可能的。在专栏里我看到猴子老师的文章,说成立了大数据社群,我想加入,我也在犹豫。
知识付费已经热火朝天,写作、手绘、PPT、演讲、唱歌等等,只要你有自己的专长,在这个时代,你就可以打造自己成为超级个体。
然而,我看到的,听到的都是快速成功的故事,急切的想改变自己的现状,但是我仍然很迷茫,找不到方向。一部分原因是我不知道自己最适合做什么。确切的说我不知道我学了这项技能是否用到,我也害怕自己付出全部努力也不能成为这个领域的佼佼者。于是一犹豫就到了4月。
李笑来曾经提到过,在学习的时候,与其不停的找更好的方法,还不如马上开始行动,省得虚度更多的时间。这句话适用于现在的我。作为一项技能来说,数据分析是将来必不可少的技能。功不唐捐,即使不从事数据分析行业,也一定可以运用在其他方面的。终于,我下定决心,准备开始学习了。
在大数据社群里,我已经成功闯关进入第二关。到开始写这篇文章所花的时间是11天,远比我想象的要长。看着群里大家进度都好快,内心未免有点焦急。
进入第二关后,先按照指示预习了《R语言实战》第一、二章的内容。看的过程花了2天的时间,有点陌生,但第二章数据结构部分对我而言并不难。
接着安装了蓝灯软件,很顺利的可以进入Google,只是之后每次连接网络不太顺畅。稍微尝试之后发现每次联网的时候打开蓝灯软件,就可以很快连接到wifi。
在阅读了第2关给的“闯关道具”《如何拒绝成为伸手党》和《小白如何学习新技能》后,我心有戚戚。因为软件操作和搜索是我的薄弱部分,但我也明白自己动手解决问题的好处,除了自己能学到更多之外,每个人都应该尊重别人的时间,而时间是最重要的维度。
我花费最多时间的部分在于实践,下面说说我遇到的问题。
在输入命令时用了中文模式
结果系统报错了:
仔细看了好几遍,输入并无错误。上网查询了好久后才发现自己犯了常识性错误。
(写下来真的有点惭愧,别笑我,我真的是小白。)
2.输入时不完整
解决了上面的问题后,后面顺利多了,输入大部分代码我都可以得到和答案一样的结果。在我第二遍输入代码的时候,又卡在了相同的代码上。
我检查了输入环境,是英文啊,看了好久,也没发现问题。又在网上搜索,也没有头绪,我真的有点着急,又无奈,怎么自己学起来就这么难呢。
考虑后,还是决心向大家求助,没想到很快有人回答了我的问题,猴子老师立刻指出我少输入了向量符号c。网上教程也指出,其他符号输入不完整,软件也会报错的。
3.Rstudio脚本中文乱码
之后,实践就很顺利了。就在前几天我准备写这篇文章的时候,我打开Rstudio,顿时傻眼了,这是什么鬼?
我以为是系统问题,重装了软件,没有效果;或者是设置问题,网络上搜索了,可能是关键词和英文界面不太习惯的问题,没找到答案。不过在持续搜索了几天之后,更改了关键词,终于得到解决方法。界面恢复正常了。现在我知道这种现象叫中文乱码。具体解决方法是这样的:
看来,学习大数据还能顺便提高英语水平呢。
4.Rstudio输出结果中文乱码
继导入中文乱码后,在导入Excel数据时,输出的结果出现了中文乱码,而脚本和其他结果中的中文都是正常显示的。
有了上次的经验,这个问题没费多长时间,搜索加自己鼓捣了一下就搞定了。解决方法是这样的:
运行后得到了想要的数据结果:
接下来,附上成果图,作为第2关的实践作业:
最后,说说我学习大数据过程中偶然获得的其他福利。
实现了早起
去年开始就有想要早起学习的想法,总是因为动力不足而断断续续。目前,已经连续早起6天了,因为时间不够用和落后的焦虑。虽然只是早起1小时,自己也觉得是个小小的进步。
2.更加明白工作中相关软件的用法了
接触数据分析后,在使用赛默飞变色龙软件时,突然意识到这个软件其实是用另一种语言编程的。软件的使用过程中,如果掌握了如何编辑脚本和相关函数会对使用软件有很大帮助,就不用太依赖于工程师了。
本文内容来自大数据社群会员实践笔记 (知乎:方宁)。
经常会有人跟我说:我是小白,不懂哎。其实这个问题反过来想想,如果你学会了,那就就不是小白了。所以,解决小白的唯一办法就是去实践学习,没有其他捷径。
很开心,见到社群里更多的人拜托了“伸手党”的恶习,也从小白逐渐成长起来。记得宫崎骏电影《龙猫》里有句台词:
生活坏到一定程度就会好起来,因为它无法更坏。努力过后,才知道许多事情,坚持坚持,就过来了。