分享《机器学习》PDF及自己的一些体会
写这篇文章主要是作为一篇分享周志华《机器学习》PDF的博客给主动学习那篇博文贴链接用的。
为了防止有人和我一样一开始看西瓜书觉得枯燥,不知所云,入门困难,就分享一下自己作为小白到萌新的一些浅薄的体会,希望对自学的同学入门有所帮助。
百度网盘链接
周志华西瓜书《机器学习》是一本经典的机器学习教程
另外还有一些数据分析的PDF电子书,毕竟数据处理也必不可少
作为一只学了没多久的菜鸡个人学习过程经验分享
机缘巧合接触了人工智能,现在这个又是大热方向。现在暑期实习做的也是这方面的东西。就开始慢慢看这方面的东西了。(说起来这个得感谢经常被我吐槽的母校,大二暑假给了一次接触并入门的机会)
关于我使用的语言python
目前大多数人工智能方向用的语言是Python,而且特别好用。关于python及其环境的安装网上的教程很多,就不赘述了。
Python和其他语言的区别就是一行一行运行,而不是运行生成整个可执行文件。
一些语法什么的相信有代码基础的同学也很容易掌握,并且我劝和我一样的小白不要过于执着于此。直接利用搜索引擎可以帮你解决很多问题,很多代码怎么写也有基础的源码范例。唯一要注意的就是Python2和Python3语法有较大差异。
菜鸟教程Python3
这个网站有一些基本的语法及其示例,查询也十分方便。类似于一本Python语言书。
代码出错了怎么办?
以下方法对几乎所有代码编程均适用
首先建议先读一下报错信息,不懂的可以谷歌翻译一下
- 代码错误问答社区:
stackoverflow
CSDN
…… - 直接搜索报错信息
- 找有经验的人询问(如果一起卡住了,建议自查)
代码不报错,也不代表是正确的。debug大法虽然很烦但是很好用。
关于自己入门机器学习的体会
机器学习的一些原理还是很重要的。但是一开始刚接触,我建议的是直接和我一样调用包。这个包的名字叫sklearn,pip install就行。
sklearn官方中文文档
现在这个网站慢慢有人管理了,有了中文介绍有有了使用范例源码。
官方文档网站上不仅有各大算法大致原理及API、怎么使用这个包用几行代码训练测试数据的范例、还有整体流程的解释……
实践是最好的老师,建议先从项目入手
这时候就要推荐kaggle了
kaggle这个网站可以用很久很久,即使你成为了一名优秀的算法工程师也可以经常去看看。kaggle上有很多入门项目和大神笔记分享,也有很多有奖竞赛,是个很锻炼人的地方。
学习kaggle上的那些入门级项目
首当其冲泰坦尼克Taitanic
上面有很多大神分享的笔记,学习它们将对整个流程有个大致了解(建议安装一个jupyte notebook来查看这些笔记)
入门参考:
方面 | 入门赛题 | 完成情况 |
---|---|---|
ML | 泰坦尼克Taitanic | Y |
图像 | 数字识别Digit Recognizer | Y |
NLP | 情感分析、quora 问句语义匹配 | N |
多看多做几个入门项目就基本OK了,入门后千万不要忘本,原理还是很重要,能让你到达更高的高度,这时候你就会发现西瓜书其实很值得学习,并且也没有那么枯燥。
稍微深入点就可以关注一下行业的最新消息,不仅是跟上发展的脚步。还有因为很多大佬会把源码分享在github上,开源的世界很美好,就算不能完全看懂源码,也能学到不少东西。
我平时关注机器学习资讯用的:
- 机器之心
- google AI blog
- 各大牛的博客
- 到用时查找论文文献发现的
学习视频网站:
- 哔哩哔哩bilibili(我的最爱)
- 网易云公开课
- coursera
- 闲鱼
- ……
也有各种其他渠道付费课程,但是我不是很喜欢看课程,因为觉得比较花时间,尤其是有些课程录制画质音质也一般,我更喜欢看源码一点点看懂它。
当然一开始对于理清整体思路看视频还是不错的选择。所以我还是建议大家一开始可以像上课一样看看这些视频,如果不知道看什么好,要看比较经典的。
结语
暂时就先这样啦,因为自己也还在学习中,所以体会也不多。主要还是分享PDF,然后顺便希望通过写出自己的入门体会,对自学入门的同学有所帮助。如果觉得有用就给个赞吧,ღ( ´・ᴗ・` )比心