转载的一些东西

选择机器学习方向,需要专注提高以下方面的能力:

(一)基础代码能力:刷OJ(leetcode or hackrank)和实现机器学习算法(如svm、lr、gbdt、random forests等),并且让代码规范高效。

(二)领域知识:kaggle比赛、认真读书(ESL或者PRML)并写读书笔记、和大神交流(特征工程、模型等)、每天找点其他人遇到的问题回答一下(知乎、Quora、StackOverFlow等)【https://www.zhihu.com/question/29890222】  

(三)英语水平:



著作权归作者所有。
商业转载请联系作者获得授权,非商业转载请注明出处。
作者:issac Syndrome
链接:https://www.zhihu.com/question/29890222/answer/46163276
来源:知乎

Logistics Regression,基本是区分菜鸟和逗逼的第一题啦。
Support Vector Machine,基本是区分进阶和菜鸟的第一题啦。
Naive Bayes,离散和连续的差别,可以看出概率基础哟。
Decision Tree,可以看点信息论,然后面试官就对你刮目相看啦。

Expectation Maximization,了解它的应用的模型,不需要背,理解EM就会觉得豁然开朗啦。
Gradient Descent,同上。

Over-fitting,如何避免过拟合?
Regularization,为什么可以避免过拟合?可以参考下病态问题。

Ensemble Learning,数据挖掘最常用的模型了吧,想想为什么集成方法是有效的。
Transfer Learning,貌似现在很火啊(图像识别领域)!!我不是很懂啊~~求懂的大神留言~~为什么由某一领域训练模型可以应用到其他领域?又是如何应用的?






著作权归作者所有。
商业转载请联系作者获得授权,非商业转载请注明出处。
作者:吴俣
链接:https//www.zhihu.com/question/21714701/answer/49112656
来源:知乎

最后想说的是:学好Python,掌握好开源的Tool。在工作解决实际问题的过程中,往往是这个逻辑:这个问题我们需要这个数据我们去crawl吧!!!(爬虫能力)-> 这些数据应该抽取ABCD这些特征(对数据的感觉)->这种数据特征的拟合用这个模型好!!!我记这个开源Tool实现了(对开源机器学习模型的了解)-> 还是不work,我们写Rule吧(有多少人工就有多少智能的步骤)。当然最后一步十分重要,尤其对于自然语言处理问题(摊手脸)




转载的一些东西_第1张图片
转载的一些东西_第2张图片





你可能感兴趣的:(girls,读书笔记)