机器学习、数据挖掘相关资源链接(持续补充...)

kaggle社区。全球最大的人工智能比赛社区。比赛众多,且种类难度都有分类。社区中各个比赛下,参赛者会在讨论区积极交流,提供kernel(解决方法)。对初学者也十分友好。
Competitions | Kaggle

天池大数据比赛,阿里巴巴主办。很多赛题都来源于企业实际工作中遇到的难题。比赛普遍分为两个阶段,在复赛中取到好成绩的队伍会受邀到杭州现场答辩,对以后求职十分有帮助。缺点是讨论区不活跃,难以了解优胜者的解法,对以学习为目的的同学不太友好。
天池大数据众智平台-数据科学家社区

AI Challenger,李开复联合几个公司举办的,今年是第一届。主赛道题目多为科研界和工业界交叉领域的热门问题,如机器翻译、场景识别等,数据量大,需要成熟的算法(复杂的深度学习模型)。基本上单独的参赛者是很难尝试了。参赛者应该多为高校、研究机构课题组的group。
AI Challenger - 全球AI挑战赛

Data Fountain,承办多家机构与各类公司的比赛,种类众多。
DF,CCF指定专业大数据竞赛平台

sklearn,使用最广泛的机器学习算法包。除了算法外,还包括数据预处理、交叉验证等众多模块。
scikit-learn: machine learning in Python — scikit-learn 0.19.0 documentation

TensorFlow,使用最广泛的深度学习算法包。谷歌开发,持续更新。
开始使用 | TensorFlow
TensorFlow API

keras,tensorflow(也有基于其它主流深度学习框架)的高级抽象API,十分适用于深度学习新手。
Keras中文文档

XGBoost,GBDT的优化实现,速度快,效果好。
XGBoost Parameters — xgboost 0.6 documentation

LightGBM,微软的GBDT优化实现,比XGBoost更快,效果相当。
Python API — LightGBM documentation

CatBoost,俄国一家科技公司开源的GBDT优化实现,直接支持类别特征。
CatBoost - open-source gradient boosting library

matplotlib,画图工具包。基本其他主流的工具包都是以该包为基础实现的。
Matplotlib: Python plotting — Matplotlib 2.0.2 documentation

seaborn,可视化工具包。
seaborn: statistical data visualization — seaborn 0.8.1 documentation

plotly,可视化工具包。
Python Graphing Library, Plotly

待补充…

你可能感兴趣的:(MasterWork-UCAS,科研,算法,论文,机器学习相关,长篇)