【资源整合帖】机器学习&深度学习,如何从入门到高手

用来收集各类资源,各大包括机器学习ML、深度学习DL、自然语言处理NLP、机器视觉等方向,更新ing~

课程资源

很多视频课程网易云课堂、腾讯课堂、MOOC等视频学习类网站都有资源,but,基本上B站上都有搬运工 ,有弹幕解释,有评论提供资料、作业、解析等,所以——B站大法好!

1.软件基础

视频教程:

  • 莫烦python:python入门学习视频教程,小哥哥讲的很好
  • Tensorflow中文社区:tensorflow教程,最流行的深度学习框架之一

书籍/文献教程:

  • scikit-learn (sklearn) 官方文档中文版:scikit-learn 是基于 Python 语言的机器学习工具
  • scikit-learn (sklearn) 官方文档英文版

工具使用手册:

  • DataFrame数据选取全攻略
  • pandas 中DataFrame使用:记录抽取,随机抽样,记录合并,字段合并,字段匹配,数据的简单计算

2.数理基础

书籍/文献教程:

  • 李航 统计学习方法:统计学相关理论
  • 机器学习中的基本数学知识

3.机器学习

视频教程:

  • 吴恩达 机器学习:机器学习入门课程,很适合入门级选手
  • Hinton 面向机器学习的神经网络
  • 台湾大学林轩田 机器学习基石
  • 台湾大学林轩田 机器学习技法
  • 台湾大学李宏毅的机器学习课程2017

书籍/文献教程:

  • 周志华 机器学习:西瓜书,机器学习理论
  • The Auton Lab:Andrew  Moore大牛的Data Mining Tutorial系列非常赞

4.深度学习

视频教程:

  • 硅谷技术大牛Siraj带你入门深度学习
  • 台大教授李宏毅的深度学习课程 2017

书籍/文献教程:

  • 伊恩·古德费洛 深度学习:花书,深度学习理论

5.自然语言处理

NLP四大类任务:

  • 序列标注:中文分词,词性标注,命名实体识别,语义角色标注……
  • 分类任务:文本分类,情感计算……
  • 句子关系判断:Entailment,QA,语义改写,自然语言推理……
  • 生成式任务:机器翻译,文本摘要,写诗造句,看图说话……

视频教程:

  • CS224n 斯坦福深度自然语言处理:原名  Deep Learning for Natural Language Processing (深度自然语言处理),是全球 NLP 领域最受欢迎的课程之一,让你在了解丰富的深度自然语言处理应用案例的同时,学会在实践中搭建出最先进的自然语言处理模型。
  • 斯坦福大学CS224d课程的中文版内容笔记:由寒小阳和龙心尘翻译和整理,得到斯坦福大学课程@Richard Socher教授的授权翻译与发表
  • 牛津大学&DeepMind 自然语言处理
  • 哥伦比亚大学Michael Collins教授的nlp课程,这门课的好处就是讲解的非常简单,无痛苦入门,之前Coursera上开了这门课,相应的资源可以在知乎上搜一下,Michael教授的笔记如行云流水,不可多得
  • Stanford的DAN JURAFSKY 和Christopher Manning的NLP课程,该课程是对1的补充,内容涵盖的也更加丰富,Coursera上也开过,目前被清了,资源知乎内找找吧
  • Stanford的CS224N,同样是Stanford的NLP经典课程,这门课主要采用深度学习的视角进行。以上三门课,如果题主好好完成,做完作业,应该会有很多的收获。
  •  

书籍/文献教程:

  • 国际计算语言学协会(ACL,The Association for Computational Linguistics):ACL成立于1962年,是自然语言处理(NLP)领域影响力最大、最具活力的顶级国际学术组织。多查阅ACL论文,有助于了解更多更新的知识
  • 《Python自然语言处理》:从输入法联想提示(predictive text)、email过滤到自动文本汇总、机器翻译,大量的语言相关的技术都离不开自然语言处理的支持,而这本书提供了自然语言处理的入门指南。通过本书,你将学到如何编写能处理大量非结构化文本的Python程序。你可以访问具有丰富标注的、涵盖了语言学各种数据结构的数据集,而且你将学习分析书面文档的内容以及结构的主要算法
  • 《基于深度学习的自然语言处理》:本书系统阐述将深度学习技术应用于自然语言处理的方法和技术,深入浅出地介绍了深度学习的基本知识及各种常用的网络结构,并重点介绍了如何使用这些技术处理自然语言
  • 《NLP高效沟通》(趣味漫画图文版):国际上大量案例证明,从破解成功人士语言和思维模式入手的NLP,能够帮助人们改善沟通质量,拥有好的人际关系和成功的未来
  • 《自然语言处理入门》:这是一本把读者阅读体验放在首位的中文 NLP 图书,作者采用从问题到算法再到工程实现的写作思路,只允许必不可少的公式出现,降低了读者学习的门槛,通俗易懂、容易上手。是一本可以在地铁上也能学会 NLP 开发的图书

经验贴:

  • 《Resource Sharing》---NLP专题分享之【学习资料推荐】:https://discussion.datafountain.cn/questions/2294​​​​​​​

6.计算机视觉

视频教程:

  • CS231n 斯坦福深度视觉识别课​​​​​​2017春季

书籍/文献教程:

 

7.语音识别

 

实战经验:

  • 用深度学习(CNN RNN Attention)解决大规模文本分类问题 - 综述和实践:北邮毕业,就职阿里搜索排序,深度学习在文本分类中应用时总结的经验心得,很受用
  • NLP文本分类实战: 传统方法与深度学习:对比传统机器学习方法和深度学习方法在NLP中的使用
  • Understanding Convolutional Neural Networks for NLP:CNN在NLP领域的理解,文章写得很通俗易懂,值得多看几次

竞赛教程:

  • 知乎“看山杯” 夺冠记:多学习大神们的竞赛思路,在工程应用和竞赛中都有帮助
  • Sebastian Ruder:NLP领域中一个大神的网站,对NLP的理解和看法

开放平台/开源模型

直接调用开放平台的API接口或SDK

谷歌最强 NLP 模型 BERT 

github项目地址https://github.com/google-research/bert

论文原文https://arxiv.org/pdf/1810.04805.pdf

  • 两行代码玩转 Google BERT 句向量词向量:使用bert迁移学习教程

百度AI开放平台

https://ai.baidu.com/

【资源整合帖】机器学习&深度学习,如何从入门到高手_第1张图片

腾讯AI开放平台

https://ai.qq.com/

【资源整合帖】机器学习&深度学习,如何从入门到高手_第2张图片

网易AI平台

http://openai.163.com/

【资源整合帖】机器学习&深度学习,如何从入门到高手_第3张图片

 

自然语言处理NLP

词向量

腾讯AI实验室中文词向量语料库【Tencent AI Lab Embedding Corpus for Chinese Words and Phrases】

https://ai.tencent.com/ailab/nlp/embedding.html

tensorflow/tensor2tensor

https://github.com/tensorflow/tensor2tensor

 

图像识别

腾讯AI Lab正式开源业内最大规模多标签图像数据集

https://github.com/Tencent/tencent-ml-images

本次正式开源,其主要内容包括:

  • ML-Images数据集的全部图像URLs,以及相应的类别标注。因原始图像版权问题,此次开源将不直接提供原始图像,用户可利用腾讯AI Lab提供的下载代码和URLs自行下载图像。
  • ML-Images数据集的详细介绍。包括图像来源、图像数量、类别数量、类别的语义标签体系、标注方法,以及图像的标注数量等统计量。
  • 完整的代码和模型。腾讯AI Lab提供的代码涵盖从图像下载和图像预处理,到基于ML-Images的预训练和基于ImageNet的迁移学习,再到基于训练所得模型的图像特征提取的完整流程。项目提供了基于小数据集的训练示例,以方便用户快速体验该训练流程。项目还提供了具有极高精度的ResNet-101模型(在单标签基准数据集ImageNet的验证集上的top-1精度为80.73%)。用户可根据自身需求,随意选用该项目的代码或模型。

你可能感兴趣的:(深度学习,机器学习,自然语言处理)