注:机器学习资料篇目一共500条,篇目二开始更新
希望转载的朋友,你可以不用联系我.但是一定要保留原文链接,因为这个项目还在继续也在不定期更新.希望看到文章的朋友能够学到更多.此外:某些资料在中国访问需要梯子.
- 《Image Scaling using Deep Convolutional Neural Networks》
介绍:使用卷积神经网络的图像缩放.
- 《Proceedings of The 32nd International Conference on Machine Learning》
介绍:ICML2015 论文集,优化4个+稀疏优化1个;强化学习4个,深度学习3个+深度学习计算1个;贝叶斯非参、高斯过程和学习理论3个;还有计算广告和社会选择.ICML2015 Sessions.
- 《Image Scaling using Deep Convolutional Neural Networks》
介绍:使用卷积神经网络的图像缩放.
- 《Microsoft researchers accelerate computer vision accuracy and improve 3D scanning models》
介绍:,第28届IEEE计算机视觉与模式识别(CVPR)大会在美国波士顿举行。微软研究员们在大会上展示了比以往更快更准的计算机视觉图像分类新模型,并介绍了如何使用Kinect等传感器实现在动态或低光环境的快速大规模3D扫描技术.
- 《Machine Learning for Humans》
介绍:(文本)机器学习可视化分析工具.
- 《A Plethora of Tools for Machine Learning》
介绍:机器学习工具包/库的综述/比较.
- 《The art of visualizing visualizations: a best practice guide》
介绍:数据可视化最佳实践指南.
- 《MIT Machine Learning for Big Data and Text Processing Class Notes - Day 1》
介绍:Day 1、Day 2、Day 3、Day 4、Day 5.
- 《Getting “deep” about “deep learning”》
介绍:深度学习之“深”——DNN的隐喻分析.
- 《Mixture Density Networks》
介绍:混合密度网络.
- 《Interview Questions for Data Scientist Positions》
介绍:数据科学家职位面试题.
- 《Accurately Measuring Model Prediction Error》
介绍:准确评估模型预测误差.
- 《Continually updated Data Science Python Notebooks》
介绍:Continually updated Data Science Python Notebooks.
- 《How to share data with a statistician》
介绍:How to share data with a statistician.
- 《The Eyescream Project NeuralNets dreaming natural images》
介绍:来自Facebook的图像自动生成.
- 《How to share data with a statistician》
介绍:How to share data with a statistician.
- 《A Neural Conversational Model》
介绍:(Google)神经(感知)会话模型.
- 《The 50 Best Masters in Data Science》
介绍:The 50 Best Masters in Data Science.
介绍:NLP常用信息资源.
- 《Conditional Random Fields as Recurrent Neural Networks》
介绍:语义图像分割的实况演示,通过深度学习技术和概率图模型的语义图像分割.
- 《Fully Convolutional Networks for Semantic Segmentation》
介绍:Caffe模型/代码:面向图像语义分割的全卷积网络,模型代码.
- 《Growing Pains for Deep Learning》
介绍:深度学习——成长的烦恼.
- 《Clustering Text Data Streams – A Tree based Approach with Ternary Function and Ternary Feature Vector 》
介绍:基于三元树方法的文本流聚类.
- 《Foundations and Advances in Data Mining》
介绍:Free Ebook:数据挖掘基础及最新进展.
- 《The Deep Learning Revolution: Rethinking Machine Learning Pipelines》
介绍:深度学习革命.
- 《The Definitive Guide to Do Data Science for Good》
介绍:数据科学(实践)权威指南.
- 《Microsoft Academic Graph》
介绍:37G的微软学术图谱数据集.
- 《Challenges and Opportunities Of Machine Learning In Production》
介绍:生产环境(产品级)机器学习的机遇与挑战.
- 《Neural Nets for Newbies》
介绍:神经网络入门.
- 《A Nearly-Linear Time Framework for Graph-Structured Sparsity》
介绍:来自麻省理工的结构化稀疏论文.
- 《Optimal and Adaptive Algorithms for Online Boosting》
介绍:来自雅虎的机器学习小组关于在线Boosting的论文 .
- 《Top 20 Python Machine Learning Open Source Projects》
介绍:20个最热门的开源(Python)机器学习项目.
- 《The Parallel C++ Statistical Library for Bayesian Inference: QUESO》
介绍:C++并行贝叶斯推理统计库QUESO,github code.
- 《《Deep learning》Yann LeCun, Yoshua Bengio, Geoffrey Hinton (2015) 》
介绍:Nature:LeCun/Bengio/Hinton的最新文章《深度学习》,Jürgen Schmidhuber的最新评论文章《Critique of Paper by "Deep Learning Conspiracy" (Nature 521 p 436)》.
介绍:基于Scikit-Learn的预测分析服务框架Palladium.
- 《Advances in Structured Prediction》
介绍:John Langford和Hal Daume III在ICML2015上关于Learning to Search的教学讲座幻灯片.
- 《100 open source Big Data architecture papers for data professionals》
介绍:读完这100篇论文 就能成大数据高手,国内翻译.
- 《Social Media & Text Analytics》
介绍:NLP课程《社交媒体与文本分析》精选阅读列表.
- 《Machine Learning for Developers》
介绍:写给开发者的机器学习指南.
- 《Hot news detection using Wikipedia》
介绍:基于维基百科的热点新闻发现.
- 《Harvard Intelligent Probabilistic Systems Group》
介绍:(Harvard)HIPS将发布可扩展/自动调参贝叶斯推理神经网络.
- 《An Empirical Exploration of Recurrent Network Architectures》
介绍:面向上下文感知查询建议的层次递归编解码器.
- 《Efficient Training of LDA on a GPU by Mean-for-Mode Estimation》
介绍:GPU上基于Mean-for-Mode估计的高效LDA训练.
- 《From the Lab to the Factory: Building a Production Machine Learning Infrastructure》
介绍:从实验室到工厂——构建机器学习生产架构.
- 《6 Useful Databases to Dig for Data (and 100 more)》
介绍:适合做数据挖掘的6个经典数据集(及另外100个列表).
- 《Deep Networks for Computer Vision at Google – ILSVRC2014》
介绍:Google面向机器视觉的深度学习.
- 《How to choose a machine learning API to build predictive apps》
介绍:构建预测类应用时如何选择机器学习API.
- 《Exploring the shapes of stories using Python and sentiment APIs》
介绍:Python+情感分析API实现故事情节(曲线)分析.
- 《Movie selection using R》
介绍:(R)基于Twitter/情感分析的口碑电影推荐,此外推荐分类算法的实证比较分析.
- 《A Tutorial on Graph-based Semi-Supervised Learning Algorithms for NLP》
介绍:CMU(ACL 2012)(500+页)面向NLP基于图的半监督学习算法.
- 《Arbitrariness of peer review: A Bayesian analysis of the NIPS experiment》
介绍:从贝叶斯分析NIPS,看同行评审的意义.
- 《Basics of Computational Reinforcement Learning》
介绍:(RLDM 2015)计算强化学习入门.
- 《Deep Reinforcement Learning》
介绍:David Silver的深度强化学习教程.
- 《On Explainability of Deep Neural Networks》
介绍:深度神经网络的可解释性.
- 《The Essential Spark Cheat Sheet》
介绍:Spark快速入门.
- 《Machine Learning for Sports and Real Time Predictions》
介绍:TalkingMachines:面向体育/政治和实时预测的机器学习.
- 《CS224W: Social and Information Network Analysis Autumn 2014》
介绍:Stanford社交网络与信息网络分析课程资料+课设+数据.
- 《RL Course by David Silver》
介绍:David Silver(DeeMind)的强化学习课程,slide.
- 《Faster deep learning with GPUs and Theano》
介绍:基于Theano/GPU的高效深度学习.
- 《Introduction to R Programming》
介绍:来自微软的.
- 《Golang:Web Server For Performing Sentiment Analysis》
介绍:(Go)情感分析API服务Sentiment Server.
- 《A Beginner’s Guide to Restricted Boltzmann Machines》
介绍:受限波尔兹曼机初学者指南.
介绍:Mining and Summarizing Customer Reviews ,Mining High-Speed Data Streams,Optimizing Search Engines using Clickthrough Data.
- 《Nvidia Deep Learning Courses》
介绍:Nvidia深度学习课程.
- 《Deep Learning Summer School 2015》
介绍:2015年深度学习暑期课程,推荐讲师主页.
介绍:这是一篇关于百度文章《基于深度学习的图像识别进展:百度的若干实践》的摘要,建议两篇文章结合起来阅读.
- 《Machine Learning Methods in Video Annotation》
介绍:视频标注中的机器学习技术.
- 《Training Recurrent Neural Networks》
介绍:博士论文:(Ilya Sutskever)RNN训练.
- 《On Explainability of Deep Neural Networks》
介绍:深度神经网络的灰色区域:可解释性问题,中文版.
- 《Machine Learning Libraries in GoLang by Category》
介绍:Golang 实现的机器学习库资源汇总.
- 《A Statistical View of Deep Learning》
介绍:深度学习的统计分析.
- 《Deep Learning For NLP - Tips And Techniques》
介绍:面向NLP的深度学习技术与技巧.
- 《CrowdFlower Competition Scripts: Approaching NLP》
介绍:Kaggle's CrowdFlower竞赛NLP代码集锦.
- 《CS224U: Natural Language Understanding》
介绍:斯坦福的自然语言理解课程.
- 《Deep Learning and Shallow Learning》
介绍:Deep Learning与Shallow Learning 介绍
- 《A First Encounter with Machine Learning》
介绍:这是一本机器学习的电子书,作者Max Welling先生在机器学习教学上面有着丰富的经验,这本书小但精致.
- 《Click Models for Web Search》
介绍:由荷兰阿姆斯特丹大学 & 谷歌瑞士著.
- 《Hinton CSC321课程/Deep Learning/Notes on CNN/Python/Theano/CUDA/OpenCV/...》
介绍:介绍个乐于总结和翻译机器学习和计算机视觉类资料的博客,包含的内容:Hinton的CSC321课程的总结;Deep Learning综述;Notes on CNN的总结;python的原理总结;Theano基础知识和练习总结;CUDA原理和编程;OpenCV一些总结.
- 《Which Algorithm Family Can Answer My Question?》
介绍:针对具体问题(应用场景)如何选择机器学习算法(系列).
- 《Free Data Science Books》
介绍:数据科学免费书分类集合
- 《Tutorial 4: Deep Learning for Speech Generation and Synthesis》
介绍:深度学习在语音合成最新进展有哪些?推荐MSRA的Frank Soong老师关于语音合成的深度学习方法的录像和幻灯片与以及谷歌的LSTM-RNN合成介绍,论文
- 《The Art of Data Science》
介绍:新书(可免费下载):数据科学的艺术
- 《Pattern Recognition and Machine Learning》
介绍:模式识别与机器学习书籍推荐,本书是微软剑桥研究院大神Bishop所写,算是最为广为认知的机器学习教材之一,内容覆盖全面,难度中上,适合研究生中文版 or 备份
- 《an introduction to visualizing DATA》
介绍:数据可视化介绍(23页袖珍小册子)
- 《That’s So Annoying!!!: A Lexical and Frame-Semantic Embedding Based Data Augmentation Approach to Automatic Categorization of Annoying Behaviors using #petpeeve Tweets ∗》
介绍:这篇论文荣获EMNLP2015的最佳数据/资源奖优秀奖,标注的推特数据集
- 《26 Things I Learned in the Deep Learning Summer School》
介绍:作者在深度学习的思考.
- 《Data-Visualization Tools & Books》
介绍:数据可视化常用工具软件资源汇总
- 《Machine Learning and Probabilistic Graphical Models Course》
介绍:Buffalo大学教授Sargur Srihari的“机器学习和概率图模型”的视频课程
- 《Understanding Machine Learning: From Theory to Algorithms》
介绍:耶路撒冷希伯来大学教授Shai Shalev-Shwartz和滑铁卢大学教授Shai Ben-David的新书Understanding Machine Learning: From Theory to Algorithms,此书写的比较偏理论,适合对机器学习理论有兴趣的同学选读
- 《Machine Learning Checklist》
介绍:机器学习学习清单
介绍:知乎上面的一篇关于NLP界有哪些神级人物?提问。首推Michael Collins
介绍:机器学习与NLP专家、MonkeyLearn联合创始人&CEO Raúl Garreta面向初学者大体概括使用机器学习过程中的重要概念,应用程序和挑战,旨在让读者能够继续探寻机器学习知识。
- 《Gradient Boosted Regression Trees》
介绍:(IPN)基于Scikit-Learn的GBRT(Gradient Boost Regression Tree)教程,slide
- 《Apache SINGA : Distributed Deep Learning System》
介绍: 无需做深度学习就能用的分布式深度学习软件.
- 《E-commerce Recommendation with Personalized Promotion》
介绍: 在亚马逊数据和众包Mechanical Turk上,实现了来自彩票和拍卖的机制,以收集用户对产品的乐意购买价格(WTP,willingness-to-pay)训练集。 E-commerce Recommendation with Personalized Promotion [Zhao,RecSys15] 回归模型预测未知WTP,提升卖家利润和消费者满意度
- 《Scalable Machine Learning》
介绍:来自伯克利分校的大规模机器学习.
介绍:来自52ml的机器学习资料大汇总.
- 《Automatic Summarization》
介绍:这本书的作者McKeown是2013年世界首个数据科学院(位于哥伦比亚大学)主任,她亦是ACL、AAAI和ACM Fellow .
- 《Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing》
介绍:EMNLP-15文本摘要若干.
- 《Recommender Systems (Machine Learning Summer School 2014 @ CMU)》
介绍:来自Netflix的Xavier Amatriain在Summer School 2014 @ CMU上长达4小时的报告,共248页,是对推荐系统发展的一次全面综述,其中还包括Netflix在个性化推荐方面的一些经验介绍.
介绍:(ECML PKDD 2015)大数据流挖掘教程,此外推荐ECML PKDD 2015 Tutorial列表.
- 《Deep learning on Spark with Keras》
介绍:Spark上的Keras深度学习框架Elephas.
- 《Prof. Surya Ganguli - The statistical physics of deep learning》
介绍:Surya Ganguli深度学习统计物理学.
- 《(系统/算法/机器学习/深度学习/图模型/优化/...)在线视频课程列表》
介绍:(系统/算法/机器学习/深度学习/图模型/优化/...)在线视频课程列表.
- 《Introduction to Topic Modeling in Python》
介绍:(PyTexas 2015)Python主题建模.
- 《Large Scale Distributed Deep Learning on Hadoop Clusters》
介绍:Hadoop集群上的大规模分布式机器学习.
- 《Top Deep Learning Employers Based On LinkedIn Data》
介绍:基于LinkedIn数据得出的深度学习热门"东家"排行.
- 《Neural Net in C++ Tutorial》
介绍:(c++)神经网络手把手实现教程.
- 《Large-scale CelebFaces Attributes (CelebA) Dataset》
介绍:香港中文大学汤晓鸥教授实验室公布的大型人脸识别数据集: Large-scale CelebFaces Attributes (CelebA) Dataset 10K 名人,202K 脸部图像,每个图像40余标注属性.
- 《Unsupervised Feature Learning in Computer Vision》
介绍:面向机器视觉的无监督特征学习,Ross Goroshin's webpage.
- 《Scheduled Sampling for Sequence Prediction with Recurrent Neural Networks》
介绍:谷歌研究院Samy Bengio等人最近写的RNN的Scheduled Sampling训练方法论文.
- 《Essential Machine Learning Algorithms in a nutshell》
介绍:机器学习基本算法简要入门.
- 《A Huge List of Machine Learning And Statistics Repositories》
介绍:Github机器学习/数学/统计/可视化/深度学习相关项目大列表.
- 《Information Processing and Learning》
介绍:CMU的信息论课程.
- 《Scheduled sampling for sequence prediction with recurrent neural networks》
介绍:谷歌研究院Samy Bengio等人最近写的RNN的Scheduled Sampling训练方法论文.
介绍:基于Hadoop集群的大规模分布式深度学习.
- 《Learning both Weights and Connections for Efficient Neural Networks习》
介绍:来自斯坦福大学及NVIDIA的工作,很实在很实用。采用裁剪网络连接及重训练方法,可大幅度减少CNN模型参数。针对AlexNet、VGG等模型及ImageNet数据,不损失识别精度情况下,模型参数可大幅度减少9-13倍.
- 《Apache Singa --A General Distributed Deep Learning Platform》
介绍:无需做深度学习就能用的分布式深度学习软件,github.
- 《24 Ultimate Data Scientists To Follow in the World Today》
介绍:当今世界最NB的25位大数据科学家,通过他们的名字然后放在google中搜索肯定能找到很多很棒的资源译文.
- 《Deep Learning for NLP - Lecture October 2015》
介绍:Nils Reimers面向NLP的深度学习(Theano/Lasagne)系列教程.
- 《Connection between probability theory and real analysis》
介绍:主讲人是陶哲轩,资料Probability: Theory and Examples,笔记.
- 《Data Science Learning Resources》
介绍:数据科学(学习)资源列表.
- 《8 Tactics to Combat Imbalanced Classes in Your Machine Learning Dataset》
介绍:应对非均衡数据集分类问题的八大策略.
- 《Top 20 Data Science MOOCs》
介绍:重点推荐的20个数据科学相关课程.
- 《Recurrent Neural Networks》
介绍:递归神经网络.
- 《Histograms of Oriented Gradients》
介绍:(HOG)学习笔记.
- 《Computational modelling courses》
介绍:计算建模/计算神经学课程汇总.
- 《How We Use Deep Learning to Classify Business Photos at Yelp》
介绍:(Yelp)基于深度学习的商业图片分类.
- 《Neural Networks and Deep Learning》
介绍:免费在线书《Neural Networks and Deep Learning》神经网络与深度学习。目前提供了前四章的草稿,第一章通过手写数字识别的例子介绍NN,第二章讲反向传播算法,第三章讲反向传播算法的优化,第四章讲NN为什么能拟合任意函数。大量python代码例子和交互动画,生动有趣.中文版
- 《Books to Read if You Might Be Interested in Data Science》
介绍:数据科学大咖荐书(入门).
- 《Deep Learning for NLP resources》
介绍:NLP 深度学习资源列表.
介绍:很多arXiv上面知名论文可以在这个网站找到github的项目链接.
- 《Learning Multi-Domain Convolutional Neural Networks for Visual Tracking》
介绍:深度学习在视觉跟踪的探索.
- 《Beginners Guide: Apache Spark Machine Learning Scenario With A Large Input Dataset》
介绍:Spark机器学习入门实例——大数据集(30+g)二分类.
介绍:保罗艾伦人工智能实验室表示,Google Scholar是十年前的产物,他们现在想要做进一步的提高。于是推出了全新的,专门针对科学家设计的学术搜索引擎Semantic Scholar.
- 《Semi-Supervised Learning》
介绍:半监督学习,Chapelle.篇篇都是经典,作者包括Vapnik,Bengio,Lafferty,Jordan.此外推荐Xiaojin (Jerry) Zhu编写的Introduction to Semi-Supervised Learning.
介绍:Spark机器学习入门实例——大数据集(30+g)二分类.
- 《Free Resources for Beginners on Deep Learning and Neural Network》
介绍:为入门者准备的深度学习与神经网络免费资源.
- 《TensorFlow is an Open Source Software Library for Machine Intelligence》
介绍:Google 开源最新机器学习系统 TensorFlow,此外提供TensorFlow白皮书white paper of tensorflow 2015.hacker news,Google大牛解读TensorFlow
- 《Veles:Distributed machine learning platform》
介绍:三星开源的快速深度学习应用程序开发分布式平台.
- 《DMTK:Microsoft Distributed Machine Learning Tookit 》
介绍:分布式机器学习工具包.
- 《Semantics Approach to Big Data and Event Processing》
介绍:语义大数据——大数据/事件处理的语义方法.
- 《LSTM(Long Short Term Memory)和RNN(Recurrent)学习教程》
介绍:LSTM(Long Short Term Memory)和RNN(Recurrent)学习教程.
- 《Marvin:A minimalist GPU-only N-dimensional ConvNet framework》
介绍:Princeton Vision Group的深度学习库开源.
- 《Ufora is a compiled, automatically parallel subset of python for data science and numerical computing》
介绍:基于AWS的自动分布式科学计算库Ufora,Why I Open Sourced Five Years of Work.
- 《Deep Learning and Deep Data Science - PyCon SE 2015》
介绍:(PyCon SE 2015)深度学习与深度数据科学.
介绍:推荐南京大学机器学习与数据挖掘研究所所长——周志华教授的Google学术主页.
- 《Advanced Linear Models for Data Science》
介绍:免费书:面向数据科学的高级线性模型.
- 《Net2Net: Accelerating Learning via Knowledge Transfer》
介绍:基于知识迁移的神经网络高效训练Net2Net.
- 《徐亦达机器学习课程 Variational Inference》
介绍:徐亦达机器学习课程 Variational Inference.
- 《Learning the Architecture of Deep Neural Networks》
介绍:深度神经网络结构学习.
- 《Multimodal Deep Learning》
介绍:来自斯坦福大学的Multimodal Deep Learning papers.
- 《深度学习简析,TensorFlow,Torch,Theano,Mxnet》
介绍:深度学习简析,TensorFlow,Torch,Theano,Mxnet.
- 《"Notes Essays —CS183C: Technology-enabled Blitzscaling — Stanford University》
介绍:这个专栏是一个stanford学生做的CS183c课程的一个note,该课程是由Reid Hoffman等互联网boss级人物开设的,每节课请一位巨头公司的相关负责人来做访谈,讲述该公司是怎么scale的。最新两期分别请到了雅虎的梅姐和airbnb创始人Brian Chesky。.
- 《Natural Language Understanding with Distributed Representation》
介绍:基于分布式表示的自然语言理解(100+页),论文.
- 《Recommender Systems Handbook》
介绍:推荐系统手册.
- 《Understanding LSTM Networks》
介绍:理解LSTM网络翻译.
- 《Machine Learning at Quora》
介绍:机器学习在quora中的应用.
- 《On Learning to Think: Algorithmic Information Theory for Novel Combinations of Reinforcement Learning Controllers and Recurrent Neural World Models》
介绍:思维学习——RL+RNN算法信息论.
- 《The 5 Ways Data Scientists Keep Learning After College》
介绍:数据科学家毕业后继续学习的5种方式.
- 《Deep Learning in Neural Networks: An Overview》
介绍:深度学习在神经网络的应用.
介绍:上下文学习,代码.
- 《Machine Learning For Complete Beginners》
介绍:机器学习零基础入门,代码.
- 《2015年中国计算机学会(CCF)优秀博士学位论文》
介绍:2015年度CCF优秀博士学位论文奖论文列表.
- 《Learning to Hash Paper, Code and Dataset》
介绍:Learning to Hash Paper, Code and Dataset.
- 《Neural networks with Theano and Lasagne》
介绍:(PyData2015)基于Theano/Lasagne的CNN/RNN教程,github.
介绍:复旦大学邱锡鹏老师编写的神经网络与深度学习讲义,ppt.
- 《Microsoft Open Sources Distributed Machine Learning Toolkit》
介绍:微软亚洲研究院开源分布式机器学习工具包.
介绍:语音识别的技术原理浅析
介绍:迈克尔·I.乔丹的主页.根据主页可以找到很多资源。迈克尔·I.乔丹是知名的计算机科学和统计学学者,主要研究机器学习和人工智能。他的重要贡献包括指出了机器学习与统计学之间的联系,并推动机器学习界广泛认识到贝叶斯网络的重要性。
介绍:杰弗里·埃弗里斯特·辛顿 FRS是一位英国出生的计算机学家和心理学家,以其在神经网络方面的贡献闻名。辛顿是反向传播算法和对比散度算法的发明人之一,也是深度学习的积极推动者.通过他的主页可以发掘到很多Paper以及优秀学生的paper,此外推荐他的学生Yann Lecun主页
介绍:Yoshua Bengio是机器学习方向的牛人,如果你不知道可以阅读对话机器学习大神Yoshua Bengio(上),对话机器学习大神Yoshua Bengio(下)
- 《Large Scale Deep Learning within google》
介绍:google大规模深度学习应用演进
- 《Deep Learning: An MIT Press Book in Preparation》
介绍:MIT出版的深度学习电子书,公开电子书
- 《A Mathematical Theory of Deep Convolutional Neural Networks for Feature Extraction》
介绍:深度卷积神经网络(CNN)提取特征的数学理论
- 《Microsoft Research Asia:Kaiming He》
介绍:推荐微软亚洲研究院何恺明主页
- 《Speech and Language Processing (3rd ed. draft)》
介绍:《语音与语言处理》第三版(草稿)
- 《LSA 311: Computational Lexical Semantics - Summer 2015》
介绍:Stanford新课"计算词汇语义学"
- 《上海交大张志华老师的统计机器学习与机器学习导论视频》
介绍:上海交大张志华老师的统计机器学习与机器学习导论视频链接:密码: r9ak .概率基础
- 《Computational Linguistics and Deep Learning》
介绍:computational linguistics and deep learning视频,推荐Deep Learning: An Introduction from the NLP Perspective
- 《Black Hat USA 2015 - Deep Learning On Disassembly》
介绍:(BlackHat2015)深度学习应用之流量鉴别(协议鉴别/异常检测),[slide])(https://www.blackhat.com/docs/us-15/materials/us-15-Wang-The-Applications-Of-Deep-Learning-On-Traffic-Identification.pdf),[material](https://www.blackhat.com/docs/us-15/materials/us-15-Wang-The-Applications-Of-Deep-Learning-On-Traffic-Identification-wp.pdf)
- 《LibRec:A Java Library for Recommender Systems》
介绍:一个推荐系统的Java库
- 《Multi-centrality Graph Spectral Decompositions and their Application to Cyber Intrusion Detection》
介绍:多中心图的谱分解及其在网络入侵检测中的应用(MC-GPCA&MC-GDL)
- 《Computational Statistics in Python》
介绍:用Python学计算统计学
- 《New open-source Machine Learning Framework written in Java》
介绍:datumbox-framework——Java的开源机器学习框架,该框架重点是提供大量的机器学习算法和统计检验,并能够处理中小规模的数据集
- 《Awesome Recurrent Neural Networks》
介绍:递归神经网络awesome系列,涵盖了书籍,项目,paper等
介绍:Pedro Domingos是华盛顿大学的教授,主要研究方向是机器学习与数据挖掘.在2015年的ACM webinar会议,曾发表了关于盘点机器学习领域的五大流派主题演讲.他的个人主页拥有很多相关研究的paper以及他的教授课程.
- 《Video resources for machine learning》
介绍:机器学习视频集锦
- 《Deep Machine Learning libraries and frameworks》
介绍:深度机器学习库与框架
介绍:这篇文章内的推荐系统资源很丰富,作者很有心,摘录了《推荐系统实战》内引用的论文.
- 《Bayesian Methods in Astronomy: Hands-on Statistics》
介绍:(天文学)贝叶斯方法/MCMC教程——统计实战
- 《Statistical Learning with Sparsity: The Lasso and Generalizations》
介绍:免费书:统计稀疏学习,作者Trevor Hastie与Rob Tibshirani都是斯坦福大学的教授,Trevor Hastie更是在统计学学习上建树很多
- 《The Evolution of Distributed Programming in R》
介绍:R分布式计算的进化,此外推荐(R)气候变化可视化,(R)马尔可夫链入门
- 《neon workshop at Startup.ML: Sentiment Analysis and Deep Reinforcement Learning》
介绍:Nervana Systems在Startup.ML的主题研讨会——情感分析与深度强化学习
- 《Understanding Convolution in Deep Learning》
介绍:深度学习卷积概念详解.
- 《Python libraries for building recommender systems》
介绍:Python推荐系统开发库汇总.
- 《Neural networks class - Université de Sherbrooke》
介绍:超棒的神经网络课程,深入浅出介绍深度学习,由Hugo Larochelle(Yoshua Bengio的博士生,Geoffrey Hinton之前的博士后)主讲,强烈推荐.
- 《CS231n: Convolutional Neural Networks for Visual Recognition》
介绍:斯坦福新课程,面向视觉识别的卷积神经网络(Fei-Fei Li & Andrej Karpathy),slides+video,homework.
- 《NIPS 2015 Deep Learning Symposium Part I》
介绍:NIPS 2015会议总结第一部分,第二部分.
介绍:python机器学习入门资料梳理.
- 《Reading Text in the Wild with Convolutional Neural Networks》
介绍:牛津大学著名视觉几何组VGG在IJCV16年首卷首期: Reading Text in the Wild with Convolutional Neural Networks,Jaderberg。这篇期刊文章融合了之前两篇会议(ECCV14,NIPS14ws),定位和识别图片中的文本(叫text spotting)。 端到端系统: 检测Region + 识别CNN。论文、数据和代码.
- 《Yet Another Computer Vision Index To Datasets (YACVID)》
介绍:计算机视觉的一个较大的数据集索引, 包含387个标签,共收录了314个数据集合,点击标签云就可以找到自己需要的库了.
- 《Why SLAM Matters, The Future of Real-Time SLAM, and Deep Learning vs SLAM》
介绍:Tombone 对 ICCV SLAM workshop 的总结: the future of SLAM, SLAM vs deep learning 重点介绍了 monoSLAM 和 LSD-SLAM,而且讨论了 feature-based 和 feature-free method 的长短。在全民deep learning做visual perception的时候,再来读读CV中的 geometry.
- 《Python based Deep Learning Framework by Nervana™》
介绍:Nervana Systems的开源深度学习框架neon发布.
- 《mageNet and MS COCO Visual Recognition Challenges video and slider》
介绍:ICCV 2015的ImageNet比赛以及MS COCO竞赛联合研讨会的幻灯片和视频.
- 《An Introduction to Machine Learning with Python》
介绍:Python机器学习入门.
- 《Neural Enquirer: Learning to Query Tables with Natural Language》
介绍:Neural Enquirer 第二版.
- 《Deep Learning - Taking machine learning to the next level》
介绍:[Google]基于TensorFlow的深度学习/机器学习课程.
- 《100 “must read” R-bloggers’ posts for 2015》
介绍:R-bloggers网站2015"必读"的100篇文章,R语言学习的福音.
- 《Machine Learning: a Probabilistic Perspective》
介绍:推荐书籍:<机器学习:概率视角>,样章Undirected graphical models Markov random fields.
介绍:这是一本在线的深度学习书籍,合著者有Ian Goodfellow, Yoshua Bengio 和 Aaron Courville.如果你是一位新入门的学员可以先看这本书籍Yoshua Bengio: How can one get started with machine learning?.中文译本
- 《UFLDL Recommended Readings》
介绍:UFLDL推荐的深度学习阅读列表.
- 《CSE 705: Deep Learning (Spring 2015)》
介绍:纽约州立大学布法罗分校2015年春季机器学习课程主页.
- 《Theano is a Deep learning Python library 》
介绍: Theano是主流的深度学习Python库之一,亦支持GPU,入门比较难.推荐Theano tutorial,Document
- 《Statistical Language Models Based On Neural Networks》
介绍:博士论文:神经网络统计语言模型.
介绍:文本数据的机器学习自动分类方法(下).
- 《Pixel Recurrent Neural Networks》
介绍:用RNN预测像素,可以把被遮挡的图片补充完整.
- 《Computational Network Toolkit (CNTK)》
介绍:微软研究院把其深度学习工具包CNTK,想进一步了解和学习CNTK的同学可以看前几天公布的《CNTK白皮书》An Introduction to Computational Networks and the Computational Network Toolkit.
- 《Kalman and Bayesian Filters in Python》
介绍: 卡尔曼滤波器教材,用尽量少的数学和推导,传授直觉和经验,全部Python示例,内容覆盖卡尔曼滤波器、扩展卡尔曼滤波,无迹卡尔曼滤波等,包括练习和参考答案
- 《Statistical inference for data science》
介绍:在线免费书:面向数据科学的统计推断,R示例代码,很不错GitHub.
- 《Learning Deep Architectures for AI》
介绍:这本书是由Yoshua Bengio撰写的教程,其内容包含了学习人工智能所使用的深度学习架构的学习资源,书中的项目已停止更新
DeepLearnToolbox.
- 《Machine Learning Tutorials》
介绍:这是一份机器学习和深度学习教程,文章和资源的清单。这张清单根据各个主题进行撰写,包括了许多与深度学习有关的类别、计算机视觉、加强学习以及各种架构.
- 《Data science ipython notebooks》
介绍:这是由Donne Martin策划收集的IPython笔记本。话题涵盖大数据、Hadoop、scikit-learn和科学Python堆栈以及很多其他方面的内容。至于深度学习,像是TensorFlow、Theano和Caffe之类的框架也均被涵盖其中,当然还有相关的特定构架和概念等.
- 《Open Source Deep Learning Server》
介绍:开源的深度学习服务,DeepDetect是C++实现的基于外部机器学习/深度学习库(目前是Caffe)的API。给出了图片训练(ILSVRC)和文本训练(基于字的情感分析,NIPS15)的样例,以及根据图片标签索引到ElasticSearch中github.
- 《Data Mining, Analytics, Big Data, and Data Science》
介绍:这是国外的一个科技频道,涵盖了数据挖掘,分析以及数据科学类的文章.偶尔还有机器学习精选.
- 《Data Mining And Statistics: What's The Connection?》
介绍:经典论文:数据挖掘与统计学.
- 《(NIPS’2015 Tutorial)Yoshua Bengio深度学习》
介绍:NIPS’2015 Tutorial by Yoshua Bengio.
- 《(NENO:Python based Deep Learning Framework》
介绍:Nervana Systems的开源深度学习框架neon发布.
- 《(Matt Might:Reading for graduate students》
介绍:犹他州大学Matt Might教授推荐的研究生阅读清单.
- 《Awesome Public Datasets》
介绍:开放数据集.
- 《Introduction to Probability - The Science of Uncertainty》
介绍:(edX)不确定性的科学——概率论导论(MITx).
- 《R software and tools for everyday use》
介绍:R语言开发常用软件/工具推荐.
- 《Implementing Dynamic memory networks》
介绍:动态记忆网络实现.
介绍:英文主页
- 《Big Data Analysis Learning Resources: 50 Courses, Blogs, Tutorials, And More For Mastering Big Data Analytics》
介绍:50个大数据分析最佳学习资源(课程、博客、教程等)
- 《A Full Hardware Guide to Deep Learning》
介绍:深度学习的全面硬件指南,从GPU到RAM、CPU、SSD、PCIe,译文
介绍:kaiming开源作品
- 《The Definitive Guide to Natural Language Processing》
介绍:自然语言处理(NLP)权威指南
- 《Evaluating language identification performance》
介绍:如何在社会媒体上做语言检测?没有数据怎么办?推特官方公布了一个十分难得的数据集:12万标注过的Tweets,有70种语言
- 《ICLR 2016 Accepted Papers》
介绍:深度学习和机器学习重要会议ICLR 2016录取文章
- 《Machine Learning: An In-Depth, Non-Technical Guide - Part 1》
介绍:机器学习——深度非技术指南
- 《Data Storytelling 101: Helpful Tools for Gathering Ideas, Designing Content & More》
介绍:数据叙事入门指南——创意生成/数据采集/内容设计相关资源推荐
- 《WikiTableQuestions: a Complex Real-World Question Understanding Dataset》
介绍:WikiTableQuestions——复杂真实问答数据集
- 《Big Data: 35 Brilliant And Free Data Sources For 2016》
介绍:(2016版)35个超棒的免费大数据源
- 《SPARKNET: training deep networks in spark》
介绍:Ion Stoica和 Michael I. Jordan两位大家首次联手发文,CAFFE和SPARK完美结合,分布式深度学习混搭模式!github
- 《DeepLearning.University – An Annotated Deep Learning Bibliography | Memkite》
介绍:深度学习(分类)文献集
介绍:深度学习阅读列表
- 《Awesome42 The easiest way to find R packages》
介绍:探索R包的好网站Awesome 42
- 《MLbase:Distributed Machine Learning Made Easy》
介绍:MLbase是Prof. Dr. Tim Kraska的一个研究项目,MLbase是一个分布式机器学习管理系统
- 《Deep Learning At Scale and At Ease》
介绍:分布式深度学习平台SINGA介绍
- 《Learn All About Apache Spark (100x Faster than Hadoop MapReduce)》
介绍:Spark视频集锦
- 《R For Deep Learning (I): Build Fully Connected Neural Network From Scratch》
介绍:R语言深度学习第一节:从零开始
- 《A Visual Introduction to Machine Learning》
介绍:图解机器学习
- 《Citation Network Dataset》
介绍:AMiner论文引用数据集(v7:2,244,021 papers and 4,354,534 citation relationships)
- 《Best Free Machine Learning Ebooks》
介绍:10本最佳机器学习免费书
- 《International Conference on Computer Vision (ICCV) 2015, Santiago》
介绍:ICCV15视频集
- 《CaffeOnSpark Open Sourced for Distributed Deep Learning on Big Data Clusters》
介绍::(Yahoo)基于Hadoop/Spark的分布式Caffe实现CaffeOnSpark
- 《A Short Introduction to Learning to Rank》
介绍:Learning to Rank简介
- 《Global Deep learning researcher》
介绍:全球深度学习专家列表,涵盖研究者主页
- 《Top Spark Ecosystem Projects》
介绍:Spark生态顶级项目汇总
- 《Proceedings of the 21st International Conference on Intelligent User Interfaces》
介绍:ACM IUI'16论文集Conference Navigator - Proceedings
- 《Machine Learning: An In-Depth, Non-Technical Guide - Part 1》
介绍:深入机器学习,2,3,4
介绍:Nando de Freitas在 Oxford 开设的深度学习课程,课程youtube地址,Google DeepMind的研究科学家,此外首页:computervisiontalks的内容也很丰富,如果你是做机器视觉方面的研究,推荐也看看其他内容.肯定收获也不小.还有,这位youtube主页顶过的视频也很有份量
- 《Neural Networks for Machine Learning》
介绍:Geoffrey Hinton在Coursera开设的MOOC
介绍:深度学习领域的Hacker news.紧跟深度学习的新闻、研究进展和相关的创业项目。从事机器学习,深度学习领域的朋友建议每天看一看
介绍:Maxout网络剖析
- 《Advances in Neural Information Processing Systems》
介绍:NIPS领域的会议paper集锦
- 《Machine learning applications in genetics and genomics》
介绍:机器学习在生物工程领域的应用,如果你从事生物工程领域,可以先阅读一篇文章详细介绍
- 《Deep Learning in Bioinformatics》
介绍:深度学习在生物信息学领域的应用
- 《A Few Useful Things to Know about Machine Learning》
介绍:一些关于机器学习需要知道知识,对于刚刚入门机器学习的同学应该读一读
- 《Cambridge Machine Learning Group》
介绍:剑桥大学机器学习用户组主页,网罗了剑桥大学一些机器学习领域专家与新闻
- 《Randy Olson's data analysis and machine learning projects》
介绍:Randy Olson's的一些数据分析与机器学习项目库,是学习实践的好材料
- 《GoLearn:Golang machine learning library》
介绍:Golang机器学习库,简单,易扩展
介绍:用Swift开发苹果应用的倒是很多,而用来做机器学习的就比较少了.Swift Ai在这方面做了很多聚集.可以看看
- 《Please explain Support Vector Machines (SVM) like I am a 5 year old》
介绍:如何向一位5岁的小朋友解释支持向量机(SVM)
- 《reddit Machine learning》
介绍: reddit的机器学习栏目
- 《ComputerVision resource》
介绍: 计算机视觉领域的一些牛人博客,超有实力的研究机构等的网站链接.做计算机视觉方向的朋友建议多关注里面的资源
- 《Multimedia Laboratory Homepage》
介绍:香港中文大学深度学习研究主页,此外研究小组对2013年deep learning 的最新进展和相关论文做了整理,其中useful links的内容很受益
- 《Search Engines that Learn from Their Users》
介绍: 这是一篇关于搜索引擎的博士论文,对现在普遍使用的搜索引擎google,bing等做了分析.对于做搜索类产品的很有技术参考价值
介绍: 深度学习书籍推荐(毕竟这类书比较少).
- 《Towards Bayesian Deep Learning: A Survey》
介绍: 贝叶斯定理在深度学习方面的研究论文.
- 《Revisiting Distributed Synchronous SGD》
介绍: 来自谷歌大脑的重温分布式梯度下降.同时推荐大规模分布式深度网络
- 《Research Issues in Social Computing》
介绍: 社交计算研究相关问题综述.
- 《What are some important areas of research in social computing right now?》
介绍: 社交计算应用领域概览,里面有些经典论文推荐
- 《Collaborative Filtering Recommender Systems》
介绍: 协同过滤在推荐系统应用.
- 《Content-Boosted Collaborative Filtering for Improved Recommendations》
介绍: 协同过滤在内容推荐的研究.
- 《Unifying User-based and Item-based Collaborative Filtering Approaches by Similarity Fusion》
介绍: 协同过滤经典论文.
- 《Item-based Collaborative Filtering Recommendation Algorithms》
介绍: 协同过滤算法.
- 《Amazon.com Recommendations Item-to-Item Collaborative Filtering》
介绍: 亚马逊对于协同过滤算法应用.
- 《Collaborative Filtering for Implicit Feedback Datasets》
介绍: 协同过滤的隐式反馈数据集处理.
- 《Tutorials, papers and code for computer graphics, fractals and demoscene》
介绍: 计算机图形,几何等论文,教程,代码.做计算机图形的推荐收藏.
- 《ELEN 6886 Sparse Representation and High-Dimensional Geometry》
介绍: 推荐哥伦比亚大学课程,稀疏表示和高维几何.12年由Elsevier、13年至今由PAMI(仍由Elsevier赞助)设立的青年研究者奖(Young Researcher Award)授予完成博士学位后七年内取得杰出贡献的;由CV社区提名,在CVPR会议上宣布。2015年得主是哥大助理教授John Wright,09年《健壮人脸识别的稀疏表示法》引用已超5K.
- 《Software engineer how to learning Machine learning》
介绍: CMU机器学习系著名教授Alex Smola在Quora对于《程序员如何学习Machine Learning》的建议:Alex推荐了不少关于线性代数、优化、系统、和统计领域的经典教材和资料.
- 《Book review: Fundamentals of Deep Learning》
介绍: 书籍推荐,深度学习基础.源码
介绍: 软件工程领域现在也对机器学习和自然语言处理很感兴趣,有人推出了“大代码”的概念,分享了不少代码集合,并且觉得ML可以用在预测代码Bug,预测软件行为,自动写新代码等任务上。大代码数据集下载
介绍: 深度学习进行目标识别的资源列表:包括RNN、MultiBox、SPP-Net、DeepID-Net、Fast R-CNN、DeepBox、MR-CNN、Faster R-CNN、YOLO、DenseBox、SSD、Inside-Outside Net、G-CNN
- 《Deep Learning: Course by Yann LeCun at Collège de France 2016(Slides in English)》
介绍: Yann LeCun 2016深度学习课程的幻灯片(Deep Learning Course by Yann LeCun at Collège de France 2016)百度云密码: cwsm 原地址
介绍: 斯坦福人机交互组五篇CHI16文章。1.众包激励机制的行为经济学研究:批量结算比单任务的完成率高。2.在众包专家和新手间建立联系:微实习。3.词嵌入结合众包验证的词汇主题分类(如猫、狗属于宠物)。4.词嵌入结合目标识别的活动预测。5.鼓励出错以加快众包速度。
介绍: 自学数据科学
- 《CS224D Lecture 7 - Introduction to TensorFlow》
介绍: 本课是CS224D一节介绍TensorFlow课程,ppt,DeepDreaming with TensorFlow
- 《Leaf - Machine Learning for Hackers》
介绍: Leaf是一款机器学习的开源框架,专为黑客打造,而非为科学家而作。它用Rust开发,传统的机器学习,现今的深度学习通吃。Leaf
- 《MXnet:Flexible and Efficient library for deep learning》
介绍: GTC 2016视频,MXnet的手把手深度学习tutorial,相关参考资料MXNet Tutorial for NVidia GTC 2016.
- 《OpenAI Gym: Toolkit for developing, comparing reinforcement learning algorithms》
介绍: OpenAI Gym:开发、比较强化学习算法工具箱
- 《conference-iclr-2016 Papers and Code》
介绍: 机器学习会议ICLR 2016 论文的代码集合
- 《probabilistic graphical models principles and techniques》
介绍: 此书是斯坦福大学概率图模型大牛Daphne Koller所写,主要涉及的是贝叶斯网络和马尔科夫逻辑网络的learning和inference问题,同时又对PGM有深刻的理论解释,是学习概率图模型必看的书籍。难度中上,适合有一些ML基础的研究生.[备份地址](https://vk.com/doc168073_304660839?hash=39a33dd8aa6b141d8a&dl=b6674
- 《BigDL: Distributed Deep learning on Apache Spark》
介绍: Spark分布式深度学习库BigDL
- 《Machine Learning and Cyber Security Resources》
介绍: 这是一份关于机器学习和数据挖掘在网络安全方面应用的资源帖,包含了一些重要的站点,论文,书籍,斯坦福课程以及一些有用的教程.
- 《6.S094: Deep Learning for Self-Driving Cars》
介绍: 麻省理工学院(MIT)开设课程.S094:自主驾驶汽车的深度学习
- 《ICML 2016 Conference and Workshops Video》
介绍: ICML 2016视频集锦
介绍: 机器学习推荐学习路线及参考资料
- 《TensorFlow and deep learning, without a PhD》
介绍:新手入门,通过TensorFlow入门深度学习
- 《How To Get Into Natural Language Processing》
介绍: 自然语言处理(NLP)入门指南
- 《Deep learning and the Schrödinger equation》
介绍:通过神经网络跳过数值方法求解薛定谔方程。
- 《Recent Advances in Distributed Machine Learning》
介绍:微软亚洲研究院的刘铁岩等人近日在AAAI 2017上做的有关优化以及大规模机器学习的Tutorial。很值得一看。里面对传统的优化算法,特别是一些理论特性以及分布式算法的相应理论特性都有一个比较详尽的总结。非常适合想快速了解这些领域的学者和工程师。另外,这个Tutorial还介绍了DMTK的一些情况,作为一个分布式计算平台的优缺点,还顺带比较了Spark和TensorFlow等流行框架。
- 《Deep Learning Implementations and Frameworks (DLIF)》
介绍:AAAI 2017的Tutorial,专门讲述了深度学习框架的设计思想和实现,比较若干种流行框架(Caffe、MXNet、TensorFlow、Chainer等)的性能和异同。
- 《Open Sourcing TensorFlowOnSpark: Distributed Deep Learning on Big-Data Clusters》
介绍:雅虎开源基于spark与TensorFlow的分布式数据深度学习框架,博文介绍
- 《Deconstruction with Discrete Embeddings》
介绍:用离散嵌入解构模糊数据
- 《Reliable Machine Learning in the Wild - NIPS 2016 Workshop》
介绍:视频发布:自然场景可靠机器学习(NIPS 2016 Workshop)
- 《A large-scale dataset of manually annotated audio events》
介绍:Google发布大规模音频数据集
- 《5 algorithms to train a neural network》
介绍:训练神经网络的5种算法
- 《Course notes for CS224N Winter17》
介绍:笔记:斯坦福CS224n深度学习NLP课程(2017)
- 《Persontyle Workshop for Applied Deep Learning》
介绍:伦敦深度学习研讨会资料
- 《Understanding, generalisation, and transfer learning in deep neural networks》
介绍:论文导读:深度神经网络理解、泛化与迁移学习,acolyer blog上还有很多经典推荐可以阅读
- 《An Introduction to MCMC for Machine Learning》
介绍:面向机器学习的马尔科夫链蒙特卡洛(MCMC)
- 《Awesome Deep learning papers and other resources》
介绍:深度学习论文与资源大列表(论文、预训练模型、课程、图书、软件、应用、相关列表等)
- 《Datasets for Natural Language Processing》
介绍:自然语言处理NLP数据集列表
- 《Machine Learning for Software Engineers》
介绍:软件工程师的机器学习
- 《Quantitative Finance resources》
介绍:量化金融(Quants)资源列表
- 《What Computers Still Can't Do.》
介绍:《计算机仍然不能做什么——人工理性批判》MIT版导言
- 《In-Datacenter Performance Analysis of a Tensor Processing Unit》
介绍:谷歌发论文详解TPU