该资源的github地址:Qix
《人工智能和机器学习领域有趣的开源项目》
介绍:部分中文列表
《机器学习经典算法详解及Python实现--基于SMO的SVM分类器》
介绍:此外作者还有一篇元算法、AdaBoost python实现文章
《Numerical Optimization: Understanding L-BFGS》
介绍:加州伯克利大学博士Aria Haghighi写了一篇超赞的数值优化博文,从牛顿法讲到拟牛顿法,再讲到BFGS以及L-BFGS, 图文并茂,还有伪代码。强烈推荐。
《简明深度学习方法概述(一)》
介绍:还有续集简明深度学习方法概述(二)
《R language for programmers》
介绍:R语言程序员私人定制版
《谷歌地图解密:大数据与机器学习的结合》
介绍:谷歌地图解密
《空间数据挖掘常用方法》
介绍:空间数据挖掘常用方法
《Use Google's Word2Vec for movie reviews》
介绍:Kaggle新比赛 ”When bag of words meets bags of popcorn“ aka ”边学边用word2vec和deep learning做NLP“ 里面全套教程教一步一步用python和gensim包的word2vec模型,并在实际比赛里面比调参数和清数据。 如果已装过gensim不要忘升级
《PyNLPIR》
介绍:PyNLPIR提供了NLPIR/ICTCLAS汉语分词的Python接口,此外Zhon提供了常用汉字常量,如CJK字符和偏旁,中文标点,拼音,和汉字正则表达式(如找到文本中的繁体字)
《深度卷积神经网络下围棋》
介绍:这文章说把最近模型识别上的突破应用到围棋软件上,打16万张职业棋谱训练模型识别功能。想法不错。训练后目前能做到不用计算,只看棋盘就给出下一步,大约10级棋力。但这篇文章太过乐观,说什么人类的最后一块堡垒马上就要跨掉了。话说得太早。不过,如果与别的软件结合应该还有潜力可挖。@万精油墨绿
《NIPS审稿实验》
介绍:UT Austin教授Eric Price关于今年NIPS审稿实验的详细分析,他表示,根据这次实验的结果,如果今年NIPS重新审稿的话,会有一半的论文被拒。
《2014年最佳的大数据,数据科学文章》
介绍:KDNuggets分别总结了2014年14个阅读最多以及分享最多的文章。我们从中可以看到多个主题——深度学习,数据科学家职业,教育和薪酬,学习数据科学的工具比如R和Python以及大众投票的最受欢迎的数据科学和数据挖掘语言
《机器学习经典算法详解及Python实现--线性回归(Linear Regression)算法》
介绍:Python实现线性回归,作者还有其他很棒的文章推荐可以看看
《2014中国大数据技术大会33位核心专家演讲PDF》
介绍:2014中国大数据技术大会33位核心专家演讲PDF下载
《使用RNN和Paragraph Vector做情感分析》
介绍:这是T. Mikolov & Y. Bengio最新论文Ensemble of Generative and Discriminative Techniques for Sentiment Analysis of Movie Reviews ,使用RNN和PV在情感分析效果不错,[项目代码](https://github.com/mesnilgr/iclr15)公布在github(目前是空的)。这意味着ParagraphVector终于揭开面纱了嘛。
《NLPIR/ICTCLAS2015分词系统大会上的技术演讲 》
介绍:NLPIR/ICTCLAS2015分词系统发布与用户交流大会上的演讲,请更多朋友检阅新版分词吧。 我们实验室同学的演讲包括:孙梦姝-基于评论观点挖掘的商品搜索技术研究李然-主题模型
《Machine Learning is Fun!》
介绍:Convex Neural Networks 解决维数灾难
《CNN的反向求导及练习》
介绍:介绍CNN参数在使用bp算法时该怎么训练,毕竟CNN中有卷积层和下采样层,虽然和MLP的bp算法本质上相同,但形式上还是有些区别的,很显然在完成CNN反向传播前了解bp算法是必须的。此外作者也做了一个资源集:机器学习,深度学习,视觉,数学等
《正则表达式优化成Trie树 》
介绍:如果要在一篇文章中匹配十万个关键词怎么办?Aho-Corasick算法利用添加了返回边的Trie树,能够在线性时间内完成匹配。 但如果匹配十万个正则表达式呢 ? 这时候可以用到把多个正则优化成Trie树的方法,如日本人写的Regexp::Trie
《Deep learning Reading List》
介绍:深度学习阅读清单
《Caffe》
介绍:Caffe是一个开源的深度学习框架,作者目前在google工作,作者主页Yangqing Jia (贾扬清)
《GoogLeNet深度学习模型的Caffe复现 》
介绍:2014 ImageNet冠军GoogLeNet深度学习模型的Caffe复现模型,GoogleNet论文.
《LambdaNet,Haskell实现的开源人工神经网络库 》
介绍:LambdaNetLambdaNet是由Haskell实现的一个开源的人工神经网络库,它抽象了网络创建、训练并使用了高阶函数。该库还提供了一组预定义函数,用户可以采取多种方式组合这些函数来操作现实世界数据。
《百度余凯&张潼机器学习视频》
介绍:如果你从事互联网搜索,在线广告,用户行为分析,图像识别,自然语言理解,或者生物信息学,智能机器人,金融预测,那么这门核心课程你必须深入了解。
《杨强在TEDxNanjing谈智能的起源》
介绍:"人工智能研究分许多流派。其中之一以IBM为代表,认为只要有高性能计算就可得到智能,他们的‘深蓝’击败了世界象棋冠军;另一流派认为智能来自动物本能;还有个很强的流派认为只要找来专家,把他们的思维用逻辑一条条写下,放到计算机里就行……" 杨强在TEDxNanjing谈智能的起源
《深度RNN/LSTM用于结构化学习 0)序列标注Connectionist Temporal ClassificationICML06》
介绍:1)机器翻译Sequence to Sequence NIPS142)成分句法GRAMMAR AS FOREIGN LANGUAGE
《Deep Learning实战之word2vec》
介绍:网易有道的三位工程师写的word2vec的解析文档,从基本的词向量/统计语言模型->NNLM->Log-Linear/Log-Bilinear->层次化Log-Bilinear,到CBOW和Skip-gram模型,再到word2vec的各种tricks,公式推导与代码,基本上是网上关于word2vec资料的大合集,对word2vec感兴趣的朋友可以看看
《Machine learning open source software》
介绍:机器学习开源软件,收录了各种机器学习的各种编程语言学术与商业的开源软件.与此类似的还有很多例如:DMOZ - Computers: Artificial Intelligence: Machine Learning: Software,LIBSVM -- A Library for Support Vector Machines,Weka 3: Data Mining Software in Java,scikit-learn:Machine Learning in Python,Natural Language Toolkit:NLTK,MAchine Learning for LanguagE Toolkit,Data Mining - Fruitful and Fun,Open Source Computer Vision Library
《机器学习入门者学习指南》
介绍:作者是计算机研二(写文章的时候,现在是2015年了应该快要毕业了),专业方向自然语言处理.这是一点他的经验之谈.对于入门的朋友或许会有帮助
《A Tour of Machine Learning Algorithms》
介绍:这是一篇关于机器学习算法分类的文章,非常好
《2014年的《机器学习日报》大合集》
介绍:机器学习日报里面推荐很多内容,在这里有一部分的优秀内容就是来自机器学习日报.
《 Image classification with deep learning常用模型》
介绍:这是一篇关于图像分类在深度学习中的文章
《自动语音识别:深度学习方法》
介绍:作者与Bengio的兄弟Samy 09年合编《自动语音识别:核方法》 3)李开复1989年《自动语音识别》专著,其博导、94年图灵奖得主Raj Reddy作序
《NLP中的中文分词技术》
介绍: 作者是360电商技术组成员,这是一篇NLP在中文分词中的应用
《Using convolutional neural nets to detect facial keypoints tutorial》
介绍: 使用deep learning的人脸关键点检测,此外还有一篇AWS部署教程
《书籍推荐:Advanced Structured Prediction》
介绍: 由Sebastian Nowozin等人编纂MIT出版的新书《Advanced Structured Prediction》http://t.cn/RZxipKG,汇集了结构化预测领域诸多牛文,涉及CV、NLP等领域,值得一读。网上公开的几章草稿:一,二,三,四,五
《An Introduction to Matrix Concentration Inequalities》
介绍: Tropp把数学家用高深装逼的数学语言写的矩阵概率不等式用初等的方法写出来,是非常好的手册,领域内的paper各种证明都在用里面的结果。虽说是初等的,但还是非常的难
《The free big data sources you should know》
介绍: 不容错过的免费大数据集,有些已经是耳熟能详,有些可能还是第一次听说,内容跨越文本、数据、多媒体等,让他们伴你开始数据科学之旅吧,具体包括:Data.gov、US Census Bureau、European Union Open Data Portal、Data.gov.uk等
《A Brief Overview of Deep Learning》
介绍: 谷歌科学家、Hinton亲传弟子Ilya Sutskever的深度学习综述及实际建议
《A Deep Dive into Recurrent Neural Nets》
介绍: 非常好的讨论递归神经网络的文章,覆盖了RNN的概念、原理、训练及优化等各个方面内容,强烈推荐!本文作者Nikhil Buduma还有一篇Deep Learning in a Nutshell值得推荐
《机器学习:学习资源》
介绍:里面融合了很多的资源,例如竞赛,在线课程,demo,数据整合等。有分类