基础资料:
参考链接:https://blog.csdn.net/abc13310086/article/details/79391832
(1)机器学习
《机器学习实战》,PeterHarrington著;(讲解通俗易懂,用Python一步一步实现算法,适合入门)
《机器学习》,周志华著;(对机器学习常用算法做了基本概述)
《Pattern Recognition and Machine Learning》, Christopher Bishop 著;(经典机器学习书籍)
《统计学习方法》,李航;(对每个算法有详细的数学推导,比较难读懂)
斯坦福大学公开课 :【机器学习课程】,吴恩达主讲;http://open.163.com/special/opencourse/machinelearning.html
【机器学习基石】【机器学习技法】,台湾大学林轩田老师;https://www.coursera.org/learn/ntumlone-mathematicalfoundations
或我的网盘 https://pan.baidu.com/s/1sm8QFI9,林老师个人主页 https://www.csie.ntu.edu.tw/~htlin/
(2)深度学习
《神经网络与深度学习》,邱锡鹏老师;https://nndl.github.io
《一天搞懂深度学习》,李宏毅;https://pan.baidu.com/s/1i6jy6Nz
Machine Learning ,李宏毅 http://speech.ee.ntu.edu.tw/~tlkagk/courses.html (包括机器学习和深度学习内容,很多课程可以看)
【神经网络与深度学习】,coursera上视频教程(网易公开课有中文视频),吴恩达;https://mooc.study.163.com/smartSpec/detail/1001319001.htm
《Deep Learning》,Ian Goodfellow著;(深度学习公认最好的教科书)
【动手深度学习】,李沐;视频地址 https://space.bilibili.com/209599371#/channel/detail?cid=23541,教程http://zh.gluon.ai
【UFLDL教程】 http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial
【Deep Learning Tutorials】 http://deeplearning.net/tutorial/ (使用Theano实现各种深度学习模型)
(3)人工智能各领域资料(专知:http://mp.weixin.qq.com/s?__biz=MzU2OTA0NzE2NA==&mid=2247489221&idx=4&sn=634953243efcf5f47beab044c75704a3&chksm=fc85f7d6cbf27ec085fb7432b675b473f71b66607cae1a03199a9658f83416d2bf7fd1b5019e&mpshare=1&scene=23&srcid=0227zBXstnyleEyF0esNAXd0#rd)
专知荟萃知识资料全集获取(关注本公众号-专知,获取下载链接),请查看:
【专知荟萃01】深度学习知识资料大全集(入门/进阶/论文/代码/数据/综述/领域专家等)(附pdf下载)
【专知荟萃02】自然语言处理NLP知识资料大全集(入门/进阶/论文/Toolkit/数据/综述/专家等)(附pdf下载)
【专知荟萃03】知识图谱KG知识资料全集(入门/进阶/论文/代码/数据/综述/专家等)(附pdf下载)
【专知荟萃04】自动问答QA知识资料全集(入门/进阶/论文/代码/数据/综述/专家等)(附pdf下载)
【专知荟萃05】聊天机器人Chatbot知识资料全集(入门/进阶/论文/软件/数据/专家等)(附pdf下载)
【专知荟萃06】计算机视觉CV知识资料大全集(入门/进阶/论文/课程/会议/专家等)(附pdf下载)
【专知荟萃07】自动文摘AS知识资料全集(入门/进阶/代码/数据/专家等)(附pdf下载)
【专知荟萃08】图像描述生成Image Caption知识资料全集(入门/进阶/论文/综述/视频/专家等)
【专知荟萃09】目标检测知识资料全集(入门/进阶/论文/综述/视频/代码等)
【专知荟萃10】推荐系统RS知识资料全集(入门/进阶/论文/综述/视频/代码等)
【专知荟萃11】GAN生成式对抗网络知识资料全集(理论/报告/教程/综述/代码等)
【专知荟萃12】信息检索 Information Retrieval 知识资料全集(入门/进阶/综述/代码/专家,附PDF下载)
【专知荟萃13】工业学术界用户画像 User Profile 实用知识资料全集(入门/进阶/竞赛/论文/PPT,附PDF下载)
【专知荟萃14】机器翻译 Machine Translation知识资料全集(入门/进阶/综述/视频/代码/专家,附PDF下载)
【专知荟萃15】图像检索Image Retrieval知识资料全集(入门/进阶/综述/视频/代码/专家,附PDF下载)
【专知荟萃16】主题模型Topic Model知识资料全集(基础/进阶/论文/综述/代码/专家,附PDF下载)
【专知荟萃17】情感分析Sentiment Analysis 知识资料全集(入门/进阶/论文/综述/视频/专家,附查看)
【专知荟萃18】目标跟踪Object Tracking知识资料全集(入门/进阶/论文/综述/视频/专家,附查看)
【专知荟萃19】图像识别Image Recognition知识资料全集(入门/进阶/论文/综述/视频/专家,附查看)
【专知荟萃20】图像分割Image Segmentation知识资料全集(入门/进阶/论文/综述/视频/专家,附查看)
【专知荟萃21】视觉问答VQA知识资料全集(入门/进阶/论文/综述/视频/专家,附查看)
【专知荟萃22】机器阅读理解RC知识资料全集(入门/进阶/论文/综述/代码/专家,附查看)
【专知荟萃23】深度强化学习RL知识资料全集(入门/进阶/论文/综述/代码/专家,附查看)
【专知荟萃24】视频描述生成(Video Captioning)知识资料全集(入门/进阶/论文/综述/代码/专家,附查看)
【专知荟萃25】文字识别OCR知识资料全集(入门/进阶/论文/综述/代码/专家,附查看)
【专知荟萃26】行人重识别 Person Re-identification知识资料全集(入门/进阶/论文/综述/代码,附查看)
(4)人工智能比较好的微信公众号
专知
PaperWeekly,视频直播 http://mp.weixin.qq.com/mp/homepage?__biz=MzIwMTc4ODE0Mw==&hid=4&sn=48a334ca2996474695eec7a3d4be349f&scene=18#wechat_redirect
机器之心
机器学习与自然语言处理
机器学习研究会
AI科技大本营
算法与数学之美
新智元
将门创投,视频直播 https://mp.weixin.qq.com/s/cq76oyKY_xQb2FP3aBsszg
智能立方
专业资料:
作者:Louise
链接:https://www.zhihu.com/question/25252987/answer/267172992
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
NO.1人工智能科普类:人工智能科普、人工智能哲学
《智能的本质》斯坦福、伯克利客座教授30年AI研究巅峰之作
《科学+遇见人工智能》李开复、张亚勤、张首晟等20余位科学家与投资人共同解读AI革命,机器学习教父Tom Mitchell力荐
《人工智能时代》从人工智能的历史、现状、未来,工业机器人、商业机器人、家用机器人、机器翻译、机器学习等人工智能应用领域依次介绍了人工智能发展前景。
《人工智能简史》 跟着图灵、冯•诺依曼、香农、西蒙、纽维尔、麦卡锡、明斯基等人工智能的先驱们重走人工智能之路,站在前人的肩膀上,看人工智能的三生三世,鉴以往才能知未来。
《科技之巅》源自麻省理工学院的科技创新预言圣经 掌握未来数年全球科技发展趋势和商业化潜力。
《科技之巅2》全球多领域20位行业专家深度解读强化学习、基因疗法2.0、自动驾驶货车、量子计算等新科技新产业。
《数学之美(第2版)》浪潮之巅 文明之光 硅谷之谜 大学之路作者吴军博士作品
新版增加大数据和机器学习内容 文津图书奖获奖书 央视新闻推荐的学科敲门砖。
《技术的潜能》美国知名战略咨询管理专家马库斯教授力作!为非技术人士了解技术影响力而写的一本简明读本!
NO.2人工智能深度学习类:深度学习、Tensorflow
点击下方书名试读
《深度学习》AI圣经,深度学习领域奠基性的经典畅销书 特斯拉CEO埃隆·马斯克等国内外众多专家推荐!
《深度学习精要(基于R语言)》基于R语言实战,使用无监督学习建立自动化的预测和分类模型
《TensorFlow技术解析与实战》包揽TensorFlow1.1的新特性
人脸识别 语音识别 图像和语音相结合等热点一应俱全 李航 余凯等人工智能领域专家倾力推荐!
《TensorFlow机器学习项目实战》第二代机器学习实战指南,提供深度学习神经网络等项目实战,有效改善项目速度和效率。
NO.3人工智能机器学习类:Python、机器学习、数据科学。
《Python机器学习实践指南》 结合了机器学习和Python
语言两个热门的领域,通过利用两种核心的机器学习算法来用Python 做数据分析。
《Python机器学习——预测分析核心算法》 从算法和Python语言实现的角度,认识机器学习。
《机器学习实践应用》阿里机器学习专家力作,实战经验分享,基于阿里云机器学习平台,针对7个具体的业务场景,搭建了完整的解决方案。
《NLTK基础教程——用NLTK和Python库构建机器学习应用》绍如何通过NLTK库与一些Python库的结合从而实现复杂的NLP任务和机器学习应用。
《Microsoft Azure机器学习和预测分析》 了解新的微软Azure
Machine Learning服务 掌握高效构建和部署预测模型的实用技能。
《机器学习与数据科学(基于R的统计学习方法)》 为数据科学家提供了一些在统计学习领域会用到的工具和技巧。
《机器学习Web应用》 eBay公司EU
Analytics部门负责人Davide Cervellin作序推荐,全面Python机器学习的图书 学会在Web下构建机器学习系统的权威指南。
《实用机器学习》 使用R语言引导读者掌握机器学习实战
顺利针对新问题 新数据选择和使用机器学习算法。
NO.4人工智能算法策略类:算法、神经网络、自然语言处理、推荐系统、系统算法、图像算法、贝叶斯、概率编程、数学算法等。
《神经网络算法与实现——基于Java语言》 完整地演示了使用Java开发神经网络的过程,既有非常基础的实例也有高级实例。
《趣学算法》 50 多个实例循展示算法的设计、实现、复杂性分析及优化过程
培养算法思维 带您感受算法之美。
《算法谜题》 Google、Facebook等一流IT公司算法面试必备,经典算法谜题合集。
《Python算法教程》 精通Python基础算法 畅销书Python基础教程作者力作。
《编程之法:面试和算法心得》程序员面试宝典 笔试金典 CSDN访问量过千万的博客结构之法算法之道博主July著作。
《趣题学算法》 一本有趣的、易学的、实用的,帮助读者快速入门应用的算法书。
《Java遗传算法编程》 遗传算法设计 机器学习人工智能 来自Java专家的声音 用遗传算法解决类似旅行商的经典问题。
《算法学习与应用从入门到精通》 320个实例、753分钟视频、5个综合案例、74个技术解惑,一本书的容量,讲解了入门类、范例类和项目实战类三类图书的内容。
NO.5人工智能时间图像和视觉识别类:图像识别、语音识别、自然语言处理、matlab建模工程。
《OpenCV和Visual Studio图像识别应用开发》无人驾驶人脸识别基础技术
用OpenCV实现图像处理应用 计算机视觉编程实战手册。
《人脸识别原理及算法——动态人脸识别系统研究》 介绍了动态场景下的人脸识别方法,该方法综合应用了人脸定位、人脸识别、视频处理等算法。
《精通Python自然语言处理》 用Python开发令人惊讶的NLP项目 自然语言处理任务 掌握利用Python设计和构建给予NLP的应用的实践。
《Python自然语言处理》基于Python编程语言和NLTK,自然语言处理领域的一本实用入门指南。
《贝叶斯方法:概率编程与贝叶斯推断》 机器学习 人工智能 数据分析从业者的技能基础 国际杰出机器学习专家余凯博士 腾讯专家研究员岳亚丁博士推荐。
《贝叶斯思维:统计建模的Python学习法》Think Stats和Think Python图书作者重磅出击
数据分析师 数据工程师 数据科学家案头常备。
《概率编程实战》人工智能领域的先驱、美国加州大学伯克利分校教授Stuart Russell作序推荐!一本不可思议的Scala概率编程实战书籍!
《自己动手写神经网络》 机器学习与人工智能参考书 基于Java语言撰写。
参考论文
一、神经网络基础部分
No1 wide_deep模型论文:
关于神经元、全连接网络之类的基础结构,想必每个AI学者都有了解。那么你是否真的了解全连接网络中深层与浅层的关系呢?来看看wide_deep模型吧。这篇论文会使你对全连接有个更深刻的理解。
关于该模型的更多介绍可以参考论文:
https://arxiv.org/pdf/1606.07792.pdf
在wide_deep模型中,wide模型和deep模型具有各自不同的分工。
—wide模型:一种浅层模型。它通过大量的单层网络节点,实现对训练样本的高度拟合性。它的缺点是泛化能力很差。
—deep模型:一种深层模型。它通过多层的非线性变化,使模型具有很好的泛化性。它的缺点是拟合度欠缺。
将二者结合起来——用联合训练方法共享反向传播的损失值来进行训练—可以使两个模型综合优点,得到最好的结果。
No2 wide_deep模型论文:
为什么Adam被广泛使用?光会用可不行,还得把原理看懂。这样出去喷一喷,才会显得更有面子。
Adam的细节请参阅论文《Adam: A Method for Stochastic Optimization》,该论文的链接网址是:
https://arxiv.org/pdf/1412.6980v8.pdf
No3 Targeted Dropout模型论文:
你还再用普通的Dropout吗?我已经开始用Targeted Dropout了。比你的又快,又好。你不知道吧,赶紧学习一下。
Targeted Dropout不再像原有的Dropout那样按照设定的比例随机丢弃部分节点,而是对现有的神经元进行排序,按照神经元的权重重要性来丢弃节点。这种方式比随机丢弃的方式更智能,效果更好。更多理论见以下论文:
https://openreview.net/pdf?id=HkghWScuoQ
二、图像分类部分
No4 Xception模型论文:
在那个图像分类的时代,谷歌的Xception系列,像x战警一样,一个一个的打破记录。其中的技术也逐渐成为AI发展的知识体系。有必要看一下。或许会对自己的工作有所启发。
详细情况请查看原论文《Xception: Deep Learning with Depthwise Separable Convolutions》,该论文网址是:
https://arxiv.org/abs/1610.02357
No5 残差结构论文:
运气好到没朋友,现有模型,后完善理论指的就是残差结构这哥们。他的传奇导致即使到今天的AI技术,也无法将它割舍,就来常微分方程都得拿它比肩。快来学学吧。用处大着呢。好多模型都拿他当先锋。
利用残差结构,可以使得网络达到上百层的深度。详情请参阅原始论文《Deep ResidualLearning for Image Recognition》,该论文网址是:
https://arxiv.org/abs/1512.03385
No6 空洞卷积论文:
NasNet的招牌动作,虽然不是出于NASNet,但是却被人家用得如火纯青。有时不得不惊叹,机器设计出来的模型还真实跟人设计的不一样!
想知道空洞卷积的感受野为什么与层数呈指数级关系吗?
细节请查看原论文《Multi-scale context aggregation by dilated convolutions》,该论文网址是:
https://arxiv.org/abs/1511.07122v3
No7 DenseNet论文:
这个模型使我想到了“一根筋”,再次证明了只有轴的人才能成大事!令类的模型,神奇的效果,快来体验一下吧。这可是比华佗还牛的神医哦!
有关DenseNet模型的细节,请参考原始论文《Densely Connected Convolutional Networks》,该论文的连接是:
https://arxiv.org/abs/1608.06993
No8 EfficientNet模型论文:
知道目前位置图像分类界谁是老大吗? 来,看看这个!
EfficientNet模型的论文地址如下:
https://arxiv.org/pdf/1905.11946.pdf
No9 Grad-CAM模型论文:
如果你能把神经元搞得透彻,你也会想到这个点子。不想聊太多!一个字“绝”!这TMD才叫卷积网络的可视化!
详细情况请参阅论文《Grad-CAM:Visual Explanations from Deep Networks via Gradient-based Localization》,该论文的链接网址是:
https://arxiv.org/pdf/1610.02391.pdf
No10 分类模型泛化能力论文:
知道为啥都喜欢使用ResNet模型当先锋吗?运气好就是运气好!好到大家都喜欢用它,还说不出为啥它那么好!反正就是好,不信的话看看这篇论文的实验结果。
论文中,在选取模型的建议中,多次提到了ResNet模型。原因是,ResNet模型在Imgnet数据集上输出的特征向量所表现的泛化能力是最强的。具体可以参考以下论文:
https://arxiv.org/pdf/1805.08974.pdf
三、批量正则化部分
No11 批量正则化论文:
这个没的说,必修课,不懂的化,会被鄙视成渣渣!
论文《Batch Normalization Accelerating Deep Network Training by Reducing Internal Covariate Shift》,该论文网址是:
https://arxiv.org/abs/1502.03167
No12 实例归一化论文:
时代不同了,批量归一化也升级了,赶紧学学新的归一化吧。
在对抗神经网络模型、风格转换这类生成式任务中,常用实例归一化取代批量归一化。因为,生成式任务的本质是——将生成样本的特征分布与目标样本的特征分布进行匹配。生成式任务中的每个样本都有独立的风格,不应该与批次中其他的样本产生太多联系。所以,实例归一化适用于解决这种基于个体的样本分布问题。详细说明见以下链接:
https://arxiv.org/abs/1607.08022
No13 ReNorm算法论文:
ReNorm算法与BatchNorm算法一样,注重对全局数据的归一化,即对输入数据的形状中的N维度、H维度、W维度做归一化处理。不同的是,ReNorm算法在BatchNorm算法上做了一些改进,使得模型在小批次场景中也有良好的效果。具体论文见以下链接:
https://arxiv.org/pdf/1702.03275.pdf
No14 GroupNorm算法论文:
GroupNorm算法是介于LayerNorm算法和InstanceNorm算法之间的算法。它首先将通道分为许多组(group),再对每一组做归一化处理。
GroupNorm算法与ReNorm算法的作用类似,都是为了解决BatchNorm算法对批次大小的依赖。具体论文见下方链接:
https://arxiv.org/abs/1803.08494
No15 SwitchableNorm算法论文:
我们国人做产品都喜欢这么干!all in one ,好吧。既然那么多批量归一化的方法。来,来,来,我们来个all in one吧。不服来辩,我这啥都有!
SwitchableNorm算法是将BN算法、LN算法、IN算法结合起来使用,并为每个算法都赋予权重,让网络自己去学习归一化层应该使用什么方法。具体论文见下方链接:
https://arxiv.org/abs/1806.10779
四、注意力部分
No16 大道至简的注意力论文:
把AI搞成玄学也就算了!居然还扯到道家了!谷歌的工程师真实中外通吃啊!搞出来了一个只用注意力就能做事的模型,连卷积都不要了!你所好玩不好玩!至简不至简!刺激不刺激!
大名鼎鼎的Attention is All You Need 注意力机制论文
注意力机制因2017年谷歌的一篇论文Attention is All You Need而名声大噪。下面就来介绍该技术的具体内容。如果想了解更多,还可以参考原论文,具体地址如下:
https://arxiv.org/abs/1706.03762
No17-18 孪生注意力论文:
好比LSTM与GRU一样,注意力他们家也除了一对双胞胎,长得略微有点不同。但是功能一样,都能吃能喝,还能注意。老虎老鼠傻傻的不清楚!
—BahdanauAttention:https://arxiv.org/abs/1409.0473。
—LuongAttention:https://arxiv.org/abs/1508.04025。
No19 各自升级的孪生注意力论文:
话说这对双胞胎,出生后就分开了。各自学的不同的语言,一个学习汉语,一个学习中文。若干年后,见面,发现二者的能力还是一样!
BahdanauAttention注意力升级成了normed_BahdanauAttention,而LuongAttention注意力升级成了scaled_LuongAttention。都一样的效果,你爱用哪个用哪个吧!
例如:
在BahdanauAttention类中有一个权重归一化的版本(normed_BahdanauAttention),它可以加快随机梯度下降的收敛速度。在使用时,将初始化函数中的参数normalize设为True即可。
具体可以参考以下论文:
https://arxiv.org/pdf/1602.07868.pdf
No20 单调注意力机制论文:
老公主动表忠心,我以后不看别的美女。老婆觉得不够,再加个限制:你以后不准看别的女人!于是单调注意力就出来了。
单调注意力机制(monotonic attention),是在原有注意力机制上添加了一个单调约束。该单调约束的内容为:
(1)假设在生成输出序列过程中,模型是以从左到右的方式处理输入序列的。
(2)当某个输入序列所对应的输出受到关注时,在该输入序列之前出现的其他输入将不能在后面的输出中被关注。
即已经被关注过的输入序列,其前面的序列中不再被关注。
更多描述可以参考以下论文:
https://arxiv.org/pdf/1704.00784.pdf
No21 混合注意力机制论文:
这个注意力很强大,比一般的注意力专注的地方更多,信息更丰富。我已经注意你很久了!呵呵呵~~~
因为混合注意力中含有位置信息,所以它可以在输入序列中选择下一个编码的位置。这样的机制更适用于输出序列大于输入序列的Seq2Seq任务,例如语音合成任务。
具体可以参考以下论文:
https://arxiv.org/pdf/1506.07503.pdf
五、高级的卷积网络知识
No22 胶囊网络与动态路由的论文:
这是一股为图像分类降温的寒风,深刻而又尖锐的点出了卷积网络的硬伤! 从事最大池化再无翻身之日。
虽然胶囊网络再实际应用中,不像它的理论那么牛,但是对AI的帮助,卷积的理解是革命性的。非常值得一读。另外,这也是一篇绝对让你对数学彻底绝望的论文。花几根白头发把里面的算法啃下来吧。这样你与大神就能更近一步。
胶囊网络分为主胶囊与数字胶囊,主胶囊与数字胶囊之间的耦合系数是通过训练得来的。在训练过程中,耦合系数的更新不是通过反向梯度传播实现的,而是采用动态路由选择算法完成的。该算法来自以下论文链接:
https://arxiv.org/pdf/1710.09829.pdf
目前胶囊网络的研究还处于初级阶段,随着人们研究的深入,相信这些问题会得到解决。
No23 矩阵胶囊网络与EM路由算法:
如果你觉得不过瘾,那么还可以再看一篇。继续自虐一下。
带有EM(期望最大化)路由的矩阵胶囊网络是动态路由胶囊网络的一个改进版本。论文链接如下:
https://openreview.net/pdf?id=HJWLfGWRb
No24 胶囊网络的其它用处:
胶囊网络混身是宝,但就是自己不争气。这也说明还有上升的空间。就拿其中一个动态路由算法来讲,居然比普通的注意力还好。
看完之后,相信你一定会手痒!要不要也试试?把你的注意力换一下。值得你尝试,会有彩蛋的!
该论文的实践也证明,与原有的注意力机制相比,动态路由算法确实在精度上有所提升。具体介绍可见以下论文:
https://arxiv.org/pdf/1806.01501.pdf
No25 卷积网络新玩法TextCNN模型:
早先小编在一个项目中,自己用卷积网络处理字符数据。自己感觉很Happy。没想到,无意间居然发现了一篇同样这么干的论文。居然还有个名字,叫TextCNN。哎!可惜啊!小编文化少,只会写代码,不会写论文。
TextCNN模型是利用卷积神经网络对文本进行分类的算法,由Yoon Kim 在Convolutional Neural Networks for Sentence Classification 一文中提出。论文地址:
https://arxiv.org/pdf/1408.5882.pdf
六、图像内容处理部分
No26 FPN模型论文(包含了ROIAlign的匹配算法):
要是搞计算机视觉,还是要建议看一下。非常的基础。也是图像分割方面的用得最多得模型。
FPN的原理是:将骨干网络最终特征层和中间特征层的多个尺度的特征以类似金字塔的形式融合在一起。最终的特征可以兼顾两个特点——指向收敛目标的特征准确、特征语义信息丰富。更多信息可以参考论文:
ROIAlign层中的匹配算法也来自于这篇FPN论文,链接如下:
https://arxiv.org/abs/1612.03144
No27 Mask R-CNN模型论文:
效果好,代码多!硬货!来啃吧!
Mask R-CNN模型是一个简单、灵活、通用的对象实例分割框架。它能够有效地检测图像中的对象,并为每个实例生成高质量的分割掩码,还可以通过增加不同的分支完成不同的任务。它可以完成目标分类、目标检测、语义分割、实例分割、人体姿势识别等多种任务。具体细节可以参考以下论文:
https://arxiv.org/abs/1703.06870
No28 YOLO V3模型论文:
这个模型的提点就是快!目标识别强烈推荐
YOLO V3模型的更多信息可以参考以下链接中的论文:
https://pjreddie.com/media/files/papers/YOLOv3.pdf
No29 Anchor-Fress模型--FCOS模型论文:
随着AI技术的进步Anchor-Fress模型死灰复燃(早先是YOLO V1那一批模型),这次不一样的是彻底干掉带Anchor的模型。训练起来那就一个爽!妈妈再也不用为我准备单独的Anchor标签了。
与YOLO V1相比,FCOS模型的思想与YOLO V1模型非常相似,唯一不同的是FCOS模型没有像YOLOv1那样只考虑中心附近的点,而是利用了ground truth边框中所有的点来进行预测边框。并且通过center-ness 分支来抑制那些效果不行的检测边框。这样FCOS 就可以改善YOLO V1模型总会漏掉部分检测边框的缺点。
相关论文地址:
https://arxiv.org/abs/1904.01355
No30 Anchor-Fress模型--CornerNet-Lite模型论文:
一样也是Anchor-Fress模型,与FCOS效果差不多少,具体看一下论文吧
CornerNet-Lite模型。相关论文地址:
https://arxiv.org/pdf/1904.08900.pdf
No31 栈式沙漏网络模型--Hourglass论文:
最初用户人的姿态估计,在符合模型中也是常被使用的模型。论文地址:
https://arxiv.org/abs/1603.06937
No32 OCR必修课——STN模型论文:
可以让模型自动仿射变化,你说牛不牛!要学OCR,就得从这个开始。
有关STN模型的论文链接如下:
https://arxiv.org/abs/1506.02025
七、循环神经网络部分
No33 QRNN模型论文:
在RNN模型的cell里,如果还只知道LSTM和GRU。那就太low了。快了补补吧:
如果想更多了解QRNN,可以参考以下论文:
https://arxiv.org/abs/1611.01576
No34 SRU模型论文:
接着来,各种RNN的Cell。又漂亮,又好吃!
SRU单元在本质上与QRNN单元很像。从网络构建上看,SRU单元有点像QRNN单元中的一个特例,但是又比QRNN单元多了一个直连的设计。
若需要研究SRU单元更深层面的理论,可以参考如下论文:
https://arxiv.org/abs/1709.02755
No35 IndRNN模型论文:
再补一个,这可都是好cell啊!
将IndRNN单元配合ReLu等非饱和激活函数一起使用,会使模型表现出更好的鲁棒性。
有关IndRNN单元的更多理论,可以参考论文:
https://arxiv.org/abs/1803.04831
No36 IndRNN模型论文:
最后,再来一个cell,如想要了解更多关于JANET单元的内容,可以参考以下论文:
https://arxiv.org/abs/1804.04849
八、AI合成部分
No37-38 Tacotron与Tacotron-2模型论文:
AI合成部分的经典模型,以上结构来自Tacotron与Tacotron-2两个结构,更多内容可以参考以下两篇论文:
https://arxiv.org/pdf/1703.10135.pdf
https://arxiv.org/pdf/1712.05884.pdf
No39 DeblurGAN模型论文:
图片合成的论文太多了。这里简单列几个,大体原理和思路了解,即可。
DeblurGAN模型是一个对抗神经网络模型,由生成器模型和判别器模型组成。
—生成器模型,根据输入的模糊图片模拟生成清晰的图片。
—判别器模型,用在训练过程中,帮助生成器模型达到更好的效果。
具体可以参考论文:
https://arxiv.org/pdf/1711.07064.pdf。
No40 AttGAN模型论文:
同样,这也是个图片合成的。不同的是多属性合成,相对比较有意思。
AttGAN模型由两个子模型组成:
(1)利用编码器模型将图片特征提取出来。
(2)将提取的特征与指定的属性值参数一起输入编码器模型中,合成出最终的人脸图片。
更多细节可以参考论文:
https://arxiv.org/pdf/1711.10678.pdf
No41 RNN.WGAN模型论文:
可以合成文本的GAN。离散数据也能干!
RNN.WGAN模型使用了WGAN模型的方法进行训练。详细做法可以参考如下论文:
https://arxiv.org/abs/1704.00028
九、多任务学习
No42 MKR模型论文:
多任务学习模型有必要了解一下。这里推荐一个论文给你看看。
MKR是一个多任务学习的端到端框架。该框架能够将两个不同任务的低层特征抽取出来,并融合在一起实现联合训练,从而达到最优的结果。有关MKR的更多介绍可以参考以下链接:
https://arxiv.org/pdf/1901.08907.pdf
十、NLP部分
No43 BERT模型论文:
如果你搞NLP,那么这个就不用我来介绍了。如果你准备搞NLP,那么赶紧来看看这个,跟上时代。
BERT相关论文链接
https://arxiv.org/abs/1810.04805
在BERT之后,又出了好多优秀的模型。但是,还是先把这个啃下来,再看别的才不费劲。
十一、模型攻防
No44 FGSM模型论文:
攻击模型的经典方法。值得掌握。
FGSM(Fast Gradient Sign Method)是一种生成对抗样本的方法。该方法的描述如下:
(1)将输入图片当作训练的参数,使其在训练过程中可以被调整。
(2)在训练时,通过损失函数诱导模型对图片生成错误的分类。
(3)当多次迭代导致模型收敛后,训练出来的图片就是所要得到的对抗样本。
具体可以参考论文:
https://arxiv.org/pdf/1607.02533.pdf
No45 黑箱攻击论文:
基于雅可比(Jacobian)矩阵的数据增强方法,是一种常用的黑箱攻击方法。该方法可以快速构建出近似于被攻击模型的决策边界,从而使用最少量的输入样本。即:构建出代替模型,并进行后续的攻击操作。
详细请见如下链接:
https://arxiv.org/abs/1602.02697