全文共2086字,预计学习时长4分钟
图片来源:unplash
斯坦福大学吴恩达教授在计算机科学课上阐述如何在人工智能领域出类拔萃时说到:
深度学习的发展势如破竹,即便已掌握了深度学习的基础知识,在研究特定应用程序时,仍需阅读论文以紧跟最新趋势。
吴恩达教授分享了一个简单有效的阅读计划技巧。包括以下步骤:
· 选择一个感兴趣的话题(如语音识别、文本摘要、GANs图像生成)。
· 列出包含10-20篇论文/期刊/博客的文献清单。
· 逐步把文章量扩大到50篇以上。
此外,吴恩达教授还分享了几个查找资源的地方,如Twitter,Machine Learning subreddit(https://www.reddit.com/r/MachineLearning/),NIPS(https://nips.cc/),ICML(https://icml.cc/)和ICLR(https://iclr.cc/)(后三者为机器学习会议)。
那么就这个方法来说,制定合适的论文清单需要花多少时间和精力?本文将传授你一些小技巧。
如何开始?
第一步,选定主题/问题。在笔者的案例中,主题是如何将深度学习应用于各种类型贷款(抵押贷款、个人贷款、信用卡等)的信用风险评估。
一旦确定了主题就列出相关关键词。笔者的关键词是:信用、贷款、放贷、抵押、风险、评估、分数、银行和金融。
搜索论文/期刊/博客文章时,将这些关键词与“深度学习”、“机器学习”或“神经网络”结合起来,就能获取所需结果。
浏览网络以获取资源
寻找到合适的资源可能需要耗费1小时到一两天,这取决于找到“完美”论文的决心有多大。但应当避免在搜索上耗费不必要的时间,只要找到3-4篇论文,就可以真正开始阅读了。下方列出了几种寻找资源的有效方法。
标准Google搜索
众所周知,在Google搜索上文提到的关键字是第一步。然后,笔者发现这种方法并不高效,因为其结果通常并无实际解决方案,而是适合所有读者的主题概述。
然而,如果使用Google Scholar搜索,找到所需内容的可能性则高得多。
搜索高级机器学习会议
第二步是浏览过去几年会议的所有标题,从中提取有趣论文。以NIPS会议为例,寻找已提交论文的列表。
· 首先,访问https://nips。将年份切换为2019年、2018年、2017年等分别搜索。
对会议进行逐年搜索时,将https://nips.cc/Conferences/2019改为https://nips.cc/Conferences/2019/Workshopbook并点击回车键。携有当年所有论文摘要的“研讨会手册”PDF文档将自动下载。
· 最后,浏览各部分,选择与主题相关的论文。
其他会议网站也有“研讨会手册”,可通过类似途径获取。
搜索最热门的线上论文图书馆
这类网站包括arxiv.org,Semantic Scholar,Science Direct等。在每个平台将先前选定的关键字通过“高级搜索”选项筛选出有趣的内容。
注:有些文件可能是私人的,需要购买。
深入研究论文
寻找与主题完全匹配的论文的过程可能既乏味又耗时,很可能会找到不完全匹配但主题相关的论文(在相同或相邻领域)。
提醒一点,研究人员的论文是基于先前发现并包含大量参考文献的。
以下就是笔者如何利用这一点指导自己的:
1.看完NIPS 2018研讨会手册后,笔者发现了一个很棒的研讨会,名为《金融服务业人工智能的挑战和机遇:公平、解释性、精确性和隐私的影响》。
2.大多数论文并不完全是关于信用价值评估的,而是关于使金融领域的深度学习模型更易解释的新方法。
3.笔者看来,为让作者讨论模型的可解释性,他们就必须查看(并引用)实际算法。惊讶的是,前3-4个引用正是笔者所需要的。
这种方法帮助笔者拓展了资源列表并找到了真正有用的材料。
过滤不需要的内容
在最后一部分中,笔者想回顾一下在选定论文时需要考虑的几件事,有助于过滤很多不需要的内容,专注于更少但质量更高的资源。
· 作者——论文可由不同领域的不同研究人员发表。笔者通常会在领英或推特上查找作者的姓名与所在机构。例如,由大型银行/金融机构的研究人员撰写的一篇信用风险评估深度学习的论文,很可能是一篇高质量论文。此外,著名的学校(斯坦福、麻省理工、蒙特利尔大学)和公司(脸书、谷歌、百度)通常拥有最优秀的研究人员。
· 发表日期——深度学习领域迅猛发展,因此5年前的论文可能与现在无关。笔者倾向于寻找更近期的论文,但也从不忽视很久之前的优秀论文,尤其是介绍突破性技术的论文。
· 引用次数——如果一篇论文引用次数不高,这并不意味着该论文质量不高。笔者经常查看论文的引用次数,只是为了了解论文的受欢迎程度,但这从来不是决定性因素。
我们一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”
(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)