如何转行人工智能?该如何学习?

对于本科没有相关基础,研究生被导师赶鸭子上架的学生,这里推荐两个星期左右补基础,剩下时间直接水论文。

基础篇:

第一步建议把pytorch的lenet手写数字识别每一行代码都看懂(耗时大概一下午)。

第二步结合实验室研究方向和算力基础,开始根据关键词在谷歌搜3-10篇近5年的高引用论文,粗读完后挑一篇最相近的,涉及数学不多的,开始读(耗时大概1-2周)。论文最好带源码,这样一边读源码一边看论文。如果英语水平有限,在知网搜top学校的博士生毕业论文也可以。主要是对深度学习有个感觉,这个时候你应该知道你的领域大家一般怎么搬砖。

论文篇:

然后结合做的相对人少的方向,比如公平性,可视化的可解释行,隐私安全等开始水论文。什么是公平性,隐私安全? 我的做法一般是在知乎搜关键词,然后直接看帖子,耗时也就一两个下午。

这一步其实对于新手来说很难找到兼具可行性和创新性的idea,最快的途径是年轻导师有投稿经验还有纵向本子,直接做导里本子最靠谱的想法就行就行。次一点的途径是功成名就的教授学生太多,并不能手把手带学生,但是有丰富投稿经验,可以和学生讨论学生的想法,并及时把学生的不靠谱想法制止。 不过考虑到国内一些年龄大一点的老师早就被优质985生源惯坏了,自己本身并不懂深度学习这些东西,那学生只能自救了。

第一步是找到你需要解决的问题,也就是确定方向。比如说,做人脸识别,结合公平性,你就要指出,白人人脸识别准确率比黑人高。这一步需要多看论文,但是只需要粗看,主要是找baseline,一个是看你结合的问题有没有人做过,最好是没人做过,被做过的问题新手不太建议从方法上刷点,第二个个是看这个问题有没有在其它应用上做过,比如有人做过人脸识别的公平性,但是你的任务是人脸生成。这时候你就可以把人脸识别的公平性loss直接借鉴过来,看看效果,作为baseline。这一步需要对你的baseline的论文里的问题定义和技术都比较熟悉,看不懂的问ChatGPT或者知乎搜。这一步同样需要确定idea的实施可行性,包括对算力的要求和对数学的要求。比如你就会cnn,最多把diffusion搞懂了,你的想法是研究随机初始化对结果的影响,那就非常不靠谱,太难的idea直接放弃。数学好不好跟你能不能中论文没什么关系,把你的baseline里涉及到的数学搞懂就行。

第二步,差不多确定了方向,就可以开始做预实验了。先复现你提出的问题,也就是什么额外的方法都不加,直接用最原始的神经网络复现出问题,再复现baseline,看看硬套别人的方法,比如直接用别的论文解决类似问题的时的loss,能不能很好的解决你提出的问题。

第三步,确定技术,让表现超过baseline,基本上实验部分就差不多了。表现不光有performance,也有efficiency,你的技术能提升efficiency也能发论文。技术部分可随便做做,既可以用别的论文里的方法,也可以结合你的具体任务去专门改改loss。其实只要你的问题是新的,不怎么看技术的创新性。

第四步,预实验成功后,再看看别人论文,实验量一般有多大。做个差不多的实验量也就差不多了。

第五步,然后模仿你想投的领域的顶会论文开始写作,投稿。如果老师也没什么投稿经验,想快点中的话,自己可以挑次一点的会议,ccf b,c的会议论文开始投稿。或者直接投顶会,被拒了根据审稿意见修改个一两轮也可以。

合理的看课学习应该夹杂在搬砖之中。比如你的任务是图类数据,需要用图神经网络,但是看知乎帖子怎么都看不明白,这个时候可以系统学一下图神经网络的课(也是挑需要的学),至于啥diffusion就不用看了。很多研究者会遇到数学焦虑,数学不好一辈子都只能感觉自己在水论文,一直学数学那就会发不出论文毕不了业。尤其是本科比较厉害的学生,这种搬砖排斥感会更明显。个人建议,如果不是你实验室的方向非这个理论不可,比如做运筹学的大部分逃不过ILP,个人建议每周学习新知识,尤其是数学物理这种基础学科的时间不要超过你科研总时间的%30。

对于本科生想充实自己的技术栈好找工作/为读研做准备,个人觉得可以看李沐的课,也可以按上面的路线走,但是重中之重是找实习/把绩点刷高。

对于有志于学术界工作的优秀研究者,一千个人有一千个优秀的方法,个人不配提学术上的建议。我唯一的建议就是,待人宽容且平和,每个人的基础,优点都不同,不要把对自己的要求套到别人身上。

你可能感兴趣的:(人工智能,学习,自然语言处理,机器学习,深度学习,语言模型)