深度学习十年感悟,从入门到放弃

写这篇在此主要是对自己对未来的思考和探索,绝没有指导和影响大家意思,我要准备放弃深度学习算法应用和研究去从事下一代操作系统和模拟信号处理芯片方面工作,主要是为自己以后事业机器人领域做点储备。14年左右从Octave及Matlab数学建模开始入门人工智能深度学习领域。当时情况是13年底我请教前辈后,在思考我们专业的未来是交通调度那么就是通信调度,最厉害的行业内也就是统计分析之类的很多体力性加上初步的分类,回归,聚类方法处理,其实日常就是excel和spss,毕业多半去研究院,设计院,铁路局,交通事业单位。当时请教了在美国留学的发小,他说自己搞深度学习,于是出于对计算机从小的爱好和好奇开始找资料学习,当时网上资料很难找,经常要托关系从国内外找人帮忙搜集资料。在慢长的各种搜集和网易公开课,Coursera,Edx及斯坦福和麻省理工官网偶尔整理得到比较系统权威的课程开始死磕入门,期间遇到黄博等同行非常荣幸,同时在此期间也非常感谢志峰他们翻译和整理了CS50课程及机器学习很多校对工作,培文在开发算法应用的OCR工程,嘉鑫数据指标特征工程ETL方面分享让我快速成长到现在。

在14年这段时间随着自己喜欢学数学建模(当初真心纯属个人爱好就觉的好玩)报学校内部培训班学,期间由于自己在这方便兴趣,运气比较好去了兰州J区四所的博后站实验室实习,这一干就是几年。随着时间我16年10月份被某局上海单位分配到浙江工作,从一个初级学生开始转向工程方面应用与开发研究,这也是我大量开始阅读相关文献资料开始。17年正式毕业从到浙江开始从事这个行业,在此我也会将我们这个行业自己风风雨雨经历写出来也算是对自己的一个总结,17年左右大家就已经开始了tensorflow方面的开发和应用研究,也参加各种比赛,这时候我们主要用sklearn,tensorflow,keras等工具。当时tensorflow在windows真心编译很难,有一天晚上在单位干到晚上四点才把服务器集群起来。当初很烦的是单位一堆行政工作,看大门,晚上值班,一年考试187次。第二年中秋节晚上我夜班值勤看着月亮开始思考人生以后,就是觉的这个工作不是不好,但这种生活不是自己想要的。于是从第二天开始准备重学之前学过的计算机相关课程,其中包括计算机组成原理,操作系统,网络技术,算法与数据结构这些比较传统的,还有自己之前学过的c++,c。看完发现啥都不懂,又开始在网上看公开课主要是浙大的翁恺老师C,C++,北邮崔毅东老师C++,后来又自己折腾学习了QT和Linux应用开发,这个主要是深度学习算法落地时候应用上学着用。不知道为啥这几年公开课很多,我们当时那会在校很少,并且没人考研,除非想当大学老师和有梦想成为科学家的同学,因为我们那种专业毕业了都分配或者签到体制内,学历之间本硕差600,博士差2000,当然博士是直接干部身份,本硕一样干部待遇但要到一线工作后两年后根据工作和考试升机关干部就行。谁没事干耗八年浪费青春,现在看当时就是愣头青失算了,当时不管考研,保研各种路子其实很简单,平时上课老师都是劝着招学生,如今已经高攀不起。

18到19年开始参考了很多大数据比赛,当初我的心态很明确就是学习。其实认识了很多业界大佬,基本都在头部企业或者科研院所,由于互联网比较登峰,很多神话SSP和各种星。相比毕业时没人去的某为现在真心高攀不起。这其实也是一个时代的趋势发展不会以个人意识和意识为转移,只能尽快适应顺势而为。不过曾经很多大佬后来也面临颠沛流离,时代给的好像我发现都会拿回去或者在子女身上薅回去,前提就是当时思维固执不再学习时间开始。这段时间我从软硬件学习应用主要是图像分类识别及目标检测,期间做了各种医学图像、遥感图像,文字图像,面膜缺陷、马路缺陷,安全帽工程防护图像,人脸识别(人脸检测,人脸纠正,人脸比对)等一系列的工程,其中自动驾驶中我们实现的辅助驾驶让我痛彻心扉,当时通过仿真软件PreScan做各种工况下的DSM,LCW,ACC,AEB,APA。同时在做文字图像识别时候我就发现这个自然语言也蛮重要,再一个就是深度学习好像里面除数据预处理不同,其他的套路类似。于是乎就去补了补数电、模电,Linux操作系统等。随着对基于微服务系统的这些图像分析算法和数据分析算法应用基本上掌握了行业情况,也能赚外快并且是那种相对容易,这段时间初步熟悉了互联网的行业的技术体系,当然计算机还是没学完,主要是计算机这个领域太深奥,入门和到深层研究是深不见底。

21年复盘自己过去在行业针对工具和技术学习,发现自己的瓶颈。于是乎开始改变自己同时这个时候犯了一个很大错,就是没请教高人指点和行业人领域导致自大的自我认识和决策失误。开始踏上一条新的弯路,这时候开始随着工作对自然语言工程化开发,真正体会到这个皇冠上的明珠的前提是真心特别消耗体力,相比图像的标注体力,文本能折腾跪。22年我指导GPT马上出来那会让我领导看看能不能立项目,结果领导这一波操作具体开始23年3月份,直到8月份我才明白领导的想法。于是乎我明白了这个沙漠很难种出来大树道理。

马上24年了深度学习从应用看,目前其实投入产出比还是很平衡。例如曾经的四小龙等没业务过的也不是很理想。再有就是深度学习的顶会顶刊论文铺天盖地,结果了很多实验室其实显卡都配不全,所以水平到底怎么样真心看不懂,反正就是成果很大,成果很多。也说明一个问题这个领域还有段路要走那就是系统和硬件。因为今年搞大模型,你要是有多张卡,并行计算需要买个微星的专门系统。不然没法用,很多驱动兼容和版本靠人堆。我有点看不到希望,于是乎我从19-20年开始业务学习调试和RSIC芯片及实时操作系统等。

随着通用人工与认知智能发展,现有的方案很难支撑未来发展,曾经跌倒过,现在站起来。开始为下一个机器人时代开始做点属于自己的准备,当然论文,算法,框架代码这些有空看看我也会。只是相当自己人生路上的毕业路,一段结束一段开始,永远在路上!

综述上梳理了6点所以我放弃算法研究后做个follower,一:顶会论文井喷每天最少几篇都看不完,这个行业研究太容易处成果了。二:一般大学抢着开啥专业,这个行业尽头快到了。三:A100,H100被限制购买后靠想象力是没法快速验证模型是否有重大突破。四:很多企业和学校就根本没数据自嗨式科研。五:多卡系统分布式训练和服务都需要专业操作系统类似微星才能并行10卡H100。六:各种开源代码编程及编译水平层次不齐,论文复现时间验证时间成本太高。与其东一下西一下不如专注机器人领域从0开始长久打算系统性,专业性,思想开放的从软硬件学透为以后农业生产,娱乐消费,医疗生活做的自己能力范围内事情。

你可能感兴趣的:(Latex科研,码上生活,反思觉悟,深度学习,人工智能)