第100步 项目完结

一、机缘

终于,这个专栏:《100 Steps to Get ML》—JET学习笔记,也算是整理完了。耗时不到两年半,中间也停更了大半年,忙别的去了。

最初是发在自己的公众号上,从今年开始同步更新到CSDN论坛。

以下是当初专题写作的初衷,来回忆一下:

Siraj Raval在YouTube发起了一个挑战赛:#100DaysOfMLCode,号召大家行动起来,每天至少花费1小时的时间来学习机器学习(ML)知识,连续坚持100天,根据1000万小时原则,就能够掌握ML这一门工具。这个编程的项目已经火爆GitHub(3000多标星)和Twitter,截止2022年9月,更新到了52期。

这个项目有三点友好之处:

① 精美且通俗易懂的学习图片

② 配套的代码,且带有详细注解

③ 相应的数据集

献上项目地址:https://github.com/Avik-Jain/100-Days-Of-ML-Code。

由于太过火爆,有大佬已经同步更新成中文版的《机器学习100天》,由MLEveryday提供,地址在此:https://github.com/MLEveryday/100-Days-Of-ML-Code。

本人本硕博均是流行病与卫生统计专业,学习ML多是为了分析临床大数据,解决临床问题。一开始也是跟着#100DaysOfMLCode项目开始学,遇到不懂的知识点或者代码报错踩坑,就去CSDN论坛学习充电和寻找解决方法。

现在打算把学习笔记整理发出,一个是总结知识,归置代码,留作纪念;二是为师弟师妹以及ML爱好者提供一点点借鉴,毕竟前人踩过的坑,后人可以踩着前人过坑嘛;三是为临床医生提供一个通俗易懂的ML建模流程,基于手头上的临床数据能够快速上手ML建模。

基于以上初衷,本学习计划偏向于实战和临床应用,因此不会过多涉及高深的理论(其实深的我也不懂,嘻嘻嘻),开门见山。不过,ML入门确实需要一定的时间和精力,个人觉得相比较于卫生统计学,ML的门槛还是挺高的。因此,本学习笔记暂且叫做《100 Steps to Get ML》《100步入门机器学习》,鉴于每个人知识背景、时间和精力不同,有些人一天能学几天的知识量,有些可能几天就学一天的知识量,所以本人偏向于把整个知识点分步,而不是分天,根据自身条件自行食用。当然,一天一步甚好,循序渐进。

学习笔记初步设想的框架:(1)跟着#100DaysOfMLCode项目把基本的ML分类模型逐一介绍,包括最基本的理论原理和代码实操。(2)复现一篇基于临床数据ML建模的SCI论文(当然是我自己的)。(3)介绍ML回归模型,重点在于时间序列预测模型在传染病预测中的应用,包括传统的ARIMA模型、GRNN模型,新兴的LSTM模型等。(4)复现一篇基于ML回归模型预测传染病发病率的SCI论文(当然还是我自己的)。(5)介绍深度学习图像识别技术,也就是CNN及其各种改进网络。

再次申明,主要是实战为主,主要是面向医学背景的同仁!

二、收获

在我创作的旅程中,我收获了许多宝贵的经验和成就。首先,我感到非常欣慰的是我的作品得到了不少粉丝的关注。在CSDN上,从开始时的几个人,到现在已经有五千多粉丝在追踪我的创作。虽然距离百万粉丝博主还有很大差距,但是这些粉丝的支持和鼓励是我继续前进的动力。

其次,我也收到了大量的正向反馈。我的作品阅读量突破了十二万大关,获得500多次收藏,代码片获得1200多次分享。此外,还获得了2023年城市之星南宁市TOP3和2023年新星奖。这些数字和荣誉不仅证明了我的作品受到了广泛的欢迎,也让我对自己的创作能力有了更深的认识和信心。

三、日常

教员说:“我们是靠总结经验吃饭的。”

这一点我越来越赞同。创作已经成为了我生活的重要一部分,它不仅是我表达自我、分享观点的方式,也是我学习新知识、提升技能的途径。每当我完成一篇文章或一个项目,我都会有一种成就感,这让我更加热爱创作。

然而,我也必须承认,在有限的精力下,平衡创作和工作学习并不容易。作为一名青椒,我需要在满足工作职责、完成学业任务与投入创作之间找到一个平衡点。为了实现这个目标,我制定了详细的时间管理计划,将我的一天分为几个时间段,包括工作、学习、休息和创作。

我一般是利用碎片时间进行创作,比如在中午下班时间、晚上睡前等。这样,即使在忙碌的日常生活中,我也能保持创作的热情和动力。

创作和我的工作、学习形成了一种互补关系。虽然有时候会感到压力,但我始终相信,只要合理安排时间,我就能在追求事业和学业成功的同时,享受创作带来的乐趣。

四、成绩

据我所知,《100 Steps to Get ML》—JET学习笔记中的机器学习分类部分,已经协助6位研究生发表了至少6篇SCI论文,其中包括中科院一区的文章。基于图像分类系列,也发表了1篇2区的SCI文章(惊喜的是,是无需修改直接接收的),这可能得力于我把机器学习分类建模与临床问题做了有效的结合,因此,文章并不是千篇一律的套路。

看到大家使用自己的代码和思路,并取得了成果,还是很欣慰的。

借鉴教员在《实践论》的理论,从实践到理论,再返回实践,如此循环,越来越接近真理。我自己总结的思路和路径,如果大家能根据它来复现发文章,那么说明我的思路是对的。独乐乐不如众乐乐嘛,这可能才是内啡肽式的快乐吧。

假期末也收到一个好消息,今年国自然青年基金终于中了,心中的石头放下咯。经常有人问我,为啥又搞机器学习,又搞基础研究呢?两者似乎八竿子打不着,其实我觉得它们在本质上是相通的,教员说过嘛,对立统一,两个领域的思维看似不同,其实也有互补统一的地方,这种东西得自己悟了。现在提倡的交叉学科其实也是这个道理吧,我现在尽量要求自己从哲学的角度去观察和思考它们,找到一些最底层的根本规律,为我所用,感觉有不少收获。推荐大家好好研究教员的《矛盾论》,大有启发。

五、下一步计划

《100 Steps to Get ML》只算是入门而已,未来还有很多要学习的。因此,未来打算分成几个专题分开学习:机器学习分类、机器学习回归、图像目标识别、图像目标检测等等。此外,也适当分享一些自己利用机器学习做的项目、发表的文章等等。

永远保持好奇心,活到老学到老,与时俱进,榨油!!!

你可能感兴趣的:(《100,Steps,to,Get,ML》—JET学习笔记,人工智能)