长风破浪会有时,直挂云帆济沧海——纪念2020,展望2021

引言

2020年是一个所有灾难片都快集齐的神奇年份。
开年之初的疫情,让所有人都为之震惊。
澳大利亚的和美国西部的大火不知道燃烧了多久。
非洲、中东地区的蝗灾,所幸没有殃及我国。
但是年中的洪水,让我们都回忆起了98年的险情。
我们喜爱,又陪伴我们青春的明星们,一个接一个离我们而去。
国际局势也纷繁复杂,英国脱欧、美国退群、局部冲突不断。
在今年即将结束的这几天的寒潮,像《后天》一样速冻了全国。

2020注定是不平凡的一年。借着CSDN年度征文的机会,梳理一下今年的所见所闻,所做所想。

1. 在CSDN上有什么进展吗?

就在2020年,我才真正顶着CSDN博客专家的头衔,进行创作,勉勉强强的粉丝破千,点赞破千,排名进入到5000名以内。而后,又跟随CSDN官方一起,成为了首页推荐官和内容合伙人。在年中时,也写过几篇自认为挺时髦的文章。不过下半年开启正常生活后,科研压力陡增,内容产出就少了许多,我希望在新的一年里能够多产出几篇干货,真正做到“传道授业解惑”。

2. 今年有什么有趣的AI进展?

今年受到疫情影响,似乎整个科研界都进展不是太顺利。可能精力都去研究如何解决这病毒了吧,还是希望早点攻克。不过,仍然有一些亮眼又有趣的小东西,我这里只举2个例子,一个学术界的,一个工业界的。

上半年受人关注的可能是在学术界出现的吞金模型“GPT-3”了。这个利用了45TB的训练文本,号称是花费了1200万美元的迄今为止最大的深度学习模型,让人惊呼“真正的AI已经到来?”。除了论文中展示的一些基本测试,例如:新词造句、语法纠错甚至是简单的数学计算,GPT-3在有限的开放后,也有其他的应用,比如自动构建神经网络代码、基于问题的搜索、与历史人物对话、自动生成前端布局等等,这些应用都特别有趣,可以去搜索看一看。

在刚开始的时候,GPT-3还可以申请试用,只要你有好的想法,你就可以给官方提交申请,审批后你就可以使用这个巨无霸了。如今,它打算商业化了,最低是100美元每月,200万字的用量。是否能够找到合适的应用场景,让我们拭目以待。

下半年我比较感兴趣的是工业界的小冰。7月13日,小冰正式脱离微软,独立运营。这是好事,也是坏事。微软一向以面向商业为主,所以做起事来总是有板有眼。而小冰比较偏向用户,无论是正经的金融领域的播报,还是我们喜爱的唱歌、绘画、写诗,都有人情味。脱离了微软的小冰,也许可以放开手脚去贴近我们大众。小冰从一个独立的少女,演化为目前的小冰框架,这是进步。

我试用过小冰的“X-studio歌手”这款小冰官方出品的人声合成唱歌软件,这是我曾经梦寐以求的产品。你可以使用小冰或者其他框架中的歌手来为你唱歌,在B站上也有很多其他up主创作的歌曲,和人类歌手创作的歌曲比较相似了。而且,你还不用花费很大功夫去调教,通过模型预测,它能够找到最合适的唱法。

但是,这也揭开了小冰的神秘面纱。曾经在微软内部,我特地提问过这个问题,小冰的歌声,究竟有多少人工,有多少智能?回答者也没有给出准确答案。在这款程序上,我能看到,应该是小冰的模型训练好以后,仍然可以人工进行一些微调,包括换气声音,节奏把握等等。

哦,对了,忘记了,最近的AlphaFold在蛋白质分子折叠问题上的进展,据说可以是第一个获得诺贝尔奖的AI应用,至于是真是假,让我们30年后再看吧。

3. 自身学术上有什么进展吗?

经过与导师、师弟师妹们的一起努力,一年下来也有几篇论文的产出,这一年也没有白白浪费。尤其是上半年的时间停滞,让我对于学术论文的撰写也有了一定的想法,相信以后可以写出更好的文章。

暑假里带领师弟们第一次参加了比赛,只拿到了排名12的成绩(前7有奖)。这也是我第一次参加相关比赛,经验不足。这里介绍一下打比赛的套路。首先,应该在开始时,就要全身心投入,快速迭代,让自己的模型先进起来,因为此时迭代成本低,效果很快就能看的见。不然,后期再进行大的改动,成本上根本吃不消。其次,能线下一起工作,不要搞离线合作。常常利用头脑风暴,新的想法很快就能够迸发,俗话说,三个臭皮匠赛过诸葛亮,更何况我们都不仅仅是臭皮匠的水平。

为我们课题组搭建了Confluence平台,虽然需要经常维护,但是也锻炼了我对于Linux系统的管理能力与认识深度,明年就把平台托付给师弟了。

为我们课题组搭建了校园网内的云盘系统,在校内可以很方便的传输我们自己的文件,下载速度也贼快。(校内也有公开的云盘系统,不过只给教职工使用)

4. 今年阅读了哪些书?

书籍是人类进步的阶梯。今年年初,购买了28本书,书单如下。通过自我评估的阅读,大概读了10本左右。1年能够认真读完10本课外书籍,我认为对于自身思想、人生的成长,是非常有意义的。

那些大佬们,之所以一年可以读几百本书,是因为书中的内容,他大多都知道了解。书中所讲的知识、道理,他都已经掌握。他所要去看的,一方面是查漏补缺,发现自己遗漏的想法;另一方面,是去了解时代发展趋势。

人工智能类(9本)

量子计算机 (已读)
人工智能 (已读)
人工智能简史 (已读)
信息简史 (已读)
计算机科学中的数学
程序员的数学(1,2,3)
统计之美

这部分书籍都是一些人工智能相关的知识型书籍,书里不会涉及编程代码,但是会有计算机科学的思想、人工智能的思想、编程的思想在内,读一读可以开拓眼界。

编程技术类(6本)

Python深度学习实践
面向机器学习的自然语言标注(已读)
强化学习
图解深度学习
图解机器学习
知识图谱

这部分主要是关于代码层面的,今年主要补一补基础的机器学习、深度学习的知识,并简要的看一看其他的研究方向,如强化学习和知识图谱等领域。基础打牢,才能够走得更远。而且,温故而知新,多看看之前的知识,还是挺有收获的。

语言学(6本)

汉语语篇分层表示体系构建与韵律接口研究
汉语语篇语法
语篇语义框架研究
汉语功能篇章语法
新编语篇的衔接与连贯(已读)
英语学术论文写作(已读)

以上书里的内容主要讲述了如何进行写作,即如何进行谋篇布局,遣词造句。用术语的话,我想“修辞”二字可以比较契合:修辞是可以在使用语言的过程中,利用多种语言手段以收到尽可能好的表达效果的一种语言活动。虽说是我的研究方向,但是也指导我的实际写作过程。这些本是教授给机器用来学习的知识,机器学的不到位,但是我们人可以学的非常完美。这使得我在写作时,思路更加的清楚,行文更加成熟,如果写作上有些困难,可以考虑看看这些书籍。值得注意的是,正如我之前所讲的,这里讲的都是文章的“形”这一部分,只掌握这些并不能很好的完成一篇文章,还有另外一部分,即文章的“神韵”。

科普读物(7本)

新未来简史 (已读)
物理学的未来
心灵的未来
达尔文的黑匣子
为什么(已读)
全球科技通史(已读)
亲密关系(已读)

这部分就比较复杂了,有关于未来的(新未来简史),有关于现在的(全球科技通史),也有关于过去、现在和未来关系的(为什么),其他的例如物理的(物理学的未来),心理学(心理学的未来)以及生物的(达尔文的黑匣子)都是我比较喜欢的话题。至于“亲密关系”,强烈建议对于如何与人相处,与亲密的人相处有困惑的人看一看,很有启发。

5. 今年印象深刻的纪录片是哪些?

今年所看的印象最深的2套纪录片:《行星》和《蓝色星球:第二季》。这两套纪录片都是BBC出品的,其内容还是十分精彩的。

《行星》讲述的是我们抬头仰望的星空,在我们太阳系内部,重要的行星们。尽管内容还是我熟知的内容,但是其叙述风格,以及令人心驰神往的星空,让我每次观看,都陶醉不已。而《蓝色星球》则讲述的是我们低头凝视的大海,在我们地球上,深蓝色的海洋里,各种各样的生物及其他们的故事。我仍然有印象的,是“阿氏偕老同穴海绵”,有兴趣的同学可以进一步了解。

6. 对明年有哪些愿望?

正所谓否极泰来。首先希望疫情可以过去,家人都健健康康。然后再希望自己学有所成吧,对自己的未来能够更清楚一些。另外,还是希望自己能够在新的一年里,能够学会一门新的技能,文的也好,武的也罢,能够让自己的生活更加丰富多彩一些。

7. 还有什么其他要说的?

今年是有史以来呆家里最长的假期,前前后后,大约4个月。套用李云龙的话,那就是“我上学以来,从来没有放过那么富裕的假期”。它让我有足够的时间,陪伴了家人。这也让我有足够的时间,停下来思考自己的人生。这是非常难得的机会,似乎实现了我们从小的愿望,时间停止。慢下来的生活让我们对于自己、他人和世界有时间思考、感悟。再重新出发之时,就会俨然不同。

还有,体重保持在了年初水平,这对于我来说,难能可贵。这也多亏了日常的锻炼,包括跑步、篮球、跳舞、跳绳、广播操以及我在Keep上花费的几十块钱。

8. 总结

2020年,是我过的最认真的一年,其所见所闻最多,对我内心也最为震撼,可以说,成长了不少,甚至完成了一次蜕变。如果说上一次像今年一样对我来说,意义重大的话,那应该是2012年吧,那也是一个传说中的年份。

最后,我非常感激一个非常重要的人,她告诉我的话,我至今仍记得清清楚楚。
她说:“你是我见过的,很少能够如此认真生活的人。”
话虽短,但是其含义深远。“认真生活”4个字,内涵太多,我一时也讲不清,但是我能够理解到她想表达的意思。没错,我一直在践行的,就是“认真生活”4个字。希望2020年对她来讲,也是一个意义重大的年份吧。

最后我想说:
2020,多多保重;2021,我们来了!

你可能感兴趣的:(#,人工智能畅想,人工智能,自然语言处理,csdn,回顾2020,展望2021)