写在前面-生信小白的自述

Photo by Julia

一直以来都有学生信的念头,一方面它确实是一个较为前沿和交叉的学科,另一方面觉得它也是一项实用的技术。然而,一直都没有勇气狠下心来去学习,一方面是对编程的畏惧,另一方面也确实是自己的的懒惰。这种逻辑思维,也是我们很多向往却又不愿去争取的一种矛盾心理,就像我们一方面羡慕别人姣好的身材,另一方面却又懒得节食与运动一样。

生物信息学,显然一门与生物和计算机都有密切关系的交叉学科。一个接触了十几年生物知识的科研狗对生物部分倒不是那么惧怕,尽管分子生物学这类晦涩难懂的课程自己在上完课后很快还给老师,但至少还好捡起来,但信息部分,也就是计算机语言这块,相信是很多想学生信的生物专业学生们所畏惧的。那么就先聊一聊我与计算机的那些前世今生吧。

我与计算机的前世今生

最早接触计算机,还要源于高中。不像现在的小孩子一样,一两岁都有玩手机看电脑的意识了。那个时候,计算机还多被称为微机,高中有一门课程叫信息技术。印象中第一位信息技术老师姓侯,一个看似刚毕业的大学生,有些瘦小,可能看上去有些像学生,而且有着高考压力的我们对这种非高考科目本身的鄙视和不在意,他的课堂纪律都不太好,所以没人把这课程当回事。印象中大家都喜欢上机课,因为那个时候可以联网,很多人有了QQ号,男生们还可以借着这个机会玩游戏。而我在这时候,反而是头疼的,因为自己的零基础,除了开关机,打开电脑都是懵的。那时候老师教我们flash动画制作,音频剪辑,每次还要交作业。每次也只能求助于旁边的同学。这些都还好,最头疼的是,我们是新课改第一届,毕业要求修满144学分,而且高中毕业会考还要考信息技术上机。虽然考前老师带我们练习过几次,但自己心里还是没底。而这个时候呢,平时玩的嗨的男生们反而一点不担心,毕竟电脑莫得度啊,反而是班上的那些认真的女同学都担心了起来,其中包括我,同学们都在想着各种招数。考试的那天,坐在我旁边的隔壁班的男生,看他很快完成了题目,那会是真不会呀,想着求救人家,但又担心被老师逮住。后来他做完要提交的时候,看着一旁急的脸红脖子粗的我还给支了招,只是一会他就交卷走了。不过还是要感谢他这一招,那次会考,虽然信息技术只得了个C,但毕竟过了。班上有个学习很牛的女同学还挂了科,后来还专门去补考的。

所以,由于计算机启蒙的晚,自己天生对这玩意有一些抵触。高考后,也是我跟计算机的第一次亲密接触,在亲戚家度过了一个多月每日与计算机相伴的时光。从最开始的只会开关机,一个多月后打字速度突飞猛进,都是QQ的功劳呢。那会自己先注册了QQ号,进了QQ群,还注册了yahoo邮箱,也会在百度上下音乐,慢慢的发现了它的美妙与便利。也在入学前,进入了大学QQ群,一下子拓宽了自己的视野。

进入大学,计算机成为我们学习生活中重要的工具。大一规定还不允许带计算机,每到周末的时候,我们都会去学校的教育超市,呆上一个半天,男生沉迷于游戏,女生痴迷于电视剧。偶尔去晚了,还要排好久的队。那个时候还流行QQ空间踩一踩,上校内,后来又陆续的有了农场,养鱼,抢车位,小黑屋等游戏,那真是一代人的记忆啊。偶尔也会文艺的来一篇文章,期待朋友们的留言评论。每到选课的时候,教超一早都排起了长队,很多人不得不跳课排队选课。对了,那会图书馆也可以上网的,更便宜但是网速贼慢,多数情况下只有在做课程论文的时候才会去那里安心的码字。

进入大二,我们有了计算机课程,班里也陆续有人买起了电脑。因为日常学习需要,我也加入了买电脑一族。那会买个笔记本还是觉得有些奢侈,班级很多人配起了组装机,我也在班级同学的帮助下配了一台,印象中主机只要一千多,而显示器还是毕业季买的二手大头,好像只要一百块就拿下,还是班里的男生骑着电瓶车帮忙给拖回来的。对,就是那种很老式的那种带大屁股的台式机显示器,这就是我的第一台电脑。有了它的确方便了很多,也成为宿舍没有电脑的同学的福音。

大二,除了计算机基础,我们还接触到了一门VB的课程。一开始自己还是觉得有些怕,尤其是上机写各种代码有些艰难。但慢慢的发现了其中的规律,看到实现运算的那一刻觉得好神奇,也逐渐有了兴趣。记得VB上机课考试时,我提前完成了上机操作,考试得了99分,估计那一份是老师怕我骄傲吧。在后来的假期里,自己还私下学习,考取了计算机VB二级证书。至此,自己也不再是那个一无所知的小白了。

大四自己保了研,有了更多的时间去学习了解,由于将来做科研,看文献写文章绘图等都离不开电脑,因此临毕业前用自己的奖学金买下了第一部笔记本。还记得当时有个在京东做校代的学弟,于是找了他,其实自己对于电脑性能配置这块还是小白,至于装机啥的就更不用说了。从计算机品牌、配置到装机及必需软件的安装,这个师弟都给搞得妥妥的。记得那会师弟说给配了个性价比最高的笔记本,宏碁的,i5处理器(那时候i5刚推出不太久),当时还是安装的windows XP系统,买下来3999。不知是电脑的配置到位还是自己比较爱惜,这个笔记本在研究生期间没出现过任何问题,只是在毕业写论文阶段感觉用起来比较卡,让实验室的师兄给加了个内存条,然后换成了64为的win7操作系统。

毕业后工作的两年,因办公室有台式机,所以笔记本就放家里偶尔上个网,没有太大需求所以一直都没换。两年后回炉攻博,显然这个本子已经不够用了。入学前的那个暑假,老公说奖励自己一个新本子,让我选择。本来想入手mac的,去专卖店的时候说了自己的用途,人家竟然不推荐mac,说是担心需要的生物学软件没有相应版本安装。于是选择就锁定京东上买了,考虑到便携轻巧,最后选了现在在用的这台联想xiaoxin,五千多买的,具体价格记不清了,当时好像是开学季有活动。拿到机子的那刻,还是兴奋了许久,因为这个本子即轻巧又好看,打眼一看跟mac还有些许像呢。因为我走读,每天带来带去也十分方便。只是好景不长,这个本子用起来并没有那么的顺心如意。在刚入学的一个多月后,有一天本子就蓝屏了,办公室旁边正坐着实验室搞生信的师弟,他看了下说是硬盘出问题了,建议我去专业维修点看下。好在买没多久,去店里重新换了硬盘。只是换了硬盘之后,感觉机子比之前卡了很多。

本子也一直用到现在,简单的日常使用也还可以,但开多了软件就明显感觉出来力不从心,除了便携感觉这个本子性价比并没有那么高。最近开始了生信学习,显然在上面安装linux太吃力,所以我也只能从python和R看起,都先装windows练练手,待有眉目了再想办法吧。老公说如果我学的好,过段时间会奖励我一个mac。因为人在英国,不知道买mac是否划得来,走着看吧。

生信大门的开启

对生信的认识,最早还要源于大学。计算机课的时候,那会老师有提到交叉学科就点到过。但那个时候会觉得是一个有些高端又遥不可及的科目,也许一辈子都跟他无缘吧。研究生期间,接触了各种分子生物学软件,其实已经慢慢的在接近了生信,只是那个时候,二代测序刚刚兴起,转录组不是每个实验室都有钱测的,更谈不上基因组等花费更为大的项目上了,所以说白了还是没有需求。那时候认识一个师兄已经在生信领域小有建树,已经开起了自己的培训班,他是博士才开始自己入门的生信,但他本身很有想法很有钻研劲头,培训班夜班的如火如荼,很多国内高校研究生甚至是讲师都慕名而来学习。那会对他也只是羡慕和敬佩,自己还没有去学习的意识。

研究生毕业工作后的两年,我又重新步入了象牙塔。这个时候,随着测序技术的成熟和价格的降低,组学技术已经越来越普及。而我所在的实验室还有专门的人负责生物信息学分析,导师在组学分析上也有着自己的一套思路。这个时候,很显然,我发现了学习生信的必要性和迫切性,虽然有些晚,但我觉得一切都还来得及,而且身边还有已入门的过来人。博一我甚至还修了学院一个海归老师的生信课程,打算开启生信学习的大门。老师的课程还算精彩,但得知生信的所有分析都要基于linux这个全新的平台后,自己还是退缩了,毕竟接触一个新鲜事物需要花费大量的时间和精力。对于一个既要上课又要忙于实验的科研狗来说,再抽出时间学习真的好艰辛,况且是一个即将步入而立之年的还要顾家的大龄女青年来说更是奢侈。而且,实验室还有专门搞生信的同胞,也许那份依赖也让自己多了个偷懒的理由。也曾在寒假背着电脑带着资料要大干一场,最终也已系统没装完就告终。就这样,博一这年,自己也就纠结于要学不学的纠结中,加上课题的不顺让自己处于进退的困境中。原计划博一暑假去学习的课程也最终放弃,就这样再次与生信大门擦肩而过。

2017年,在博一到博二过渡的过程中,是自己近三十年来最黑暗的日子。对现状的不满,对自己的过高要求,让那段时间的自己一度陷入抑郁,也许曾以为自己不会走出,一辈子都暗无天日,还好后来及时止损,逐渐走出了阴霾。后来都常常在想,如果当时早点时间果断学起了生信,让自己忙碌,让自己有事可做,让自己多一个选择也不至于那么迷茫,陷入那样一个可怕的死循环。

然而逝去的时光总是不可追回,每一步走过的路都有它存在的理由。进入2018,我的生活又充满阳光,我对未来又有了新的期待,在这一年,我决定重启生信大门,这一次光明正大的走近它。

年初在微信上接触到了python这个新兴的语言,看到了它作为爬虫工具的有趣性,当即报了一个在线课程,决定寒假学习。然而这次还是有些失败,短暂的寒假基本上奔走于亲戚家和出国准备中。二月底来到英国,开始规划着自己这一年的安排。因为实验条件的原因,自己无法继续跟进实验,只能以处理手头数据、撰写文章和安排下一步实验为主,之外的时间学点新技术帮老公养一下细胞。

来这之前,自己在国内已经做了一些实验,手上已经拿到了转录组数据,因为实验室几乎人手一套转录组数据了,如果单凭实验室的一个师妹来分析确实很难,要排队好久。自己年前的数据师妹也已经给进行了前期的简单分析,需要后续进一步个性化的分析。这个时候自己会生信,如何从转录组中挖掘与生理生化契合的数据是多么的重要;这一年,如果做不了实验,学一门有用的技术也是一个不错的选择。

在这里,也有一个小插曲,让我更加坚定了尽快去开启生信大门。我们所在的研究室隔壁是一个Genomic Centre,有次在跟该centre一个华人聊天了解到,这边转录组学还是基于microarray在做,目前也是在尝试二代测序,但是相关的分析也都还在摸索中,急需要招一个懂生信的工作人员。一个可以挂牌Genomic centre的单位竟然还拿不出一个真正做生信的专家来也确实有些寒酸。测序成本的降低必然会进一步推动测序技术的推广,生信人员的需求也会日益增加。自己有需求,社会又需要,一直以来想学的想法为什么不去实现它?

在一次信息检索中,我有幸接触了北大生信专业的一个在读生信博士的知乎live课程,他的课程通俗易懂但又实用,他会用实例带我们一步步解决问题。听完第一讲,我就决定了要按他的思路来一步步学习,到现在也有差不多一个月的摸索,自己也慢慢有了思路,知道该看什么练什么,虽然需要大把的时间去阅读,去练习,去巩固,但有了方向,这些只是时间问题。

“凡是预则立,不预则废”。任何一个想法不能单纯的去想口号,需要有计划安排,并一步步去执行它。最近在上收获了很多正能量,有人坚持日更逐渐成为签约作者甚至即将出版新书;有人坚持学习语言,30岁后仍能够拿到国外进修留学的机会。而这每一个成功者的背后都离不开自律和坚持。

我曾经是一个自认为还算是自律和坚持的人,一路走来也算较为顺利的完成了一些重要的人生阶段。然而行政工作的那两年,真的让自己松懈了很多,虽然上班也是兢兢业业,年度考核优秀,得到了领导的赏识,但下班后大把的时光也曾沉浸在追剧游玩中。当决定重新走入象牙塔深造时,这种经历就变得可怕,我也知道17那一年的恐慌和迷茫跟这两年的消遣时光有很大的关系。既然决定回归,那必须拿出曾经的自律和坚持,再给自己一次拼搏的机会。“努力了,就不后悔”。

我的生信学习计划

如何做到自律和坚持?在我看来定期的计划和总结十分有必要,于是我给自己在上开辟了一片小天地:专门对自己生信的学习之路进行记录,一方面是学习笔记,留给自己也分享给他人;另一方面,也是为了监督自己,有些时候也许写下来的想法更容易实现吧。

不念过往,不畏将来,一切从当下开始。赶紧开始制定我的学习计划:

长期目标:希望通过近一年的学习,自己可以真正入门生信。具体为基于linux系统,通过python语言利用常用的软件对转录组数据进行前期的处理,然后利用R语言进行后续的统计分析和绘图。

任务分解:未达成上述目标,我需要掌握linux系统的基本操作,需要学习python语言和R语言。基于目前系统的考虑,我得先从python和R语言学起,待有一定基础后想办法搭建linux系统学习环境,开始进行简单的项目处理。

学习安排:

1.R语言:

课程(知乎live在线课程和B站录播课程)结合教材(R forBeginners),在windows系统下安装R和R Studio,基本熟悉R语言的规则,会简单常用的语句编写和程序应用,会画简单的heatmap,plot图等。预计用时2周(W17和W18),每周写总结1篇。

2.Python语言:

课程(微信有讲课程)结合教材(从零开始学python网络爬虫,编程小白的第1本python入门书),在windows系统下安装python和PyCharm,基本熟悉python语言的规范,会简单的网络爬虫。预计用时2周(W19和W20),每周写总结1篇。

3.Linux系统入门:

教材(鸟哥的私房菜)结合网络视频(Youtube),熟悉linux系统常用的命令并在windows下自带的bash下练习基本命令。待熟悉及硬件条件成熟后,安装linux系统,并基于此系统整合之前R和Python,下载转录组分析相关的软件,并熟悉其用法。预计用时3周,每周写总结1篇。

4.RNA-seq流程分析

结合之前学习的知乎课程(如何快速入门生物信息学)、本实验室发表的相关转录组文献及youtube相关视频,总结出适合自己的一套转录组分析流程及相关软件使用。预计用时1周,写总结1篇。

5.项目小试

下载当前设备可接受的一套数据进行练习,熟悉整个流程及软件的使用。

6.正式入门生信

结合前期学习,进行总结,争取回国后可用本实验室服务器进行项目分析。

备注:以上是自己暂定的学习思路及时间安排,具体以实际执行为准。

                                                                                                        2018.4.29凌晨 猪猪头于伦敦

你可能感兴趣的:(写在前面-生信小白的自述)