学生信的那些事儿之二 - (小白)怎么学生信

只有当一个人对自己失去信心的那一刻,他才是真的过时了。——《飞驰人生》

什么是生物信息学

生物信息学(Bioinformatics)是研究生物信息的采集、处理、存储、传播,分析和解释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计算机科学相结合形成的一门新学科。它通过综合利用生物学,计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。<来自百度百科>

简单点说,生物信息学就是综合利用统计学,计算机科学和信息技术对生物学数据进行分析研究,揭示生物数据中隐藏奥秘的一门学科。

毫无生信背景的人适合做生信么

什么专业背景的人适合做生物信息分析这一行?根据上面的定义其实不难发现,一个生信人需要具备统计学,计算机科学和信息科学方面的知识储备,不过个人认为每一个意欲投身生信行业的的人需要明确的一点是:这些知识和技能很重要,但是在生信工程师的整个知识体系中,这部分不是最重要的(不是不重要,只是非最重要),这些都是工具,提升我们处理生物数据的效率,挖掘数据隐含信息的高效工具,注意是工具!有了这些工具我们可以短时间内高效处理海量数据,某种程度上大大加快科研的进程。就像小时候收小麦还是人工用镰刀在炎炎烈日下不停挥舞,一季农忙可能得持续半月有余,而现在随着联合收割机一顿猛如虎的操作,一个上午大几十亩地就轻轻松松搞定,甚至都没有了农忙时节的气氛,因为实在太快了。

显而易见,工具面对的对象就是最重要的了,也就是系统的生物学知识。这方面知识储备的构建真难说一朝一夕就能完成,纯计算机背景出身的人,你花很长时间可能也无法跟他解释清楚什么是中心法则,什么叫Chip-seq, 或者染色体之类。只有具备了系统的生物学知识,我们才能去阅读相关文献,理解作者的研究目的,实验方案设计和idea创新,也才能知道怎样更好地去使用其他工具。

丝毫没有贬低计算机科学的意思,但是没办法,谁让这是生物学的主场呢。你可以在市面上的培训机构花三四个月的时间参加密集的计算机技能课程培训,结业后就可以去一家互联网公司写代码(我有不少同学就是这么干的,现在开开心心做码农,毕竟一入生(物)门深似海···)。但是我不敢说给一个人同样的时间,他可以把生物学知识也掌握的那么好。(此处讨论是不涉及大牛和天才的,毕竟那样的存在没办法讨论啊)

综上,个人认为有一定生物学背景的人适合考虑做生物信息分析这一行。而大家经常说的"小白"可不可以做,我觉得这个"小白"是有限定条件的,那就是他只是计算机知识的小白,如果这两方面都白的晃眼,要么你现在年龄尚浅 (比如刚上大学),要么你属于那种不在此文讨论范围内的天才,可以一目十行,且过目不忘。

怎么开始,怎么学

大概两个月前决定自学生信(市场上有一些不错的培训班,但是工作原因,目前还无法完全脱产专心投入,不久以后还是会去的),还参加了知名某树的三天线下培训。开课之前虽然讲师已经提前布置了一些"作业",比如提前看看马哥的Linux教学视频,看看他们已经在一些视频网站发布的免费入门视频,看是真的看了,但是讲真,参加培训的时候还是很快陷入一脸懵逼的状态,感觉经常跟不上老师的节奏(可能是我天资愚钝)。分析了下主要原因:

  • 老师使用的命令看不懂 (包括跟命令配合使用的一些参数)

  • 课后练习时发现,有时候即便复制老师命令也无法运行 (这个就要提到活学活用了,报错可能是自己的系统跟老师的设置不一样,或者有些软件没有安装)

  • 想去解决问题的时候发现不知道从哪里入手

后来反思了一下出现这些问题的原因。首先,对于培训来说毕竟时间有限,老师上课前其实是基本默认Linux的基本命令学员已经了解的七七八八了 (然而很多时候并不是,大部分时候学生都比较懒的···)。其次,对于个人准备以及后续练习来说,Linux系统和基本命令知识的匮乏很要命,个人感觉如果没有起码从头到尾看完一本入门书,在面对实际问题的时候可能寸步难行,因为几乎每个命令都得去查一下,或者面对报错根本不知道为什么报错,该通过什么途径去解决报错。

这个时候就很地带高人出现,指点一二,告诉我学生信入门的步骤,第一步做什么,第二步做什么···,然后按照指导路线执行和勤加练习就行。尴尬就尴尬在胸中憋着一股劲儿,不知道从何开始,使向哪里。作为在痛苦的海洋里扑腾过几下的小白,有几点经验分享下,希望对一些人有一点点的借鉴:

  1. 开始跑那些很炫酷的组学流程之前,郑重建议看几本Linux的入门书籍,推荐《鸟哥的Linux私房菜》,《Linux命令行与shell脚本编程大全》,还有相关的视频,比如马哥的Linux视频教程。后续还需要读一读生物统计学的教材,生物信息学的教材,肯定有帮助的。

  2. 网络上免费的组学分析的视频教学建议可以看,也可以先不看。如果越过第一步直接来第二步,极大概率你完全听不懂,甚至会打击你小小的自信心,但是请记录下自己不懂的地方,然后去看Linux入门书和视频,然后再回来看,一定会有豁然开朗的感觉!

    如果不看,也就是先看Linux入门书然后再来看组学视频,估计你能跟上讲师的思路,但是可能就没有那种由不懂到懂得快感了。

  3. 遇到问题先自己尝试解决是一种美德 - 善用搜索技能。就像重启电脑或者手机可以解决绝大部分问题一样,遇到生信运行报错的问题,在网上搜索一般来说可以解决你99%的问题,太阳底下没有新鲜事,你想象不到有多少人前仆后继的踩过你现在踩得坑,也想象不到有多少乐于分享的前辈写了非常棒的解决问题的教程。搜狗微信搜索,百度搜索,谷歌搜索等等,善用搜索关键字。要有探索欲,寻根究源的意识,中文的教程不满意就去看英文原版的manual,总有一款适合你。

  4. 始终目标明确。学生信是为了给自己的项目锦上添花,加速自己的科研进程?还是想把生信作为自己的职业,给更多的人分享,让更多的人受益?不同的目标,学习过程中的侧重点是不一样的。

  5. 分享。其实上面的条条所谓的"经验",很多前辈都已经谆谆教诲很多次了,我再说一次有没有意义?对我当然有,毕竟教学相长不是一句空话,我花几个小时的时间写这一篇文章就让我回顾了自己近两个月在生信自学道路上走过的沟沟坎坎。每一次的分享都是梳理自己的思路和总结的机会,不求突飞猛进,日拱一卒也值得欣喜。对其他人,可能会有,也可能不会有,缘分的事,就随缘吧。

其他的碎碎念

除却上面的,还想唠叨几句。就是关于学习这件事,不管是一门学问还是一项技能,学要多久呢?这个很难说,毕竟人和人都不一样。但是很多东西还是可以预测的,或者说是有统计意义的 (生统来了)。比如张三和李四学同时开始生信,可能张三花了4个月入门,李四却用了5个月或者半年,这个差异可以说是不显著的,基本可以忽略。而且一般来说两者的差距不会到一年两年,正态分布的原理在这里也会适用。生物信息学不是那么简单的一门学问,是很严肃的,所以整天想着可以一个月速成,半年摇身一变圈内独立潮头的大牛,这个就很不严肃了。凭什么呢,对吧?那么多优秀的前辈持续学习精进了四五年都依然谦虚好学,不敢懈怠,才有今天的成绩。

所以,整个过程中心态也很重要。遇到困难挫折是太正常不过了,在一开始就应该做好打持久战的心理准备,然后步步为营,日日精进。

习大大说:伟大的事业之所以伟大,不仅因为这种事也是正义的、宏大的,而且因为这种事也不是一帆风顺的。伟大的人物之所以伟大,不仅因为这样的人物为人民、为民族、为人类建立了丰功伟绩,而且因为这样的人物在艰苦磨砺中铸就了坚强的意志和高尚的人格。

貌似一下子到了社会主义价值观的高度···

Anyway, 一起快乐学生信!


作为初学者,很多分享肯定不成熟,甚至有错误的成分,热烈欢迎所有人的所有建议和指正。

你可能感兴趣的:(学生信的那些事儿之二 - (小白)怎么学生信)