生物信息学软件:两种风格

生物信息学目前有两种极为不同的手段:一种是基于网络的工具,另一种是基于命令行的工具。基于网络的工具有时也被称为“点击工具”,使用这些工具并不需要具备编程知识,可以直接上手使用。

基于网络的或图形用户界面(GUI)

  • 中心资源:NCBI,EBI, DDBJ。

  • 基因组浏览器:NCBI, UCSC, Ensembl。

  • GUI软件:MEGA, Rstudio, BioMart, IGV。

生物信息学领域非常依赖于互联网来获取序列数据、获取用以分析分子数据的软件、以及整合生物学相关的各种资源和信息。

命令行(通常是Linux系统)

  • 数据分析软件:序列、蛋白质、基因组。

  • 编程语言:Python, R, Perl

  • 二代/三代测序数据分析工具

基于命令行的工具的学习过程具有较为陡峭的学习曲线,但差不多总是可以为执行程序提供更多选择。它们更适用于分析目前生物信息学中常见的大规模数据集。由于使用者可以将命令行工具的每个分析步骤都记录下,即使是对于较小的数据集 ,命令行工具也可以让使用者更灵活更精准地完成任务,并更容易进行可重复研究。

命令行软件有如下特点:

  • 操作系统通常是 Linux (一种与 Unix 相似的运行环境)。MAC 操作系统也与 Linux 系统相当。尽管 Windows 操作系统很流行,却不适用于大多数命令行程序。现在 Windows 系统支持内置 Linux,即 WSL (Windows下的Linux子系统),能够运行一些轻量级的 Linux 软件,如 Python,R 脚本。 参考我之前写的一篇文章:强烈推荐Windows平台下生信环境搭配:Windows Terminal + WSL

  • 编程语言在生物信息学中被广泛使用,例如使用 Python 和 R 处理各种数据。学习这些语言很重要,因为这对于能够编写程序脚本并完成一系列任务极其有用。R 语言有较陡峭的学习曲线,但不熟悉也可以使用一些R包,如 Bioconductor 社区的,可以把它们当作软件来使用。

  • Unix系统的命令行提供了 Shell,Linux 许多发行版和 Mac OS X 操作系统默认的 Shell 是 Bash。Bash有一系列用途,可以完成诸如对数据表进行排序、统计行或列的数量、合并数据、或使用正则表达式等任务。我之前写过一篇介绍生物信息学入门 Linux 的文章,很受欢迎,在这里推荐给大家:生信人的自我修养:Linux 命令速查手册。针对有些人会忽视对 Linux 的学习,我也写过一篇科普文章,介绍生信人为什么要学习 Linux:科普任重而道远:生物信息为什么要学 Linux?

生信应该选用哪种操作系统?

  • Linux 对于许多生物信息学专家来说是必要的,因为他们往往需要应用具有大内存 RAM 的 Linux 系统来处理非常大的数据集(例如 TB 级别的数据)。

  • 对于新手来说,Mac OS 相对容易上手,因为它提供了一个类似 Unix 的终端。

  • Windows 系统的话,桌面端软件在 Windows 下有比较好的用户体验,如 Rstudio。但是 Windows 下的命令行工具,不管是安装 WSL,还是 Cygwin,都具有一定的难度,对新手极不友好。

整合两种风格

许多生物信息学资源可用于弥合基于网络的软件与命令行软件这两种不同的风格。其中 Galaxy 生信云(UseGalaxy.CN)就是非常好的例子。在 Galaxy,许多基于 Linux 环境的命令行软件都被打包成了网页工具,并且整合成了一键式的分析流程,如 RNA-seq 定量:云上生信,未来已来 | 转录组标准分析流程重磅上线!

Galaxy平台让新手也能进行生信分析,研究人员无需学习复杂的编程技术,从而节省大量宝贵时间用于科学问题的探索。如何实现这一点?

专业的事让专家做。Galaxy 是一个社区驱动的国际合作项目,有来自于全世界的生信专家、计算机专家把所有脏活累活干了。用户只需要明确自己的分析需求,就可以在平台完成以往需要生信专家才能胜任的工作。也就是说,Galaxy 就是你身边的生信专家。

快速入门 Galaxy:新年第一课:从零开始入门Galaxy生信云平台

利用 Galaxy 进行可重复性研究:生物信息学中的可重复性研究

关于简说基因

  • 生信平台

    Galaxy中国(UseGalaxy.cn)致力于打造中国人的云上生物信息基础设施。大量在线工具免费使用。无需安装,用完即走。活跃的用户社区,随时交流使用心得。

  • 生信培训

    简说基因的生信培训班,荣获学员的一致好评。如果你也对生物信息学感兴趣,欢迎来跟简说基因,学真生信

  • 生信分析

    我们能够承接所有 NGS 组学数据分析业务,包括但不限于 WGS / WES / RNA-seq 等。基因组组装、注释,以及各种重测序业务都可以与简说基因合作。

生物信息学软件:两种风格_第1张图片

你可能感兴趣的:(生物信息学软件:两种风格)