吹了十几年的生物云计算,为何还在原地踏步?

十年前Cloud Computing火爆的时候,大家自然而然开始了想站在生物云计算的风口,可是没起风,猪肉去涨价了。生物云计算究竟是遗失的美好,还是雾里看花,水中望月;究竟是出身未捷身先死,还是怀才不遇,壮志未酬。

生物云计算,看上去很美

首先,我们得定义什么是生物云计算?按照字面定义,目的就是做生物的计算,主要包括各种生物序列的分析工作,加上云,就是能够在云端处理。其实和其他云计算也没太大的不同。这是非常好的想法,后面在结合上5G技术,就更好了。比如在野外利用纳米孔测序仪进行测序,数据实时传输到云端开始处理,然后结果返回结果。通过各种终端都可以直接查看结果,看起来非常完美是不是。

然而现实情况是,这些年很多公司推出的生物云计算,大方向都是在炒概念,生物大数据,生物云计算,5G,物联网,人工智能,精准医学……都是当前时髦的热词,如果不带几个这样的词儿,都不好意思和别人打招呼。但是当街头老大妈都准备入市赚钱的时候,也就说明股市泡沫要来了。

硅谷有一个臭名昭著的技术成熟度曲线,也叫做技术循环曲线,或者直接叫做炒作周期,是指新技术、新概念在媒体上曝光度随时间的变化曲线。是指经过新闻媒体和学术会议的大肆宣传之后,新技术趋势一下子跌倒了谷底。生物云计算就是这样的一个例子。

生物云计算的乌托邦之梦

云计算其实是一种非常好的解决方案。然而目前为何还没有完全普及,虽然市面上有很多产品,有些做的确实也还可以,但依然不是主流。

很多公司的产品是想做成傻瓜式的操作,有一个图形化界面,用户购买之后,登录账户,然后上传数据,选择要分析的流程,点击运行,然后等待结果就行,用户体验非常好是不是,你甚至不需要任何生物信息经验就可以了。

(图片引自知乎:https://zhuanlan.zhihu.com/p/25504362)

利用这段时间,去楼下点上一杯咖啡,晒晒太阳,伸个懒腰,刷刷手机,然后回来等待结果就行了,生活真美好……

甚至还有很多人预言,已经不需要做生物信息的人了,这些工作会像精算师一样逐渐被生物云计算以及人工智能所取代,这个我不肯定也不否定。

梦醒时分

喝完咖啡回来,查看一下结果。“wow,fxxx”,出错了,到底哪里有问题呢?这就是当前生物云计算的问题所在。将所有分析封装起来,如果中间环节有问题,就比较麻烦。

举个简单的例子,例如做人全基因组的变异检测。从拿到原始测序数据,到最终得到可靠的结果,中间可能需要10几个处理过程。这些过程都是承上启下的,有一个过程有问题,整个流程就断掉。如果断掉在查找原因,重新从这里开始,这反而更加繁琐。

其次,像这种非常标准化的分析过程,采用目前的云计算是没有问题的。但如果是做科学研究。科学研究本身就是一个反复探索的过程,需要反复测试,不断调参,使用这种图形化反而更加复杂。

第三:所有图形化本质上只不过是给命令行添加上一个按钮,本质上内容都是一样的,根本不存在不懂生物信息也能使用的情况,如果不懂的话那些参数就只能按照默认的来处理了。

(图片引自知乎:https://zhuanlan.zhihu.com/p/25504362)

回到未来

由于当前的生物云计算现实情况,就会造成一种现象:懂分析的人不喜欢图形界面,不懂分析的人有了图形界面也还是不会用。我并不是一棒子打死各种生物云计算,每个用户的具体需求不同,具体分析内容也不同,有些分析云计算非常方便。相反,我觉得需要生物云计算,甚至我们自己也运营生物云计算平台,只不过不是图形化界面,需要用户自己熟悉敲命令。

其实云计算有诸多的优势:

首先,方便数据管理,也就是同一份文件不需要进行多个拷贝,测序完成之后直接上传到云服务器,用户可以在任何地点联网访问。

第二,软件和数据库也无需进行多个拷贝,并且可以第一时间进行更新,省去很多麻烦,例如,只需要在云端下载一份nt数据库,所有的用户都可以与之进行比对,而不需要下载很多份。

第三,云计算可以进行弹性计算,也就是资源可以充分利用,需要多大资源,就提供多大资源,不会像本地资源存在计算资源不足的情况。

第四,云计算不需要很多的配置以及系统维护。

你可能感兴趣的:(吹了十几年的生物云计算,为何还在原地踏步?)