多源异构作物组学数据融合方法研究——以高粱为例

摘要

【目的】作物组学研究是农业作物科学发展的未来研究趋势,在数据密集型科学研究背景下,作物组学数据存在数据量大、来源多、结构复杂的特点,对多源异构作物组学数据的融合有利于优质作物种质资源的挖掘,助力农业科技发展。【方法】运用文献调查和网络数据收集法,对当前作物组学数据的分布和数据组织结构进行了分析,得出了多组学数据资源的主要特征;以高粱为例通过语义分析和文献查询方法,优化设计得到新的高粱多组学数据标准元数据,并开发脚本实现了不同数据库元数据到标准元数据的映射和转换,基于元数据实现了对多源数据的融合;通过整合mapping、变异分析、DEG计算等多种生物信息学方法,实现了对异构组学数据的融合。【结果】形成了高粱多源异构组学数据融合方法,能够实现对NCBI、EMBL、PlantGDB、国家农业科学数据中心等数据库中基因组、转录组、代谢组、表型组数据的融合。【局限】需进行数据源、标准元数据的针对性开发,以满足在其它作物中推广的实际需求。【结论】本文基于元数据和生物信息学方法,开发得到了作物多源异构组学数据的融合方法,具有普适性,可在其它作物品种中推广应用。

关键词: 组学数据; 多源异构; 数据融合; 高粱

引言

作物生命科学研究是我国农业科技可持续发展的强大支撑

你可能感兴趣的:(网络通信安全及科学技术专栏,大数据)