MATLAB中COBRA插件的学习(一)输入文件的格式

来自官网教程翻译Input and output of reconstructions and models — The COBRA Toolbox (opencobra.github.io)

MATLAB中COBRA插件的学习(一)输入文件的格式_第1张图片

MATLAB中COBRA插件的学习(一)输入文件的格式_第2张图片

可用的输入格式


COBRA 工具箱支持使用多种格式的模型,包括:

  • MAT 文件格式
  • 系统生物学标记语言 (SBML) 格式
  • SimPheny 格式
  • Excel 格式

最常用的模型格式是 MAT 文件 (.mat) 格式,其中一个简单的 MATLAB 结构包含一个或多个在 COBRA 工具箱文档中定义的字段。

MAT 文件格式
MAT 文件格式的模型需要遵循 COBRA 工具箱文档中定义的规则。
SBML 格式
COBRA Toolbox 当前支持 SBML Level 3 第 1 版(定义见此处)的模型格式,并支持旧版本的 SBML。它还支持 3 级通量平衡约束 (FBC) 包(版本 1 和版本 2)。
COBRA 工具箱将使用提供的 SB​​ML ID 作为模型结构的各个元素的 ID,并使用名称字段作为名称。假设(但不是必需的)代谢物 ID 以“M_”开头,反应 ID 以“R_”开头,基因 ID 以“G_”开头,隔室 ID 以“C_”开头。这是由于 SBML 中标识符的限制,如果这些起始序列始终存在于模型中,它们将被删除。
MAT 文件格式的代谢物 ID 使用代谢物标识符,后跟方括号中的隔室标识符(例如 ala_L[c])。由于括号是 SBML ID 的非法字符,COBRA 工具箱假设,对于所有非边界物种,前有下划线的隔间标识符(例如 SBML ID:M_ala_L_c)等价于 MAT 文件隔间标识符并转换为模型这样的。
COBRA 工具箱对 Schellenberger 等人,Nature Protocols,2011 中定义的 NOTE 字段具有传统支持,但建议尽可能使用注释。通常,如果存在 fbc-package 字段和 NOTES 字段,则将使用 fbc-package 值(例如,CHARGE 用于代谢物,或 GENE_ASSOCIATION 用于反应)。这同样适用于注释,即如果有 EC 编号的注释,注释字段 EC 编号将被忽略。但是,SBML 级别 2 中的费用字段将被备注字段定义覆盖。

SimPheny 格式
SimPheny 模型以 3 或 4 个文件提供(如果提供 GPR 规则,则为 4 个)。模型标识符将按照 SimPheny 文件中的说明使用。
Excel 格式
如果文件符合 COBRA 工具箱文档中列出的规范,则 COBRA 工具箱接受 excel 文件格式的模型。

可用的输出格式


COBRA 工具箱还允许存储多种文件类型,如下所述。
MAT 文件格式
MAT 文件 (.mat) 格式是最常用的。 MAT 文件格式组成是一个简单的 MATLAB 结构,其中包含在 COBRA 工具箱文档中定义的一个或多个字段。即使对于 The COBRA Toolbox 不支持的模型特定字段,它也具有无损数据存储的优势。
SBML 格式
SBML 是一种常用的存储生物模型的格式。 COBRA 工具箱允许使用 SBML Level 3 Version 1 生成模型,并使用 FBC 包扩展来编码基于约束的属性。这是推荐发布的格式,因为它可以被许多不同的工具使用,并允许最好地使用模型。
Excel 格式
从历史上看,模型经常使用 Excel 文件交换,今天仍在使用。一些用户更喜欢使用 Excel 对模型进行概览。 COBRA Toolbox 提供了 COBRA Toolbox 文档中描述的格式的 Excel 导出。

文本格式
最后,COBRA 工具箱提供了一个简单的文本导出,它本质上是一个制表符分隔的文件,其中包含反应及其反应公式以及相关的 GPR,但没有进一步的信息。 此格式仅使用必填字段,将忽略任何可选字段。

你可能感兴趣的:(cobra学习,matlab,学习,开发语言)