PDBx/mmCIF 文件格式(三)

PDB-101: Learn: Guide to Understanding PDB Data: Missing Coordinates and Biological Assemblies (rcsb.org)

Missing Coordinates and Biological Assemblies

由于结构确定方法的特点,大多数条目不包括已识别分子中每个原子的坐标。在某些情况下,实验方法可能无法观察到某些原子。例如,在 X 射线晶体学实验中没有观察到柔性区域和氢原子,因此不包含在 PDB 坐标文件中。在其他情况下,只有一部分分子可能包含在 PDB 条目中。例如,在对称分子的 X 射线晶体结构中,PDB 条目通常仅包含复合物的一个亚基,并且需要根据亚基坐标计算完整生物组装的坐标。搜索 PDB 档案时,重要的是要考虑结构的哪些部分包含在每个特定条目中。
下面描述了您可能遇到的一些常见情况。

Asymmetric and Biological Assemblies

在用于 X 射线晶体学的晶体中,蛋白质和/或核酸的多个拷贝对称地堆叠在一个阵列中。通常,该数组的最小唯一部分的结构(称为非对称单元,asymmetric unit)存放在 PDB 档案中。根据晶体中的对称性,不对称单元可以具有一个或多个拷贝的蛋白质和/或核酸。
分子的生物学相关组装可能与 PDB 条目中包含的不对称单元结构完全不同。对于充当四聚体的血红蛋白,不对称单元在一些 PDB 条目中仅包括 2 条链(功能性四聚体的一半),在其他条目中包括 8 条或更多链(代表几个功能性四聚体)。二十面体病毒是另一个常见的例子:通常只存放一条链,因此需要生成衣壳中所有 60 条链的坐标。如果您想自己进行计算,条目文件中提供了生成或选择生物组装链所需的对称操作,或者您可以从档案中下载生物组装的坐标。
For a detailed tutorial on biological assemblies, click here.

Alpha-Carbon Coordinate Files

在某些情况下,实验只产生蛋白质的低分辨率图像,例如来自电子显微镜或 X 射线晶体学的结构,其晶体排列不整齐。在这些情况下,实验数据不足以解析每个原子,研究人员可能会选择仅包含蛋白质中每个氨基酸的单个坐标。大多数情况下,包括α-碳位置的位置。这些结构显示了蛋白质链的折叠。

提示:如果您尝试显示 PDB 条目的线框图并得到一个空白屏幕或只是一堆小点,您可能正在查看一个只有 α-碳的结构。线框图通常会在这些文件中出现空白,因为 α-碳位置相距太远而无法显示键。相反,尝试使用带状图或粗骨架管来显示分子。如果您的分子图形程序允许使用那么大的球体,则具有人工大球体(半径 5 埃)的空间填充图也可以很好地工作。

Missing Loops and Tails

由于 X 射线晶体学依赖于获得具有许多完全相同位置的蛋白质的晶体,因此柔性蛋白质会引起问题。在 X 射线结构中通常不会观察到蛋白质中移动的区域,因此这些区域的坐标不包含在 PDB 条目中。您会将这些视为链中的断点,并且通常是链开头和结尾处的缺失部分。源自 NMR 的结构通常不存在此问题。 NMR 结构的集合通常包括几种非常不同的柔性区域构象,因此您可以选择一种或全部使用它们。
不幸的是,除了为缺失部分建模坐标外,没有简单的解决方案来解决这个问题 (see the list of links for molecular modeling programs)。 这个问题可能很重要,因为柔性环通常涉及蛋白质的活性位点或结合位点。

提示:搜索包括配体或结合配偶体的其他结构通常很有用。在这些情况下,环可能以稳定的构象围绕配体闭合,因此将在晶体学实验中看到。

Fragments and Domains

许多大型蛋白质,尤其是具有几个可移动部分的蛋白质,已被证明不可能作为一个整体结晶。在这些情况下,研究人员采取了分段方法。他们将蛋白质切成易于处理的小块,然后解析出每一块的结构。为了获得整个蛋白质的图片,必须以正确的方向重新组装这些片段。
不幸的是,在这些情况下,没有综合资源可以帮助您拼凑功能分子。您将需要查看序列数据以及分子生物学报告来整理整体形式。
提示:在搜索 PDB 条目时,请务必注意每个坐标文件中实际包含的内容。注意 PDB 标题中的“配体结合域”和“片段”等词,它提示您正在查看功能分子的一部分。

Where are the Hydrogen Atoms?

大多数晶体学实验不解析氢原子,因此 PDB 档案中的大多数晶体坐标文件仅包含非氢原子的位置。在某些情况下,在结构细化过程中使用极性氢原子(极性氢原子是那些与氮、氧和硫相连的原子,它们可以参与氢键)。另一方面,NMR 确定的结构通常包括结构中的所有氢原子,因为在这些实验中获得的大部分实验信息包括这些氢原子之间的距离。
由于晶体学实验通常看不到氢原子,并且由于氧原子和氮原子具有相似数量的电子,因此在晶体学电子密度图中看起来相似,因此通常难以确定侧链中原子的确切身份,例如天冬酰胺和谷氨酰胺。在某些情况下,如果您仔细观察与相邻氨基酸的氢键模式,您可能会通过转换酰胺侧链中的氮和氧来找到更好的匹配。
提示:Reduce 程序可用于添加蛋白质和核酸中缺失的氢原子,以及确定蛋白质中的最佳氢键模式。

你可能感兴趣的:(PDBx/mmCIF 文件格式(三))