如何根据蛋白质序列找到蛋白质ID

多数数据集中有蛋白质序列但不存储蛋白质ID,这使得PDB文件获取困难,如何找到蛋白质序列对应的ID,参考以下(还没有找到批处理方法,如果有知道的小伙伴评论区留言):

1. 进入官方网站:RCSB PDB: HomepageAs a member of the wwPDB, the RCSB PDB curates and annotates PDB data according to agreed upon standards. The RCSB PDB also provides a variety of tools and resources. Users can perform simple and advanced searches based on annotations relating to sequence, structure and function. These molecules are visualized, downloaded, and analyzed by users who range from students to specialized scientists.如何根据蛋白质序列找到蛋白质ID_第1张图片https://www.rcsb.org/

2. 高级搜索:

如何根据蛋白质序列找到蛋白质ID_第2张图片

 3. 输入目标序列

如何根据蛋白质序列找到蛋白质ID_第3张图片

 4. 筛选,左边有物种,0.98为score,取score最小的,原理不知。

如何根据蛋白质序列找到蛋白质ID_第4张图片

 5. 可下载相关文件

如何根据蛋白质序列找到蛋白质ID_第5张图片

 7. 验证结果:判断序列与找到的蛋白质ID序列是否一致

如何根据蛋白质序列找到蛋白质ID_第6张图片

 输出YES

你可能感兴趣的:(蛋白质基础,python)