weixin_30824599

免疫信息学

http://blog.sciencenet.cn/blog-204973-845856.html

第一节免疫信息学源流

上个世纪中叶充满科学传奇。那不仅是个DNA双螺旋结构阐明、分子生物学产生与兴起的时代，也是系统论、控制论、信息论纷纷形成问世并引起全球广泛关注的时代，还是电子计算机走进人类社会并产生重要影响的时代。香农发表了《通信的数学理论》，奠定了他信息论之父的地位；维纳出版了专著《控制论-关于在动物和机器中控制和通讯的科学》；贝塔朗菲出版了系统论的代表作《一般系统理论：基础、发展与应用》。信息科学与计算机注定从一开始就与生命科学有着千丝万缕的联系。维纳专著的标题就有动物一词，贝塔朗菲本身就是生物学家。也就在那时，计算生物学（Computational Biology）、理论生物学（Theoretical Biology）悄然问世。进入上个世纪八十年代，随着人类基因组计划的酝酿与实施，数据驱动的生命科学研究开始横扫一切，生物信息学应运而生，日新月异，并不断渗透或应用到生命科学各学科甚至信息科学的一些前沿领域。

免疫学也不例外，生物信息学与免疫学的交叉融合形成了生物信息学的一个分支学科：免疫信息学（immunoinformatics）。俄亥俄州立大学已故外科与病理学系教授、移植免疫学家Charles G. Orosz在本世纪初首先创造了immuno-informatics一词，并将其定义为研究免疫系统产生、传递、处理及存储信息规律的学科（the study of the principles by which the immune system generates, posts, processes, and stores information）[1, 2]。或许人类偷懒的天性使然，在第239期的诺华基金研讨会（Novartis Foundation Symposium）*上，以色列魏茨曼科学院计算机科学与应用数学系的Lee A. Segel教授省掉该词中间的连字符，immunoinformatics这一词汇第一次出现在文献中[3]。在这篇题为“通过扩散信息网络的扩散反馈控制免疫系统”的文章中，Segel教授在文中写道[3]：“

免疫系统是研究生物信息处理的绝佳对象。由于免疫系统本身极为有趣，加上它在医学上的重要性，因此，虽然还有许多研究要做，但免疫系统的硬件相对已研究得较为清楚。在分子水平，显著的高频体细胞突变改变了遗传信息，使B细胞受体更具多样性。然而，更为吸引我的是在细胞水平，因为我相信，这一水平的规律，不仅决定免疫系统的行为，而且也能用于其它主要的生物系统，以及非生物的分布式自主系统。

脊椎动物拥有许多不同类型免疫细胞，总数可达1018个，却没有明显的老王（Boss）。不同类型的细胞群调动起来对付、攻击各种病原及毒株。此外，免疫系统也参与伤口愈合、组织重建等其它自身稳定任务。大量被称为细胞因子的信号分子指导着免疫系统。每种细胞因子具有几种功能，每种功能受几种细胞因子的影响。当配体与相应受体结合，通常分泌多种而非一种细胞因子。

这一超级复杂的分布式自主系统是如何确定做什么，何时做，做到何等程度的？我将从各个方面讨论这一问题，着重强调信息的作用。我尤其要论证基于细胞因子的扩散信息网络（diffuse informational network）所起的决定性作用。这样，我也就回应了Orosz关于免疫信息学（immunoinformatics）关键作用的建议。其中，免疫信息学被定义为研究免疫系统产生、传递、处理及存储信息的学科。”

2002年10月，诺华基金会资助下的史上首次免疫信息学研讨会在伦敦召开，来自实验免疫学、理论免疫学、生物信息学等各个领域学者畅所欲言[4]。在这次会议上（即第254期的诺华基金研讨会），会议主席德国教授Rammensee提出：免疫信息学可分为硬的、半软及软的三个领域，硬领域主要指免疫学相关核酸、多肽序列等数据及数据库工作，半软领域指处理免疫数据的方法及各种预测算法、软件等，软领域指免疫相关数学模型及其它各类理论免疫学研究[5]。此次研讨会迄今，免疫信息学已经过十余年发展，已经成为免疫学、生物信息学、计算机科学相结合的前沿领域。

广义地讲，当前免疫信息学可大体以下两大领域：

一是人工免疫系统(Artificial Immune System, AIS)及其应用[6, 7]。所谓人工免疫系统是指根据免疫系统的机理、特征、原理开发的人工智能算法与系统，如克隆选择算法、B细胞算法、阴性选择算法、树突状细胞算法等。人工免疫系统已应用到聚类分类、异常检测、信息安全、智能优化、图像处理、机器人控制、网络数据及文本挖掘等众多领域。该领域学者主要来自计算机与信息科学背景，模拟免疫机制，构建新的算法来解决各种科学及工程实践问题。该领域的研究内容从字面上看，非常贴近免疫信息学，源自免疫原理，落脚于信息方法。由于笔者对此领域没有深入研究，本章也不再赘述。

二是计算免疫学（Computational Immunology）及其应用。所有应用数学、计算机、人工智能、生物信息学方法来处理免疫学数据、分析免疫学问题的研究都属于计算免疫学，具体内容涵盖：理论免疫学（Theoretical Immunology）分析，免疫相关数学模型，各类免疫相关数据库构建，各种免疫相关预测算法、计算工具、网络服务及其应用如计算疫苗学（Computational Vaccinology）[8, 9]、反向疫苗学（Reverse Vaccinology）[10, 11]、计算机辅助疫苗设计[12]、计算机辅助抗体设计[13]等。一言以蔽之，用计算的方法解决免疫相关科学或工程实践问题就是计算免疫学，这也是当前免疫信息学的主流方向[14]。有趣的是，这一方向的工作从字面上看，用“信息免疫学”一词或许更为贴切，即源自信息学方法，落脚于免疫学问题。本章将结合笔者的科研工作，主要介绍计算免疫学资源及其应用。

第二节免疫信息学资源

所谓免疫信息学资源，主要是指免疫相关的数据集、数据库、单机及网络程序等能够给用户解决相关问题提供便利与帮助的数据资料和软件工具。实验免疫学家、生物技术企业、咨询机构等作为这些资源的普通用户，可能并不太关心相关数据库如何构建、程序算法细节，但需要了解到哪儿去找特定数据，对于特定问题，什么软件好用等等。对于生物技术专业的同学——未来生命科学的研究者、生物技术的探索者、生物产业的创业者与经营者、政策的制定者与管理者，亦复如是。本节着重介绍开源、免费、共享、方便的网络免疫信息学资源。

1、免疫学数据库

在生物信息学研究中，构建专业的数据库、高质量的数据集是关键的基础性工作。没有相应的专业数据支持，后续研究工作无法开展。当然，有了数据仍不够，还必须有质控标准与措施来保证数据的质量，否则，生物信息学研究就是垃圾进、垃圾出。这就好比实验生物学研究，必需要有合适的模式生物及独到可靠的研究材料一样。

由于生物技术的飞速发展与信息技术的进步，海量的生物数据产生了，这就需要各种类型的数据库来存储、管理、检索各种类型数据，如核酸序列、蛋白序列、空间结构、表达谱芯片、网络与通路等。大量生物信息学数据库产生了，如GenBank[15]、UniProt[16]、MMDB[17]、KEGG[18]等。这些数据库当然也包含了部分免疫学相关数据，但构建专门的免疫学数据库对免疫学研究而言无疑更为专业与方便。自从1970年第一个免疫学数据库KABAT诞生以来，大批高度专一或涵盖广泛的免疫学数据库纷纷登场。本节我们重点介绍几个重要的门户型综合数据库及一些具有历史意义或特色鲜明的专一型数据库。

（1）免疫遗传信息的门户IMGT[19]

IMGT数据库最初由Marie-Paule Lefranc (Université Montpellier II, CNRS) 创建于1989年，目前已发展成为全球免疫遗传信息的门户。IMGT是“免疫遗传学（ImMunoGeneTics）”的缩写，目前包括7个子数据库。这些子数据库可分为序列数据库(IMGT/LIGM-DB、IMGT/MH-DB、IMGT/PRIMER-DB、IMGT/CLL-DB)，基因数据库(IMGT/GENE-DB)、结构数据库(IMGT/3D structure-DB) 和单克隆抗体数据库(IMGT/mAb-DB)。IMGT/LIGM-DB是一个具有详细注释的人类和其他脊椎动物免疫球蛋白（IG）与T细胞受体（TCR）的序列数据库，目前收录了来自303个物种的16万多条序列。IMGT/MH-DB是一个人类主要组织相容性复合物（HLA）的专门数据库，其中包括世界卫生组织HLA系统命名委员会的官方序列；目前，该数据库服务器主机放在欧洲生物信息学研究所（EBI）。IMGT/PRIMER-DB是标准化的IG和TCR寡核苷酸探针或引物数据库；目前该数据库有来自11个物种的1864条记录。IMGT/PRIMER-DB提供的信息尤其适用于正常和病理情况下的IG和TCR的表达研究、单链抗体、噬菌体展示、基因芯片设计。IMGT/CLL-DB是一个新的数据库，主要收集来自慢性淋巴细胞性白血病患者的IG序列。IMGT/GENE-DB是人类、小鼠、大鼠、家兔IG和TCR基因的数据库；到目前为止，它收录了IG和TCR基因2893个、等位基因4139个。IMGT结构数据库收录IG、TCR、MHC空间结构及相关信息，目前有2686个记录。IMGT/ mAb-DB收录已上市及临床试验中的单克隆抗体、抗体-受体融合蛋白及其他免疫应用的融合蛋白，目前有单抗272个、抗体-受体融合蛋白18个，共计420个条目。此外，IMGT网站目前还提供了15个与数据库配套的在线分析工具。IMGT已广泛用于自身免疫、感染、肿瘤的相关医学研究、兽医学研究及抗体生物技术研究中。IMGT的所有资源都可通过其主页http://www.imgt.org免费使用。

（2）免疫表位信息的门户IEDB[20]

所谓表位（epitope）就是抗原中能被免疫细胞特异性识别的线性片段或空间构象性结构，是引起免疫应答和免疫反应的基本单位。表位在免疫学基础与应用研究中具有核心地位，是疫苗、抗体药物、肿瘤免疫、移植免疫、超敏反应的结构基础。IEDB是免疫表位数据库（Immune Epitope DataBase）的缩写，创建于2003年。IEDB虽然不是最早出现的表位数据库，但在NIAID的资助下，经过10年的发展，它已毫无疑问地发展成为全球免疫表位信息的门户。目前IEDB收录的表位及相关信息涵盖除肿瘤和HIV以外的99%已发表文献。文本挖掘程序自动扫描了2200万多篇PubMed文摘；大量专家对其中13000多篇文献（含7000多篇感染相关文献、1000多篇变态反应相关文献、约4000篇自身免疫相关文献、1000篇移植免疫相关文献）进行了人工归类、信息提取与注释。到笔者撰写此节为止，IEDB已提取文献14718篇，收录了人类及其它各种动物识别的多肽表位92407个，非多肽表位1831个。IEDB还包含了直接提交及来自FIMM、TopBank等一系列MHC配体数据库的数据，共有MHC配体（抗原肽）214704条。IEDB收录的表位不仅数量最多，而且质量最好，包含的表位相关的各种背景信息最为丰富，甚至连实验细节也不放过。此外，IEDB还提供了一些配套工具用于表位预测与分析[21]。所有IEDB数据及工具均可通过www.immuneepitope.org免费访问与使用。

（3）免疫多态性数据库IPD[22]

该数据库由安东尼.诺南研究所（Anthony Nolan Research Institute）#的HLA信息学小组与欧洲生物信息学研究所紧密合作，创建于2003年，旨在为研究免疫系统基因的多态性提供方便。IPD目前包括MHC、KIR、HPA、ESTDAB等四个子数据库。IPD-MHC数据库收录了大量物种的MHC序列。这些物种包括：家犬、狼、山狗，家猫，僧帽猴、狨猴、枭猴、松鼠猴、绢猴、叶猴、狒狒、猕猴、白眉猴以及其它猴类，倭黑猩猩、黑猩猩、长臂猿、大猩猩、猩猩等。ESTDAB是一个肿瘤细胞系的数据库。IPD最具特色的是KIR数据库和HPA数据库；KIR收录了人类杀伤细胞免疫球蛋白样受体（Killer-cell Immunoglobulin-like Receptors, KIR）共614个各等位基因及相应蛋白质的序列；HPA收录了人类同种异体血小板抗原数据。这些数据库均可通过http://www.ebi.ac.uk/ipd免费使用。

（4）HIV数据库

这是第一个面向病原体的数据库，收录获得性免疫缺陷病毒（HIV）的核酸序列、免疫表位、耐药相关突变及疫苗试验。其中，HIV分子免疫学数据库始建于1987年，由洛斯阿拉莫斯国家实验室开发，最初的目的只是提供一个已知HIV表位的全面列表，包括细胞毒性T细胞表位、辅助性T细胞表位和抗体结合位点。目前这一模式已推广到其他病原体，如丙型肝炎病毒（Hepatitis C Virus, HCV）和出血热病毒（Hemorrhagic Fever Viruses, HFV）。HIV数据库提供了大量分析工具，如表位比对（QuickAlign）、PeptGen、基序检索（Motif Scan）、序列定位（Sequence Locator）、ELF（Epitope Location Finder）等等。QuickAlign可用于比对表位、功能域或其它任何感兴趣的蛋白质区域。PeptGen可创建蛋白质的重叠肽图谱，有助于多肽设计与表位确定。基序检索工具可找出蛋白序列中具有某一指定HLA基因型、血清型或超型基序的亚序列。序列定位工具能给出用户序列相对于HIV参考序列（HXB2）或SIV参考序列(SIVMM239)的位置。整个项目受NIAID资助，所有数据及工具均可通过http://www.hiv.lanl.gov免费获得或使用。

（5）KABAT 数据库[23]

为了确定抗体序列中的抗原结合部位，著名免疫学家Elvin A Kabat（1914-2000）和他的研究小组于1970年创立了KABAT数据库；这也是第一个免疫学数据库。现在的KABAT数据库包括来自许多物种的IG、TCR、MHC及其它免疫相关分子的序列。一方面，新的序列仍在不断加入KABAT数据库；另一方面，该数据库相关信息分析工具也越来越多，这些工具包括关键词搜索、变异性分析和序列比对等。KABAT数据库及相应工具曾经可以从http://immuno.bme.nwu.edu免费获得；但现在只有付费注册才能使用。2003年以后，该数据库不再更新，第一个免疫学数据库就这样在不适宜的商业模式下成为僵尸数据库。

（6）SYFPEITHI数据库[24]

1999年，Hans-Georg Rammensee教授及其同事开发了一个关于MHC配体和基序的数据库—SYFPEITHI。该数据库的名字来源于第一个直接测序的天然MHC配体，即SYFPEITHI九肽；该配体洗脱自小鼠P815肿瘤细胞的H-2Kd分子。目前，SYFPEITHI数据库收录了来自人类和其他物种（如猿、牛、鸡、小鼠等）MHC-I 类和 II类配体的序列7000多条，基序200多种，所有的数据仅来源于文献。SYFPEITHI数据库工具可检索等位基因、基序、天然配体、T细胞表位、源蛋白质/物种及参考文献。数据库与EMBL和PubMed数据库有超链接。SYFPEITHI数据库提供了一个基于基序打分的表位预测界面，可预测人类及小鼠的多种MHC分子配体，通过www.syfpeithi.de免费在线使用。SYFPEITHI数据库的脱机版本，可在个人电脑或局域网内使用，但需付费（单机每年3000欧元）。又一个具有历史意义的数据库在商业化模式中迷失。

（7）未完待续

从半抗原小分子、佐剂、表位、抗原、变应原到抗体，但凡当前免疫学课本上有的，互联网往往已有相应数据库。例如：半抗原数据库（HaptenDB[25]），佐剂数据库（Vaxjo[26]）表位数据库（Bcipep[27]、CED[28]），保护性抗原数据库（Protegen[29]）、肿瘤抗原数据库（TANTIGEN、CIDB[30]），变应原及表位数据库（ALLERDB[31]、Farrp、InformAll[32, 33]、SDAP[34]），抗体数据库（SACS[35]、Abysis）等等，不一而足。从纸质版到电子版，从平面文件(flat file)到关系型数据库，从单机到网络，免疫学数据库经过几十年的发展，种类与数量越来越多，数据库的容量越来越大，结构也越来越复杂。除了这些数据库外，免疫学相关的测试数据集（Benchmarks）也是重要的资源。由于篇幅限制，我们不再列举免疫学数据库及数据集。好事者，可通过 Google等搜索引擎，Nucleic Acids Research、Database及其它专业期刊查询相关数据库与数据集。

2. 单机软件与网络程序

有了数据的支持，理论免疫学家就可以通过数学方法建立理论模型，进行模拟仿真；计算免疫学家则可在此基础上进行数据挖掘，建立新的算法，或用这些数据训练人工神经网络、支持向量机，建立新的预测模型并进行测试、评估与分析。这些模型、仿真、算法及预测器往往最终实现为单机或网络程序。如前所述，网络程序已经成为免疫信息学乃至生物信息学软件开发的大趋势，但出于数据安全保密等各种考虑，单机软件仍受一些公司与研究组的青睐。另外一个趋势是数据库自带的分析工具越来越多，数据库与网络程序的界限日渐模糊。此外，不少时候，解决一个免疫学问题往往需要一系列小的软件工具与步骤，由于这些小软件大都是现成的，因此只需要进行系统集成，形成合理的工作流程即可，这样的工作可通过诸如Accelrys公司的Pipeline Pilot等平台来自动化。由于免疫学相关网络程序不可胜数，本节不再具体罗列，而在免疫信息学的具体应用中部分提及。

第三节免疫信息学的应用

免疫学不仅是研究分子识别与相互作用的基础学科，而且贴近应用。FDA近年批准进入市场销售或临床试验的药物中，新型抗体与新型疫苗屡拔头筹。由于抗体药物的巨大成功，以新型抗体、新型疫苗开发为核心的免疫学研究已经成为世界各国生物技术学术界与产业界全力追捧与投入的领域。与生物信息学相结合免疫信息学研究不仅可以解决一些分子识别的基本生物学问题，而且也必将为产业界提供新的工具。免疫信息学资源已在生命科学基础研究与应用开发研究中广泛应用。这里，笔者结合自己的研究工作进行部分介绍。

1. 表位预测

表位预测是免疫信息学研究的核心问题之一，也是抗体、疫苗、移植免疫、变态反应计算分析的基础。因此，发现一个重要的新表位和发现一个新基因一样，都蕴藏着巨大的财富。因此，从IT巨人微软到世界500强的生物医药公司罗氏，都有人在做表位预测研究。1999年，纳斯达克上市公司Epimmune（Nasdaq：EPMN）将其发现鉴定的一个可能用于乳癌、肺癌、结肠癌治疗的候选"先导表位"作价200万美元卖给了给美国Searle公司（世界500强的转基因寡头孟山都公司的制药部）。靠着它的另一项专利成果泛DR表位PADRE，Epimmune公司还从Elan公司、Pharmexa公司获得了不菲的非独占授权费，而后，Genencor公司更为此付出了6000万美元的独占性授权费；不仅如此，Epimmune公司今后还将享有上述3家公司所有PADRE相关产品的销售提成。

回到现实，如果我们将抗原比作一篇文章，那么表位就好比文章的关键词；而表位簇集区域就好比是摘要。根据表位特异性免疫应答的程度，可将抗原中的表位分为免疫优势表位、亚优势表位和隐性表位；根据表位对机体的影响，可分为保护性表位（免疫位）、致病性表位（变应位）、耐受性表位（耐受位）；根据识别的免疫细胞，可分为B细胞表位、辅助性T细胞（Th）表位、细胞毒性T细胞（Tc）表位等。表位预测就好比对抗原这篇文章进行钩玄摘要。目前有关研究主要是B细胞表位、Th表位、Tc表位的预测上。

（1）B细胞表位预测

B细胞表位要被抗体识别，只能位于抗原表面。因此，早期的线性B细胞表位预测采用唯象方法（Phenomenological theory），通过计算蛋白亚序列的理化性质或二级结构，利用B细胞表位与上述理化特性或二级结构的相关性进行预测。例如，亲水的氨基酸更多位于液相面，而疏水的更多地深埋在抗原内核，因此可以计算蛋白质序列局部的亲水性来间接推断B细胞表位。对蛋白序列局部理化性质或二级结构倾向的理论计算大多依据相应的属性量表，这些量表可通过实验或统计分析得到。常用的量表如Janin可及性量表、Hopp和Woods亲水量表、Parker亲水量表（示例见图7-1）、Thornton突出指数量表、Welling抗原性量表等。30多年来，经典量表时有优化更新，对滑窗法的预测性能也有所改进。

图7-1 基于Parker亲水量表的线性B细胞表位预测示例

复杂网络（Complex networks）已经成为近年自然科学乃至社会科学诸多学科领域研究的一个焦点与超级热点。现实世界中的很多系统都可以用复杂网络的模型来描述与研究，如互联网、集成电路、电力网、通讯网、铁路网、食物链、人际关系网等等。各种网络在数学上都可以用图（Graph）来表述。图论（Graph theory）源于18世纪大数学家欧拉（Leonhard Euler）对规则图（regular graph）的研究；20世纪50年代，两位匈牙利科学家Erdös和Rényi的研究使经典图论出现重大突破，确立了随机图理论（Random Graph Theory）。但不管是表征何种网络的图，它们都是由一些基本单元和它们之间的连接构成的；在图论中，我们通常把前者称为节点（nodes）、顶点（vertices）或点（point），把后者称为边（edges）、连接（links）或者线（lines）。基于图论的系统生物学研究已经取得了许多重大成果，食物链网络、大脑皮层神经元网络、代谢网络、基因调节网络等许多生物系统的复杂网络已被证实具有小世界(small-world)或/和标度无关（scale-free）特性。在基因调节网络、代谢网络的研究中，蛋白质（或酶）被简单地看作为网络节点。但是，当把研究聚焦于蛋白质本身或其部分片段的时候，例如对蛋白质抗原，我们同样可以把抗原看作一个复杂网络，一个大的“图”。它的节点是氨基酸残基，它的边是氨基酸残基之间在序列上与空间结构上的联系（如图7-2）。

图7-2：蛋白质抗原氨基酸残基网络示意图（家兔子宫珠蛋白: 1UTG）

我们从PDB数据库中筛选出无冗于、高分辨率的代表性晶体结构640个，以氨基酸残基为节点，残基之间序列上的联系（实质是肽键）或空间上的联系（实质是二硫键等其它共价键或氢键、疏水相互作用、范德华力等非共价相互作用）为边，构建了640个抗原的氨基酸残基网络。计算这些网络中每个氨基酸残基的连接度（Connectivity）、聚类系数（Clustering coefficient）、完形度（Closeness）、间度（Betweeness）等复杂网络参数，统计推演出基于复杂网络的4个新量表（见表7-1），即相对连接度（Rk）、相对聚类系数（Rc）、相对完形度（Ro）、相对连接度（Rb）。

表7-1 基于抗原氨基酸残基网络拓扑性质的新属性量表[36]

我们把上述新量表用于基于滑动窗的B细胞表位残基预测。结果显示，在5个测试数据集中，相对连接度（Rk）表现稳定优越，在注释最完整、质量最佳的HEL数据集中，相对连接度的ROC曲线下面积最大，提示预测性能显著优于Parker亲水性(Ph)及Levitt指数(Li)等两个已知最好的B细胞表位预测量表（见图7-3）[37]。因为相对连接度反应了一个氨基酸残基在网络中相邻氨基酸残基数目的倾向。偏爱在抗原内核的，邻居一般较多，在表面的，邻居相对较少。因此，用相对连接度来预测B细胞表位能有如此表现也就不奇怪了。

图7-3相对连接度、Parker亲水性及Levitt指数预测性能比较

专门的线性B细胞表位预测工具有PREDITOP、ADEPT、PEOPLE、BepiPred[38]等；一些综合性序列分析软件，如OMIGA、UWGCG、ANTHEPROT等，也包含了的线性B细胞表位预测功能。线性B细胞表位预测往往是根据蛋白质抗原的氨基酸序列，预测其上可能的B细胞表位区段。由于B细胞表位在没有其对应抗体时是不能确定的，它的存在取决于相应抗体的存在，所以，从学术的角度，目前的线性B细胞表位预测似乎是个伪命题。但就是这个命题却是目前大部分抗体公司急需解决，有着重大现实需求的。例如，根据预测结果，用从天然蛋白中筛选出的合成肽段来免疫动物，以期获得的抗多肽抗体能与天然蛋白本身发生交叉反应。这具有重要的实用价值，相应抗体既可用于亲和层析，达到分离纯化完整蛋白抗原的目的，又可用于免疫组化或其它免疫反应而有助于基础研究与临床诊断，可以开发为科研甚至临床诊断试剂。当前，人工神经网络、支持向量机等机器学习方法已用于线性B细胞表位预测，但性能仍不令人满意。此外，基于噬菌体展示或抗原空间结构的构象表位预测近年来也广受关注。前者我们将在后文中单独论述；后者包括Java语言编写的基于随机森林的单机程序Bpredictor[39]，网络程序CEP[40]、DiscoTope[41]及SEPPA[42]等。

（2）T细胞表位预测

T细胞表位的预测研究肇始于对Th表位的预测。早期的Th表位预测明显受线性B细胞表位预测思路的影响，不少研究试图从实验证实的Th表位中找出它们在理化特性或二级结构上的共同特征并在一定程度上获得了成功，第一个Th表位预测程序AMPHI就是早期研究的代表作品。二十世纪80年代末90年代初， MHC-I类分子晶体结构的阐明和多种Tc表位基序的发现使Tc表位预测研究率先取得突破。这带动了MHC- II类分子晶体结构与各种Th表位基序的揭示，使Th表位预测摆脱了B细胞表位预测思路的影响。目前，打分矩阵、隐马尔可夫模型(Hidden Markov Model，HMM)、比较分子力场分析（comparative molecular field analysis, CoMFA）、比较分子相似性指数分析（comparative molecular silmilarity indices analysis, CoMSIA）、人工神经网络（artificial neural network , ANN）、支持向量机（Support Vector Machine, SVM）等各种方法都已用于T细胞表位预测。相关单机及网络程序包括AMPHI、Tepitope、TSites、EpiMer、EpiMatrix、BIMAS、MHCPred、NetMHC、NetMHCpan、NetMHCcons、NetCTL、NetCTLpan、NetMHCII、NetMHCIIpan、MetaMHC[43]、TEPITOPEpan等。这个领域非常热闹，于是该领域元老Brusic教授于2009年组织了首届机器学习在免疫学中的应用——HLA-I类配体预测（MLI）大赛[44]。行笔至此，2012伦敦奥运与第二届MLI大赛正如火如荼，发扬奥运精神，我们也参与其中。希望有兴趣的同学今后能加入我们。

虽然对Tc表位预测的探索起步最晚，但进展最快，研究最深入，预测最成功，尤其是基于支持向量机的方法。目前，对Tc表位的预测，研究内容已经不只限于对MHC-I类分子结合及其结合能力的预测，而且还拓展到对候选Tc表位自然产生可能性及其转运效率的预测，即对蛋白酶体酶切位点及抗原处理相关转运蛋白（transporters associated with antigen processing, TAP）的转运进行预测，范围涵盖整个抗原处理与递呈过程，相关程序如FragPredict、PAProC、NetChop等。此外，近些年的研究越来越重视杂合性T细胞表位、超型表位及表位簇集区域的预测。

2. 噬菌体展示

（1）噬菌体与噬菌体展示

噬菌体（phage）是一类感染细菌的病毒。有些噬菌体，如丝状噬菌体M13、fd、f1等，是非常好的表达载体[45]。通过基因工程方法，可以将外源基因片段或随机DNA序列插入噬菌体基因III或VIII中，表达后形成的融合蛋白仍能够自主装配成噬菌体外壳并将外源蛋白或多肽展示在噬菌体颗粒表面（见图7-4）。

图7-4：通过基因III或VIII展示外源序列的M13噬菌体示意图

噬菌体易于培养，增殖迅速。通过随机PCR等分子生物学技术，可以很方便地构建多样性从数百万到数百亿的噬菌体文库（phage library）[46]。这就使得生物学家可以像钓鱼一样，从“鱼塘”（噬菌体文库）里高效地钓到能与“鱼饵（bait）”结合的展示了特定多肽的噬菌体。通常，用来筛选噬菌体文库的物质被称为靶位（target）；靶位的天然配体称为模板（template）。如图7-5所示，使用靶位（如细胞、抗体、受体、酶、化合物、半导体材料等），经过几轮结合、洗脱、增殖的循环淘选（panning），通常能快速从噬菌体文库中筛出一系列可能与靶位特异性结合的噬菌体；通过DNA测序能快捷、可靠地推导出它们所展示外源多肽的氨基酸序列。这些能与靶位结合的外源多肽，通常模拟了相应模板的特定位点，因而被称为模拟肽（mimotope）；而上述获得模拟肽的分子生物学实验流程与技术则被称为生物淘选（biopanning）或噬菌体展示（phage display）[47]。

噬菌体展示技术一经问世便迅速发展，并在现代分子生物医学研究中广泛应用。在基础研究中，利用噬菌体展示技术可以预测出表位[48]、其他蛋白质相互作用位点[49]与网络[50, 51]，确定药物作用的靶标蛋白；在应用研究中，噬菌体展示技术可用于开发器官靶向试剂[52]、新诊断试剂[53]、新生物技术药物[54]和疫苗[55]。尤其值得一提的是，噬菌体展示技术在基于新型生物材料的新能源如生物锂电池[56]、氢能源[57]等研究中大放异彩，美国总统奥巴马曾因此专程参观了麻省理工学院的相关实验室。

图7-5 噬菌体展示技术示意图（Science 2002）[58]

（2）噬菌体展示数据中的信号与噪声

在噬菌体展示实验的结果中，信号是研究者想要得到的模拟肽序列，也就是能特异性结合靶位的多肽。但是，由于噬菌体展示技术本身固有的原因，在淘选得到模拟肽的同时，也将不可避免地得到一些噪声序列，也就是所谓的靶位无关多肽（target-unrelated peptides, TUP）[59, 60]。这些噪声序列可分为两类。一类是选择相关TUP (Selection-related TUP, SrTUP)，专指发生在噬菌体的结合选择环节，能够结合筛选体系中某种成分但并非与靶位特定位点结合的噬菌体展示多肽。由于靶位本身及淘选体系的复杂性，文库中的噬菌体除了与研究者期待的靶位位点结合外，还可能与淘选体系中的固相基质（如塑料和磁珠）、检测放大分子（如链亲和素、蛋白A）、封闭试剂（如牛血清白蛋白）、污染分子（如胎牛血清中的牛免疫球蛋白、大肠杆菌内毒素）及靶位的其它位点结合。另一类是增殖相关TUP (Propagation-related TUP, PrTUP)，专指发生在噬菌体增殖环节，不是因为能与靶位结合，而是因为具有更快、更强的增殖能力而进入实验结果里的多肽[61]。与选择相关TUP一样，增殖相关TUP也极其常见，尤其多见于最为常用的基于M13噬菌体的Ph.D.系列商业化文库[62]。基于fd-tet噬菌体的文库增加了抵抗增殖相关噪声的设计；即便如此，增殖相关噪声序列仍不时出现在噬菌体展示实验结果中[61]。实验结果显示，增殖相关TUP不仅可能混入噬菌体展示的结果中，有的时候甚至会主宰噬菌体展示数据[62]。计算机模拟结果显示，噬菌体增殖能力的差异即便微小到10%，经过几轮增殖后也能引起噬菌体文库克隆丰度的极显著差异[63]。因此，噬菌体展示的实验结果往往是模拟肽与靶位无关多肽的混合物。

如果不加区分，将噪声作为信号，也就是把噬菌体展示实验结果中的靶位无关多肽当作模拟肽，不言而喻，其研究结果往往是误导的和悲剧的。令人遗憾的是，这种情况相当常见。例如，全球有几十个研究组都报道过一种序列为SVSVGMKPSPRP的神奇“模拟肽”。汇总各研究组的实验结果，提示它可能与40多种不同的靶位结合[64, 65]。这些靶位包括：多种器官与组织（如头发、皮肤、小鼠肿瘤血管、小鼠胚胎），多种细胞（如神经元、前列腺癌细胞、肝癌细胞、小鼠卵细胞、金黄色葡萄球菌），RNA，DNA，多种抗体，多种酶（如葡萄糖氧化酶、乙酰胆碱酯酶），多种蛋白（如神经生长因子、艾滋病毒Vif蛋白），多种多肽及各种材料（如磷脂酰丝氨酸脂质体、脑膜炎球菌脂多糖、羟基磷灰石、聚四氟乙烯、墨水染料、单壁碳纳米管、钴纳米颗粒、铂铁合金及磷化铟、砷化镓、氮化镓等半导体材料）结合。难道SVSVGMKPSPRP是无所不能的万能胶水？实际上，上述多数实验里它只是一条增殖相关的TUP。然而，具有讽刺意味的是，相当多的实验小组把噪声作为信号，最终得出了一些错误的结论还如获至宝。

令人欣慰的是，在噬菌体展示领域，无论是实验研究者还是理论研究者，都已经开始注意到实验数据中的噪声问题。在进行后续研究之前，很有必要预先减少或尽量消除实验数据中的靶位无关多肽，这已逐渐成为本领域研究者的共识。因此，靶位无关多肽的研究已经成为近年来噬菌体展示领域实验与生物信息学研究的热点。通过采取消减淘选（subtractive panning）、提高靶位结合选择的严谨度、减少淘选次数等各种实验措施，能在一定程度上减少选择相关及增殖相关噪声。但是，仅靠实验本身的改进并不能彻底消除靶位无关多肽，这是由噬菌体展示内在的结合选择与感染增殖环节所决定的[63]。因此，借助信息学手段来检测噪声序列，进而对噬菌体展示数据进行计算纯化等一系列预处理，不失为省时、省力、省钱的上佳之选。

（3）噬菌体展示数据预处理研究进展

目前，噬菌体展示数据的预处理方法大体可分为三类。一是是基于信息论的方法，二是基于TUP序列特征的方法，三是基于数据库搜索比对的方法[66]。

早在2004年，Mandava等就根据香农的信息论提出了用信息含量（Information content）这一指标来衡量噬菌体展示结果中每条多肽是信号还是噪声[67]。对于噬菌体展示实验结果中任意一条多肽序列X1X2…XN，其出现在初始文库中的概率P = P1×P2×…×PN，其中PN代表着初始文库中某种氨基酸出现在第N位的频率。多肽的信息含量INFO =﹣㏑(P)。Mandava等所谓的信息含量类似于信息论中的信息熵（information entropy）。Mandava等认为，初始文库中越罕见的多肽，信息含量越高，经过几轮淘选还能出现在结果中，这就越不可能是随机事件，这样的多肽应该是有意义的信号；反之，越是具有增殖优势的噬菌体，在初始库中就越常见，信息含量也就越低，如果出现在结果中则很可能是噪声序列。根据上述假设，他们开发了INFO程序[63]。

2010年，我们研究组根据Menendez等的综述，总结了当时所有已知靶位无关多肽的序列特征，编写了一个基于TUP序列特征的靶位无关多肽检测、报告与滤除程序（SAROTUP，http://immunet.cn/sarotup）[68]。我们的测试结果显示，给噬菌体展示实验数据增加一个基于TUP序列特征的预处理环节，不仅能极大地提高Pepsurf、Mapitope等程序预测蛋白质相互作用位点的性能，还有助于基于噬菌体展示的候选疫苗筛选[68]。

为了检测不具备已知TUP序列特征的靶位无关多肽，我们接着又构建了一个噬菌体展示实验结果的数据库（MimoDB，http://immunet.cn/mimodb），收集了全球各研究组利用噬菌体展示淘选随机文库的实验结果[64]。该数据库每季度更新，笔者成文时版本有数据1956套，多肽序列16500条，是目前世界上最大、最全的噬菌体展示实验结果数据库。去年底，我们又开发了MimoSearch、MimoBlast等几个基于该噬菌体展示数据库的小工具。通过MimoSearch小工具搜索数据库，可以查看实验者提交的多肽序列是否与其它已发表的结果完全相同。如果多个研究组在淘选实验中使用的靶位不同却又得到了完全相同的多肽序列，那么相应多肽极可能是噪声序列，即便它很可能不具备任何已知的噪声序列特征。通过MimoBlast小工具可对MimoDB进行全数据库序列搜索比对，不仅可以找到与实验者提交多肽序列不完全相同但高度相似的已发表结果,从而提示靶位无关多肽，还能找出与已知TUP高度相似的多肽从而推导新的TUP序列特征[65]。目前，这些基于数据库搜索比对的工具也已集成到了SAROTUP程序的2.0版中。

（4）基于噬菌体展示的表位预测[49]

由于模拟肽和抗原上的天然表位能与同一抗体结合，所以，通常认为，模拟肽及其所模拟的天然表位应该具有相似的物理化学性质和空间关系。这是目前所有基于噬菌体展示的表位预测方法共同的假设与前提。在这个假设与前提下，通过比对模拟肽序列（或一套模拟肽的共同序列）与抗原序列，抗原序列中与模拟肽序列匹配（一致或高度相似）的部分可能就是相应的天然表位。这种情况已得到不少实验结果的验证。但是，在针对蛋白质抗原的体液免疫中，所产生的抗体约有90%所识别的都是空间构象性表位；或者说与抗体结合的绝大多数天然表位在序列上都是不连续。因此，基于噬菌体展示的表位预测，在绝大多数情况下，模拟肽与抗原在一级结构上没有或者仅有非常低的相似性。因此，如何把模拟肽合理映射到抗原的空间结构上或分散的抗原序列中，就成为基于噬菌体展示的表位预测研究的核心问题。目前，相关算法、流程、单机及网络程序包括PEPTIDE、FINDMAP、EPIMAP、SiteLight、Mapitope、RELIC、3DEX、MIMOX、MIMOP、PepSurf、Pepitope、Pep-3D-Search、EpiSearch、MimoPro、LocaPep、PepMapper等[66]。

（5）噬菌体展示免疫信息学研究感悟

回顾既往7年我们在噬菌体展示领域的免疫信息学研究，我们做了数据集、数据库、数据预处理软件、数据解析预测软件，我们深深感受到了计算的力量。仅以我们的噬菌体展示实验结果数据库而言，这让我们充分体会到为什么Rammensee教授要将之称为hard了。数据的核实、提取及无休止的更正与更新，让数据库工作真的非常艰苦hard。当然，Rammensee教授的原意是指这些直接来源的实验结果的数据是如何hard，如何可靠；而建立在数据之上的算法与预测软件，那产出就软了，因为是计算预测结果，但好歹还可通过实验验证，所以就算个半软吧；至于无法实验验证的数学模型与仿真，那就全软了。这种认识，笼罩整个生物医学界，那就是：实验最可靠，实验是金标准；生物信息学，奇技淫巧罢了，计算的结果靠不住。但是，当我们搜集所有噬菌体展示实验结果到MimoDB数据库中时，我遇到了实验研究的各种怪状；当所有噬菌体展示实验结果通过MimoDB平台可以相互对照后，我们发现，实验结果也不都是可靠的，实验结果也不都是金标准，以子之矛、攻子之盾的地方实在太多。意外地，MimoDB可以成为一个噬菌体展示领域的循证生物学分析平台，可以帮助实验研究者消除实验结果中的噪声，这就是数据库的力量。

3. 在抗体研究中的应用

目前，有很多单机及网络程序可用于抗体的基础与应用研究的方方面面[13]。例如，使用Abnum可按Kabat、Chothia等三种方式给抗体序列定位编号，从而确定CDR区[69]；使用SUBIM确定抗体重链、轻链的亚类[70]；使用AbCheck检查提交的抗体序列中是否可能存在克隆伪迹（cloning artifacts*）或测序错误[71]；使用SHAB评估抗体的人源化程度[72]；使用PAPS预测抗体重链与轻链堆叠角度（VH/VL packing angle）[73]；使用AbM、WAM[74]、SWISS-MODEL[75]、PIGS[76]、RosettaAntibody[77]等建立抗体的三维结构模型。此外，计算方法也可用于抗体亲和力成熟、防止凝聚、延长半衰期的设计等各个方面[13]。

免疫信息学已经极大地改变了单克隆抗体产业。目前，抗体测序已成常规，而一旦有了抗体序列，就可以通过序列分析确定其重链、轻链类型而无需实验确认；通过同源建模、分子对接及动力学等分析更能推断其相应抗原的大致情况。我们与华西医大合作，对他们通过杂交瘤技术获得的抗苏丹红I单抗进行了免疫信息学研究，通过从头计算与同源建模相结合的方式，获得了其空间结构的理论模型（见图7-6）。该图左侧为抗体轻链，其绿色、水色、蓝色、紫色部分对应LFR、L1、L2、L3；右侧为抗体重链，其红色、水色、蓝色、紫色段分别对应HFR、H1、H2、H3。正中凹洞为抗原结合位点，凹洞底部主要由重链骨架区形成，侧壁主要由L3和H3形成。整个图像由通过PMV软件以分子表面的方式显示，其中分子表面用MSMS软件计算。

图7-6 抗苏丹红I单抗可变区空间结构理论模型

我们在剑桥结构数据库（Cambridge Structural Database, CSD）中查询到的苏丹红I的晶体结构实验数据共4条，没有苏丹红II、III、IV晶体结构的实验数据。使用Gaussian软件，计算出苏丹红I-IV的空间结构。将4条实验验数据与理论计算的苏丹红I结构进行叠合，发现实验数据之间RMSD差别竟然比与理论结果之间的差异还大，说明计算结果精确可靠。用Autodock4.1将理论计算的苏丹红I-IV结构与抗苏丹红I单抗模型进行了盲对接与定位对接，得到了苏丹红I（见图7-7）到苏丹红IV与抗苏丹红I单抗可能的结合模式。颇为有趣的是，苏丹红I、II与抗苏丹红I单抗的抗原结合位点对接结合时构象相似：“2-萘酚”（naphthalen-2-ol）基团在内，其余部分朝外；苏丹红III、IV与抗苏丹红I单抗的抗原结合位点对接结合时构象相似：2-萘酚”（naphthalen-2-ol）基团在外，其余部分在内。

图7-7 抗苏丹红I单抗-苏丹红I相互作用示意图

在上图中，抗体轻链绿色，重链橙色，均按卡通模式显示。根据CCP4软件包计算结果，苏丹红I在抗原结合袋中与轻链的H34、Q89、T97（绿字标出）及重链的V37、W47、E50、V97、K98、W103等主要通过范德华力相互作用，图中仅显示了这些残基中直接与苏丹红有范德华相互作用的重原子。此外，苏丹红I的N13原子与轻链T97残基的OG1之间距离2.69 Å，形成氢键（黄色虚线）。抗苏丹红I单抗与苏丹红II的相互作用与抗苏丹红I单抗-苏丹红I的相互作用非常相似，苏丹红II的N13原子与轻链T97残基的OG1之间距离2.67 Å，氢键更强，不再另图显示。

我们使用了SplitPocket[78]计算了抗苏丹红I单抗的抗原结合袋的体积以及苏丹红I、II、III、IV分子的体积。在抗苏丹红I单抗所有袋结构中，最大的袋位于抗原结合位点，我们将其称为抗原结合袋。它的尺寸为 5.23 Å × 6.64 Å × 10.36 Å（宽×厚×深度），体积为359.56 Å3；而苏丹红I、II、III、IV分子的体积分别为228.28 Å3、261.12 Å3、323.76 Å3、356.56 Å3。由于已有的研究显示[79]：结合袋往往都要比配体大得多，配体极少能够占据整个结合袋，所以，以上计算结果显示，抗苏丹红I单抗的抗原结合袋容纳结合苏丹红I、II分子比较容易，而要容纳苏丹红III则有些困难，苏丹红IV则几无可能。这些结果，与对接结合能数据也是较为一致的。总之，我们免疫信息学的计算分析提示：苏丹红I、II能与抗苏丹红I单抗的抗原结合位点结合，强度相近；苏丹红III可能有较弱的结合，而苏丹红IV不大可能与抗苏丹红I单抗结合。我们的结果返回华西后与他们实验的结果不尽一致！他们的实验结果显示，抗苏丹红I单抗与苏丹红I亲和力最高，其次苏丹红III，与苏丹红II结合较弱，不结合苏丹红IV。是实验错了还是我们的计算不对？后来，我们的合作者反复研究，发现当初结合实验时未考虑苏丹红I-IV之间溶解度的差异，纠正后的实验结果与我们计算的一致。计算的力量，由此可见一斑！我们也进一步仔细阅读他们的专利，发现免疫用的半抗原是苏丹红I修饰物（苏丹红I号-3-丙酸，Sudan1-C3）而并非苏丹红I本身。Sudan1-C3与OVA、BSA等偶联后，除了桥联的羧基碳原子外，其结构比苏丹红I多了2个碳原子，而与苏丹红II 的一个甲基碳原子正好重叠，另一个碳原子位置不同。因此，Sudan1-C3与苏丹红I、II很相近，推测引起的单克隆抗体能与苏丹红I、II发生较强交叉反应。

我们也曾对抗CD147的美妥昔单抗（metuximab）进行过同源建模，其理论模型见图7-8。该图左侧为轻链，其绿色、水色、蓝色、紫色部分对应轻链骨架区(LFR)、轻链互补决定区1、2、3（L1、L2、L3）；右侧为重链，其红色、水色、蓝色、紫色段分别对应HFR、H1、H2、H3。美妥昔单抗的抗原结合位点呈两端开放的扁槽状，L3和H3构成槽底，L1、L2构成左槽壁，H1、H2构成右槽壁，LFR2区的F49及HFR3区的R94残基也参与了形成美妥昔单抗的抗原结合位点。从图中不难看出，针对蛋白质抗原的抗体与先前针对化学小分子的抗体，它们所形成的抗原结合位点形态迥然不同。对于任一抗体，通过建模后对抗原结合位点形态的观察，似乎就能大概知道其所针对抗原的大致类型。计算之神奇，叹为观止矣！

图7-8 美妥昔单抗三维空间理论模型

4. 在疫苗研究中的应用

疫苗极大地促进了人类健康事业的发展。但是，人类的生命与财产仍面临巨大的威胁。这些威胁主要体现在以下五个方面。其一，是新的传染病病原不断出现，如埃博拉病毒、人类获得性免疫缺陷病毒（HIV）、新的传染性肝炎病毒、疯牛病病毒及SARS病毒等。其二，是一些为人熟知的人畜致病微生物不断产生新的变种或耐药性并再次成为人类生命的杀手与财富的终结者，如大肠杆菌O157、结核分枝杆菌、口蹄疫病毒、禽流感病毒等。其三，是911后整个世界面临着日益严重的生物恐怖主义威胁，如911后的炭疽恐慌。其四，是大量疑难疾病急需新的治疗手段，如癌症的免疫治疗。其五，是对药品及疫苗本身生物安全性的担忧，如传统疫苗通常使用某种疾病的减毒或灭活的致病原，但这仍可能造成疾病传播或中。正因为如此，人类社会才迫切需要更快地拥有更多、更安全、更可靠的新的疫苗产品。

就以疫苗最经典的应用领域——传染病预防为例，目前已明确的致病微生物超过400中，但只针对其中30多种开发出了上市的疫苗。因此，仍然大量传染病预防疫苗仍亟待开发。目前的疫苗研发已从传统的预防性疫苗发展到治疗性疫苗，适用范围从原来单纯的传染病预防发展到对过敏性疾病、自身免疫性疾病、器官移植性疾病、计划生育、免疫去势、不孕不育症、老年痴呆、肿瘤防治、戒烟戒毒等各个方面。随着人类基因组计划的完成与大量病原微生物基因组的阐明，人类已进入从基因组到候选保护性抗原到保护性表位到个体化定制疫苗的时代，免疫信息学在其中发挥着重要的助推作用。

例如，在表位疫苗设计方面，EpiVax公司设计了iVAX工具包。iVAX是一套根据蛋白抗原序列，设计表位疫苗的免疫信息学工具，包括Conservatrix、EpiMatrix、ClustiMer、BlastiMer、EpiAssembler、Aggregatrix和VaccineCAD等程序。其中，Conservatrix评估九肽片段在同一病原不同毒株之间的保守性；EpiMatrix评估多肽片段的HLA-I、II分子结合能力；ClustiMer根据EpiMatrix输出确定富含T细胞表位多肽群；BlastiMer评估这些多肽群与人类基因组间的相似性，相似的序列要么耐受难以引起免疫应答，要么造成自身免疫病，因此需去掉；EpiAssembler将保守、特异且富含T细胞表位的多肽群合起来；Aggregatrix确定覆盖最多HLA型别，最多毒株病原的最小一套表位；VaccineCAD将候选表位多肽合理串接，避免因多肽连接形成新的表位。

疫苗研究在线信息网（Vaccine Investigation and OnLine Information Network, VIOLIN）也提供了大量疫苗研发相关信息，包括疫苗相关的各种数据库及程序[80]。其中，Vaxign是一个集成的反向疫苗学在线软件[81]。它包括两个部分：一是可直接查询预先已预测好的结果；二是对提交的新基因组或蛋白序列进行实时交互分析预测。Vaxign集成了一系列软件，包括：（1）确定蛋白抗原亚细胞定位的PSORTb，分泌或病原外膜蛋白可能是理想的候选靶标，而胞浆及内膜蛋白则不理想；（2）预测蛋白质跨膜方式的TMHMM，跨膜超过1次的蛋白难以克隆、表达、纯化，不适宜作为重组疫苗的抗原；（3）预测粘附及粘附样分子的SPAAN，粘附样分子的通常是理想的疫苗靶标；（4）预测MHC-I及II结合能力的Vaxitope，此软件由He研究组自己开发；（5）分析序列相似性的BLAST，与宿主高度相似的序列要么耐受要么导致自身免疫，不是理想的靶标。

最后，举一个实际案例。脑膜炎奈瑟菌是流行性脑脊髓膜炎（简称流脑）的病原菌。根据其荚膜多糖抗原的差异，可将脑膜炎奈瑟菌分为至少13个血清型，其中致病的主要是A、B、C、Y及W-135血清型。迄今，A、C、Y及W-135血清型的纯化多糖疫苗已使用了多年，取得了较好的预防效果；但到目前为止仍然未能开发出针对脑膜炎奈瑟菌B血清型（MenB）的疫苗。原因主要是MenB荚膜多糖一段与人唾液酸一致，其荚膜多糖不宜作为疫苗，而主要的外膜蛋白PorA变异度大，免疫后只能引起毒株特异性保护，不能预防所有MenB感染（见图7-9）。这样，MenB导致的流脑愈发常见，已占美国流脑的1/3，欧洲流脑的45%-80%以上，成为严重的健康威胁。2000年，MenB-MC58株的全基因组测序完成[82]，生物信息学方法立刻用于预测其基因，免疫信息学方法立刻用于预测、筛选保护性抗原[83]，预测与实验相结合，很快确定了在外膜上含量相对较少、但更加保守的几个保护性抗原如H因子结合蛋白（factor H-binding protein, FHBP)、奈瑟菌粘附素A（Neisseria adhesin A, NadA）及奈瑟菌肝素结合抗原（Neisseria heparin-binding antigen, NHBA）等。正是由于采用了这种计算加实验的转化医学策略，目前，MenB疫苗已在上市审批中[84]。

图7-9 脑膜炎奈瑟菌B示意图

5. 在移植免疫中的应用

人工神经网络等机器学习方法已经用于移植免疫领域多年；例如，用于预测肝移植排斥、肝移植后他克莫司血药浓度、辅助诊断肾移植超急排斥、评估肾移植并发症、预测肾移植后巨细胞病毒感染、预测胰腺移植的预后等。器官移植，最重要的是HLA配型。然而，由于供者有限，在没有完全匹配的情况下，如何从不完全匹配的供者选出最合适、最兼容的。美国匹兹堡大学医学中心的Duquesnoy教授研究该问题10余年，开发了一系列基于EXCEL的宏程序HLAMatchmaker[85]。由于该程序要创建临时文件并要反复地在EXCEL表格之间剪切粘贴，既费时间又容易出错，因此Filho等最近开发了基于HLAMatchmaker的EpHLA程序，实现的分析过程的完全自动化。[86]

6. 在变态反应防治中的应用

民以食为天。然而，自古以来食物过敏（food allergy）就一直困扰着人类。流传于民间和传统医学中的“发物”之说以及与之相关的种种饮食禁忌，在一定程度上反应了人们对食物过敏的经验认识。现代医学与免疫学研究表明，绝大多数食物过敏属于IgE介导的I型变态反应，一般表现为哮喘、腹泻、腹痛、荨麻疹等；但严重的也可能出现危及生命的、与青霉素过敏反应类似的过敏性休克。流行病学调查的数据显示，食物过敏在成年人中的发病率约为2 ~4%；而在儿童中则更高达8%；每年每100万人中，约32人发生严重甚至致命的食物过敏[87]。随着转基因农作物的出现及其在食品工业中的广泛应用，公众对食物过敏的担忧进一步加深。了解、获取食物过敏的相关信息已经成为公众的迫切需求。“新买的转基因玉米会不会有更高的引起食物过敏的风险？”、“我吃豌豆过敏，那吃山里朋友送来的土特产小扁豆会不会也过敏呢？”人们自然而然会有诸如此类的种种问题。也就是说，公众迫切需要一个与天气预报与预警类似的，使用方便、通俗易懂的食物过敏预测、预警与查询系统。

由于食物过敏极为常见，危害广泛，且与公众日常生活与健康息息相关，美国、日本、欧盟国家及相关国际组织如世界卫生组织（World Health Organization, WHO）、联合国粮农组织（Food and Agriculture Organization, FAO）一直非常重视食物过敏及其防治研究。现代医学研究认为，食物过敏主要由食物中一些特别的蛋白质引起；这些引起过敏（变态反应）的蛋白质在免疫学中被统称为变应原（allergen）。目前，对食物过敏除了一些对症治疗外，并没有根治措施。因此，避免接触或摄入过敏食物，从而预防食物过敏的发生就至关重要了。临床上，主要通过皮试和体外IgE检测来诊断食物过敏。然而，临床诊断用变应原的种类有限，而食物及其蛋白质组成却纷繁复杂。如何根据有限的实验结果，科学严谨地推断到更多未经实验检测的食品（包括转基因食品）中去，从而预测、预警其引起食物过敏的风险，这已经成为免疫信息学研究的一个前沿与热点。

这主要体现在以下两个方面：其一是1996年以来，大量变应原数据库及IgE表位数据库出现；其二是食物过敏预测方法日趋成熟。目前，食物过敏的免疫信息学预测已经发展出短肽匹配、序列比对、结构比较等3种不同方法[88]。短肽匹配方法比较用户提交的蛋白质氨基酸序列与数据库中所有已知过敏原有没有8个连续相同氨基酸。如果有，则认为该蛋白质可能引起食物过敏。在美国、欧盟、日本，短肽匹配方法已经广泛用于转基因植物的安全评估中。序列比对方法采用BLAST或FASTA程序，把用户提交的蛋白质氨基酸序列与数据库中所有已知过敏原进行序列相似性的两两比对。2001年，FAO/WHO专家组推荐，两比对序列80个氨基酸残基的序列节段内，如果35%以上的氨基酸残基相同则预测该蛋白质可能引起过敏反应。新近的研究显示，两条比对好的序列中如有70%以上的氨基酸残基相同，则几乎肯定会有食物过敏的发生。例如，Sanchez-Monge等报道，对豌豆过敏的18位患者同时也都对小扁豆过敏[89]。豌豆中的过敏原主要是豌豆种子球蛋白（vicilin）和伴球蛋白（convicilin）；而小扁豆的种子球蛋白与豌豆种子球蛋白有90%以上的氨基酸残基相同，豌豆伴球蛋白与小扁豆伴球蛋白之间，相同氨基酸残基超过70%。Beyer等报道[90]，14位对榛子过敏的患者中，12位经检测有能与11S榛子球蛋白结合的IgE。同时，这14位对榛子过敏的患者约有一半也对花生或核桃、巴西果、腰果、杏仁等过敏。这些坚果的11S球蛋白序列有45%~55%的氨基酸残基与榛子相同。本领域最新的研究思路是通过比较结构进行食物过敏预测。由于食物过敏主要由IgE介导，而大多数IgE识别的是变应原上的空间构象性表位；同时，大多数重要的变应原都可归结到少数几个结构家族，提示只要与已知变应原具有相似空间结构，即使氨基酸序列相似性程度低，也可能形成相似的空间构象性表位，并因此可能引发交叉的过敏反应。2005年，在西班牙召开了一场关于过敏预测方法的专题国际学术讨论会。与会专家一致认为， FAO/WHO专家组2001年推荐的双测试中，6连续氨基酸短肽匹配方法假阳性率高，不主张继续采用。对序列比对方法中的同率阈值，与会专家存在分歧，主流意见认为，FAO/WHO专家组2001年推荐的35%的阈值较为保守，但仍可在应用中继续检验。此外，与会专家还一致看好结构比较方法，但由于目前结构数据仍然缺乏，同时还没有与序列比对类似的统一清晰的结构相似性指标，结构比较方法仍有待进一步研究。

药物过敏是另一种最为常见的变态反应。最近，药物过敏有突破性发现[91]。至少有部分药物，如阿巴卡韦、卡马西平等导致严重甚至是致命的IV变态反应，其机制完全不同于传统观点。现已确定，阿巴卡韦与卡马西平能分别结合到HLA-B*57:01、HLA-B*15:02分子的抗原结合槽，从而使相应分子递呈抗原肽的特性发生改变，就仿佛用药后机体有了一个新的HLA分子，从而导致具有该HLA等位基因的患者发生类似器官移植不匹配的后果。今后，免疫信息学在预测药物过敏方面必定大有所为。免疫信息学还能用到什么地方？未来总是超乎想象。

脚注

* 诺华基金会是一个国际性的科学和教学慈善机构，它旨在促进生物学、医学和化学研究方面的合作。John Wiley从1986年起就是诺华基金会的出版商，出版了独一无二的、受到业界高度尊重的诺华系列丛书。这些书籍包括诺华基金研讨会的论文集，并且还汇编了主要科学家和学者演讲后广泛的鼓舞人心的讨论和辩论。这些珍贵的资源涵盖了20世纪后期所有关键的生物学发展，并且由国际知名的专家作为撰稿人，其中更包括很多诺贝尔奖获得者。生动的辩论加上撰稿人的国际地位，为诺华基金研讨会系列丛书赢得了在科学文献方面独一无二的尊贵地位。

^#1971年Anthony Nolan出生并发现患有Wiskott-Aldrich综合征，只能通过骨髓移植治疗，但当时没有寻找除至亲之外的供者系统。1973年，世界上第一例无亲缘关系的配型与骨髓移植成功。居住在澳洲的安东尼妈妈雪莉.诺南(Shirley Nolan)看到了希望，不远千里回到英国，呼吁国人踊跃验血，并于1975年催生了Anthony Nolan基金会，建立了世界上第一个骨髓资料库。可惜，安东尼.诺南没有等到合适的供者，于1979年去世。1993年安东尼.诺南研究所建成；迄今已有职员171位，登记的供者已超过40万份。

参考文献

Orosz CG: An introduction to immuno-ecology and immuno-informatics. In: Design Principles for the Immune System and Other Distributed Autonomous Systems. Edited by Segel LA, Cohen IR: Oxford University Press; 2001: 125–149.
Orosz CG: The case for immuno-informatics. Graft 2002, 5(8):462-465.
Segel LA: Controlling the immune system: Diffuse feedback via a diffuse informational network. In: Complexity in biological information processing: Novartis Foundation Symposium 239. Edited by Bock GR, Goode JA: John Wiley & Sons; 2001: 31–44.
Petrovsky N, Schonbach C, Brusic V: Bioinformatic strategies for better understanding of immune function. In Silico Biol 2003, 3(4):411-416.
Rammensee HG: Immunoinformatics: bioinformatic strategies for better understanding of immune function. Introduction. Novartis Found Symp 2003, 254:1-2.
Hart E, Timmis J: Application areas of AIS: The past, the present and the future. Applied Soft Computing 2008, 8(1):191-201.
Timmis J: Artificial immune systems-today and tomorrow. Natural Computing 2007, 6(1):1-18.
Flower DR, McSparron H, Blythe MJ, Zygouri C, Taylor D, Guan P, Wan S, Coveney PV, Walshe V, Borrow P et al: Computational vaccinology: quantitative approaches. Novartis Found Symp 2003, 254:102-120; discussion 120-105, 216-122, 250-102.
Pinheiro CS, Martins VP, Assis NR, Figueiredo BC, Morais SB, Azevedo V, Oliveira SC: Computational vaccinology: an important strategy to discover new potential S. mansoni vaccine candidates. J Biomed Biotechnol 2011, 2011:503068.
Rappuoli R, Covacci A: Reverse vaccinology and genomics. Science 2003, 302(5645):602.
Jones D: Reverse vaccinology on the cusp. Nat Rev Drug Discov 2012, 11(3):175-176.
Hagmann M: Computers aid vaccine design. Science 2000, 290(5489):80-82.
Kuroda D, Shirai H, Jacobson MP, Nakamura H: Computer-aided antibody design. Protein Eng Des Sel 2012:in press.
Tomar N, De RK: Immunoinformatics: an integrated scenario. Immunology 2010, 131(2):153-168.
Benson DA, Karsch-Mizrachi I, Clark K, Lipman DJ, Ostell J, Sayers EW: GenBank. Nucleic Acids Res 2012, 40(Database issue):D48-53.
UniProtConsortium: Ongoing and future developments at the Universal Protein Resource. Nucleic Acids Res 2011, 39(Database issue):D214-219.
Madej T, Addess KJ, Fong JH, Geer LY, Geer RC, Lanczycki CJ, Liu C, Lu S, Marchler-Bauer A, Panchenko AR et al: MMDB: 3D structures and macromolecular interactions. Nucleic Acids Res 2012, 40(Database issue):D461-464.
Kanehisa M, Goto S, Sato Y, Furumichi M, Tanabe M: KEGG for integration and interpretation of large-scale molecular data sets. Nucleic Acids Res 2012, 40(Database issue):D109-114.
Lefranc MP, Giudicelli V, Ginestoux C, Jabado-Michaloud J, Folch G, Bellahcene F, Wu Y, Gemrot E, Brochet X, Lane J et al: IMGT, the international ImMunoGeneTics information system. Nucleic Acids Res 2009, 37(Database issue):D1006-1012.
Salimi N, Fleri W, Peters B, Sette A: The Immune Epitope Database: A Historical Retrospective of the First Decade. Immunology 2012:in press.
Kim Y, Ponomarenko J, Zhu Z, Tamang D, Wang P, Greenbaum J, Lundegaard C, Sette A, Lund O, Bourne PE et al: Immune epitope database analysis resource. Nucleic Acids Res 2012, 40(Web Server issue):W525-530.
Robinson J, Mistry K, McWilliam H, Lopez R, Marsh SG: IPD--the Immuno Polymorphism Database. Nucleic Acids Res 2010, 38(Database issue):D863-869.
Johnson G, Wu TT: Kabat Database and its applications: future directions. Nucleic Acids Res 2001, 29(1):205-206.
Rammensee H, Bachmann J, Emmerich NP, Bachor OA, Stevanovic S: SYFPEITHI: database for MHC ligands and peptide motifs. Immunogenetics 1999, 50(3-4):213-219.
Singh MK, Srivastava S, Raghava GP, Varshney GC: HaptenDB: a comprehensive database of haptens, carrier proteins and anti-hapten antibodies. Bioinformatics 2006, 22(2):253-255.
Sayers S, Ulysse G, Xiang Z, He Y: Vaxjo: a web-based vaccine adjuvant database and its application for analysis of vaccine adjuvants and their uses in vaccine development. J Biomed Biotechnol 2012, 2012:831486.
Saha S, Bhasin M, Raghava GP: Bcipep: a database of B-cell epitopes. BMC Genomics 2005, 6:79.
Huang J, Honda W: CED: a conformational epitope database. BMC Immunol 2006, 7:7.
Yang B, Sayers S, Xiang Z, He Y: Protegen: a web-based protective antigen database and analysis system. Nucleic Acids Res 2011, 39(Database issue):D1073-1078.
Jongeneel V: Towards a cancer immunome database. Cancer Immun 2001, 1:3.
Zhang ZH, Tan SC, Koh JL, Falus A, Brusic V: ALLERDB database and integrated bioinformatic tools for assessment of allergenicity and allergic cross-reactivity. Cell Immunol 2006, 244(2):90-96.
Mills EN, Valovirta E, Madsen C, Taylor SL, Vieths S, Anklam E, Baumgartner S, Koch P, Crevel RW, Frewer L: Information provision for allergic consumers--where are we going with food allergen labelling? Allergy 2004, 59(12):1262-1268.
Mills EN, Jenkins JA, Sancho AI, Miles S, Madsen C, Valovirta E, Frewer L: Food allergy information resources for consumers, industry and regulators. Arb Paul Ehrlich Inst Bundesamt Sera Impfstoffe Frankf A M 2006(95):17-25; discussion 25-17.
Ivanciuc O, Schein CH, Braun W: SDAP: database and computational tools for allergenic proteins. Nucleic Acids Res 2003, 31(1):359-362.
Allcorn LC, Martin AC: SACS--self-maintaining database of antibody crystal structure information. Bioinformatics 2002, 18(1):175-181.
Huang J, Kawashima S, Kanehisa M: New amino acid indices based on residue network topology. Genome Inform 2007, 18:152-161.
Huang J, Honda W, Kanehisa M: Predicting B cell epitope residues with network topology based amino acid indices. Genome Inform 2007, 19:40-49.
Larsen JE, Lund O, Nielsen M: Improved method for predicting linear B-cell epitopes. Immunome Res 2006, 2:2.
Zhang W, Xiong Y, Zhao M, Zou H, Ye X, Liu J: Prediction of conformational B-cell epitopes from 3D structures by random forests with a distance-based feature. BMC Bioinformatics 2011, 12:341.
Kulkarni-Kale U, Bhosle S, Kolaskar AS: CEP: a conformational epitope prediction server. Nucleic Acids Res 2005, 33(Web Server issue):W168-171.
Haste Andersen P, Nielsen M, Lund O: Prediction of residues in discontinuous B-cell epitopes using protein 3D structures. Protein Sci 2006, 15(11):2558-2567.
Sun J, Wu D, Xu T, Wang X, Xu X, Tao L, Li YX, Cao ZW: SEPPA: a computational server for spatial epitope prediction of protein antigens. Nucleic Acids Res 2009, 37(Web Server issue):W612-616.
Hu X, Zhou W, Udaka K, Mamitsuka H, Zhu S: MetaMHC: a meta approach to predict peptides binding to MHC molecules. Nucleic Acids Res 2010, 38(Web Server issue):W474-479.
Zhang GL, Ansari HR, Bradley P, Cawley GC, Hertz T, Hu X, Jojic N, Kim Y, Kohlbacher O, Lund O et al: Machine learning competition in immunology - Prediction of HLA class I binding peptides. J Immunol Methods 2011, 374(1-2):1-4.
Smith GP: Filamentous fusion phage: novel expression vectors that display cloned antigens on the virion surface. Science 1985, 228(4705):1315-1317.
Devlin JJ, Panganiban LC, Devlin PE: Random peptide libraries: a source of specific protein binding molecules. Science 1990, 249(4967):404-406.
Smith GP, Petrenko VA: Phage Display. Chem Rev 1997, 97(2):391-410.
Huang J, Gutteridge A, Honda W, Kanehisa M: MIMOX: a web tool for phage display based epitope mapping. BMC Bioinformatics 2006, 7:451.
Huang J, Ru B, Dai P: Prediction of protein interaction sites using mimotope analysis. In: Protein-Protein Interactions - Computational and Experimental Tools. Edited by Cai W: InTech; 2012: 189-206.
Tong AH, Drees B, Nardelli G, Bader GD, Brannetti B, Castagnoli L, Evangelista M, Ferracuti S, Nelson B, Paoluzi S et al: A combined experimental and computational strategy to define protein interaction networks for peptide recognition modules. Science 2002, 295(5553):321-324.
Thom G, Cockroft AC, Buchanan AG, Candotti CJ, Cohen ES, Lowne D, Monk P, Shorrock-Hart CP, Jermutus L, Minter RR: Probing a protein-protein interaction by in vitro evolution. Proc Natl Acad Sci U S A 2006, 103(20):7619-7624.
Pasqualini R, Ruoslahti E: Organ targeting in vivo using phage display peptide libraries. Nature 1996, 380(6572):364-366.
Hsiung PL, Hardy J, Friedland S, Soetikno R, Du CB, Wu AP, Sahbaie P, Crawford JM, Lowe AW, Contag CH et al: Detection of colonic dysplasia in vivo using a targeted heptapeptide and confocal microendoscopy. Nat Med 2008, 14(4):454-458.
Macdougall IC, Rossert J, Casadevall N, Stead RB, Duliege AM, Froissart M, Eckardt KU: A peptide-based erythropoietin-receptor agonist for pure red-cell aplasia. N Engl J Med 2009, 361(19):1848-1855.
Knittelfelder R, Riemer AB, Jensen-Jarolim E: Mimotope vaccination--from allergy to cancer. Expert Opin Biol Ther 2009, 9(4):493-506.
Lee YJ, Yi H, Kim WJ, Kang K, Yun DS, Strano MS, Ceder G, Belcher AM: Fabricating genetically engineered high-power lithium-ion batteries using multiple virus genes. Science 2009, 324(5930):1051-1055.
Nam YS, Magyar AP, Lee D, Kim JW, Yun DS, Park H, Pollom TS, Jr., Weitz DA, Belcher AM: Biologically templated photocatalytic nanostructures for sustained light-driven water oxidation. Nat Nanotechnol 2010, 5(5):340-344.
Smothers JF, Henikoff S, Carter P: Affinity selection from biological libraries. Science 2002, 298(5593):621-622.
Menendez A, Scott JK: The nature of target-unrelated peptides recovered in the screening of phage-displayed random peptide libraries with antibodies. Anal Biochem 2005, 336(2):145-157.
Vodnik M, Zager U, Strukelj B, Lunder M: Phage display: selecting straws instead of a needle from a haystack. Molecules 2011, 16(1):790-817.
Thomas WD, Golomb M, Smith GP: Corruption of phage display libraries by target-unrelated clones: diagnosis and countermeasures. Anal Biochem 2010, 407(2):237-240.
Brammer LA, Bolduc B, Kass JL, Felice KM, Noren CJ, Hall MF: A target-unrelated peptide in an M13 phage display library traced to an advantageous mutation in the gene II ribosome-binding site. Anal Biochem 2008, 373(1):88-98.
Derda R, Tang SK, Li SC, Ng S, Matochko W, Jafari MR: Diversity of Phage-Displayed Libraries of Peptides during Panning and Amplification. Molecules 2011, 16(2):1776-1803.
Ru B, Huang J, Dai P, Li S, Xia Z, Ding H, Lin H, Guo F, Wang X: MimoDB: a New Repository for Mimotope Data Derived from Phage Display Technology. Molecules 2010, 15(11):8279-8288.
Huang J, Ru B, Zhu P, Nie F, Yang J, Wang X, Dai P, Lin H, Guo FB, Rao N: MimoDB 2.0: a mimotope database and beyond. Nucleic Acids Res 2012, 40(Database issue):D271-277.
Huang J, Ru B, Dai P: Bioinformatics resources and tools for phage display. Molecules 2011, 16(1):694-709.
Mandava S, Makowski L, Devarapalli S, Uzubell J, Rodi DJ: RELIC--a bioinformatics server for combinatorial peptide analysis and identification of protein-ligand interaction sites. Proteomics 2004, 4(5):1439-1460.
Huang J, Ru B, Li S, Lin H, Guo FB: SAROTUP: scanner and reporter of target-unrelated peptides. J Biomed Biotechnol 2010, 2010:101932.
Abhinandan KR, Martin AC: Analysis and improvements to Kabat and structurally correct numbering of antibody variable domains. Mol Immunol 2008, 45(14):3832-3839.
Deret S, Maissiat C, Aucouturier P, Chomilier J: SUBIM: a program for analysing the Kabat database and determining the variability subgroup of a new immunoglobulin sequence. Comput Appl Biosci 1995, 11(4):435-439.
Martin AC: Accessing the Kabat antibody sequence database by computer. Proteins 1996, 25(1):130-133.
Abhinandan KR, Martin AC: Analyzing the "degree of humanness" of antibody sequences. J Mol Biol 2007, 369(3):852-862.
Abhinandan KR, Martin AC: Analysis and prediction of VH/VL packing in antibodies. Protein Eng Des Sel 2010, 23(9):689-697.
Whitelegg NR, Rees AR: WAM: an improved algorithm for modelling antibodies on the WEB. Protein Eng 2000, 13(12):819-824.
Arnold K, Bordoli L, Kopp J, Schwede T: The SWISS-MODEL workspace: a web-based environment for protein structure homology modelling. Bioinformatics 2006, 22(2):195-201.
Marcatili P, Rosi A, Tramontano A: PIGS: automatic prediction of antibody structures. Bioinformatics 2008, 24(17):1953-1954.
Sircar A, Kim ET, Gray JJ: RosettaAntibody: antibody variable region homology modeling server. Nucleic Acids Res 2009, 37(Web Server issue):W474-479.
Tseng YY, Dupree C, Chen ZJ, Li WH: SplitPocket: identification of protein functional surfaces and characterization of their spatial patterns. Nucleic Acids Res 2009, 37(Web Server issue):W384-389.
Liang J, Edelsbrunner H, Woodward C: Anatomy of protein pockets and cavities: measurement of binding site geometry and implications for ligand design. Protein Sci 1998, 7(9):1884-1897.
Xiang Z, Todd T, Ku KP, Kovacic BL, Larson CB, Chen F, Hodges AP, Tian Y, Olenzek EA, Zhao B et al: VIOLIN: vaccine investigation and online information network. Nucleic Acids Res 2008, 36(Database issue):D923-928.
He Y, Xiang Z, Mobley HL: Vaxign: the first web-based vaccine design program for reverse vaccinology and applications for vaccine development. J Biomed Biotechnol 2010, 2010:297505.
Tettelin H, Saunders NJ, Heidelberg J, Jeffries AC, Nelson KE, Eisen JA, Ketchum KA, Hood DW, Peden JF, Dodson RJ et al: Complete genome sequence of Neisseria meningitidis serogroup B strain MC58. Science 2000, 287(5459):1809-1815.
Pizza M, Scarlato V, Masignani V, Giuliani MM, Arico B, Comanducci M, Jennings GT, Baldi L, Bartolini E, Capecchi B et al: Identification of vaccine candidates against serogroup B meningococcus by whole-genome sequencing. Science 2000, 287(5459):1816-1820.
Black S, Pizza M, Nissum M, Rappuoli R: Toward a meningitis-free world. Sci Transl Med 2012, 4(123):123ps125.
Duquesnoy RJ: Antibody-reactive epitope determination with HLAMatchmaker and its clinical applications. Tissue Antigens 2011, 77(6):525-534.
Filho HL, da Mata Sousa LC, von Glehn Cde Q, da Silva AS, dos Santos Neto Pde A, do Nascimento F, de Castro AF, do Nascimento LM, Kneib C, Bianchi Cazarote H et al: EpHLA software: a timesaving and accurate tool for improving identification of acceptable mismatches for clinical purposes. Transpl Immunol 2012, 26(4):230-234.
Gibson J: Bioinformatics of protein allergenicity. Mol Nutr Food Res 2006, 50(7):591.
Goodman RE: Practical and predictive bioinformatics methods for the identification of potentially cross-reactive protein matches. Mol Nutr Food Res 2006, 50(7):655-660.
Sanchez-Monge R, Lopez-Torrejon G, Pascual CY, Varela J, Martin-Esteban M, Salcedo G: Vicilin and convicilin are potential major allergens from pea. Clin Exp Allergy 2004, 34(11):1747-1753.
Beyer K, Grishina G, Bardina L, Grishin A, Sampson HA: Identification of an 11S globulin as a major hazelnut food allergen in hazelnut-induced systemic reactions. J Allergy Clin Immunol 2002, 110(3):517-523.
Illing PT, Vivian JP, Dudek NL, Kostenko L, Chen Z, Bharadwaj M, Miles JJ, Kjer-Nielsen L, Gras S, Williamson NA et al: Immune self-reactivity triggered by drug-modified HLA-peptide repertoire. Nature 2012, 486(7404):554-558.

转载于:https://www.cnblogs.com/nkwy2012/p/7967936.html

你可能感兴趣的:(数据库,操作系统,运维)

Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
【从浅识到熟知Linux】Linux发展史 Jammingpro 从浅学到熟知Linux linux 运维服务器
归属专栏：从浅学到熟知Linux个人主页：Jammingpro每日努力一点点，技术变化看得见文章前言：本篇文章记录Linux发展的历史，因在介绍Linux过程中涉及的其他操作系统及人物，本文对相关内容也有所介绍。文章目录Unix发展史Linux发展史开源Linux官网企业应用情况发行版本在学习Linux前，我们可能都会问Linux从哪里来？它是如何发展的。但在介绍Linux之前，需要先介绍一下Un
linux 发展史种树的猴子内核 java 操作系统 linux 大数据
linux发展史说明此前对linux认识模糊一知半解，近期通过学习将自己对于linux的发展总结一下方便大家日后的学习。那Linux是目前一款非常火热的开源操作系统，可是linux是什么时候出现的，又是因为什么样的原因被开发出来的呢。以下将对linux的发展历程进行详细的讲解。目录一、Linux发展背景二、UINIX的诞生三、UNIX的重要分支-BSD的诞生四、Minix的诞生五、GNU与Free
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
2023最详细的Python安装教程（Windows版本）程序员林哥 Python python windows 开发语言
python安装是学习pyhon第一步，很多刚入门小白不清楚如何安装python，今天我来带大家完成python安装与配置，跟着我一步步来，很简单，你肯定能完成。第一部分：python安装（一）准备工作1、下载和安装python(认准官方网站)当然你不想去下载的话也可以分享给你，还有入门学习教程，点击下方卡片跳转进群领取（二）开始安装对于Windows操作系统，可以下载“executableins
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
经纬恒润二面&三七互娱一面&元象二面 Redstone Monstrosity 面试前端
1.请尽可能详细地说明，进程和线程的区别，分别有哪些应用场景？进程间如何通信？线程间如何通信？你的回答中不要写出示例代码。进程和线程是操作系统中的两个基本概念，它们在计算机系统中扮演着不同的角色，并且在不同的应用场景中发挥作用。进程和线程的区别定义：进程：进程是操作系统进行资源分配和调度的基本单位。每个进程都有独立的内存空间和系统资源。线程：线程是进程内的一个执行单元，是操作系统进行调度的最小单位
3.增删改查--连接查询问女何所忆
关系型数据库的一个特点就是，多张表之间存在关系，以致于我们可以连接多张表进行查询操作，所以连接查询会是关系型数据库中最常见的操作。连接查询主要分为三种，交叉连接、内连接和外连接，我们一个个说。1、交叉连接交叉连接其实连接查询的第一个阶段，它简单表现为两张表的笛卡尔积形式，具体例子：如果你没学过数学中的笛卡尔积概念，你可以这样简单的理解这里的交叉连接：两张表的交叉连接就是一个连接合并的过程，T1表中
C++常见知识掌握 nfgo c++开发语言
1.Linux软件开发、调试与维护内核与系统结构Linux内核是操作系统的核心，负责管理硬件资源，提供系统服务，它是系统软件与硬件之间的桥梁。主要组成部分包括：进程管理：内核通过调度器分配CPU时间给各个进程，实现进程的创建、调度、终止等操作。使用进程描述符（task_struct）来存储进程信息，包括状态（就绪、运行、阻塞等）、优先级、内存映射等。内存管理：包括物理内存和虚拟内存管理。通过页表映
docker from指令的含义_多个FROM-含义 weixin_39722188 docker from指令的含义
小编典典什么是基本图片？一组文件，加上EXPOSE端口ENTRYPOINT和CMD。您可以添加文件并基于该基础图像构建新图像，Dockerfile并以FROM指令开头：后面提到的图像FROM是新图像的“基础图像”。这是否意味着如果我neo4j/neo4j在FROM指令中声明，则在运行映像时，neo数据库将自动运行并且可在端口7474的容器中使用？仅当您不覆盖CMD和时ENTRYPOINT。但是图像
Redis:缓存击穿我的程序快快跑啊缓存 redis java
缓存击穿(热点key)：部分key(被高并发访问且缓存重建业务复杂的)失效,无数请求会直接到数据库，造成巨大压力1.互斥锁：可以保证强一致性线程一：未命中之后，获取互斥锁，再查询数据库重建缓存，写入缓存，释放锁线程二：查询未命中，未获得锁(已由线程一获得)，等待一会，缓存命中互斥锁实现方式：redis中setnxkeyvalue:改变对应key的value,仅当value不存在时执行，以此来实现互
mysql学习教程，从入门到精通，TOP 和MySQL LIMIT 子句（15）知识分享小能手大数据数据库 MySQL mysql 学习 oracle 数据库开发语言 adb 大数据
1、TOP和MySQLLIMIT子句内容在SQL中，不同的数据库系统对于限制查询结果的数量有不同的实现方式。TOP关键字主要用于SQLServer和Access数据库中，而LIMIT子句则主要用于MySQL、PostgreSQL（通过LIMIT/OFFSET语法）、SQLite等数据库中。下面将分别详细介绍这两个功能的语法、语句以及案例。1.1、TOP子句（SQLServer和Access）1.1
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s