暗涧幽火

电商知识图谱

文章作者：阿里CBU技术部

内容来源：《阿里巴巴B2B电商算法实战》

导读：发展是平台永恒的话题，以电商平台为例，在基于用户身份、历史行为挖掘偏好，以实现精准搜索和推荐结果展示之外，为了激励用户在平台进行更多采购，需要专门构建强化采购激励、拓宽采购品类的场景。本文以知识图谱为切入点，重点讲解了阿里巴巴B2B在电商结构化信息挖掘和场景应用等方面的经验。

知识图谱并不是一个全新的概念，它经历了知识工程、专家系统、语义网络等多种形式。

知识工程与专家系统

在1977年第五届国际人工智能会议上，美国斯坦福大学计算机科学家Edward A. Felgenbaum发表的文章The art of artificial intelligence. 1. Themes and case studies of knowledge engineering，系统性地阐述了“专家系统”的思想，并且提出了“知识工程”的概念。他认为：“知识工程利用了人工智能的原理和方法，为那些需要专家知识才能解决的应用难题提供求解的一般准则和工具。在1984年8月全国第五代计算机专家讨论会上，史忠植教授提出：“知识工程是研究知识信息处理的学科，提供开发智能系统的技术，是人工智能、数据库技术、数理逻辑、认知科学、心理学等学科交叉发展的结果。”

专家系统最成功的案例是DEC的专家配置系统XCON。1980年，XCON最初被用于DEC位于新罕布什尔州萨利姆的工厂，它拥有大约2500条规则。截至1986年，它一共处理了80 000条指令，准确率达到95%～98%。据估计，通过减少技师出错时送给客户的组件以加速组装流程和增加客户满意度，它每年为DEC节省2500万美元。

一个典型的专家系统如图1所示，其特点主要包括：

在特定领域里要具有和人一样或者超出人的高质量解决困难问题的能力；
拥有大量、全面的关于特定领域的专业知识；
采用启发的方法来指导推理过程，从而缩小解决方案的搜索范围；
能够提供对自己的推理决策结果进行解释的能力；
引入表示不同类型知识（如事实、概念和规则）的符号，专家系统在解决问题的时候用这些符号进行推理；
能够提供咨询建议、修改、更新、拓展能力，并能处理不确定和不相关的数据。

图1 专家系统架构

可以看到，专家系统大量依靠领域专家人工构建的知识库。在数据量激增、信息暴涨的当下，人工维护知识库的方式在效率和覆盖率上都难以达到令人满意的水平。另外，推理规则的增加也增加了系统的复杂度，从而导致系统非常难以维护。

语义网络与知识图谱

1. 语义网络

伴随着Web技术的不断发展，人类先后经历了以网页的链接为主要特征的Web 1.0时代到以数据的链接（Linked Data）为主要特征的Web 2.0时代，目前Web技术正逐步朝向Web之父Berners Lee在2001年提出的基于知识互联的语义网络（semantic Web），也就是Web 3.0时代迈进。

在Web 2.0时代，互联网发展迅猛，数据的规模呈爆发式增长，基于统计的机器学习方法占据主流，并且在各个领域取得不错的成果。例如搜索引擎，搜索的流程大致可拆分为基于用户查询、召回、L2R这3个过程，一定程度提升了用户获取信息的效率。但是这种服务模式仍然是把一系列信息抛给用户，用户最终还是需要对数据进行筛选、甄别，才能拿到自己最需要的信息。因此这种服务方式在效率、准确率上都有缺陷。

语义网络的目标是构建一个人与机器都可理解的万维网，使得网络更加智能化，在解析用户查询意图的基础上，提供更加精准和快速的服务。传统的语义网络要做到这一点，就需要把所有在线文档构成的数据都进行处理并存放在一起，形成一个巨大、可用的数据库。

这么做需要强大的数据处理和Web内容智能分析能力：首先就需要对这些Web数据进行语义标注，但是由于Web数据具有体量巨大、异质异构、领域范围大等特点，所以如何自动给Web上的网页内容添加合适的标签成为技术痛点之一。另外，面对已经标注过的Web数据，机器如何进行思考和推理也是亟待解决的问题。

由于上述问题的存在，在语义网络提出后的10年间，其没有得到大规模应用，但是在对其研究的过程中，积累沉淀了成熟的本体模型建模和形式化知识表达方法，例如RDF（Resource Description Framework）和万维网本体语言（Web Ontology Language，OWL），这为后续知识图谱的出现奠定了基础。

2. 知识图谱

① 知识图谱概述

知识图谱由Google公司于2012年5月16日第一次正式提出并应用于Google搜索中的辅助知识库。谷歌知识图谱除了显示其他网站的链接列表，还提供结构化及详细的相关主题的信息。其目标是提高搜索引擎的能力，希望用户能够使用这项功能来解决他们遇到的查询问题，从而提高搜索质量和用户体验。

知识图谱是结构化的语义知识库，用于以符号形式描述物理世界中的概念及其之间的关系。其基本组成单位是“实体-关系-实体”三元组，以及实体及其相关属性-值对，实体间通过关系相互连接，构成网状的知识结构。随着知识图谱构建规模越来越大，复杂度越来越高，开始出现实体、类别、属性、关系等多颗粒度、多层次的语义单元，这些关联关系通过统一的知识模式（Schema）抽象层和知识实例（Instance）层共同作用构成更加复杂的知识系统。

从定义中可以看到，知识图谱是一个语义知识库，具备足够的领域知识，其最重要的组成成分是三元组。三元组通常可以表示为G=，其中R表示知识图谱中实体间所有关系的集合，例如关系“is_a”。一般情况下，关系都是带方向且有明确语义的，反之则关系不能成立，例如“阿里巴巴is_a公司”。也有一些关系是双向的，例如“张三is_friend_of李四”，反之亦然。对于这种双向关系，通常情况会对调实体位置，拆分为2个三元组分别存储。实体Eh、Et⊆E={e1,e2,...,e|E|}分别表示头实体（Head Entity）、尾实体（Tail Entity），两个实体共同用于表征关系的方向。

实体及其属性可以用一种特殊的关系三元组表示，例如“has_a”。实体和属性的界线比较模糊，一般从业务角度出发，在设计Schema的时候，如果认为某类属性具有一类概念的共性，同时在后面的推理（例如路径游走时新关系发现）中能够发挥作用，就可以把它作为实体对待。还有一类属性，比如年龄、身高，这类单纯描述实体特征的最细粒度属性，则一般被设计为属性。

② 常见开放知识图谱

WordNet是由普林斯顿大学认知科学实验室于1985年构建的一个英文电子词典和本体知识库，采用人工标注的方法构建。WordNet主要定义了名词、形容词、动词和副词之间的语义关系，包括同义关系、反义关系、上下位关系、整体部分关系、蕴含关系、因果关系、近似关系等。比如，其中的名词之间的上下位关系，“水果”是“苹果”的上位词。

Freebase是由创业公司MetaWeb于2005年启动的一个以开放、共享、协同的方式构建的大规模链接数据库语义网络项目，2010年被谷歌收购并成为谷歌知识图谱中的重要组成部分。Freebase主要数据源有Wikipedia、世界名人数据库（NNDB）、开放音乐数据库（Music-Brainz）以及社区用户的贡献。它主要通过三元组构造知识，并采用图数据存储，有5800多万个实体和30多亿个实体间关系三元组。2016年正式关闭，数据和API服务都迁移至Wikidata。

Yago是由德国马普研究所研发的链接知识库，主要集成了Wikipedia、WordNet和GeoNames这3个数据库中的数据。Yago将WordNet的词汇定义与Wikipedia的分类体系进行融合，从而使得Yago相对于DBpedia有更加丰富的实体分类体系，同时Yago还考虑了时间和空间知识，为知识条目增加了时间和空间维度属性描述。目前Yago已经包含1.2亿条三元组知识，是IBM Watson的后端知识库之一。

OpenKG是一个面向中文领域的开放知识图谱社区项目，主要目的是促进中文领域知识图谱数据的开放与互联。OpenKG上已经收录了大量开放中文知识图谱数据、工具及文献。目前开放的知识图谱数据包括百科类的zhishi.me（狗尾草科技、东南大学）、CN-DBpedia（复旦大学）、XLore（清华大学）等。

当然，还有一些垂直领域知识图谱，这类知识图谱不像上述通用领域知识图谱那样所涉内容广而全。垂直领域知识图谱主要面向特定领域的特定知识、应用场景进行构建，比如医疗领域的Linked Life Data、电商领域的阿里巴巴商品知识图谱和场景导购知识图谱。

知识图谱构建

知识图谱构建是一个系统工程，涵盖多种信息处理技术，用于满足图谱构建过程中的各种需要。典型的图谱构建流程主要包括：知识抽取、知识推理和知识存储。

知识表示贯穿于整个知识图谱构建和应用的过程，在不同阶段知识表示具有不同的体现形式，例如在图谱构建阶段，知识表示主要用于描述知识图谱结构，指导和展示知识抽取、知识推理过程；在应用阶段，知识表示则主要考虑上层应用期望知识图谱提供什么类型的语义信息，用以赋能上层应用的语义计算。

本节重点讲述面向应用的知识图谱表示。

1. 知识抽取

知识抽取是知识图谱构建的第一步，是构建大规模知识图谱的关键，其目的是在不同来源、不同结构的基础数据中进行知识信息抽取。按照知识在图谱中的组成成分，知识抽取任务可以进一步细分为实体抽取、属性抽取和关系抽取。

知识抽取的数据源有可能是结构化的（如现有的各种结构化数据库），也有可能是半结构化的（如各种百科数据的infobox）或非结构化的（如各种纯文本数据）。针对不同类型的数据源，知识抽取所需要的技术不同，技术难点也不同。通常情况下，一个知识图谱构建过程面对的数据源不会是单一类型数据源。

本节重点介绍针对非结构化文本数据进行信息抽取的技术。如上文所述，实体和属性间的界线比较模糊，故可以用一套抽取技术实现，所以下文如果不做特殊说明，实体抽取泛指实体、属性抽取。

① 实体抽取

实体抽取技术历史比较久远，具有成体系、成熟度高的特点。早期的实体抽取也称为命名实体识别（Named Entity Recognition，NER），指的是从原始语料中自动识别出命名实体。命名实体指的是具有特定意义的实体名词，如人名、机构名、地名等专有名词。实体是知识图谱中的最基本的元素，其性能将直接影响知识库的质量。按照NER抽取技术特点，可以将实体抽取技术分为基于规则的方法、基于统计机器学习的方法和基于深度学习的方法。

基于规则的方法：

基于规则的方法首先需要人工构建大量的实体抽取规则，然后利用这些规则在文本中进行匹配。虽然这种方法对领域知识要求较高，设计起来会非常复杂，且实现规则的全覆盖比较困难，移植性比较差，但是在启动的时候可以通过这个方法可以快速得到一批标注语料。

基于统计机器学习的方法：

既然是机器学习的方法，就需要标注语料，高质量的标注语料是通过这类方法得到好的效果的重要保障。该方法的实现过程为：在高质量的标注语料的基础上，通过人工设计的特征模板构造特征，然后通过序列标注模型，如隐马尔可夫模型（Hidden Markov Model，HMM）、最大熵模型（Maximum Entropy Model，MEM）和条件随机场模型（Conditional Random Fields，CRF）进行训练和识别。

模型特征的设计需要较强的领域知识，需要针对对应实体类型的特点进行设计。例如，在人名识别任务中，一个中文人名本身的显著特点是一般由姓和一两个汉字组成，并且人名的上下文也有一些规律，如“×××教授”“他叫×××”。在有了高质量的标注语料的基础上，合适的特征设计是得到好的序列标注模型效果的又一重要保障。

对于序列标注模型，一般我们对需要识别的目标字符串片段（实体）通过SBIEO（Single、Begin、Inside、End、Other）或者SBIO（Single、Begin、Inside、Other）标注体系进行标注。命名实体标注由实体的起始字符（B）、中间字符（I）、结束字符（E）、单独成实体的字符（S）、其他字符（O）等组成，如图2所示。

图2 命名实体标注

为了区分实体的类型，会在标注体系上带上对应的类型标签，例如ORG-B、ORG-I、ORG-E。

在实体抽取中，我们最常用的基于统计的序列标注学习模型是HMM、CRF。其中，HMM描述由隐藏的隐马尔可夫随机生成观测序列的联合分布的P(X,Y)过程，属于生成模型（Generative Model），CRF则是描述一组输入随机变量条件下另一组构成马尔可夫随机场的数据变量的条件概率分布P(Y|X)，属于判别模型（Discrimination Model）。

以HMM为例，模型可形式化表示为λ= (A,B,π)，设I是长度为T的状态序列，O是对应长度的观测序列，M为所有可能的观测数（对应于词典集合大小），N为所有状态数（对应标注的类别数），A是状态转移矩阵：

其中：

aij表示在时刻t处于qi的条件下在时刻t+1转移到qj的概率。

B是观测概率矩阵：

其中：

π是初始状态概率向量：

其中：

πi表示在时刻t=1处于状态qi的概率。

HMM模型的参数学习即学习上面的A,B,π矩阵，有很多实现方法，比如EM和最大似然估计。一般在语料充足的情况下，为了简化过程，采用最大似然估计，例如：

序列标注任务可以抽象为求解给定观察序列O=(o1,o2,...,oT)和模型λ=(A,B,π)，也就是计算在模型λ下使给定观测序列条件概率P(I|O)最大的观测序列I=(i1,i2,...,iT)，即在给定观测序列（即原始字符串文本）中求最有可能的对应的状态序列（标注结构）。一般采用维特比算法，这是一种通过动态规划方法求概率最大路径的算法，一条路径对应一个状态序列。

定义在时刻t状态为i的所有单个路径(i1,i2,…,it)中概率最大值为：

可以得到变量δ的递推公式：

定义在时刻t状态为i的所有单个路径(i1,i2,…,it-1,i)中概率最大的路径的第t-1个节点为：

维特比算法在初始化δ1(i)=πibi(o1),Ψ1(i)=0，i=1,2,...,N之后，通过上述递推公式，得到最优序列。

CRF算法与维特比算法类似，其得到在各个位置上的非规范化概率的最大值，同时记录该路径：

基于深度学习的方法

在上面介绍用统计机器学习的方法构造特征的时候，我们发现实体在原始文本中的上下文特征非常重要。构建上下文特征需要大量的领域知识，且要在特征工程上下不少功夫。随着深度学习的方法在自然语言处理上的广泛应用，构建上下文特征开始变得简单了。深度学习的方法直接以词/字向量作为输入，一些模型（如RNN、Transformer等）本身就能很好地学习到上下文信息，并且不需要专门设计特征来捕捉各种语义信息，相比传统的统计机器学习模型，性能都得到了显著提高。这一类模型的通用结构基本都是一个深度神经网络+CRF，如bi-LSTM-CRF、IDCNN-CRF、LSTM-CNN-CRF、Bert-biLSTM-CRF等，模型可以基于字或词输入（一般来说，基于字的模型性能更加优秀，它可以有效解决OOV问题）。这个DNN模型可以学习上下文语义特征、预测各个位置上输出各个标签的概率，然后再接入CRF层来学习各标签之间的依赖关系，得到最终的标注结果。

② 关系抽取

关系抽取的目标是抽取两个或者多个实体间的语义关系，从而使得知识图谱真正成为一张图。关系抽取的研究是以MUC（Message Understanding Conference）评测会议和后来取代MUC的ACE（Automatic Content Extraction）评测会议为主线进行的。ACE会议会提供测评数据，现在许多先进的算法已经被提出。

一般关系抽取的顺序是，先识别实体，再抽取实体之间可能存在的关系。其实也可以把实体抽取、关系抽取联合在一起同时完成。目前，关系抽取方法可以分为基于模板的关系抽取和基于监督学习的关系抽取两种方法。

基于模板的关系抽取

基于模板的关系抽取，即由人工设计模板，再结合语言学知识和具体关系的语料特点，采用boot-strap思路到语料里匹配并进行抽取关系。这种方法适用于小规模、特定领域任务冷启动时的关系抽取，这种场景下效果比较稳定。

基于监督学习的关系抽取

基于监督学习的关系抽取方法一般把关系抽取任务当作一系列的分类问题处理。即基于大规模的标注语料，针对实体所在的句子训练有监督的分类模型。分类模型有很多，例如统计机器学习方法SVM及深度学习方法（如CNN）等。

传统的机器学习方法重点在特征选择上，除了实体本身的词特征，还包括实体词本身、实体类型、两个实体间的词以及实体距离等特征。很多研究都引入了依存句法特征，用以引入实体间的线性依赖关系。基于深度学习的关系抽取方法则不需要人工构建各种特征，输入一般只要包括句子中的词及其位置的向量表示特征。目前基于深度学习的关系抽取方法可以分为流水线方法（Pipeline）和联合抽取方法（Jointly）。前者是将实体识别和关系抽取作为两个前后依赖的分离过程；后者则把两个方法相结合，在统一模型中同时完成，从而避免流水线方法中存在的错误累计问题。

在经典的深度学习关系抽取方法中，输入层采用的就是词、位置信息，将在Embedding层得到的向量作为模型的输入，经过一个BI-LSTM层和Attention层，输出得到各个关系的概率，如图3所示。

图3 经典深度学习关系抽取模型架构

③ 知识融合

通过知识抽取，我们得到大量实体（属性）和关系，但是由于描述、写法的不同，结果中存在大量冗余和错误信息，有必要对这些数据进行消歧、清洗和整合处理。作为知识融合的重点技术，实体链接（Entity Linking）的目的是将在文本中抽取得到的实体对象链接到知识库中与之对应的唯一确定的实体对象，以实现实体消歧和共指消解。

实体消歧（Entity Disambiguation）专门用于解决同名实体的歧义问题，最简单的方法是通过实体的属性、周边的词构成特征向量，通过向量的余弦相似度评估两个实体的相似度。基于这个思想，我们可以有更多的基于语义的方法来表征目标实体，从而评估两个实体是否是同一个。

共指消解（Entity Resolution）是指解决多个不同写法的实体指向同一个实体的问题。一般这类问题可以参考实体消歧方法解决，也可以具体问题具体分析，通过一些规则方法解决。

2. 知识推理

知识推理是基于现有的知识图谱结构，进一步挖掘隐含的知识，用来补全现有知识图谱属性、关系，从而发现新的知识，拓展和丰富图谱。例如可以通过推理发现新属性，如由已知实体的出生年月属性推理出年龄；也可以发现新关系，例如，已知（A，股东，B公司）、（C，股东，B公司）可以推理得出（A，合作伙伴，C）。知识推理的方法可以分为两大类：基于逻辑的推理和基于图的推理。

① 基于逻辑的推理

基于逻辑的推理主要包括一阶谓词逻辑（First Order Logic）推理、描述逻辑（Description Logic）推理。一阶谓词对应着知识库里的实体对象和关系，通过谓词之间的“与”和“或”的关系来表示知识变迁从而实现推理。例如通过“妈妈是女人”“女人是人”可以推理得到“妈妈是人”。描述逻辑则是在一阶谓词的基础上，解决一阶谓词逻辑的表示能力有限的问题，通过TBox（Terminology Box）和ABox（Assertion Box），可以将知识图谱中复杂的实体关系推理转化为一致性的检验问题，从而简化推理。

② 基于图的推理

基于图的推理方法，主要借助图的结构特征，通过路径游走的方法，如Path Ranking算法和神经网络图向量表示方法，进行基于图的推理。Path Ranking算法的基本思想是从图谱的一个节点出发，经过边在图上游走，如果能够通过一个路径到达目标节点，则推测源节点和目标节点存在关系。神经网络图向量表示方法则是对通过向量表示后的图节点、关系进行相似度运算，推理节点之间是否存在关系。

3. 知识图谱存储

知识图谱中的信息可以用RDF结构表示，它的主要组成成分是三元组，主要包括实体及其属性、关系三类元素。在实际应用中，按照底层数据库的存储方式不同，可以分成基于表结构的存储和基于图结构的存储。基于表结构的存储可以理解为一般的关系型数据库，常见的如MySQL、Oracle，基于图存储的数据库常见的有Neo4j、OrientDB、GraphDB等。

① 基于表结构的存储

基于表结构的知识图谱存储利用二维数据表对知识图谱中的数据进行存储，有3种常见的设计方案：基于三元组的存储、基于类型表的存储和基于关系型数据库的存储。

基于三元组的存储

因为知识图谱可以由三元组描述，所以我们可以把知识图谱转化成三元组的描述方式，将其放到一张数据表中。例如可以类似表1所示的形式。

表1 三元组存储示例

这种存储的优点很明显，结构比较简单，可以通过再加一些字段来增强对关系的信息的描述，例如区分是属性还是关系。其缺点也很明显：首先，这样有很高的冗余，存储开销很大，其次，因修改、删除和更新操作带来的操作开销也很大；最后，由于所有的知识都是以一行一个三元组的方式存储的，因此所有的复杂查询都要拆分为对三元组的查找才能得到答案。

基于类型表的存储

针对上述方案存在的缺点，可以为每一种实体类型设计一张数据库表，把所有同一类型的实体都放在同一张表中，用表的字段来表示实体的属性/关系。这种方案可解决上面存储简单、冗余度高的问题，但是缺点也很明显：首先，表字段必须事先确定，所以要求穷举实体的属性/关系，且无法新增（否则需要修改表结构）；其次，因为属性/关系都是存储在特定列中的，所以无法支持对不确定类型的属性和关系的查找；最后，因为数据按照类型放在对应表中，所以在查询之前就需要事先知道实体的类型。

基于关系型数据库存储

关系型数据库通过表的属性来实现对现实世界的描述。我们可以在第二种方案的基础上设计实体表（用于存储实体属性）、关系表（用于存储实体间的关系），这一定程度上可以解决表结构固定、无法新增关系的问题，因为一般我们认为实体的属性可以在Schema设计时事先枚举完。例如表7-1，可以拆分为3张表（见表2、表3和表4）。

表2 组织机构表

表3 人物表

表4 关系表

4. 基于图结构的存储

知识图谱本身就是图结构的，实体可以看作图的节点，关系可以看作图的关系，基于图的方式存储知识，可以直接、准确地反映知识图谱内部结构，有利于知识的查询、游走。基于图谱的结构进行存储，可以借用图论的相关算法进行知识推理。常见的图数据库有Neo4j、OrientDB、GraphDb、GDB（阿里云）等。

Neo4j是一个开源的图数据库，它将结构化的数据以图的形式存储，基于Java实现（现在也提供Python接口），是一个具备完全事务特性的高性能数据系统，具有成熟数据库的所有特性。Neo4j分为商业版和社区版。其中社区版是开源的，是一个本地数据库；商业版则实现了分布式功能，能够将多台机器构造成数据库集群来提供服务。它采用的查询语言是cypher，可以通过Neo4j实现知识图谱节点、关系的创建（create命令）和查询（match命令）。

Neo4j在Linux上的安装非常简单，到官网上下载对应的安装包，解压后安装到bin目录，然后通过./neo4j start命令启动。我们可以在：

http://localhost:7474/browser/

访问可视化界面（见图4），可以在这个Web页面上通过cypher和图数据库进行交互。

图4 Neo4j Web可视化界面

阿里巴巴内部也研发了图数据库用于存储知识图谱数据，如GDB、iGraph等，其中GDB（Graph Database，图数据库）是由阿里云自主研发的，是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库。它支持Apache TinkerPop Gremlin查询语言，可以快速构建基于高度连接的数据集的应用程序。GDB非常适合用于社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类需要用到高度互连数据集的场景。目前GDB正处于公测期间，阿里巴巴内部很多知识图谱业务都基于GDB存储，它具备如下优势：

标准图查询语言：支持属性图，高度兼容Gremlin图查询语言。
高度优化的自研引擎：高度优化的自研图计算层和存储层，通过云盘多副本方案保障数据超高可靠性，支持ACID事务。
服务高可用：支持高可用实例，单节点出故障后业务会迅速转移到其他节点，从而保障了业务的连续性。
易运维：提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能，大幅降低运维成本。

知识表示

知识表示是指在不同的语义环境下有不同的含义，例如在图谱构建阶段，知识表示可以认为是基于RDF用三元组形式，如“<实体，属性，值>”或者“<实体，关系，实体>”（也有描述为<主语，谓词，宾语>）来表征知识图谱的语义信息的。在知识图谱接入上层应用场景后，尤其是随着深度学习方法的广泛采用，如何将知识图谱和深度学习模型融合，借助知识图谱引入领域知识来提升深度学习模型性能，引起了学术界和工业界的广泛关注。

本节将重点介绍基于知识表示的学习方法，介绍如何将知识图谱中的高度稀疏的实体、关系表示成一个低维、稠密向量。

1. 距离模型

结构表示（Structured Embedding，SE），将每个实体用d维的向量表示，所有实体被投影到同一个d维向量空间中，同时，为了区分关系的有向特征，为每个关系r定义了2个矩阵Mr,1,Mr,2∈Rd*d，用于三元组中头实体和尾实体的投影操作，将头实体、尾实体投影到关系r的空间中来计算两个向量的距离，公式为：

用以反映2个实体在关系r下的语义相关度，距离越小，说明这2个实体存在这种关系的可能性越大。然而该模型有一个重要缺陷，它使用头、尾两个不同的矩阵进行投影，这个矩阵相互独立没有协同，往往无法精确刻画两个实体基于关系的语义联系。为了解决这个问题，后续出现了单层神经网络模型（Single Layer Model，SLM）、语义匹配能量模型（Semantic Matching Energy，SME）等方法，如RESCAL。RESACL模型是一个基于矩阵分解的模型，在该模型中，将整个知识图谱编码为一个三维张量X，如果三元组存在，则Xhrt=1，否则为0。张量分解的目标是要将每个三元组对应的张量分解为实体和关系，使得Xhrt尽量接近lhMrlt，函数可表示为：

2. 翻译模型

自从Mikolov等人于2013年提出word2vec模型开始，表示学习Embedding在自然语言处理领域受到广泛关注，该模型发现在词向量空间中平移（加减）不变现象，即：

其中C(w)表示w通过word2vec得到的词向量。受这类类比推理实验启发，Bordes等人提出了TransE模型，之后又出现多种衍生模型，如TransH、TransR等。TransE将知识库中的关系看作实体间的平移向量，对于每个三元组，TransE希望：

即期望头节点向量沿关系平移后，尽量和尾节点向量重合（见图5）。

图5 TransE 模型

模型的损失函数定义如下：

“||”表示取模运算，如L2距离。

在实际学习过程中，为了增强模型知识表示的区分能力，TransE采用了最大间隔，目标函数为：

其中，S是正确的三元组集合，S-是错误的三元组集合，γ为正确三元组得分和错误三元组得分之间的间隔距离，是一个超参数。S-的产生与负样本的生成方式不同，不通过直接随机采样三元组，而是将S中每一个三元组的头实体、关系、尾实体其中之一随机替换成其他实体或关系来构造。

TransE模型简单有效，后续很多知识表示学习方法都是以此为代表进行拓展的。例如TransH模型，为了解决TransE在处理1-N、N-1、N-N复杂关系时的局限性，提出让一个实体在不同关系下拥有不同的表示。另外，虽然TransH模型使得每个实体在不同关系下拥有了不同的表示，但是它仍然假设实体和关系处于统一语义空间中，这和我们一般的认知有点不同，于是有学者提出了TransR模型。TransR模型首先通过一个投影矩阵Mr把实体投影到关系的语义空间，然后再进行关系类比推理（见图6）：

图6 各种翻译模型

电商知识图谱应用

知识图谱提供了一种更好的组织、管理和利用海量信息的方式，描述了现实世界中的概念、实体以及它们之间的关系。自从谷歌提出知识图谱并应用在搜索引擎中，用以提升搜索引擎使用体验，提高搜索引擎质量以后，知识图谱在各种垂直领域场景中都扮演了重要的角色。

随着消费升级，行业会场+爆款的导购模式已经无法满足消费者心智，人们对货品的需求逐渐转化为对场景的需求。通过场景重新定义货品的需求产生，场景运营平台应运而生。场景运营平台通过对商品知识的挖掘，将具有共同特征的商品通过算法模型聚合在一起，形成事实上的跨品类商品搭配。在算法端完成场景-商品知识图谱的建设后，通过当前诉求挖掘消费者深层次诉求，推荐某个场景下互相搭配的商品，给予消费者对应场景下一站式的购物体验，达到鼓励消费者跨类目购买行为及提升客单价的目的。例如在阿里电商平台，导购场景就有了很好的应用，并取得了不错的效果。

1688团队在阿里内部数据和算法基建的基础上，基于B类商品特征，构建了自己的商品知识图谱，以CPV的方式表征一个商品，具体商品表征如图7所示。

图7 商品CPV表征示意图

任何知识图谱应用的构建，整体上都要经历如下几个步骤：文本等非结构化或半结构化信息→结构化的知识图谱→知识图谱表征→特定应用场景。1688的商品知识图谱，在阿里通用的电商NLP技术的基础上，完成了半结构化信息向结构化的知识图谱转化的步骤，但是中间存在大量质量较差、语义模糊甚至错误的数据。为了优化这部分数据，阿里做了大量的工作，包括实体合并、消歧、长尾数据裁剪等。

针对初步加工过的数据，还需要大量的人工来标注清洗，以发挥数据的价值。而数据标注清洗这种累活一般是找专门的数据标注公司外包完成的。为了减少专门标注的成本，我们采用了“以战养兵”的思路，让运营直接使用这份经过初步加工的数据，通过收集运营的操作数据，快速反馈到算法模型中并不断优化结果，形成运营-数据的相互反馈，如图8所示，让工具越用越顺手，越用越好。

图8 主题会场搭建流程示意图

具体的主题录入方式是：运营指定一个主题场景，比如婚庆主题，在指定主题下涵盖商品的类目、属性、属性值。比如列举一组配置，可以搭配后台配置截图。通过行业运营专家的经验将主题和相应的商品图谱关联起来，我们可以明确哪些CPV数据存在业务关联，以及运营认为哪些数据是有效的。除了主题数据的人工录入，我们还配套了相关的自动化页面搭建方案。

电商经常需要做促销活动，活动会场页面的制作需要投入大量人力，常见的活动页面如图9所示。

图9 常见电商促销活动页面图

这种活动类导购页面的搭建，核心是站在买家的角度帮助他们发现和选择商品，如图10所示。其中，什么商品、如何挑选、怎样呈现就是导购页面包含的核心要素和业务流程。映射到技术领域，则会涉及建立页面、数据分析、投放策略的三个方面。

图10 活动类导购页面搭建流程示意图

1688在活动页面制作方面沉淀多年，有众多实用的技术和工具供运营使用，如页面组件化搭建产品（积木盒子、奇美拉）、指标选品工具（选品库）、商品排序投放产品（投放平台）等。这些产品都有各自的细分业务域，运营通常需要跳转到多个平台进行配置，才能完成一张活动页面的搭建，整体流程如图11所示。

图11 活动页面搭建平台示意图

这就像是办证件，A窗口让你去B窗口登记，B窗口让你去C窗口填表。我们都围着一个个的“窗口”转，这是一种以资源为中心的工作方式。以前让用户围绕着资源转，是为了最大化资源的使用效率，但是在今天这个人力成本高的时代，需要从资源视角转向用户视角，让资源围着用户转，这样可以最大化价值流动效率。

我们通过几个月的努力，将十余个系统打通，实现了数据源标准化方案、数据页面绑定方案、页面自动多端搭建方案、投放自动化方案等，形成了如图12所示的产品体系。

图12 会场搭建产品体系示意图

通过将系统打通，使得运营搭建一个页面的配置工作量减少了83.2%。而在剩余的16.8%的工作里，有87%是选品工作。借助主题会场，我们希望将运营选品的工作量也降低50%以上，并借助数据和算法，实现智能选品、智能搭建、智能投放。

今天的分享就到这里，谢谢大家。

随着人工智能技术的发展与应用，知识图谱作为AI进步的阶梯越来越受到学术界和产业界的重视，并且已经在很多领域、场景中体现出自身的价值。从最初的互联网搜索、推荐、问答等ToC场景，逐渐进入到垂直行业ToB的应用当中。然而，场景的变化对知识图谱技术的发展与应用也提出了新的挑战与机遇。繁杂多变的行业场景，复杂专业的知识表示，行业低资源的知识获取，深度决策的知识应用等，对知识图谱的技术提出更多新的要求。

2021年03月27日，第一届DataFunSummit：知识图谱在线峰会来啦！将邀请3位主席，8位出品人，40余位知名学者与一线技术专家出席本次峰会，共话『知识图谱的核心技术与前沿应用』。

▌知识图谱在线峰会报名，现已全面启动

本届在线峰会现已全面开放免费报名，知识图谱与人工智能领域不容错过的业内分享，3月27日与你一同见证。

https://lkzhf.datafun.hbsaas.com/index.php?r=apply/activity-detail&ActivityId=54

了解更多

你可能感兴趣的:(运维,信息安全,小程序,数字货币,运维,小程序)

【微信小程序】5步轻松掌握微信小程序获取位置API，你get到了吗？墨瑾轩微信小程序微信小程序 notepad++小程序
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣5步轻松掌握微信小程序获取位置API，你get到了吗？亲爱的小伙伴们，大家好呀！今天我们要一起来探讨微信小程序中的获取位置API——wx.getLocation。无论你是小程序的新手，还是有一定经验的开发者，这篇文章都会带你深入了解wx.getLocation
微信小程序-点餐（美食屋）02开发实践你我哈微信小程序微信小程序小程序美食 html php
目录概要整体架构流程（一）用户注册与登录（二）菜品浏览与点餐（三）订单管理（四）后台管理部分代码展示1.index.wxml2.list.wxml3.checkout.wxml4.detail.wxml小结优点概要01篇让我们成功搭建开发环境，现在让我们着手开发“美食屋”点餐系统了。下面，我会用PHP和MySQL实现系统核心功能，像用户注册登录、展示和管理菜品，以及处理订单。快一起动手，让“美食屋
微信小程序获取用户位置李十岁a 微信小程序小程序
文章目录概要整体流程小结概要使用uniapp实现微信小程序获取用户位置信息整体流程例如：1.首先进入微信公众平台-开发-开发管理-接口设置-点击开通-wx.getLocation（注意：申请接口时填写详细说明，上传图片，可查看示例进行填写，不然可能需要申请好几遍亲测）2.在uniapp-page.json中小程序配置"mp-weixin"里添加以下内容或者在manifest.json配置文件中勾选
各类运维工具下载地址维护容器云服务运维
tomcat：Indexof/dist/tomcat/tomcat-8Indexof/dist/tomcat/tomcat-9Indexof/dist/tomcat/tomcat-10jdk：JavaDownloads|Oracle
智能运维分析决策系统：赋能数字化转型的智慧引擎我的运维人生运维运维开发技术共享
智能运维分析决策系统：赋能数字化转型的智慧引擎在数字化转型的大潮中，企业运维管理正经历着从传统手动运维向智能化、自动化运维的深刻转变。智能运维分析决策系统（AIOps，ArtificialIntelligenceforITOperations）作为这一转变的核心驱动力，通过融合大数据、机器学习、人工智能等先进技术，实现了对运维数据的深度洞察与智能决策，极大地提升了运维效率与质量，为企业数字业务的连
一图解锁 | 运维管理到工具体系的建设逻辑
本文来自腾讯蓝鲸智云社区用户:CanWay在数字化转型的大潮中，运维作为企业IT架构的关键环节，正面临着前所未有的挑战与机遇。如何利用先进的技术手段，提升运维效率和质量，成为业界关注的焦点。作为数字研运解决方案的引领者，嘉为蓝鲸在数字化运维方面做了大量探索和尝试，形成了一套数字化运维管理方法论，将近20年来经验浓缩成书——《数字化运维：IT运维架构的数字化转型》，小编将持续带领大家一起阅读本书的主
前端新手如何用vite构建小程序中使用的模块（以AES加密模块crypto-js为例） warmbook 前端前端小程序 javascript
如果你只是想简单地把在vite项目中使用的模块引入到小程序中，不妨试试库模式。以crypto-js为例，你需要写两个JS文件：一个是构建脚本，类似于vite.config.js；//build.cjsconst{build}=require('vite'),path=require('path');build({publicDir:false,configFile:false,runtimeCom
JS面向对象封装 ESC/POS 指令打印类 warmbook javascript 前端 node.js
微信小程序蓝牙打印请搜索插件ESCPOS指令打印，先申请，再V我50RMB可永久使用。代码中用到的中文转码方法见：gbk.jsgb2312编码字符转Uint8Array，解决打印机中文乱码问题基类命令规则参考小程序插件文档Printer类部分import{isAscii,U2B}from'./gbk.js';constfontSize=12,/*计算字符串长度(1个中文=2个英文字符)*/char
ESC/POS常用打印指令面向对象封装，PHP处理二维码定位，微信小程序蓝牙打印 warmbook 笔记 javascript 微信小程序蓝牙 php
热敏小票/标签打印机，使用ESC/POS指令打印，常用指令封装，适用于GBK编码constPER_MM=8,//每毫米像素数fontSize=12,//每字符像素数gbk=require('./gbk'),//兼容中文的字符转换库，文末附链接/*计算字符串长度(1个中文=2个字符)*/charLen=str=>{letwidth=0;for(leti=0;i{dev.port.write(ESCP
centos7安装jumpserver堡垒机落花_忆流年运维项目 linux
堡垒机简介跳板机属于内控堡垒机范畴，是一种用于单点登陆的主机应用系统。跳板机就是一台服务器，维护人员在维护过程中，首先要统一登录到这台服务器上，然后从这台服务器再登录到目标设备进行维护。但跳板机的缺点是没有实现对运维人员操作行为的控制和审计，出现误操作或违规操作难以定位到原因和责任人；并且跳板机存在严重的安全风险，如果跳板机系统被攻入，则后端资源完全暴露无遗。对于个别资源（如telnet）可以通过
全面解析物联网信息安全知识体系无声远望
本文还有配套的精品资源，点击获取简介：本资料集详细介绍物联网信息安全的多个重要方面，包括基础概念、数学基础、数据安全与隐私保护、集成安全技术、安全分析、防护策略和身份认证。从基本的物联网安全概念到深度探讨密码学基础，再到数据保护技术，再到全面的系统安全设计，安全分析，防御措施以及身份验证技术，这些内容将为研究者、开发者和管理者提供物联网安全的全面视角。1.物联网信息安全基础概念在现代技术不断发展的
小程序与内嵌网页的数据通信大耳朵乔乔 #微信小程序开发小程序
小程序与内嵌网页的数据通信前言微信小程序提供了web-view组件，允许开发者在小程序中嵌入网页。然而，由于小程序和网页运行在不同的环境中，它们之间的通信就需要依赖特定的机制来实现。然而我们日常的需求中，很多的时候都涉及到小程序内嵌网页和小程序之间进行数据通信的情况。这篇文章是我自己总结的微信小程序与内嵌web-view中网页通信的一些方法。小程序向内嵌网页传递数据通过修改web-view的src
redis清空缓存奔跑吧邓邓子高效运维缓存 redis 数据库
提示：“奔跑吧邓邓子”的高效运维专栏聚焦于各类运维场景中的实际操作与问题解决。内容涵盖服务器硬件（如IBMSystem3650M5）、云服务平台（如腾讯云、华为云）、服务器软件（如Nginx、Apache、GitLab、Redis、Elasticsearch、Kubernetes、Docker等）、开发工具（如Git、HBuilder）以及网络安全（如挖矿病毒排查、SSL证书配置）等多个方面。无论
【微信小程序】微信小程序中的异步函数是如何实现同步功能的 ai安歌 Mob移动端实践笔记微信小程序小程序异步同步
在微信小程序中，虽然很多API都是异步的，但可以通过一些方法来实现类似同步的功能。以下是几种常见的方法：1.使用async/awaitasync/await是ES2017引入的语法糖，它基于Promise来实现异步操作的同步化写法。示例代码Page({asynconLoad(){try{//模拟一个异步API，例如获取用户信息constuserInfo=awaitthis.getUserInfo(
如何进行小程序开发和编程——详细教程萧鼎软硬件与前后端详解小程序开发
如何进行小程序开发和编程——详细教程近年来，小程序凭借其无需安装、即用即走的特点，迅速成为移动互联网生态中的重要组成部分。本文将以详细的步骤和丰富的内容，带你从零开始掌握小程序开发的核心技术和流程。一、小程序简介小程序是一种运行在移动设备上的轻量级应用，主要依托于各大生态平台（如微信、支付宝、抖音等）。它的开发模式介于网页开发和原生应用开发之间，拥有独特的架构设计和开发工具支持。二、小程序的开发准
车联网安全黄一113530 网络安全网络安全渗透测试
1、智能汽车安全如何分类？智能汽车终极发展阶段是无人驾驶，车联网则是无人驾驶实现的基础，然而车联网技术应用过程中却会带来信息安全问题，具体可分为以下三种：一、用户隐私汽车智能化是建立在车辆动态数据收集及应用上的，如车辆行驶、车体、动力、安全及环境数据等层面，尤其是车辆行驶数据一直都被视为变现的大数据金矿，无论是车联网前装的车商，还是车联网后装的互联网科技公司，都在用户不知情的情况下收集车主驾驶历史
ESP32-C3入门教程蓝牙篇③——基于微信小程序和Esp Blufi实现 WiFi配网小康师兄 ESP32-C3入门教程微信小程序小程序 blufi ESP32 WiFi配网
基于微信小程序和EspBlufi实现WiFi配网文章目录一、前言二、软件框架三、软件流程四、API介绍五、全部源码一、前言本文基于VSCodeIDE进行编程、编译、下载、运行等操作基础入门章节请查阅：ESP32-C3入门教程基础篇①——基于VSCode构建HelloWorld教程目录大纲请查阅：ESP32-C3入门教程——导读二、软件框架
ESP32-C3入门教程 WiFi篇⑦——基于SoftAP 的 WiFi 智能配网小康师兄 ESP32-C3入门教程物联网 esp32 WiFi配网 SoftAP WiFi
文章目录一、前言二、WiFi配网方式三、功能简述四、源码实现一、前言本文基于VSCodeIDE进行编程、编译、下载、运行等操作基础入门章节请查阅：ESP32-C3入门教程基础篇①——基于VSCode构建HelloWorld教程目录大纲请查阅：ESP32-C3入门教程——导读二、WiFi配网方式WiFi配网即：用户通过App/小程序/网页等途径将WiFi的SSID和密码等信息发送给ESP32，方式有
Oracle、PostgreSQL该学哪一个？ leegong23111 oracle postgresql 数据库
从事数据库运维一线工作的老鸟，经常会有人来问我：“Oracle和PostgreSQL，我该学哪个？哪个更有职业发展前景？”今天就来和大家好好唠唠。先说说Oracle。它堪称数据库领域的“老牌贵族”，功能极其强大。在大型企业和金融机构中，Oracle有着深厚的根基。其具备高度的稳定性和可靠性，能支撑超大规模的数据处理和高并发业务。比如在银行的核心交易系统中，每天要处理海量的交易数据，Oracle就能
mysql主从数据一致性怎么校验_mysql主从数据一致性校验及纠错工具 Oliverzzzhang
目录1、概述2、percona-tooldit工具的安装3、新建用户4、pt-table-checksum使用5、pt-table-sync使用6、个人总结1、概述假如你是一位运维人员，假如你生产环境上目录1、概述2、percona-tooldit工具的安装3、新建用户4、pt-table-checksum使用5、pt-table-sync使用6、个人总结1、概述假如你是一位运维人员，假如你生产环
ISO27001、风险评估与纵深防御梦龙zmc 网络安全网络安全
ISO27001是国际标准化组织（ISO）和国际电工委员会（IEC）联合发布的信息安全管理体系（ISMS）标准，其最新版本为ISO/IEC27001:2013。该标准为组织提供了一套全面的方法，用于建立、实施、维护和持续改进信息安全管理体系，以保护组织的信息资产免受各种威胁，确保信息的机密性、完整性和可用性。ISO27001的主要内容和实施步骤包括：1.范围定义：明确信息安全管理体系的边界，包括需
202年寒假充电计划——自学手册网络安全（黑客技术）网安康sir web安全安全网络 php 开发语言
前言什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习导航三大章节，涉及价值观、方法论、执行力、行业分类、职位解读、法
uniapp 微信小程序去除button默认样式带着梦想扬帆启航 uniapp 微信小程序 LESS CSS 微信小程序 css 前端
一般情况下我们需要去掉的默认样式就是button按钮的背景和边框.btn{color:#333;text-align:center;border:none;border-radius:0;background-color:transparent;}此时你会发现按钮的边框并没有去掉，通过控制器定位到这个按钮的边框样式可以看到，这个边框线是通过伪元素实现的，我们只需要多加一个处理即可将这个边框线去除.
【原创】运维基础之OpenResty(Nginx+Lua)+Kafka weixin_30293079 大数据运维 lua
使用docker部署1下载#wgethttps://github.com/doujiang24/lua-resty-kafka/archive/v0.06.tar.gz#tarxvfv0.06.tar.gz2准备配置文件testkafka.conf#vitestkafka.conflua_package_path"/usr/local/openresty/lualib/resty/kafka/?.
【含文档+PPT+源码】基于小程序的智能停车管理系统设计与开发小咕聊编程小程序
项目介绍本课程演示的是一款基于小程序的智能停车管理系统设计与开发，主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的Java学习者。1.包含：项目源码、项目文档、数据库脚本、软件工具等所有资料2.带你从零开始部署运行本套系统3.该项目附带的源码资料可作为毕设使用智能停车管理系统的重要核心功能包括管理注册用户、管理停车场公告、车辆信息管理、车位信息管理、车辆入库、车辆出库、数据统计、查找附
2025年转行进入网络安全领域薪资及工作安排与前景如何程序员羊羊学习 web安全安全开发语言服务器
如果你计划在2025年转行到网络安全领域，以下是一些建议，可以帮助你顺利过渡并打下坚实的基础：1.薪资情况初级职位（0-3年经验）薪资范围：大约8k-15k/月（根据地区、公司规模和工作内容有所不同）。职位类型：包括网络安全运维、信息安全管理员、安全工程师等。工作内容：监控网络、实施基本的安全防护措施、分析安全事件日志等。中级职位（3-7年经验）薪资范围：大约15k-30k/月。职位类型：包括网络
【比特币与区块链】比特币的工作原理与区块链技术爱技术的小伙子区块链
比特币与区块链比特币的工作原理与区块链技术引言比特币是世界上第一个成功实施的加密货币，其背后的技术——区块链——为去中心化、透明和安全的数字交易提供了基础支持。本文将探讨比特币的工作原理，并深入剖析其所依赖的区块链技术。什么是比特币？比特币（Bitcoin）是由中本聪（SatoshiNakamoto）于2008年提出并于2009年发布的开源软件。比特币是一种去中心化的数字货币，不依赖于任何中央机构
mysql-slow.log-清理 qq_33469570 MySQL mysql 慢查询不走索引
mysql慢查询日志作为运维人员，磁盘空间也是监控中重要的一个环节，数据库服务器磁盘空间不足告警，有时候不是因为业务数据量大，而是因为开启了慢查询，如果my.cnf文件中log-queries-not-using-indexes=1,那么慢查询记录的日志中就不完全是慢查询日志，它包含了查询中没有引用索引的语句，久而久之慢查询日志文件会越来越大，如下为清理慢查询日志，以及关闭未走索引查询记录slow
Chrome插件：图片缩放为头像（128*128）易林示小工具 chrome 前端
前置条件：安装有chrome谷歌浏览器的电脑使用步骤：1.打开chrome扩展插件2.点击管理扩展程序3.加载已解压的扩展程序4.选择对应文件夹5.成功后会出现一个扩展小程序6.点击对应小程序7.使用小程序8.拖拽成功后会自动保存到下载代码：1.manifest.json{"manifest_version":3,"name":"图片缩放器","version":"1.0","descriptio
微信小程序 - wx.navigateTo({}) 跳转页面携带对象/数组/复杂数据参数（携带一个复杂对象数据参数）王二红 +Wechat 微信小程序小程序
前言你可以理解为：携带一个复杂对象数据参数，实现跳转页接收。在微信小程序，使用wx.navigateTo({})API携带参数跳转页面很常见，但是今天有一个需求，需要携带一个复杂的数据，它是一个数组，里面嵌套了N个对象，对象里还有数组。支持Vue2/Vue3语法，完美解决。解决方案使用
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d