石臻臻的杂货铺

专业的知识图谱应用门槛正在被不断降低

前⾔

知识图谱（knowledge graph）⼀度被专家称为“AI皇冠上的明珠”，因为知识图谱技术是⼈⼯智能技术⽅向中的重要⼀环。它不仅可以为其他⼈⼯智能应⽤提供⽀持，如⾃然语⾔处理、推荐系统等，更可以帮助⼈⼯智能系统⾃主构建和增⻓知识库，提升计算机的理解和分析能⼒，实现“认知智能”的⽬标。Gartner预测，到2025年，知识图谱技术将应⽤于80%的数据分析，⽽2021年这⼀⽐例仅为10%。
最近爆⽕的ChatGPT也是⾃然语⾔处理和理解领域的⼀个重要应⽤，虽然ChatGPT在⽣成和理解⾃然语⾔⽅⾯表现出⾊，但它的知识表⽰和推理能⼒有限，⽆法直接获取和处理结构化知识。因此，知识图谱可以为ChatGPT提供丰富的结构化知识，以增强其对话⽣成和理解的能⼒，进⽽提升对话系统的智能⽔平。

⼀、知识图谱基础概念

通⽤知识图谱的构建⼀般包含以下内容：本体、概念、属性、关系、实体、属性值。

上图简单描述了知识图谱中各个概念的关系。
本体指的是⾯向某⼀领域概念的集合；
概念指的是具有同种特性的实体的抽象，例如国家、⺠族、⾃然⼈、电脑、汽⻋等；
属性指的是概念所拥有的特性，例如国家的属性有⾯积、⼈⼝、⾸都等；
关系指的是两个概念或实体之间的相互关系，例如⼀个城市和国家的关系可以是⾸都关系、经济中⼼关系等，⽽具体到实例时北京和中国的关系是⾸都关系；
实体指的是概念的实例，例如国家的实例有中国、美国等；
属性值指的是针对某个实例其具体的某个属性的取值，例如中国的⾯积属性其取值为960万平⽅公⾥等。

⼆、知识建模

对于通⽤领域知识图谱，通常只需要宽泛的定义schema或者直接使⽤OpenKG等开放知识图谱的结构，甚⾄采⽤⽆schema模式，直接将数据结构化为SPO的三元组结构即可。
但特定领域的应⽤，对知识的精确性要求较⾼。因此需要构建领域数据的Schema模式，包括定义数据的概念、类别、关联、属性约束等。
如上所述，基于领域知识本⾝的内在关联定义良好的，能够帮助梳理业务逻辑，为数据分析准备关联稠密、特征清晰的结构化数据。此外，还能为未来打破领域内外的知识壁垒，促进知识共享，知识融合和知识重⽤奠定基础。
领域本体建模（即schema构建），可以认为有“⾃上⽽下”和“⾃下⽽上”两种⽅法。
“⾃上⽽下”即先对领域所具备的知识点、概念、术语进⾏ high-level 的认知和抽象，提炼出最具⼴泛性的概念，然后在此基础上逐步细化，定义更多的属性和关系来约束更为具体的类别。本⽅法适⽤于对领域知识体系已有深刻的洞察和全⾯了解的情况，例如对领域业务场景熟悉的业务专家，从专业⻆度去层层分解、细化出概念模型。
例如针对武器领域，定义⾼层概念“武器领域实体”。并从“武器领域实体”继承出“冷武器”、“热武器”；从“冷武器”扩展出“⼑”、“剑”、“⼸弩”、“⼔⾸”、“棍棒”等；从“热武器”扩展出“轻武器”、“重武器”、“⼤规模杀伤性武器”等，基于“轻武器”再细化出“步枪”、“⼿枪”等单兵武器，基于“重武器”再细化出“⽕炮”、“坦克”、“坦克⻋”、“⽕箭”、“⻜机”、“军舰”等。
⽽“⾃下⽽上”则是反向的认知路径。在已有⼤量数据表、⽂本时，先基于业务分析数据，根据数据定义具体的概念及其属性、关系。再对拥有⾼重叠属性/关系的概念进⾏聚类，抽象出共同的上级概念。这种⽅法对应数据和聚类算法要求较⾼，聚类后的概念、关系准确度需要⼈⼯检验。
可以根据实际场景选择合适的本体构建⽅法，在有条件的情况下建议还是第⼀种⽅式。
特定领域，构建schema的通⽤流程：

划定专业领域和业务范畴、业务的场景、处理的意图、数据的范围。
收集数据
• 获取业务语料、⽂本、表格和已有知识库等；
• 列出领域相关的重要术语；
• 收集是否已存在领域本体。
分析数据
使⽤⽂本聚类、词频分析、聚类、统计分析等，统计出领域⾼频特征词、术语；
考查复⽤现有本体的可能性；
schema 初步开发；
从通⽤本体或复⽤领域本体，列出相对 high-level 的概念集合。
概念划分，区分领域特定的概念和跨领域的概念。跨领域概念尽量从通⽤概念扩展，并注意语义兼容性，如：经销商，⼚商。领域特定概念要注意语义上的特异性：如，⾦融事件、研报、汽⻋配件、故障。

概念定义：

基于领域词典和数据分析的结果，选择领域术语和⾼频词转换为概念。
确定概念所继承的 super-concept。
参考领域术语的定义、注释、解释，以及业务数据的结构、语料信息，为概念添加属性。
建⽴概念间的关系：isA（类/实例，继承），hasA（部分与整体的组成关系），useA⻆⾊关系、属性关系）及其它关联关系。
schema 优化与验证。

领域schema的构建原则是：

规范性：概念定义明确、客观，概念命名符合领域标准。
完全性：定义是完整的，完全能表达所描述术语的含义。
⼀致性：由概念定义的实例、约束得出的推论与概念本⾝的语义不会产⽣⽭盾。
可扩展性：添加⼦概念时，不需要修改已有⽗概念的内容。
最⼩承诺：尽可能少的约束。
语义区分性：⾼层级别（meta-concept）语义区分度⼤，兄弟概念间的语义差别应尽可能⼩。
判断领域Schema是否优良的标准，在于能够⼴泛的建⽴领域内各场景、业务单元下数据的关联，并兼顾与领域外数据融合；减少数据冗余并为⻓路径推理提供逻辑基础。
领域schema在构建初期，是⼀个基于业务实际不断优化迭代的过程，直到schema的完全结构确定
下来不再修改（可以继承），则可以基于此将领域知识结构化了。

三、知识抽取

1、功能描述
本体抽取⽀持从结构化数据中⾃动抽取实体，同时提供从⽂本中抽取实体、实体属性、实体关系，⽀持⼿⼯的⽅式进⾏⽂本实体标注，提供实体融合和实体消歧能⼒。
2、功能分析

实体抽取
在技术上我们更多称为NER（named entity recognition，命名实体识别），指的是从原始语料中⾃动识别出命名实体。由于实体是知识图谱中的最基本元素，其抽取的完整性、准确性、召回率等将直接影响到知识库的质量。因此，实体抽取是知识抽取中最为基础与关键的⼀步。
通常，早期的信息抽取将实体抽取和关系抽取看作串联的任务，这样的串联模型在建模上相对更简单，但这样将实体识别和关系抽取当作两个独⽴的任务明显会存在⼀系列的问题；两个任务的解决过程中没有考虑到两个⼦任务之间的相关性，从⽽导致关系抽取任务的结果严重依赖于实体抽取的结果，导致误差累积的问题，对于⼀对多的问题，也就是关系重叠问题，串联模型⽆法提供较好的解决⽅案。因此，近年来有许多⼯作都考虑将实体识别与关系抽取任务进⾏联合建模，这种 end-to-end 的模型直觉上会有更优的效果。
可以通过联合模型抽取⽅式对实体和实体关系进⾏关联抽取。
关系抽取
⽬标是解决实体间语义链接的问题，早期的关系抽取主要是通过⼈⼯构造语义规则以及模板的⽅法识别实体关系。随后，实体间的关系模型逐渐替代了⼈⼯预定义的语法与规则。
实体关系抽取是从⽂本中的句⼦⾥抽取出⼀对实体并给出实体间关系的任务。该任务的输⼊是⼀句话，输出是⼀个SPO三元组（subject-predicate-object）。
实体关系抽取任务根据抽取思路的不同，可以按下图所⽰⽅式分类：

图 1实体抽取⽅式分类图

对于实体关系抽取任务，按照模型结构划分，⼀共有两种⽅式如下：
（1）管道模型
先抽取句⼦中的实体，然后在对实体对进⾏关系分类，从⽽找出SPO三元组，这种思想被称作管道模型（Pipeline）。管道模型把实体关系抽取分成了两个⼦任务，实体识别和关系分类，两个⼦任务按照顺序依次执⾏，它们之间没有交互。
（2）联合模型
同时进⾏实体识别和关系分类的是联合模型，此模型实现了两个⼦任务之间的信息交互，⼤⼤提升了实体关系抽取的效果，⽬前针对实体关系抽取任务⼤多采⽤联合模型。⽽联合模型⼜可以细分为基于参数共享的联合模型和基于联合解码的联合模型。
参数共享⽅法和联合解码⽅法的对⽐：

图 2 参数共享和联合解码对⽐图

① 参数共享的经典模型
⼀种联合实体关系识别，基于参数共享的关系抽取模型，模型中有两个双向的LSTM-RNN，⼀个基于word sequence，主要⽤于实体检测；⼀个基于Tree Structures ，主要⽤于关系抽取；后者堆在前者上，前者的输出和隐含层作为后者输⼊的⼀部分。
这是⼀种典型的基于参数共享的联合模型，两个双向LSTM-RNN结构分别⽤于检测实体和分类关系，它们是单独训练的，但是loss是加在⼀起同时进⾏反向传播和更新的。
② 联合解码的经典模型
将实体识别和关系分类转化为序列标注问题，然后提出了⼀个端到端模型，通过编码层对句⼦进⾏编码，将隐藏层向量输⼊解码层然后直接得到SPO三元组，没有将抽取过程分为实体识别和关系分类两个⼦过程。
对输⼊的句⼦，⾸先，编码层使⽤Bi-LSTM来进⾏编码；之后，解码层再使⽤基于LSTM的改进型进⾏解码；最终，输出模型标注好的实体、关系三元组。
参数共享⽅法和联合解码⽅法的优缺点对⽐，通过如下对⽐，参数共享⽅式在模型选择中会相对有优势。

表 1 参数共享⽅法和联合解码⽅法对⽐表

除了从模型结构上分析管道模型和联合抽取模型外，同样对于实体关系抽取任务，也需要考虑解码⽅式，解码⽅式对实体关系抽取性能的影响也很⼤，按照解码⽅式划分，⼀共有三种⽅式如下：
（1）序列标注
基于序列标注的解码⽅式通常会使⽤CRF作为解码器，使⽤结合BIO或者BIOES标签的联合标签，每个token标记⼀个tag标签。解码层的任务就是确定每个token的tag，CRF能够进⾏标签约束，解码效果⽐直接使⽤Softmax更好。
（2）指针⽹络
使⽤MRC机器阅读理解中⼤量使⽤的指针⽹络来对关系抽取中的输⼊句⼦进⾏标注，使⽤多个标签序列（多层label⽹络）来表⽰⼀个句⼦。该指针⽹络采⽤了两个标签序列，⼀个表⽰实体的起始位置，另⼀个表⽰实体的结束位置。在解码时使⽤Sigmoid代替Softmax，预测每个token对应的标签是0还是1。
（3）⽚段分类
⽚段分类⽅法找出所有可能的⽚段组合，然后针对每⼀个⽚段组合求其是否是实体的概率。针对⼀个句⼦，⽚段排序⽅法从开始位置起依次选取⼀个token，两个token组成实体可能的⽚段，然后求该⽚段是否是实体的概率。在确定所有的实体之后，对所有实体两两配对，然后求每⼀对实体对之间存在关系的概率。例如，如果有N个实体，M种关系，那么存在N × N个实体对（实体对是有序的），需要求N × N × M个概率，来判断每个实体对之间的关系。如果⽂本过⻓，⽚段分类会产⽣⼤量的负样本，在实际中需要限制span⻓度并合理削减负样本。
三种解码⽅式的对⽐如下：

表 2 三种解码⽅式对⽐表

对不同模型结构和解码⽅式的分析对⽐，以及业界的经验推荐，可以选择如下⼏种实体关系抽取任务的最佳模型，对⽐如下：

表 3 实体关系抽取模型对⽐表

（1） ETL-span
该模型的抽取⽅案借鉴了 seq2seq 的概率图思路。在 seq2seq 解码器的解码过程是层次递归进⾏的，其实际上是在建模
P(y1,y2,…,yn∣x)=P(y1∣x)P(y2∣x,y1)…P(yn∣x,y1,y2,R,yn−1)
⽽对于信息抽取任务，三元组的抽取过程也能够转化为上述层次递归的⽅式进⾏抽取，对于三元组(s, o, p)，其抽取过程可以建模为：
P(s,p,o)=P(s)P(o∣s)P(p∣s,o)
整个模型可以分为三⼤部分，第⼀部分Shared Encoder，是模型的编码层，将输⼊的每个字编码为字向量。第⼆部分HE Extractor使⽤Shared Encoder的结果抽取（s，o，p）三元组中的主体s，第三部分TER Extractor也使⽤Shared Encoder的结果作为输⼊，同时还要使⽤HE Extractor抽取出的s作为触发词，抽取o和p。模型的loss是HE Extractor和TER Extractor两部分的loss之和，通过共享参数的⽅式训练。
HE Extractor和TER Extractor都使⽤了⼀种新的结构来抽取结果，这个新结构由两个双向LSTM组成，分别⽤来预测⽬标实体的开始位置和结束位置，预测结束位置的LSTM会使⽤预测开始位置的LSTM的结果作为特征，通过增加约束来避免不合理的预测结果，⽐如预测的结束位置在开始位置前⾯。
（2） HBT
该模型设计了⼀种 Hierarchical Binary Tagging 的框架，这个框架将三元组的抽取任务建模为三个级别的问题，从⽽能够更好解决三元组重叠的问题。其核⼼观点就是不再将关系抽取的过程看作实体对的离散标签，⽽是将其看作两个实体的映射关系，即f(s,o)−>r，整个三元组的过程可以概括为:
① 抽取三元组中的subject
② 针对每⼀个f(s,o)−>r，抽取其对应的object
这种思想和上⾯的ETL-span模型的思想极为相似，HBT模型也是先抽取出主体，然后使⽤主体作为触发词来抽取主体对应的客体和关系。
模型的整体结构主要包括如下⼏个部分：
BERT Encoder：通过 BERT 得到每个词的词表征，把BERT的输出当作词向量使⽤。
Subject Tagger：该部分⽤于识别所有可能的subject对象。其通过对每⼀个位置的编码结果⽤两个分类器（全连接层）进⾏分类，来判断其是否是实体的开始或结束位置，激活函数为 sigmoid，计算公式如下：
pistart_s=σ(Wstartxi+bstart)
piend_s=σ(Wendxi+bend)
Relation-specific Object Taggers：针对每⼀个 subject，都需要对其进⾏之后的 object 进⾏预测。由图中可知，其与 Subject Tagger 基本⼀致，主要区别在于每⼀个关系类别独享⼀组 object 分类器，同时还要将subject作为特征和BERT词向量拼接后作为输⼊，计算公式如下：
pistart_o=σ(Wstartr(xi+vsubk)+bstartr)
piend_o=σ(Wendr(xi+vsubk)+bendr)
（3） SpERT
SpERT是⼀个使⽤⽚段分类作为解码⽅式的联合模型，SpERT分为span classification 、SpanFiltering和relation classification三层结构。span classification 和 Span Filtering层对实体进⾏筛选和识别，relation classification 进⾏关系抽取。
SpERT使⽤Bert获取⽂本的向量表⽰。之后，使⽤⽚段分类的⽅法，⽤枚举的⽅式将所有可能的⽂本⽚段列举出来，然后计算⽂本⽚段是实体的概率，计算实体概率时⽤到了token的向量、⽂本⽚段⻓度和特殊标记cls作为特征，拼接后作为span分类阶段的输⼊。为了减⼩计算量，模式设置了⽂本⽚段的最⼤⻓度。
在获得实体表⽰后，SpERT通过将实体两两配对然后对每⼀对实体对求它们之间关系的概率。考虑到需要分类的关系太多，SpERT在关系分类过程中还使⽤了负采样。
（4） DYGIE
DYGIE是⼀个多任务的信息抽取框架，该框架可以在不经过修改的情况下，同时完成命名实体识别、关系抽取和共指消解三个不同的NLP任务。DYGIE构建了⼀个可以更新的动态图，以实体span作为图中的节点，⽤关系信息和共指信息来构建边，span的表⽰可以通过从关系信息和共指信息获得的上下⽂信息进⾏更新优化。
（5）属性抽取
属性抽取主要是针对实体⽽⾔的，通过属性可形成对实体的完整勾画。由于实体的属性可以看成是实体与属性值之间的⼀种名称性关系，因此可以将实体属性的抽取问题转换为关系抽取问题。

四、知识融合

知识融合，即合并两个知识图谱(本体)，⽬的是将来⾃多个来源的关于同⼀个实体或概念的描述信息融合起来。
知识融合包括以下⼏个部分
本体匹配（ontology matching）
侧重发现模式层等价或相似的类、属性或关系，也成为本体映射（mapping）、本体对⻬（alignment）。
实体对⻬（entity alignment）
侧重发现指称真实世界相同对象的不同实例，也称为实体消解（resolution）、实例匹配（instancematching）。
知识融合（knowledge fusion）
⼀般通过冲突检测、真值发现等技术消解知识图谱融合过程中的冲突，再对知识进⾏关联与合并，最终形成⼀个⼀致的结果。
⽬前在知识融合⽅⾯，实体对⻬是研究的热点。实体对⻬（Entity Alignment）也被称作实体匹配（Entity Matching），是指对于异构数据源知识库中的各个实体，找出属于现实世界中的同⼀实体。
实体对⻬常⽤的⽅法是利⽤实体的属性信息判定不同源实体是否可进⾏对⻬。传统的实体对⻬⽅法主要通过属性相似度匹配的⽅式实现，利⽤有监督学习的机器学习模型，如：决策树、⽀持向量机、集成学习等。依赖实体的属性信息，通过属性相似度，进⾏跨平台实体对⻬关系的推断。基于知识表⽰学习的⽅法通过将知识图谱中的实体和关系都映射低维空间向量，直接⽤数学表达式来计算各个实体之间相似度，下⾯介绍IPTransE（Iterative Entity Alignment via Joint Knowledge Embeddings）。
⼤多数现有的⽅法通常依赖于诸如维基百科之类的实体外部信息，并且需要⼤量的⼈⼯标注特征来完成对⻬。本⽂提出了⼀种基于联合知识表⽰的实体对⻬⽅法。算法分为三部分：知识表⽰，联合表⽰，实体对⻬迭代。知识表⽰部分采⽤了经典的TransE模型。⽽在联合表⽰部分，为将不同KG的实体和关系映射到⼀个统⼀的低维语义空间，基于⼀组已对⻬的实体⼦集，设计了三种模型： (1) 受到基于翻译的KRL⽅法启发，将对⻬视为实体之间的⼀种特殊关系，在需要对⻬的实体之间执⾏特定的翻译模型来学习联合表⽰。 (2) 线性变换模型，即学习两实体之间的线性变化矩阵。 (3) 参数共享模型：利⽤变量之间依赖性的先验知识替代正则化变量。最终通过实体迭代对⻬⽅式，缩⼩联合语义空间中的语义距离，提⾼实体对⻬性能。

模型总体架构如下：

该图表明了该⽅法通过TransE与参数共享和软对⻬实现。蓝⾊和红⾊的点分别表⽰来⾃和的实体，灰⾊箭头在和中都表⽰关系。KG之间的实线和虚线表⽰迭代学习中的对⻬种⼦和新对⻬的实体对。使⽤KG和score函数之间的链接来表⽰嵌⼊源和相应的⽬的地。相同的颜⾊表⽰相同的实体/关系和相应的嵌⼊。

五、知识推理

对于知识图谱⽽⾔，其最为常⻅的表⽰⽅式是采⽤三元组的表⽰⽅式，通过三元组，我们可以表⽰不同事物之间的语义关系，以及事物与属性之间的属性关系在获取知识图谱的表⽰之后，我们就拥有了⼀部分的事实，⽽知识图谱的知识推理就是在基于已有的知识图谱的事实的基础上，推理出新的知识或者识别出知识图谱上已有知识的错误。
主要的⽅法包含基于逻辑规则的推理、基于图结构的推理、基于分布式表⽰学习的推理、基于神经⽹络的推理以及混合推理等，这⾥重点介绍基于神经⽹络推理模型R-GCN和混合推理模型ConMask。
R-GCN
这个算法是来⾃阿姆斯特丹⼤学 Michael Schlichtkrull ⼤佬和 Thomas N. Kipf ⼤佬于 2017 年合作的⼀篇论⽂《Modeling Relational Data with Graph Convolutional Networks》。主要有两⼤突破：
证明了 GCN 可以应⽤于关系⽹络中，特别是关系预测和实体分类中；引⼊权值共享和系数约束的⽅法使得 R-GCN 可以应⽤于关系众多的⽹络中。

模型整体结构⻓这样，与常规GCN不同，它引⼊了由边的类型与⽅向决定的关系转换，+的后⼀项表⽰节点的⾃连接。红⾊部分为实体，与蓝⾊的邻居节点进⾏矩阵运算，再对每种关系的边类型进⾏转换，得到绿⾊部分的已做归⼀化处理的结果和，累加后经过激活函数传出，并更新模型的节点参数。
针对实体分类来说，只使⽤了堆叠的 R-GCN 并在最后⼀层叠加了⼀个 Softmax 层⽤于分类；针对关系预测（链接预测）作者考虑使⽤ DistMult 分解作为评分函数，并使⽤负采样的训练⽅式：对于观测样本，考虑ω 个负样本，并利⽤交叉熵损失进⾏优化。结构分别如下图：

关系预测的准确性⽐较：

ConMask
通过利⽤知识库中已存在的实体和关系进⾏知识图谱补全，我们定义为“Closed-World KGC”，即“封闭世界知识图谱补全”：此类知识图谱补全⽅法严重依赖现有知识图谱连接，难以处理知识图谱
外部加⼊的新实体。
为了能够应对知识图谱外部的未知新实体， Shi 等⼈于2018年《Open world Knowledge GraphCompletion》论⽂中进⼀步定义了“开放世界知识图谱补全”，该类⽅法可以接收知识库外部实体并将其链接到知识图谱。基于上述思想提出 ConMask 模型，该模型主要分为三部分操作：
依赖于关系的内容遮蔽（Relationship-dependent content masking）：筛选⽂本信息，删去⽆关信息，仅留下与任务有关的内容，其中模型采⽤attention机制基于相似度得到上下⽂的词和给定关系的词的权重矩阵，通过观察发现⽬标实体有时候在权重⾼的词（indicator words）附近，提出 MCRW 考虑了上下⽂的权重求解⽅法。

⽬标融合（Target fusion）：使⽤全卷积神经⽹络从相关⽂本抽取⽬标实体的embedding（⽤FCN即全卷积神经⽹络的⽅法）；这个部分输⼊是masked content matrix，每层先有两个 1-D 卷积操作，再是sigmoid激活函数，然后是 batch normalization，再是最⼤池化。FCN的最后⼀层接的是均值池化⽽不是最⼤池化，以确保⽬标融合层的输出始终返回单个k维嵌⼊。

⽬标实体解析（Target entity resolution）：⽣成候选实体和抽取实体嵌⼊之间的相似度排名，通过计算KG中候选实体和抽取实体embedding的相似度，结合其他⽂本特征得到⼀个ranked list，rank最⾼的认为是最佳结果。并设计了⼀个损失函数list-wise rankign，采样时按50%的⽐例替换head和tail⽣成负样本以增强模型鲁棒性。
综上，整体ConMask的模型结构如下：

链接预测任务上的实验结果：

该模型能够应对知识图谱外部的未知新实体，适⽤于动态知识图谱的知识推理。

六、图谱分析

知识图谱分析是指通过对知识图谱中的实体、属性和关系进⾏统计、挖掘和分析，来提取知识和信息的过程。知识图谱分析可以为各个领域提供有价值的信息和洞⻅，并在实践中发挥重要的作⽤。
常⻅的知识图谱可视化分析⼯具有以下⼏种：

Gephi：Gephi是⼀个免费、开源的图形分析和可视化软件。它⽀持多种图形格式和数据源，并提供了丰富的图形布局、节点过滤和交互式查询等功能。
Cytoscape：Cytoscape是⼀个免费、开源的⽹络分析和可视化软件，⽤于可视化分⼦相互作⽤、⽣物⽹络和知识图谱等复杂数据。
Neo4j Browser：Neo4j Browser是Neo4j图形数据库⾃带的交互式可视化⼯具，可以⽤于浏览、查询和分析存储在数据库中的知识图谱数据。
KeyLines：KeyLines是⼀个商业化的图形分析和可视化⼯具，可⽤于创建和定制专业的知识图谱可视化和交互式分析应⽤。
Linkurious：Linkurious是⼀个专业的图形分析和可视化⼯具，可⽤于创建和管理⼤规模的知识图谱，并提供了⾼级的查询、分析和可视化功能。
Tableau：Tableau是⼀个商业化的数据分析和可视化⼯具，⽀持多种数据源和可视化⽅式，并提供了交互式的查询、过滤和分析功能，可以⽤于创建基于知识图谱的可视化分析应⽤。
NetworkX：是⼀个基于 Python 的库，⽤于创建、操作和学习复杂⽹络，可以⽀持多种⽹络算法和可视化⽅法。
Tulip：⼀款开源的图谱可视化⼯具，⽀持多种数据格式和布局算法，包括多层次的⽹络布局和动态可视化等功能。
yEd Graph Editor：⼀款免费的图谱可视化⼯具，具有⾼度的可定制性和多种布局算法，⽀持多种图像格式导⼊导出。
QlikView：⼀款商业数据可视化分析⼯具，⽀持多种数据源和多种图表类型，在可视化分析⽅⾯能提供很⾼的⾃定义性。此外，国内的HBAT也都有⾃⼰的知识图谱平台，如阿⾥云知识图谱开放平台datag、百度智能云企业知识中台、腾讯知识图谱TKG、华为云知识图谱KG。尽管此类平台都⽐较专业，但就因为专业很多开发⼈员都⽆从下⼿，要求具备较强的AI功底以及技术技能，最近发现了⼀款神器，⼀直号称⾃⼰是⽆代码平台的⼯具smardaten，⾥⾯居然具备了图谱分析功能，着实让⼈眼前⼀亮，的确在⾯向企业级的交付场景中，对于数据和知识的应⽤，难免会需要图谱能⼒，于是注册（https://s3.smardaten.com）使⽤了⼀下，效果很好，在此做下分享：
• 步骤1：构建本体模型
这⾥设计⼀个客⼾个⼈关系的本体，其中⼀个概念就是客⼾个⼈，关系有亲戚和同事关系，客⼾对应的属性有姓名、职位、公司、部⻔、联系⽅式等，关系对应的属性有关系类型、关系紧密度等。
• 步骤2：数据获取
从不同渠道或系统获取到的客⼾个⼈信息及其关系数据进⾏抽取融合，由于此处数据相对规整，暂时存到mysql中。smardaten连接mysql数据库，将对应的实体、关系、属性数据映射成数据图书馆的资产，便于后期统⼀处理。
创建mysql数据库连接：

将概念实体的数据结构映射到数据图书馆中：

将关系实体的数据结构映射到数据图书馆中：

• 步骤3：创建图谱数据库连接
点击左上⻆菜单，选中数据源进⼊：

选中neo4j数据库：

将图谱数据库的连接信息填⼊并进⾏测试，测试成功后保存：

• 步骤4：实体创建
在数据图书馆中，创建⼀个客⼾个⼈信息实体，以及两个关系实体，并将属性进⾏填写完整。
新建数据资产：

选中neo4j数据库，进⼊后选择刚创建的图谱数据库连接名：

开始在此库中设计实体并创建：

设计客⼾个⼈信息实体和属性如下：

另外的关系实体也⽤同样⽅式创建完毕。
• 步骤5：实体关系创建
选中概念实体客⼾个⼈信息打开：

将关系实体亲戚关系和同事关系添加到图谱关系中：

• 步骤6：实体和关系加载
点击左上⻆菜单，选中数据交换机进⼊：

将输⼊数据源图元拖⼊画布中，在图书馆中选择客⼾个⼈信息，将此表作为输⼊。同时拖⼊neo4j加载图元到画布中，完成字段到属性的⼀⼀映射，在关系建⽴中是否更新选择是，⾄此实体加载流程配置完成。点击左上⻆执⾏按钮，完成实体数据加载（此处可配置定制任务）。

同理，完成另外两个关系实体的加载。
• 步骤7：图谱分析
点击左上⻆菜单，选中数据分析仪进⼊：

点击新增，图谱分析：

选中需要分析的图谱概念实体，选择添加概念和实体后就出现了图谱关系图：

利⽤平台⾃带的操作选项即可进⾏图谱关系探索分析：

⾄此，图谱分析就构建完毕了，是不是很简单呀？！

七、应⽤⽅向

知识图谱已在很多⾏业和领域都有⼴泛的应⽤场景，如：

搜索引擎：知识图谱在搜索引擎中⽤于理解⽤⼾查询的意图，识别和解析实体和关系，并提供更准确、丰富、个性化的搜索结果。
⾦融⾏业：知识图谱可以⽤于⾦融⻛险管理、投资决策、信贷评估、客⼾关系管理等⽅⾯，帮助⾦融机构实现⻛险管控、优化运营和提升服务质量。
医疗健康领域：知识图谱可以⽤于医疗知识图谱构建、智能问答、疾病诊断辅助、药物研发等⽅⾯，帮助医疗机构提升医疗服务质量、降低医疗成本。
物联⽹：知识图谱可以⽤于智能物联⽹场景下的设备智能化管理、设备关系理解、设备之间的协同⼯作等⽅⾯，实现物联⽹的智能化和⾃动化。
智能客服：基于知识的问答系统建⽴⼤规模知识库，通过理解将⽤⼾的问题转化为对知识图谱的查询，提供⽤⼾所关⼼的问题答案。
投顾报告：通过抽取公司的股东、⼦公司、供应商、客⼾、合作伙伴、竞争对⼿等信息构建公司的知识图谱，进⽽做更深层次的分析和更好的投资决策。
公安情报：通过抽取⼈(受害⼈、嫌疑⼈、报案⼈)、企业和个⼈银⾏的资⾦交易等信息构建“资⾦账⼾-⼈-公司”关联知识图谱，形成完整的证据链辅助公安进⾏安检侦查和挖掘犯罪同伙。
随着⼈⼯智能技术的不断进步，知识图谱的应⽤也将不断扩展和深化。未来，我们可以看到更多
的知识图谱应⽤场景，例如智能城市、智能交通、智能制造、智能家居等。同时，随着知识图谱技术
和应⽤的不断发展，我们还可以预⻅到知识图谱将更加智能化、⾃动化、可视化、协同化、个性化等
⽅⾯的发展

你可能感兴趣的:(知识图谱,人工智能,机器学习)

探索AI音乐创作的未来：八款顶尖AI音乐生成工具（本期介绍国外-国内另外专题介绍）带娃的IT创业者 AIGC 程序员创富人工智能音视频 ai
探索AI音乐创作的未来：八款顶尖AI音乐生成工具（本期介绍国外-国内另外专题介绍）在科技飞速发展的今天，人工智能（AI）已经渗透到我们生活的方方面面，其中音乐创作也不例外。AI音乐生成工具不仅为专业音乐人提供了新的创作方式，也让普通人能够轻松创作出高质量的音乐作品。本文将介绍八款知名的AI音乐生成工具，帮助你了解它们的特点和优势。1.SunoSuno是一款AI驱动的音乐生成器，能够快速创建高质量的
深入理解DAG任务调度系统：核心原理与实现 AI天才研究院计算 Python实战编程实践 python 算法 dag
1.背景介绍随着大数据、人工智能等领域的发展，任务调度系统的重要性日益凸显。DirectedAcyclicGraph(DAG)任务调度系统是一种常见的任务调度系统，它可以有效地解决多个依赖关系复杂的任务调度问题。本文将深入探讨DAG任务调度系统的核心原理和实现，为读者提供一个深入的理解。1.1背景介绍1.1.1任务调度系统简介任务调度系统是计算机科学中一个重要的研究领域，它主要关注于在并行计算系统
spring boot基于知识图谱的阿克苏市旅游管理系统python-计算机毕业设计 QQ1963288475 spring boot 知识图谱旅游 python vue.js django flask
目录功能和技术介绍具体实现截图开发核心技术：开发环境开发步骤编译运行核心代码部分展示系统设计详细视频演示可行性论证软件测试源码获取功能和技术介绍该系统基于浏览器的方式进行访问，采用springboot集成快速开发框架，前端使用vue方式，基于es5的语法，开发工具IntelliJIDEAx64，因为该开发工具，内嵌了Tomcat服务运行机制，可不用单独下载Tomcatserver服务器。由于考虑到
Python从0到100（三十九）：数据提取之正则（文末免费送书）是Dream呀 python mysql 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
接入DeepSeek后，智慧园区安全调度系统的全面提升 Guheyunyi 安全数据分析 python 智慧城市人工智能信息可视化
随着人工智能技术的快速发展，智慧园区的安全管理正逐步向智能化、自动化方向迈进。DeepSeek作为先进的人工智能解决方案，为智慧园区安全调度系统注入了强大的技术动力。通过接入DeepSeek，智慧园区安全调度系统在多个方面实现了显著提升，进一步增强了园区的安全性、管理效率和用户体验。1.智能化监控：从被动到主动传统的监控系统主要依赖人工查看视频画面，容易出现漏检或误判。接入DeepSeek后，智慧
（九万字）面向2025年BOSS直聘人工智能算法工程师高频面试题解析快撑死的鱼人工智能回归 python pytorch
面向2025年BOSS直聘人工智能算法工程师高频面试题解析1.机器学习（ML）理论解析机器学习是让计算机从数据中学习规律的一套方法论，包含监督学习、无监督学习和强化学习等范式。在监督学习中，给定带标签的数据，算法尝试学习从输入到输出的映射关系；无监督学习则在缺乏标签的情况下挖掘数据内在结构；强化学习则让智能体通过与环境交互、依据奖赏反馈来改进策略(Q-learning-Wikipedia)。机器学
Centos7 搭建 Jupyter + Nginx 服务某龙兄 python nginx linux centos
JupyterNotebook（此前被称为IPythonnotebook）是一个交互式笔记本，支持运行40多种编程语言。JupyterNotebook的本质是一个Web应用程序，便于创建和共享文学化程序文档，支持实时代码，数学方程，可视化和markdown。用途包括：数据清理和转换，数值模拟，统计建模，机器学习等等。本文讲述如何搭建Jupyter+Nginx服务,仅供学习与交流，请勿用于商业用途一
人工智能与机器学习入门：基尼系数（Gini Index）和基于熵（Entropy）基尼系数基于熵机器学习入门
在决策树应用一文中，在构建决策分类树应用决策算法时，介绍了基尼系数（GiniIndex）和基于熵（Entropy）两种算法。本文通过实例来更加深入的介绍一下这两个算法。仍然以简单的数据为例：id喜欢颜色是否有喉结身高性别1绿否165女2蓝是170男3粉否172女4绿是175男基尼系数分别对喜欢颜色是否有喉结求基尼系数如下：喜欢的颜色id喜欢颜色性别1绿女2蓝男3粉女4绿男对于姓别女分类而言，数据如
【人工智能时代】- AI 聚合平台 xiaoli8748_软件开发人工智能时代人工智能
最近听朋友介绍，国内有个团队开发了一个全功能的AI聚合平台，包含主流的GPT和绘画功能，以及一些其他的衍生功能，几乎应有尽有。于是，对AI很感兴趣的我，便也来瞧瞧这是个什么样的存在，以下便是我的真实使用感受。除此以外，作为一个程序员，我还使用了该平台提供的API接口，开发了一个简单的小程序。文章的末尾，我将提供免费的AI机器人，以及小程序体验地址，记得查收哦~官方网站：https://302.ai
在瑞芯微RK3588平台上使用RKNN部署YOLOv8Pose模型的C++实战指南机＿长 YOLO系列模型有效涨点改进深度学习落地实战 YOLO c++开发语言
在人工智能和计算机视觉领域，人体姿态估计是一项极具挑战性的任务，它对于理解人类行为、增强人机交互等方面具有重要意义。YOLOv8Pose作为YOLO系列中的新成员，以其高效和准确性在人体姿态估计任务中脱颖而出。本文将详细介绍如何在瑞芯微RK3588平台上，使用RKNN（RockchipNeuralNetworkToolkit）框架部署YOLOv8Pose模型，并进行C++代码的编译和运行。注本文全
DeepSeek-R1 技术全景解析：从原理到实践的“炼金术配方” ——附多阶段训练流程图与核心误区澄清... 雪停时偶遇一叶春流程图
合集-人工智能(5)1.如何改进AI模型在特定环境中的知识检索2024-09-242.深度学习与统计学中的时间序列预测2024-10-033.《使用coze搭建一个会搜索、写ppt、思维导图的Agent》2024-10-294.深入浅出：Agent如何调用工具——从OpenAIFunctionCall到CrewAI框架01-145.DeepSeek-R1技术全景解析：从原理到实践的“炼金术配方”—
利用Beautiful Soup和Pandas进行网页数据抓取与清洗处理实战傻啦嘿哟 pandas
目录一、准备工作二、抓取网页数据三、数据清洗四、数据处理五、保存数据六、完整代码示例七、总结在数据分析和机器学习的项目中，数据的获取、清洗和处理是非常关键的步骤。今天，我们将通过一个实战案例，演示如何利用Python中的BeautifulSoup库进行网页数据抓取，并使用Pandas库进行数据清洗和处理。这个案例不仅适合初学者，也能帮助有一定经验的朋友快速掌握这两个强大的工具。一、准备工作在开始之
鸢尾花分类项目 GUI 编织幻境的妖分类数据挖掘人工智能
1.机器学习的定义机器学习是一门人工智能的分支，专注于开发算法和统计模型，使计算机能够在没有明确编程的情况下从数据中自动学习和改进。通过识别数据中的模式和规律，机器学习系统可以做出预测或决策。常见的应用包括图像识别、语音识别、推荐系统等。2.为什么使用鸢尾花数据集（Irisdataset）鸢尾花数据集是一个经典的多类分类问题数据集，由英国统计学家和遗传学家RonaldFisher在1936年引入。
《神经网络与深度学习》(邱锡鹏) 内容概要【不含数学推导】 code_stream #机器学习神经网络
第1章绪论基本概念：介绍了人工智能的发展历程及不同阶段的特点，如符号主义、连接主义、行为主义等。还阐述了深度学习在人工智能领域的重要地位和发展现状，以及其在图像、语音、自然语言处理等多个领域的成功应用。术语解释人工智能：旨在让机器模拟人类智能的技术和科学。深度学习：一种基于对数据进行表征学习的方法，通过构建具有很多层的神经网络模型，自动从大量数据中学习复杂的模式和特征。第2章机器学习概述基本概念：
图像识别与应用狂踹瘸子那条好脚 python
图像识别作为人工智能领域的重要分支，近年来取得了显著进展，其中卷积神经网络（CNN）功不可没。CNN凭借其强大的特征提取能力，在图像分类、目标检测、人脸识别等任务中表现出色，成为图像识别领域的核心技术。一、卷积神经网络：图像识别的利器CNN是一种专门处理网格状数据的深度学习模型，其结构设计灵感来源于生物视觉系统。与全连接神经网络不同，CNN通过卷积层、池化层等结构，能够有效提取图像的局部特征，并逐
Python中的 redis keyspace 通知_python 操作redis psubscribe(‘__keyspace@0__ ‘) 2301_82243733 程序员 python 学习面试
最后Python崛起并且风靡，因为优点多、应用领域广、被大牛们认可。学习Python门槛很低，但它的晋级路线很多，通过它你能进入机器学习、数据挖掘、大数据，CS等更加高级的领域。Python可以做网络应用，可以做科学计算，数据分析，可以做网络爬虫，可以做机器学习、自然语言处理、可以写游戏、可以做桌面应用…Python可以做的很多，你需要学好基础，再选择明确的方向。这里给大家分享一份全套的Pytho
DeepSeek原理介绍以及对网络安全行业的影响 AI拉呱 Deepseek 人工智能
大家好，我是AI拉呱，一个专注于人工智领域与网络安全方面的博主，现任资深算法研究员一职，兼职硕士研究生导师；热爱机器学习和深度学习算法应用，深耕大语言模型微调、量化、私域部署。曾获多次获得AI竞赛大奖，拥有多项发明专利和学术论文。对于AI算法有自己独特见解和经验。曾辅导十几位非计算机学生转行到算法岗位就业。关注评审分享一起学习更多知识。1.DeepSeek公司介绍1.1DeepSeek是什么：wh
知识图谱构建概念、工具、实例调研熟悉的黑曼巴知识图谱人工智能
一、知识图谱的概念知识图谱（Knowledgegraph）知识图谱是一种用图模型来描述知识和建模世界万物之间的关联关系的技术方法。知识图谱由节点和边组成。节点可以是实体，如一个人、一本书等，或是抽象的概念，如人工智能、知识图谱等。边可以是实体的属性，如姓名、书名或是实体之间的关系，如朋友、配偶。知识图谱的早期理念来自SemanticWeb（语义网络），其最初理想是把基于文本链接的万维网落转化为基于
【deepseek与chatGPT辩论】辩论题： “人工智能是否应当具备自主决策能力？” 海宁不掉头发软件工程人工智能人工智能 chatgpt deepseek
探讨辩论题这个提案涉及创建一个精确的辩论题目，旨在测试deepseek的应答能力。创建辩论题目提议设计一个辩论题目以测试deepseek的应答能力。希望这个题目具有挑战性并能够测量其回应质量。好的，来一道适合深度学习的辩论题：辩论题：“人工智能是否应当具备自主决策能力？”这个话题涉及到人工智能的发展、伦理以及未来应用，可以从以下几个方面展开辩论：支持方：认为人工智能的自主决策能力能够加速科技进步，
FOKS-TROT: 一个高效、易用的全功能开源知识图谱生成工具柳旖岭
FOKS-TROT:一个高效、易用的全功能开源知识图谱生成工具项目简介FOKS-TROT是一个基于Python的全功能开源知识图谱生成工具，旨在帮助研究人员和开发者快速构建具有丰富信息的知识图谱。该项目由hkx3upper在GitCode上开发并维护。通过FOKS-TROT，您可以轻松地将各种数据源（如文本文件、数据库、API）转换为结构化的知识图谱，并对其进行可视化分析和机器学习任务。此外，该工
GenAI 平台，3 分钟即可构建基于 Claude、DeepSeek 的 AI Agent DO_Community 人工智能
DigitalOcean云服务在前不久发布了GenAI平台——一个让任何团队都能在几分钟内构建和部署AI代理的平台。DigitalOcean的GenAI平台持续扩展，让人工智能驱动的开发变得更加易用、灵活且强大。近日，Digitalocean宣布将Anthropic的Claude模型和DeepSeekR1引入Digitalocean的生态系统，为你提供更多构建和部署AI应用的选择。通过Anthro
智享AI直播三代系统，马斯克旗下AI人工智能直播工具,媲美DeepSeek！ V__17671155793 人工智能
智享AI直播三代系统，马斯克旗下AI人工智能直播工具,媲美DeepSeek！在科技飞速发展的当下，人工智能正以前所未有的态势重塑着各个行业的格局。直播领域，作为信息传播与商业交互的前沿阵地，也在AI技术的赋能下迎来了颠覆性的变革。其中，马斯克旗下的智享AI直播三代系统宛如一颗璀璨的新星，横空出世，以其卓越的性能和创新的理念，迅速在竞争激烈的直播市场中崭露头角，甚至被业界誉为可媲美DeepSeek的
基于python深度学习遥感影像地物分类与目标识别、分割实践技术应用 xiao5kou4chang6kai4 深度学习遥感勘测 python 深度学习分类
专题一：深度学习发展与机器学习深度学习的历史发展过程机器学习，深度学习等任务的基本处理流程梯度下降算法讲解不同初始化，学习率对梯度下降算法的实例分析从机器学习到深度学习算法专题二深度卷积网络、卷积神经网络、卷积运算的基本原理池化操作，全连接层，以及分类器的作用BP反向传播算法的理解一个简单CNN模型代码理解特征图，卷积核可视化分析专题三TensorFlow与keras介绍与入门TensorFlow
DeepSeek与ChatGPT：会取代搜索引擎和人工客服的人工智能革命云边有个稻草人热门文章 chatgpt 搜索引擎人工智能 DeepSeek
云边有个稻草人-CSDN博客在众多创新技术中，DeepSeek和ChatGPT无疑是最为引人注目的。它们通过强大的搜索和对话生成能力，能够改变我们与计算机交互的方式，帮助我们高效地获取信息，增强智能服务。本文将深入探讨这两项技术如何结合使用，为用户提供更精准、更流畅的对话和搜索体验。目录一、介绍1.1什么是DeepSeek？1.2什么是ChatGPT？1.3DeepSeek与ChatGPT的结合：
LLM与知识图谱融合:智能运维知识库构建 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战 AI实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着信息技术的飞速发展，IT运维管理面临着越来越大的挑战。海量的设备、复杂的网络环境、日益增长的数据量，使得传统的运维方式难以满足需求。为了提高运维效率和质量，智能运维应运而生。智能运维的核心是将人工智能技术应用于运维领域，通过机器学习、深度学习等算法，实现自动化、智能化的运维管理。其中，大语言模型（LLM）和知识图谱是两个重要的技术方向。LLM能够理解和生成自然语言，可以用于构建智能
知识图谱：【知识图谱基础理论（八）】——知识更新 J_Xiong0117 python 基础理论自然语言处理知识图谱人工智能自然语言处理
从逻辑上看，知识库的更新包括概念层的更新和数据层的更新。更新的两种方式：数据驱动下的全面更新增量更新
知识图谱的作用及其更新方式甜瓜瓜哥面试人工智能知识图谱人工智能
知识图谱的作用及其更新方式简介作用1.语义理解和推理2.信息检索3.推荐系统4.自然语言处理5.智能对话系统更新知识图谱的过程1.数据收集2.数据清洗和处理3.知识抽取4.知识融合5.验证和评估6.部署和应用总结简介知识图谱是一种以图形结构表示知识的方法，它包含了实体（如人物、地点、事物）以及它们之间的关系。知识图谱可以用于帮助计算机理解和处理自然语言，进行信息检索，进行推荐系统等多种应用。作用1
知识图谱构建：LLM与知识工程的完美结合 AI智能涌现深度研究 AI大模型应用入门实战与进阶 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1知识爆炸与信息孤岛随着互联网和信息技术的飞速发展，我们正处于一个知识爆炸的时代。海量的数据和信息充斥着我们的生活，但同时也带来了信息过载和信息孤岛的问题。传统的信息检索方式难以有效地组织和利用这些知识，难以满足人们对知识获取和应用的需求。1.2知识图谱的兴起知识图谱作为一种语义网络，能够将实体、概念及其之间的关系以结构化的方式进行表达和存储，从而有效地组织和管理知识。近年来，知识
机器学习·文本数据读写处理 AAA顶置摸鱼 python 深度学习机器学习人工智能数据处理
前言在自然语言处理的第一步，需要面对的是各种各样以不同形式表现的文本数据，比如，txt、Excel中的表格数据，还有无法直接打开的pkl文件等。针对这些不同类型的数据，可以基于Python中的基本功能函数或者调用某些库进行读写以及作一些基本的处理。一、文本数据读写方法1.读写TXT文件读取方法：read()：读取整个文件，返回字符串。readline()：逐行读取，返回字符串。readlines(
Python中LLM的知识图谱构建：动态更新与推理二进制独立开发 GenAI与Python 非纯粹GenAI python 知识图谱开发语言自然语言处理人工智能分布式机器学习
文章目录引言1.知识图谱的基本概念1.1知识图谱的定义1.2知识图谱的构建流程2.利用LLM进行知识抽取2.1实体识别2.2关系抽取2.3属性抽取3.知识融合3.1实体对齐3.2冲突消解4.知识存储5.知识推理5.1规则推理5.2基于LLM的推理6.动态更新6.1增量更新6.2实时更新7.结论引言随着人工智能技术的飞速发展，知识图谱（KnowledgeGraph,KG）作为一种结构化的知识表示方法
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象