汀、人工智能

知识图谱之《海贼王-ONEPICE》领域图谱项目实战（含码源）：数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等

项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）：汇总有意义的项目设计集合，助力新人快速实战掌握技能，助力用户更好利用 CSDN 平台，自主完成项目设计升级，提升自身的硬实力。

专栏订阅：项目大全提升自身的硬实力

[专栏详细介绍：项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）

知识图谱之《海贼王-ONEPICE》领域图谱项目实战（含码源）：数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等

码源下载见文章顶部或者文末

https://download.csdn.net/download/sinat_39620217/87975887

实体关系可视化页面可视化页面尝鲜

1. 项目背景& 项目内容

《海贼王》(英文名ONE PIECE) 是由日本漫画家尾田荣一郎创作的热血少年漫画，因为其宏大的世界观、丰富的人物设定、精彩的故事情节、草蛇灰线的伏笔，受到世界各地的读者欢迎，截止2019年11月7日，全球销量突破4亿6000万本[^{1]，并被吉尼斯世界纪录官方认证为“世界上发行量最高的单一作者创作的系列漫画”[}2]。

《海贼王》从1997年开始连载至今，以及将近22年，在900多话的漫画中大量性格鲜明的角色相继登场，故事发生的地点也在不断变化，这既给我们带来阅读的乐趣，同时也为我们梳理故事脉络带来了挑战。

本次任务试图为《海贼王》中出现的各个实体，包括人物、地点、组织等，构建一个知识图谱，帮助我们更好的理解这部作品。

本项目内容包括数据采集、知识存储、知识抽取、知识计算、知识应用五大部分

数据采集

本次项目主要采集构建了两个知识图谱和一个关系抽取数据集
- 人物知识图谱：主要包含各个人物的信息
- 关系抽取数据集：标注出自然语言中存在的实体以及他们之间的关系
- 实体关系知识图谱：构建《海贼王》中各个实体之间关系的知识图谱
知识存储

尝试使用了三元组数据库Apace Jena和原生图数据库Neo4j，并分别使用RDF结构化查询语言SPARQL和属性图查询语言Cypher，在知识图谱上进行查询。
知识抽取

基于之间构建的关系抽取数据集，利用deepke中提供的工具进行关系抽取实践，测试了包括PCNN、GCN、BERT等模型在我们构建数据集上的效果
知识计算
- 图计算：在Neo4j上对实体关系知识图谱进行了图挖掘，包括最短路径查询、权威结点发现、社区发现等
- 知识推理：在Apache Jena上对关系知识图谱进行了知识推理，补全了一部分的数据
知识应用
- 智能问答：基于REfO实现一个对于《海贼王》中人物的知识库问答系统(KBQA)。
- 可视化图片：通过D3对实体关系图片进行可视化，并整合了人物知识图谱中的信息，进行展示。

2.数据采集

数据来源

本次项目中所使用的数据主要来源为两个：一个是从别的知识图谱中获取已经存在的知识信息，另一个是从相关网页中爬取解析半结构化的自然语言文本信息

2.1 人物知识图谱构建

2.1.1 抽取通用知识图谱中已有的目标域知识

知识图谱技术近些年来快速发展，一些公司机构已经构建了许多通用知识图谱，我们可以从中抽取出我们目标领域内相关的实体知识信息，作为我们知识图谱的冷启动数据。

CN-DBpedia[^{3]是由复旦大学知识工场[}4]实验室研发并维护的大规模通用领域结构化百科，我们选择其作为通用知识图谱来源。

整个处理流程如下：

构建《海贼王》实体词汇库
获取实体列表
筛选实体列表
获取图谱中对应实体的三元组知识

构建《海贼王》实体词汇库

主要通过领域WiKi获取《海贼王》中的实体词汇库。在这里，我们在萌娘百科的相关页面[^6]中获取由粉丝爱好者整理的词条名信息，作为词汇库。

我们将原始的半结构化词条数据保存在 cndbpedia/data/raw_moegirl_onepiece_entries.txt 中，并利用正则表达式对其进行解析

python cndbpedia/parse_raw_moegirl_onepiece_entries.py

输出的结果保存在 cndbpedia/data/processed_moegirl_onepiece_entries.txt 中，一共提取了509个词条名

获取实体列表

我们利用知识工厂提供的API[^5]，将词条名作为输入实体指称项名称(mention name)，获取返回对应实体(entity)的列表。

python cndbpedia/get_onepiece_cndbpedia_entities.py

总共获取了1014个不同的实体名，并输出了两个文件，输出的结果保存在 cndbpedia/data 文件夹中。

cndbpedia_onepiece_entities_list.txt：保存了所有识别出的CN-DBpedia中的实体名，例如

爱德华·纽盖特（《航海王燃烧意志》游戏角色）
爱德华·纽盖特（日本漫画《海贼王》中的角色）
爱莎（《弑神者！》中的弑神者之一）
爱莎（《海贼王》中的角色）
爱莎（艾尔之光游戏人物）

moelgirl_cndbpedia_entities_mapping.json ：保存着从moegirl的的条目作为实体指称项名称，在api上查找到的对应的实体列表，例如

"夏奇": [
    "夏奇（日本动漫《海贼王》角色）",
    "夏奇（福建人民艺术剧院主持人）",
    "夏奇（深圳市夏奇实业有限公司）",
    "夏奇（《永嘉诗联》主编）"
],
"布拉曼克": [
    "布拉曼克"
],
"艾佛兰德拉": [
    "艾佛兰德拉"
],
"顶上战争": [
    "大事件（漫画《海贼王》中顶上战争）"
],
"堪十郎": [
    "堪十郎"
],

筛选实体列表

由于自然语言和现实世界的多义性，往往一个mention name可能对应着知识图谱中的多个不同实体。就拿 布鲁克 这个名字来说，在api返回的实体列表中，就有好多不同的实体

布鲁克
布鲁克（奥地利城市穆尔河畔布鲁克缩写）
布鲁克（广告策划师）
布鲁克（日本动漫《海贼王》中的人物）
布鲁克（温力铭演唱歌曲）
布鲁克（游戏《赛尔号》中的精灵）
布鲁克（西班牙2010年拍摄电影）

而其中第四个才是我们需要的。

因此我们可以设置一些筛选条件，只有当实体名中包含：海贼王，航海王，海贼，航海，onepiece，one piece，动漫，漫画 这些关键词之一时，才认为是我们需要的实体

python cndbpedia/filter_moelgirl_cndbpedia_entities_mapping_file.py

输出的结果保存在 cndbpedia/data 文件夹中

**筛选结果：**在509个词条中

有162个词条在CN-DBpedia没有对应的实体名，这些词条被保存在 moelgirl_cndbpedia_api_no_results_mention_name_list.txt；
有11个词条虽然有实体名，但所有对应实体名中都没有包含上面提到的关键词，这些词条被保存在 filter_out_entities_mapping.json
剩余336个词条中，都有对应符合条件的实体名，一共有357个。这些词条被保存在 query_avpair_entities_list.txt，此外 query_avpair_entities_mapping.json 中保存着这些合法词条名和实体名对应的字典。

获取图谱中对应实体的三元组知识

我们利用知识工厂提供的API[^5]，根据前面筛选的实例列表，获取图谱中对应实体的三元组知识

python cndbpedia/get_onepiece_cndbpedia_avpair.py

输出结果保存在 cndbpedia/data 文件夹中

query_avpair_cndbpedia_onepiece_results.json：保存着每个实体对应的三元组知识的字典，采用两级索引结构，第一级索引是mention name，第二级索引是实体名字，示例如下

"砂糖": {
        "砂糖（《海贼王》人物）": {
            "性别": "女",
            "配音": "詹雅菁（台湾）",
            "中文名": "砂糖",
            "登场作品": "海贼王",
            "初次登场": "漫画第682话、动画608话",
            "恶魔果实": "超人系童趣果实",
            "职位": "唐吉诃德家族梅花军特别干部",
            "外文名称": "Sugar",
            "年龄": "外貌年龄10岁，真实年龄22岁",
            "CATEGORY_ZH": "人物",
            "DESC": "砂糖是日本动漫《海贼王》中的人物，童趣果实能力者。唐吉诃德家族干部，隶属梅花军托雷波尔。被家族视为重要的干部，多弗朗明哥为此特别安排家族最高干部托雷波尔担任她的贴身保镖。"
        }
    },

query_avpair_keys_list_file.txt：保存在所有属性名称的列表

2.1.2 抽取网页中半结构化的知识

生命卡(vivre card)[^{7]是海贼王官方整理发布的角色资料图鉴，包含着丰富的角色信息。国内的粉丝爱好者也将其翻译成了中文版本，并发布在了网页上[}8]。这部分就是希望抽取Talkop论坛中相关网页中存在的半结构化信息，构建对应人物的知识图谱。

抽取流程

由于格式较为固定，因此采用模板匹配的方式来抽取知识，整个流程如下：

从网页中获取原始文本信息
人工删除不相关的文本
利用代码以模板匹配的方式，自动抽取人物属性信息
```
cd talkop
python parse_processed_manual_talkop_vivre_card.py
```
输出的文件保存在 talkop/data/processed_manual_talkop_vivre_card 文件夹中，每个网页对应着三个输出文件
- xxx-predicate_key_list.txt：所有解析得到的predicate
- xxx-entities_id_name_list.txt：所有解析得到的id和实体名
- xxx-entities_avpair.json：抽取到所有实体的属性知识，以json的格式保存
人工校验：例如：查看是否抽取到了所有的实体、通过查看抽取的predicate结果来调整模板。整个过程中是代码自动抽取和人工校验构成闭环的过程，在闭环过程中不断补充模板信息，改善抽取结果

在整个过程中，2、3、4是不断循环往复的过程，直至抽取的知识满足我们的需要。

汇总结果

在上面部分中，我们分别抽取了各个网页中人物实体的属性信息，现在将这些信息进行进一步的汇总

cd talkop
python summary_talkop_vivre_card.py

从汇总的结果可以看到，一共包含660个不同的实体，164个不同的predicate

输出的文件保存在 talkop/data/processed_manual_talkop_vivre_card 文件夹中，一共有两个文件：

summary_predicate_set.txt：所有predicate的汇总
summary_entities_id_name_list.txt：所有抽取得到的实体名以及对应ID的汇总

2.2. 关系抽取数据集构建

标注数据来源：在前面构建的人物知识图谱中，有一项重要的属性是历史信息，记录着每个人物在故事中的时间线以及对应的故事。每个人的历史信息记录着其与其他实体之间交互的信息，我们可以利用它来构建我们垂直领域内的关系抽取数据集
标注工具：精灵标注助手[^8]
构建方法：自底向上构建，在构建过程中逐步构建整个图谱的schema

**数据标注格式：**精灵标注助手提供导出json格式，其具体形式如下所示，其中 T 和 E 分别表示标注出的实体信息和关系信息

{
    "content": "xxxx"
    "labeled": true,
    "outputs": {
        "annotation": {
            "A": [""],
            "E": [""],
            "R": ["",{
                    "arg1": "Arg1",
                    "arg2": "Arg2",
                    "from": 1,
                    "name": "到过",
                    "to": 2
                },
            ],
            "T": ["",{
                    "attributes": [],
                    "end": 7,
                    "id": 1,
                    "name": "人",
                    "start": 0,
                    "type": "T",
                    "value": "蒙其·D·路飞"
                },
            ]
        }
    },
    "path": "D:\\annot\\fuseki_vivrecard_sentence_item.txt",
    "time_labeled": 1578072175246
}

数据存储位置： 被标注的原始数据被保存在 deepke-master/data/vivrecard/rawfuseki_vivrecard_sentence_item.txt原始标注结果被保存在 deepke-master/data/vivrecard/annot/outputs/fuseki_vivrecard_sentence_item.json。

为了方便后续关系抽取模型处理，我们将标注数据转为符合deepke项目格式的数据

并保存在 deepke-master/data/vivrecard/origin，具体详情参见知识抽取部分

2.3 数据集统计信息

实体类型：一共7种实体：‘事件’, ‘组织’, ‘船只’, ‘地点’, ‘职务’, ‘恶魔果实’, ‘人’

关系类型：一共22种关系

head_type	tail_type	relation	index	freq
None	None	None	0	0
人	事件	参与	1	36
人	人	同盟	2	1
人	人	夫妻	3	3
人	人	战斗	4	38
人	人	母亲	5	3
人	人	父亲	6	4
人	人	老师	7	6
人	人	遇见	8	100
人	地点	出生地	9	3
人	地点	到过	10	145
人	恶魔果实	拥有果实	11	10
人	组织	创建	12	23
人	组织	加入	13	66
人	组织	属于	14	38
人	组织	战斗	15	20
人	组织	离开	16	18
人	组织	遇见	17	14
人	组织	领导	18	15
人	职务	担任	19	70
人	船只	建造	20	2
组织	组织	战斗	21	1

这些关系的频数柱状图如下图所示，可以看到这些关系展现出明显的长尾分布

训练正样本个数：616个

2.4 实体关系知识图谱构建

在进行关系抽取数据集的标注过程中，我们将标注的实体和关系单独导出，构建《海贼王》实体关系数据集

在上述过程中，一共标注了307个不同的实体，569个不同结点间的关系

cd deepke-master
python utils/convert_vivrecard2deepke.py

输出的实体关系数据保存在 deepke-master/data/vivrecard/summary/vizdata_vivrecard_relation.json，可用于后续进行知识图谱可视化，具体参见知识图谱可视化部分

3. 知识存储

3.1. 基于RDF 三元组数据库：Apache Jena

3.1.1 Jena 简介&项目实践

Jena[^9]是 Apache 顶级项目,其前身为惠普实验室开发的 Jena 工具包.Jena 是语义 Web 领域主要的开源框架和 RDF 三元组库,较好地遵循了 W3C 标准,其功能包括:RDF 数据管理、RDFS 和 OWL 本体管理、SPARQL 查询处理等.Jena 具备一套原生存储引擎,可对 RDF 三元组进行基于磁盘或内存的存储管理.同时,具有一套基于规则的推理引擎,用以执行 RDFS 和 OWL 本体推理任务.

avpair to triple

以vivrecard人物属性知识图谱为例，首先我们将之前获得的数据，转换为Jena支持解析的 N-Triple 三元组格式，命名空间前缀为

cd talkop
python avpair2ntriples_talkop_vivre_card.py

导出的 N-Triple 格式的数据保存在 talkop/data/processed_manual_talkop_vivre_card/ntriples_talkop_vivre_card.nt，一共有14055个，其中非空triples有12863个

NOTE：

在项目构建过程中，我们也将从CN-DBpedia获取的知识转换为 N-Triple 格式，命名空间前缀为
```
python cndbpedia/avpair2ntriples_onepiece_cndbpedia.py
```
结果保存在 cndbpedia/data/ntriples_cndbpedia_onepiece.nt，一共有4691个triple

启动 Fuseki

按照陈华均老师提供文件：https://github.com/zjunlp/kg-course/blob/master/tutorials/Tutorial-Jena.pdf

进一步配置fuseki，上传数据集就可以查询了

3.1.2 SPARQL查询示例

SPARQL[^11] 是 W3C 制定的 RDF 知识图谱标准查询语言.SPARQL 从语法上借鉴了 SQL.SPARQL 查询的基本单元是三元组模式(triple pattern),多个三元组模式可构成基本图模式(basic graph pattern).SPARQL 支持多种运算符,将基本图模式扩展为复杂图模式(complex graph pattern).SPARQL 1.1 版本引入了属性路径(property path)机制以支持 RDF 图上的导航式查询.下面使用图 2 所示的电影知识图谱 RDF 图,通过示例介绍 SPARQL 语言的基本功能. [^10]

下面给出了使用SPARQL在我们构建的数据库上进行查询的示例

查询前五个角色的身高

PREFIX : 
select ?s ?name ?zhname ?height ?o where {
	?s ?height ?o .
	FILTER(?height in (:身高, :身长)) .
    OPTIONAL { ?s :名称 ?name. ?s :外文名 ?zhname.}
}
limit 5

结果

 "s" , "name" , "zhname" , "height" , "o" ,
 ":0001" , "【蒙其·D·路飞/Monkey D Luffy】" , "Monkey D Luffy" , ":身高" , "174cm" ,
 ":0004" , "【乌索普/Usopp】" , "Usopp" , ":身高" , "174cm" ,
 ":0511" , "【乔艾莉·波妮/Jewelry Bonney】" , "Jewelry Bonney" , ":身高" , "174cm" ,
 ":0002" , "【罗罗诺亚·索隆/Roronoa Zoro】" , "Roronoa Zoro" , ":身高" , "181cm" ,
 ":0224" , "【缇娜/Hina】" , "Hina" , ":身高" , "181cm" ,

筛选生日范围

PREFIX : 
select ?s ?name ?o where {
	?s :生日 ?o .
    ?s :名称 ?name .
  	filter(?o > '4月1日' && ?o < '5月1日')
}
limit 5

结果

 "s" , "name" , "o" ,
 ":0009" , "【布鲁克/Brook】" , "4月3日" ,
 ":0660" , "【伯尔杰米/Porchemy】" , "4月3日" ,
 ":0010" , "【甚平/Jinbe】" , "4月2日" ,
 ":0076" , "【哲夫/Zeff】" , "4月2日" ,
 ":0028" , "【克比/Koby】" , "5月13日" ,

3.2. 基于原生图数据库：Neo4j

3.2.1. Neo4j简介&Cypher查询示例

Neo4j[^12]是由 Neo 技术公司开发的图数据库.可以说,Neo4j 是目前流行程度最高的图数据库产品.Neo4j 基于属性图模型,其存储管理层为属性图的节点、节点属性、边、边属性等元素设计了专门的存储方案.这使得 Neo4j 在存储层对于图数据的存取效率优于关系数据库.

#####4.2.2. 项目实践

relation to triple

以实体关系知识图谱为例，首先我们将之前获得的各个实体之间关系的数据，转换为Jena支持解析的 N-Triple 三元组格式，命名空间前缀为

cd deepke-master
python utils/convert_vivrecard2deepke.py

导出的 N-Triple 格式的数据保存在 deepke-master/data/vivrecard/summary/vivrecard_ntriples.nt，一共有1848个

启用 Neo4j

Neo4j的下载安装可以参考： https://neo4j.com/download-thanks-desktop/?edition=desktop&flavour=winstall64&release=1.2.4&offline=true

cd D:\neo4j\bin
neo4j.bat console

之后访问：http://localhost:7474/ 就可以了

默认的用户名和密码都是 neo4j

Cypher 最初是图数据库 Neo4j 中实现的属性图数据查询语言，是一种声明式的语言，用户只需要声明查什么，而不需要关系怎么查。

下面给出了使用Cypher在我们构建的数据库上进行查询的示例

导入

CREATE INDEX ON :Resource(uri)
                          
CALL semantics.importRDF("file:///${PROJECT_PATH}/deepke-master/data/vivrecard/summary/vivrecard_ntriples.nt","N-Triples")

查看schema
```
call db.schema()
```
把resource屏蔽掉，就能清楚的看到schema了
查询前100个人
```
MATCH (n:ns0__人) RETURN n LIMIT 100
```

查询属于人的结点中，URI里面包含 薇薇 的结点

MATCH (n:ns0__人)
WHERE n.uri CONTAINS '薇薇'
RETURN n.uri

n.uri

“http://kg.course/talkop-vivre-card/deepke/人/寇布拉•薇薇”

“http://kg.course/talkop-vivre-card/deepke/人/奈菲鲁塔丽•薇薇”

“http://kg.course/talkop-vivre-card/deepke/人/薇薇”

n.uri
“http://kg.course/talkop-vivre-card/deepke/人/寇布拉•薇薇”
“http://kg.course/talkop-vivre-card/deepke/人/奈菲鲁塔丽•薇薇”
“http://kg.course/talkop-vivre-card/deepke/人/薇薇”

根据uri筛选名字间最短路径

MATCH p=shortestPath(
(n1)-[*]-(n2)
)
WHERE n1.uri CONTAINS '斯摩格' and n2.uri CONTAINS '罗宾'
RETURN p

根据名字筛选德雷斯罗萨到司法岛里面四跳的路径

# 五跳内能到的所有路径
# 9312 多萝菲（Miss.圣诞快乐）
# 9306 本·贝克曼
MATCH p = ((n1)-[*4]-(n2))
WHERE n1.uri CONTAINS '司法岛' and n2.uri CONTAINS '德雷斯罗萨'
RETURN p

可以发现这里面存在一些环路的情况，即同一个结点在路径中出现两次

4. 知识抽取

DeepKE[^13]基于 Pytorch 的深度学习中文关系抽取处理套件。在这部分中我们利用之前构建的关系抽取数据集和deepke，进行中文关系抽取实践

4.1. 数据转换&标注统计

在这部分，我们需要完成以下三部分内容：

将我们的标注结果转换为deepke所接收的格式
为了保证关系分布均匀，将数据随机打乱
完成训练集、测试集、验证集的划分，目前按 7:2:1进行划分

使用 deepke-master/utils/convert_vivrecard2deepke.py 完成数据格式转换

cd deepke-master
python utils/convert_vivrecard2deepke.py

输出

一共有616个训练正样本，其中train、test、valid分别有：431/123/62个

输出的文件保存在 deepke-master/data/vivrecard/ 中的 origin 和 summary 文件夹中

├── annot
│   └── outputs
│       └── formatted_fuseki_vivrecard_sentence_item.json # 对json文件进行缩进等格式化
├── origin                                          # 输出转换得到deepke训练数据到该文件夹
│   ├── relation.csv
│   ├── test.csv
│   ├── train.csv
│   └── valid.csv
└── summary
    ├── all_sent.txt                      # 所有的句子
    ├── annot_entity_sent.txt             # 被标记上实体的句子
    ├── annot_relation_sent.txt           # 被标记上关系的句子
    ├── entities_type_name_dict.json      # 标注数据中所有的实体类型，以及属于该类型的所有实体名字
    ├── relation.csv                      # 标注数据中的存在的所有数据
    ├── unannot_entity_sent.txt           # [未被]标记上实体的句子
    └── unannot_relation_sent.txt         # [未被]标记上关系的句子

4.2. 训练

在训练过程中我们尝试使用了deepke所提供的PCNN, rnn, gcn, capsule, transformer, bert 这些模型，epoch 设置为 50，num_relations 根据我们数据集的实际情况修改为19，需要注意的是基于BERT的语言模型进行训练时，需要先在相关网页[^14]下载好预训练模型

新的数据集有22种关系(包括None)，需要通过 num_relations 来更改

cd deepke-master

python main.py show_plot=False data_path=data/vivrecard/origin out_path=data/vivrecard/out num_relations=22 epoch=50 model=cnn

python main.py show_plot=False data_path=data/vivrecard/origin out_path=data/vivrecard/out num_relations=22 epoch=50 model=rnn 

python main.py show_plot=False data_path=data/vivrecard/origin out_path=data/vivrecard/out num_relations=22 epoch=50 model=gcn

python main.py show_plot=False data_path=data/vivrecard/origin out_path=data/vivrecard/out num_relations=22 epoch=50 model=capsule

python main.py show_plot=False data_path=data/vivrecard/origin out_path=data/vivrecard/out num_relations=22 epoch=50 model=transformer

# lm bert layer=1
python main.py show_plot=False data_path=data/vivrecard/origin out_path=data/vivrecard/out num_relations=22 epoch=50 model=lm lm_file=~/ZJU_study/Knowledge_Graph/deepke/pretrained/ num_hidden_layers=1

# lm bert layer=2
python main.py show_plot=False data_path=data/vivrecard/origin out_path=data/vivrecard/out num_relations=22 epoch=50 model=lm lm_file=~/ZJU_study/Knowledge_Graph/deepke/pretrained/ gpu_id=0 num_hidden_layers=2


# lm bert layer=3
python main.py show_plot=False data_path=data/vivrecard/origin out_path=data/vivrecard/out num_relations=22 epoch=50 model=lm lm_file=/home/zenghao/ZJU_study/Knowledge_Graph/deepke/pretrained/ gpu_id=1 num_hidden_layers=3

4.3. 训练结果

	PCNN	RNN	GCN	CAPSULE	TRANSFORMER	LM(BERT) LAYER=1	LM(BERT) LAYER=2	LM(BERT) LAYER=3
VALID	80.11	83.87	55.91	75.27	82.26	89.79	90.86	89.78
TEST	86.18	85.64	63.15	82.66	86.18	91.87	91.33	92.14

可以到基于bert的语言模型效果最好，明显由于其他模型。GCN的效果最差。这也说明在小规模数据上利用预训练的语言模型还是能够抽取到比较好的特征的。

但是在我们后面对于实际数据的预测结果发现，语言模型的泛化效果似乎不如PCNN模型的好

我们猜测是由于我们的数据存在长尾分布问题，模型可能趋向于预测某些特定关系来作弊，已达到准确率提高的效果

5. 知识计算

5.1. 图计算

知识图谱的一个很重要的特征就是其的图结构，不同实体之间的结构本身就内含着许多的隐式的信息，可以被进一步的挖掘利用。

在这部分中，我们参考他人在类似领域的实践[^15][16]，利用Neo4j提供的图算法，对我们构建的实体关系知识图谱，用图算法进行一定的计算分析，包括计算最短路径、关键结点、结点中心度、社区发现等。

5.1.1. 人物网络分析

人物数量

万事以简单开始。先看看上图上由有多少人物：

MATCH (c:`ns0__人`) RETURN count(c)

count©
134

概要统计

统计每个角色接触的其它角色的数目：

MATCH (c:`ns0__人`)-[]->(:`ns0__人`)
WITH c, count(*) AS num
RETURN min(num) AS min, max(num) AS max, avg(num) AS avg_characters, stdev(num) AS stdev

min	max	avg_characters	stdev
1	6	1.8374999999999997	1.1522542572790615

图（网络）的直径

网络的直径或者测底线或者最长最短路径：

// Find maximum diameter of network
// maximum shortest path between two nodes
MATCH (a:`ns0__人`), (b:`ns0__人`) WHERE id(a) > id(b)
MATCH p=shortestPath((a)-[*]-(b))
RETURN length(p) AS len, extract(x IN nodes(p) | split(x.uri, 'http://kg.course/talkop-vivre-card/deepke')[-1]) AS path
ORDER BY len DESC LIMIT 4

len	path
10	[“/人/克拉巴特尔”, “/职务/管家”, “/人/克洛”, “/职务/船长”, “/人/甚平”, “/事件/顶上战争”, “/人/缇娜”, “/事件/世界会议”, “/人/Dr.古蕾娃”, “/人/乔巴”, “/人/Dr.西尔尔克”]
9	[“/人/Dr.西尔尔克”, “/人/乔巴”, “/人/Dr.古蕾娃”, “/事件/世界会议”, “/人/伊卡莱姆”, “/组织/草帽一伙”, “/人/库洛卡斯”, “/地点/伟大航路”, “/人/哥尔·D·罗杰”, “/人/西奇”]
9	[“/人/Dr.西尔尔克”, “/人/乔巴”, “/人/Dr.古蕾娃”, “/事件/世界会议”, “/人/缇娜”, “/组织/草帽一伙”, “/人/娜美”, “/组织/恶龙一伙”, “/人/哞哞”, “/人/卡里布”]
9	[“/人/克拉巴特尔”, “/职务/管家”, “/人/克洛”, “/职务/船长”, “/人/东利”, “/人/路飞”, “/人/克利克”, “/地点/伟大航路”, “/人/哥尔·D·罗杰”, “/人/西奇”]

我们能看到网络中有许多长度为9的路径。

最短路径

使用Cypher 的shortestPath函数找到图中任意两个角色之间的最短路径。让我们找出克洛克达尔和**加尔帝诺（Mr.3）**之间的最短路径：

MATCH p=shortestPath(
(n1)-[*]-(n2)
)
WHERE n1.uri CONTAINS '克洛克达尔' and n2.uri CONTAINS '加尔帝诺'
RETURN p

还可以对路径中的结点进行一些限制，例如路径中不能包含某种类型的结点

MATCH p=shortestPath((n1)-[*]-(n2))
WHERE n1.uri CONTAINS '克洛克达尔' and n2.uri CONTAINS '加尔帝诺' and id(n2) > id(n1) and NONE(n IN nodes(p) WHERE n:`ns0__组织`)
RETURN p

路径中只能包含某种类型的结点

例子：所有从索隆到强尼的1到3跳的路径中，只经过人物结点的路径

MATCH p=(n1)-[*1..3]-(n2)
WHERE n1.uri CONTAINS '索隆' and n2.uri CONTAINS '强尼' and all(x in nodes(p) where 'ns0__人' IN LABELS(x))
RETURN p

所有最短路径

联结斯摩格和一本松之间的最短路径可能还有其它路径，我们可以使用Cypher的allShortestPaths函数来查找：

MATCH (n1:`ns0__人`), (n2:`ns0__人`) WHERE n1.uri CONTAINS '克洛克达尔' and n2.uri CONTAINS '加尔帝诺' and id(n2) > id(n1)
MATCH p=allShortestPaths((n1)-[*]-(n2))
RETURN p

5.1.2. 关键节点

在网络中，如果一个节点位于其它两个节点所有的最短路径上，即称为关键节点。下面我们找出网络中所有的关键节点：

// Find all pivotal nodes in network
MATCH (a:`ns0__人`), (b:`ns0__人`) WHERE id(a) > id(b)
MATCH p=allShortestPaths((a)-[*]-(b)) WITH collect(p) AS paths, a, b
MATCH (c:`ns0__人`) WHERE all(x IN paths WHERE c IN nodes(x)) AND NOT c IN [a,b]
RETURN a.uri, b.uri, c.uri AS PivotalNode SKIP 490 LIMIT 10

a.uri	b.uri	PivotalNode
“http://kg.course/talkop-vivre-card/deepke/人/萨奇斯”	“http://kg.course/talkop-vivre-card/deepke/人/妮可·罗宾”	“http://kg.course/talkop-vivre-card/deepke/人/路飞”
“http://kg.course/talkop-vivre-card/deepke/人/萨奇斯”	“http://kg.course/talkop-vivre-card/deepke/人/瓦波尔”	“http://kg.course/talkop-vivre-card/deepke/人/路飞”
“http://kg.course/talkop-vivre-card/deepke/人/萨奇斯”	“http://kg.course/talkop-vivre-card/deepke/人/诺琪高”	“http://kg.course/talkop-vivre-card/deepke/人/路飞”
“http://kg.course/talkop-vivre-card/deepke/人/萨奇斯”	“http://kg.course/talkop-vivre-card/deepke/人/诺琪高”	“http://kg.course/talkop-vivre-card/deepke/人/娜美”

从结果表格中我们可以看出有趣的结果：娜美和路飞是萨奇斯和诺琪高的关键节点。这意味着，所有联结萨奇斯和诺琪高的最短路径都要经过娜美和路飞。我们可以通过可视化萨奇斯和诺琪高之间的所有最短路径来验证：

MATCH (n1:`ns0__人`), (n2:`ns0__人`) WHERE n1.uri CONTAINS '萨奇斯' and n2.uri CONTAINS '诺琪高' and id(n1) <> id(n2)
MATCH p=shortestPath((n1)-[*]-(n2))
RETURN p

5.1.3. 节点中心度

节点中心度给出网络中节点的重要性的相对度量。有许多不同的方式来度量中心度，每种方式都代表不同类型的“重要性”。

度中心性(Degree Centrality)

度中心性是最简单度量，即为某个节点在网络中的联结数。在《海贼王》的图中，某个角色的度中心性是指该角色接触的其他角色数。作者使用Cypher计算度中心性：

MATCH (c:`ns0__人`)-[]-()
RETURN split(c.uri, 'http://kg.course/talkop-vivre-card/deepke')[-1] AS character, count(*) AS degree ORDER BY degree DESC

character	degree
“/人/路飞”	33
“/人/缇娜”	20
“/人/娜美”	19
“/人/山治”	15

从上面可以发现，在《海贼王》网络中路飞和最多的角色有接触。鉴于他是漫画的主角，我们觉得这是有道理的。

介数中心性（Betweenness Centrality）

介数中心性：在网络中，一个节点的介数中心性是指其它两个节点的所有最短路径都经过这个节点，则这些所有最短路径数即为此节点的介数中心性。介数中心性是一种重要的度量，因为它可以鉴别出网络中的“信息中间人”或者网络聚类后的联结点。

图中红色节点是具有高的介数中心性，网络聚类的联结点。

为了计算介数中心性，需要安装 algo 库

CALL algo.betweenness.stream('ns0__人', 'ns1__遇见',{direction:'both'})
YIELD nodeId, centrality

MATCH (user:`ns0__人`) WHERE id(user) = nodeId

RETURN user.uri AS user,centrality
ORDER BY centrality DESC;
       
或者
       
CALL algo.betweenness.stream('ns0__人', null,{direction:'both'})
YIELD nodeId, centrality

MATCH (user:`ns0__人`) WHERE id(user) = nodeId

RETURN user.uri AS user,centrality
ORDER BY centrality DESC;

user	centrality
“http://kg.course/talkop-vivre-card/deepke/人/路飞”	759.0
“http://kg.course/talkop-vivre-card/deepke/人/缇娜”	335.0
“http://kg.course/talkop-vivre-card/deepke/人/加尔帝诺（Mr.3）”	330.0

NOTE：上面的是不考虑方向的，所以设置为 {direction:'both'}。如果考虑方向，可以

loading incoming relationships: ‘INCOMING’,‘IN’,‘I’ or ‘<’

loading outgoing relationships: ‘OUTGOING’,‘OUT’,‘O’ or ‘>’

紧度中心性（Closeness centrality）

紧度中心性是指到网络中所有其他角色的平均距离的倒数。在图中，具有高紧度中心性的节点在聚类社区之间被高度联结，但在社区之外不一定是高度联结的。

网络中具有高紧度中心性的节点被其它节点高度联结

MATCH (c:`ns0__人`)
WITH collect(c) AS characters
CALL algo.closeness.stream('ns0__人', null)
YIELD nodeId, centrality

RETURN algo.asNode(nodeId).uri AS node, centrality
ORDER BY centrality DESC
LIMIT 20;

node	centrality
“http://kg.course/talkop-vivre-card/deepke/人/Miss黄金周”	1.0
“http://kg.course/talkop-vivre-card/deepke/人/范德·戴肯”	1.0
“http://kg.course/talkop-vivre-card/deepke/人/杰斯”	1.0

5.1.4. 社区发现

CALL algo.beta.louvain.stream(null, null, {
 graph: 'huge',
 direction: 'BOTH'
}) YIELD nodeId, community, communities
RETURN algo.asNode(nodeId).uri as name, community, communities
ORDER BY community ASC

name	community	communities
“http://kg.course/talkop-vivre-card/deepke/人/瓦波尔”	151	null
“http://kg.course/talkop-vivre-card/deepke/组织/黑胡子海贼团”	151	null
“http://kg.course/talkop-vivre-card/deepke/地点/磁鼓岛”	151	null
“http://kg.course/talkop-vivre-card/deepke/人/克罗马利蒙”	151	null
“http://kg.course/talkop-vivre-card/deepke/组织/磁鼓王国”	151	null
“http://kg.course/talkop-vivre-card/deepke/组织/医生20”	151	null
“http://kg.course/talkop-vivre-card/deepke/人/杰斯”	151	null
“http://kg.course/talkop-vivre-card/deepke/组织/邪恶暗黑磁鼓王国”	151	null
“http://kg.course/talkop-vivre-card/deepke/人/宇宙小姐”	151	null

可以看到，基本把瓦波尔那一系列的community给检测出来了，包括在磁鼓岛和黑暗磁鼓王国

5.1.5. PageRank

CALL algo.pageRank.stream('ns0__人', null, {iterations:20, dampingFactor:0.85})
YIELD nodeId, score
RETURN algo.asNode(nodeId).uri AS page,score
ORDER BY score DESC

page	score
“http://kg.course/talkop-vivre-card/deepke/人/路飞”	2.9112886658942436
“http://kg.course/talkop-vivre-card/deepke/人/山治”	1.4952359730610623
“http://kg.course/talkop-vivre-card/deepke/人/拉布”	1.1878799288533628

5.2. 知识推理

TODO

6. 知识应用

6.1. 智能问答

在这部分中我们参考前人的工作[^17][18]，基于REfO[^19]实现了一个KBQA系统，主要流程为：解析输入的自然语言问句生成 SPARQL 查询，进一步请求后台基于 TDB 知识库的 Apache Jena Fuseki 服务, 得到结果。代码和数据存放在 vivirecard-KB_query 目录下

6.1.1. 支持的问题类型

对于生日/英文名/血型/星座/霸气/身高的查询
谁出生在哪里/出生在某个地方的有谁

6.1.2. 查询示例

运行 python query_main.py 就可以开始进行QA过程

cd vivirecard-KB_query
python query_main.py

直接输入问题，按回车后就会返回答案；当系统中没有对应知识时，会返回 I don't know. :(；当系统无法理解问题时会返回 I can't understand. :(

雷利的身高是多少？

188cm
罗杰的血型是啥

S型
谁出生在风车村？

蒙其·D·路飞、玛琪诺、乔路叔&鸡婶、乌普·斯拉普
出生在可可亚西村的有谁？

娜美、诺琪高、阿健、贝尔梅尔、Dr.纳克、萨姆
我想知道斯摩格的生日

3月14日
特朗普的生日是多少

I don’t know.
sasdasdasd

I can’t understand.

6.2. 知识图谱可视化

在这部分中，我们参考别人的工作[^{20]，利用D3[}21]对之前构建的实体关系知识图谱提供可视化交互功能，包括结点连接关系可视化、查询相关结点信息。同时在这部分也整合了之间构建的人物属性知识图谱，提供了信息框的展示过程，相关的数据和代码存放在 visualization 目录下。整个可视化页面的交互过程如下面的[gif图]

可视化网页存放于 visualization/html/index.html，可以通过 Microsoft Edge 浏览器直接打开

如果需要在其他浏览器中打开，可能会加载不出来可视化结果。这是因为跨域请求在大多数浏览器中是禁止的，请求不到json数据。因此需要用 WAMP/LAMP/MAMP 配置一个Web网络环境。

打开后可视化界面如下所示，不同的颜色代表不同类型的实体，具有关系的实体会用白色的细线连接，可以明显的看到有些实体与其他实体存在大量的连接

点击左上角的模式切换按钮，我们可以把结点展示从圆圈模式变换为文本模式，能够进行更加细致的观察

选中某个结点后，将只会显示该节点以及与其直接相连接的结点。特别的，如果该节点类型是人物，还会在页面右侧显示该人物的信息框

此外左侧还提供了搜索框的功能，可以方便我们查找结点信息

码源下载见文章顶部或者文末

https://download.csdn.net/download/sinat_39620217/87975887

你可能感兴趣的:(项目大全：提升自身的硬实力,知识图谱,搜索引擎,人工智能,深度学习,自然语言处理)

Matlab打开慢、加载慢的解决办法 RickyWasYoung matlab windows 开发语言
安装完毕后直接打开会非常慢，而且打开了之后还得加载很久才能运行解决办法如下：1.找到路径“D:\ProgramFiles\Polyspace\R2020a\licenses”（我是把matlab安装在D盘了，如果是其他盘修改路径即可），该路径记为A2.复制该路径下的lic文件的名称“license_LAPTOP-XXXXXXXX_123456_R2020a.lic”（名称不同，找到这个文件就ok）
2021-08-05 酒泉浩海
2021年8月5日复盘【姓名】曹兴虎【面条名字】谢艳【身份】新馒头【21天目标】陪伴面条成长，完成学习，实现蜕变，拿到结果。提升点评能力。巩固课程内容学习。【结果事实】今天是面条正式打卡的第四天。谢艳老师在早上6点多就完成了打卡作业，将链接发了过来，特别的极致利他。昨天点评中给与的建议，今天大部分都做了调整，特别好。镜头呈现上面再次给与了建议，争取要露出膝盖以上的部分，期待明天的改进。坚持每日分享
2018-07-26 一颗药丸
学习力是指一个人或一个企业、一个组织学习的动力、毅力和能力的综合体现。学习力是把知识资源转化为知识资本的能力。个人的学习力，不仅包含它的知识总量，即个人学习内容的宽广程度和组织与个人的开放程度；也包含它的知识质量，即学习者的综合素质、学习效率和学习品质；还包含它的学习流量，即学习的速度及吸纳和扩充知识的能力；更重要的是看它的知识增量，即学习成果的创新程度以及学习者把知识转化为价值的程度。组织学习力
《进击的智人》凛冽的南北朝Vs明末的地狱小乔非乔
周-秦（嬴政统一）-汉-（公元220年）三国两晋南北朝（三分天下-晋-少数民族纷立政权）-隋再次统一（公元589）公元225年开始一系列气候剧变拉开了帷幕，寒冷伴随着干旱，280-291年持续干旱。同时蝗灾对农业造成重创1）繁殖能力强2）以农作物为主3）食量巨大——天下大饥。气候转冷-北方农田变成草原-农牧交界线南移-少数民族大批进入中原-民族矛盾轰然爆发-特别在道德伦理上的矛盾显著，如匈奴的“收
【清14】如何写好一篇文章？教你五个步骤来搞定！阿树説
作者/阿树来源/阿树说（公众号：sxs20181001）我们要如何写好一篇文章呢？五个步骤就够了，那么哪五个步骤呢？一列提纲，二写初稿，三找素材，四填素材，五修改。第一步，列提纲。首先确定我们要写的主题，把主要观点、次要观点，以列提纲的形式简单写一下，或者思维导图的方式都是可以的，目的是把文章的主体框架先搭建好。第二步，写初稿。根据我们列的提纲，写初稿。写初稿的时候，我们总是觉得自己的文章写得很烂
饱暖思淫欲，饥寒起盗心佛晓星辉
弟弟的生日到了，他是属鼠的，今年的本命年。在为他庆生的同时，不由地想起与他有关的父亲的记忆。弟弟出生在1961年，那时，正是国家三年自然灾害的困难时期。弟弟出生时，爷爷已经有了五个孙女，这第一个孙子一落地，就被爷爷抱到他的热炕头，尽管有爷爷的特殊的疼爱，但家里没粮，妈妈奶水不够总是现实问题。在弟弟出生的第十天上，爸爸骑自行车去离家二十里开外的远房舅舅家借粮食，以解燃眉之急。不巧的是舅舅不在家，一粒
Django框架——模板路径配置、模板变量及过滤器觅远过滤器 python django
目录模板路径配置过滤器过滤器时间格式模板变量及过滤器参见：Django框架——URL路由及模板渲染方式模板路径配置配置模板路径是通过配置文件setting.py中的TEMPLATES来设置。这是一个设置选项的列表，模板大都包含两项通用设置，有两种方式配置模板:第一种:：DIRS定义一个目录列表，模板引擎按列表顺序搜索这些目录以查找模板源文件。将templates放在主项目目录下。第二种：APP_D
Flink cdc同步增量数据timestamp字段相差八小时（分析｜解决）不是粘贴复制的！ BUG FIXER 大数据 flink android 大数据
问题我使用flinkcdc同步mysql到mysql遇到了timestamp字段缺少八小时的问题。很少无语，flink,cdc,debezium时区都设置了，没有任何效果！分析问题出现在mysqlbinlog身上！！！因为默认mysql会使用UTC来存储binlog,你可以使用下方的sql验证：mysqlbinlog--base64-output=DECODE-ROWS-v--start-date
【2024国赛C题】【农作物的种植策略】2024 年全国大学生数学建模比赛思路、代码更新中..... 程序猿鑫数学建模
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️竞赛事件及参赛1找程序网站推荐2公式编辑器、流程图、论文排版324年国赛C题及资源下载4思路、代码分享......⛳️竞赛事件及参赛根据乡村的实际情况，充分利用有限的耕地资源，因地制宜，发展有机种植产业，对乡村经济的可持续发展具有重要的现实意义。选择适宜的农作物，
【Django备忘录】Django数据库的迁移
目录Contents一、确认信息二、生成迁移文件三、迁移数据库定义某个应用的数据模型后，就要执行数据库迁移了，具体步骤如下：一、确认信息先确认你的应用是否在项目名/setting.py的INSTALLED_APPS列表中激活，激活完成后才可使用迁移。没有激活完成会检测不到数据模型修改项，导致迁移后没有数据模型。二、生成迁移文件打开CMD，cd到你的项目的目录（注意是manage.py的同级目录），
淘宝购物如何通过返利APP赚取佣金？进货返利全攻略好项目高省
怎样使用返利app淘宝购物赚佣金？淘宝返利app怎么进货怎么返利作为一个经常网购的宝妈，我深知在淘宝上购物的便利与实惠。但你是否知道，通过使用返利app，你可以在淘宝购物的同时赚取佣金？今天，我就来为你揭秘淘宝返利app的省钱之道！我们在开始讲今天的文章之前，小编想和大家分享我正在使用的副业兼职工具---高省，官方邀请码140326。此码已开通二星级皇冠特权，注册后直接飙升二星级皇冠，佣金更高。高
Java 实习模拟面试之信也科技：IO、多线程、集合、MySQL、Redis、HTTP、Linux 常见面试题解析
在本次模拟面试中，我们将模拟一场面向Java实习生岗位的面试，重点围绕Java基础（IO、多线程、集合）、MySQL、Redis、MQ、HTTP协议以及Linux基础等核心知识点。通过模拟面试官提问和候选人的回答方式，帮助你更好地准备技术面试。一、Java基础（IO、多线程、集合）面试官提问：请谈谈你对JavaIO的理解，以及NIO和BIO的区别？候选人回答：JavaIO是Java提供的一套用于处
字符串排序一粒沙白兔 C语言刷题记录算法 c语言
题目描述编写一个程序，输入三个字符串，程序需对这三个字符串按字典序进行排序，并将排序后的结果依次输出。要求使用函数实现字符串的交换操作。源代码#include#include#include#defineMAX_LEN20//定义常量表示字符串的最大长度//函数声明：用于交换两个字符串voidswap(char*str1,char*str2);intmain(){charstr1[MAX_LEN]
2018-11-14 三年级三班刘云冉
今天早晨我早把冉冉叫起来，让她读试卷，表现的不耐烦，拿着试卷发呆啊！不读看着，你晚上读了一遍还没有读完，看着办吧！我生气的走了，她却读起来了，读完吃饱饭我送她上学，我是为你好，人家的妈妈好从不训孩子，打孩子，那是人家孩子听话你呢？我们都沉默了，我这一天都在反思，我该怎么教育她，怎么和她说，怎么让她理解上学读书做题，这方面我也不愿去发火，去训你但是你就是不听，做了的练习题还是错，每天晚上我都陪着你，
数据中台过时了?为什么现在都在说数据飞轮九.九大数据
数据中台作为一种集中式的数据管理与服务平台，在解决企业数据管理困境中发挥着重要作用，如数据孤岛、数据标准化、数据共享与复用等问题。通过统一的数据采集、处理、存储和服务，数据中台构建了一个全局性的数据枢纽，满足各业务部门的数据需求。对于业务场景相对稳定、数据主要用于历史分析和跨部门协作的大型企业而言，数据中台依然是不可替代的工具。然而，随着市场环境的快速变化和技术的不断进步，数据飞轮的概念逐渐兴起。
记录每天发生的小确幸晓_35f4
[玫瑰]感恩早晨买早餐时偶遇姐姐，激动的抱抱肩膀想跳起。虽然带着口罩，虽然有点湿热，心里的爱和热情依然如火，谢谢相逢，谢谢缘起和经过，我们就是如此最美好的陪伴着。[玫瑰]感恩今天赶个早市买个西瓜，用刀轻轻碰一下听见脆生生的一声清“咔”，再来一刀，“嘭”直接开花。粉白的瓤没有鲜红欲滴的美丽，却别有一番青涩和稚气，放进嘴里，汁水四溢。一股清流进入喉底，那是大地的青气，清爽美丽，沁人心脾。想起闰土和猹，
略说本体论中的公理和规则的区别与联系金井PRATHAMA 知识图谱与NLP 知识图谱人工智能
本体论中的公理和规则是构建知识模型的核心逻辑工具，用于确保概念和关系的严谨性与一致性。以下是具体说明与示例：一、公理（Axioms）定义：公理是本体论中无需证明的基本断言，用于定义概念的本质属性和约束条件。它们构成领域内知识推理的基础框架。示例：属性的排他性公理：某个属性与其否定形式不能同时成立。举例：若定义“人类是哺乳动物”，则“人类是非哺乳动物”必然为假。（哲学领域常用此公理避免逻辑矛盾。）传
略说NLP引入公理模型的可行性金井PRATHAMA 知识图谱与NLP 自然语言处理人工智能知识图谱
在自然语言处理（NLP）的深层语义分析中，公理化体系的引入具有理论可行性，但其实际应用仍面临挑战。以下从公理模型的设计思路、关键技术要点及注意事项三个方面展开分析，结合搜索结果的多个相关技术点进行综合说明：一、公理模型在深层语义分析中的设计思路公理的定义与语义形式化公理模型需以形式化逻辑为基础，定义语义分析中的原始概念（如谓词、实体、关系）和推理规则。例如：原始概念：将语义角色（如施事者、受事者）
AI（day08）类和对象的基本概念及属性和方法的常见分类和使用场景旭日东升的xu. AI（基础补习）python 开发语言
类创建&对象创建**类概念：类是对一类对象的抽象，是对象的模板或蓝图。它定义了对象的属性（特征）和方法（功能）。****对象概念：对象是类的实例化，是类的实际数据存储，具有类所定义的属性和方法。**示例一：#类，抽象小汽车classCar:#创建'Car'类def__init__(self,pinpai,color,price):#初始化属性：类内部的全局变量，在类内部任何实例化对象方法里都可以使
【C语言】基于 DEV C++的简单扫雷游戏九.九 C 语言游戏 c++游戏算法 c语言编辑器开发语言
目录一、代码二、实训报告三、答辩PPT一、代码这学期C语言大作业选题:基于DEVC++的简单扫雷游戏,以下是devc++适配代码。#define_CRT_SECURE_NO_WARNINGS1#include#include#include#defineROWS9#defineCOLS9#defineMINE_COUNT10voidInitBoard(charboard[][COLS],intro
热爱生活，善待自己！喜欢宫崎骏动漫的小丫头
一直觉得人生是自己的，生活是自己过。但是生活在尘世，我们总会面对各种各样的问题，会遇到形形色色的人，这些人或事，总会让我们更清晰的解刨生活，认识自己。所有的经历或多或少的让我们成长，学会思考人生，解析自己，窥探潜意识下的自我，然后做选择。我不知道我还会经历什么事，将会遇到怎样的人，我甚至不知道将来该如何：不稳定的工作，看不见的未知未来。可是每次在仔细回想，认真思考后，我依然选择顺从自己的内心。我设
《目标检测模块实践手册：从原理到落地的尝试与分享》第一期加油吧zkf 目标检测模块解析与实践目标检测目标跟踪人工智能
大家好，欢迎来到《目标检测模块实践手册》系列的第一篇。从今天开始，我想以一种“实践记录者”的身份，和大家聊聊在目标检测任务中那些形形色色的模块。这些内容没有权威结论，更多的是我在实际操作中的一些尝试、发现和踩过的坑。至于这些模块在大家的具体网络应用中是否可行，还需要大家自己去验证，也非常期待能和大家交流不同的经验。目标检测任务的本质与模块的作用目标检测，简单来说，就是从输入的图像中，准确地找出我们
『创业小记』3. 尝试精简的日子稷山云
简单对于创业者来说，在拿到第一笔投资，或第一笔订单之前，花的基本上是自己的钱。精简从节俭开始没有节俭的美德，绝对不是口袋里有花不完钱的缘故。至于为什么过去没有做到，这是一个很难回答的问题，因为从来没有仔细想过。但是，节俭确实是个好习惯，如果我可以做到的话。但节俭并不代表精简。精简代表的是一种生活方式和精神状态。想要自由，就要学会管理自己，包括钱、物品和时间。因为想要自由自在，所以辞去了工作；因为想
2022-05-27 0d4f1fa7bb39
今天是洛阳导师班第三天，听课一天，觉得很充实，还有点累。想想院长，已经连续讲了三天了，院长更累，谢谢院长，院长辛苦啦！今天弄明白了两个逻辑。一个人成长的顶层逻辑：一推二协助三我要学。一个人成长的底层逻辑：一是原生家庭二是不配得三是自我价值的培养。院长的课，值得好好学习，思考，并在运用时举一反三，那么我们的生活就会朝着美好的方向发展。
如何解决Flink CDC同步时间类型字段8小时时间差的问题，以MySQL为例智海观潮 Flink flink flink cdc 大数据实时数据同步
在使用FlinkCDC进行数据同步时，默认情况下经常会遇到时间类型的字段与实际值相差8个小时的问题。本文以MySQL为例提供解决方案，其他数据源也可以参考这类实现。原文链接：https://mp.weixin.qq.com/s/_f41ES8UquM-kj3Ie8JU_g1.设置server时区比如MySQL服务的时区为UTC时间，可以参考以下code设置时区。MySqlSourcemySqlSo
月亮与玫瑰虞渊引落
如若有一天，我拥有一朵玫瑰，那必定是世界上最漂亮的玫瑰，为此我要夸赞它的香味，怡人清甜；如若有一天我拥有一个月亮，那必定是银河里最好看的月亮，为此我要赞美它的月色，柔和温润；可我现在既没有玫瑰花，也没月亮，我知道，世界上不止一朵玫瑰，银河里也不止一个月亮，世间爱憎时难分明，但是却没有独属于我的月亮与玫瑰。
Python 进程间的通信：原理剖析与项目实战女码农的重启 java 进程通信 python
在Python编程中，当涉及多进程编程时，进程间的通信（Inter-ProcessCommunication，简称IPC）是一个重要的课题。多个进程在运行过程中，常常需要交换数据、传递状态或协同工作，这就离不开进程间通信机制。本文将深入讲解Python进程间通信的原理，并结合实际项目案例，展示其在项目中的具体使用方法。一、Python进程间通信原理操作系统为进程提供了多种通信机制，Python在标
拼多多返利软件哪个最好?返利最高? 日常购物小技巧
大家好，我是花桃APP商品推荐官：美美，今天给各位说说拼多多返利软件哪个最好?返利最高?说【拼多多返利】之前给大家推荐一款返利APP，【全网返利最高哦!可以对比一下自己在用的返利软件】都是有内部返利和优惠券的，应用商店搜索下载花桃APP即可查询返利佣金。【官方邀请码：999999】目前的话拼多多返利平台最高的就是【花桃APP】，花桃APP属于温州花桃网络科技有限公司旗下，是国内首家和拼多多官方对接
2019心门开 coco任意门
与人沟通的时候只有心门打开了，能量才能流动起来。孩子是最有灵性的，与孩子的沟通，应建立在情绪的沟通上。站在孩子的立场去体验感受，共情理解和尊重孩子，呵护她的自我感受能力，让她成长为真正的自己。我家娃现在还很小，一岁半，但是我已经感觉到，她作为一个独立的个体，已经拥有了自己独特的思想思维方式。孩子降生到这个世界的时候，在这之前我们是没有跟她商量就把她带到这个世界上来的，所以我们就没有什么理由对她耀武
特岗教师入职培训心得宝鹃我的嗓子怎么成这样了
为了帮助我们新上岗教师更快进入教师的角色，伊川县教育局为我们这些新教师组织入职培训。在今天的培训中，我受益匪浅，段武亭老师和董建举老师以过来人的身份，教授给我们如何规划职业生涯以及如何快速成长成为“名师”的经验。董建举老师特别强调无论新教师还是老教师都要“善于反思自超越”。反思就意味着成长，只有善于反思才能找出不足之处，才能突破，才能进步。著名教育学家叶斓曾说过“一位教师写三年教案，不可能成为名师
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的