逃跑的英雄

知识图谱（2） -- 深入解读demo

一. 流程

1. 安装pymysql，mysql

pip install pymysql

2. 爬取数据

执行 crawler.movie_crawler.py

3. 利用D2RQ生成mapping文件

generate-mapping -u root -o kg_demo_movie_mapping.ttl jdbc:mysql:///kg_demo_movie

这里需要对生成的mapping进行一定的修改，请参考大佬专栏。

4. 利用D2RQ生成nt文件

这里的nt文件就是存放所有RDF数据的文件了。

.\dump-rdf.bat -o kg_demo_movie.nt .\kg_demo_movie_mapping.ttl

5. 建立protege

根据大佬专栏教程建立owl文件，也就是所谓的本体文件，确定数据与数据之间的关系。

6. 书写fuseki_conf.ttl

这里还是根据大佬的专栏进行书写，（没错，很不负责任地说，这是一篇基于大佬专栏的笔记），但是大佬专栏写的ttl文件可能并不能适应于你下载的fuseki版本，所以需要进行两处修改。

1. 将 ja:baseModel<#tdbGraph>; 修改为 ja:MemoryModel<#tdbGraph>
2. 注释掉 ja:content 这一行，等服务开启后，通过http://localhost:3030/登陆页面，手动上传ontology.ttl文件(本体文件，也就是用Protege生成的文件)即可。

7. 上传nt数据

登陆服务器后，选择对应的知识图谱，然后选择上传数据的选项，将之前生成的RDF文件上传到服务器上。

8. 运行python代码

执行 kg_demo_movie/KB_query/query_main.py 进行知识图查询

到这里，比较麻烦的操作就算是完成了，最后剩下的编码细节将会在下一节讲，不过将不再使用本demo，选择使用一个较为简单的demo来做记录。

二. 可能遇到的问题

1. pymysql编码问题

在利用原demo进行流程测试过程中，发现出现编码不匹配问题，大概就是爬取的数据是UTF8格式的，然后数据库存的确实unicode格式。后来找了很多资料，终于解决关于python中pymysql数据编码的问题。

2. 安装mysql的问题。

这里建议直接用pip安装mysql，省心省力。

pip install MySQL-python

3. 使用D2RQ生成默认的mapping文件。

需要在原教程的命令中加入-p 123456 作为链接数据库的密码。

4. 使用D2RQ的时候，需要对生成的mapping文件适当地修改。

这里的话，还是按照大佬的教程走，然后参照大佬的方式进行修改就行，这个步骤有点小繁琐吧，因为数据库如果更新了，相应地就需要对这个文件进行更新，这是一件比较麻烦的事情，后续会看看怎么改善这一步。

5. 使用D2RQ进行查询时，出现中文查询失败的情况，但是中文显示并没有问题，这是一个很奇怪的事情。

不过这并没有关系，因为总会有大佬提出解决方案。（做个小白真是太好了！: )）。

三. 参考资料

1. 知识图谱-给AI装个大脑

你可能感兴趣的:(KB-QA)

QA问答论文笔记伊直程序媛 nlp
《Multi-TaskLearningwithMulti-ViewAttentionforAnswerSelectionandKnowledgeBaseQuestionAnswering》论文笔记背景：在之前的研究工作中，都是将不同的QA任务放在不同框架中解决。在作者这篇论文中，他采用的方法是利用多任务学习同时解决答案选择和KB-QA问题。框架：multi-task:multi-view:发现一篇
揭开知识库问答KB-QA的面纱3·信息抽取篇 Omni-Space 知识图谱 /Knowledge Graph
内容速览你是如何通过知识库回答问题的如何确定候选答案如何对问题进行信息抽取如何筛选候选答案论文实验与总结本期我们将介绍KB-QA传统方法之一的信息抽取（InformationExtraction），我们以一个该方法的经典代表作为例，为大家进一步揭开知识库问答的面纱。该方法来自约翰·霍普金斯大学YaoX,VanDurmeB.的InformationExtractionoverStructuredDa
KBQA基础知识 La_La_Land 转载
学长让我了解一下这方面的知识，所以就写在这里当做笔记吧！(揭开知识库问答KB-QA的面纱1·简介篇-Losin的文章-知乎https://zhuanlan.zhihu.com/p/25735572)资料来源1.知识库，如维基等，但这些百科全书的知识组建形式是非结构化的自然语言2.为了方便计算机的处理和理解，我们需要更加形式化、简洁化的方式去表示知识，那就是三元组（triple）这里我们可以简单的把
语义解析KB-QA的方法框架 demm868
向AI转型的程序员都关注了这个号????????????机器学习AI算法工程公众号：datayx什么是语义解析（SemanticParsing）什么是逻辑形式（LogicForm）语义解析KB-QA的方法框架实验结果知识问答KB-QA以一个经典的语义解析baseline方法为例，介绍语义解析如何进行KB-QA。该方法来自斯坦福BerantJ,ChouA,FrostigR,etal.的Semanti
基于知识图谱的问答系统(上) 自助者天助也 NLP
基于知识图谱的问答系统(上)本项目是基于知识图谱的问答系统，BERT+BILSTM+CRF做命名实体识别和句子相似度比较，最后实现线上的部署。项目的分以下步骤进行描述：1-问答QA系统简单介绍-1.1-问答系统目标-1.2-问答系统分类-1.3-问答系统框架2-知识库问答KB-QA介绍1-问答QA系统简单介绍-1.1-问答系统目标总目标：给定一个自然语言的问题，能够得到简短、精确的答案。或是⼀个能
基于知识图谱的问答系统(二): 语义解析黑暗贤者问答系统语义解析
语义解析KB-QA的思路是通过对自然语言进行语义上的分析，转化成为一种能够让知识库“看懂”的语义表示，进而通过知识库中的知识，进行推理（Inference）查询（Query），得出最终的答案。简而言之，语义解析要做的事情，就是将自然语言的问题，转化为一种能够让知识库“看懂”的语义表示，这种语义表示即逻辑形式（LogicForm）。逻辑形式的具体内容参考:BerantJ,ChouA,FrostigR
揭开知识库问答KB-QA的面纱7·深度学习下篇（一） zjrn NLP 知识图谱
内容速览什么是记忆网络基于记忆网络的KB-QA在上两期，我们分别介绍了使用深度学习的卷积神经网络对向量建模和语义解析方法进行提升的两篇经典论文。今天我们将为大家带来两篇使用深度学习其他两种经典模型进行KB-QA的文章，分别是记忆网络（MemoryNetwork）和带注意力机制的循环神经网络（RecurrentNeuralNetworkswithAttentionMechanism）。它们都是深度学
基于BERT模型的知识库问答(KBQA)系统 Chen_Meng_ NLP BERT KB-QA QA 问答系统
一、知识库KB-QA的介绍参考链接：https://zhuanlan.zhihu.com/p/257355721、什么是知识库“奥巴马出生在火奴鲁鲁。”“姚明是中国人。”“谢霆锋的爸爸是谢贤。”这些就是一条条知识，而把大量的知识汇聚起来就成为了知识库。我们可以在wiki百科，百度百科等百科全书查阅到大量的知识。然而，这些百科全书的知识组建形式是非结构化的自然语言，这样的组织方式很适合人们阅读但并不
【论文笔记】An End-to-End Model for QA over KBs with Cross-Attention Combining Global Knowledge Lawe 论文笔记 Question Answering
一、概要该文章发于ACL2017，在Knowledgebase-basedquestionanswering(KB-QA)上，作者针对于前人工作中存在没有充分考虑候选答案的相关信息来训练questionrepresentation的问题，提出了一个使用Cross-Attention机制的神经网络模型来针对于候选答案的不同方面信息来训练模型；并且训练知识库的全局信息学习，在一定程度上减轻的the
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他