RDF图及SPARQL初步感受

前景提要

FOAF

FOAF,即Friend-of-a-Friend,简称FOAF。FOAF 是一种 XML/RDF 词汇表,它以计算机可读的形式描述您通常可能放在主 Web 页面上的个人信息之类的信息。
FOAF 词汇表提供了一种管理社区内信息的有用方法。关于其他人的信息常常是最令人感兴趣的一类数据,而且 FOAF 实现了分散、机器可读和个人描述等需求。但在其自己的应用领域之外,FOAF 提供了用于研究有关构建语义 Web 的概念(链接、信任和起源的概念)的有用试验台。

RDF图

RDF图:RDF图是由三元组(subject, predicate, object)组成的有向图,subject通过predicate指向object,如图1-1所示为一个RDF图。通常用三元组的数量表示RDF图的大小。

RDF图及SPARQL初步感受_第1张图片

SPARQL

SPARQL是一组W3C推荐标准,提供了对Web上或RDF存储(RDF Store)中的RDF图内容进行查询和处理的语言和协议。代表 Web 未来的语义 Web 是一个以知识为中心的模型,除了人类可读的文档和 XML 消息格式之外,它还增加了机器可以理解和处理的数据。SPARQL Protocol and RDF Query Language (SPARQL) 对于语义 Web 就像 SQL 对于关系数据库一样重要。它允许应用程序对分布式 RDF 数据库进行复杂的查询,并得到了互相竞争的多种框架的支持。本教程通过一家虚拟公司的团队跟踪和日志系统演示了它的用法。


目录

1.班级同学的foaf文件数据规范
2.fuseki 的使用
3.saprql 的语法
4.FOAF文件可视化人物网络


正文

跟着老师在学信息情报相关的语义网的知识。老师本着“talk is useless , show me the code”的教育培养方针,带我们了解了语义网以及相关的rdf图数据库的存储。
所以,现在的任务是将同学们的FOAF文件导入到RDF TripleStore里面去,再使用SPARQL语法对图数据库进行简单的查询,并且补充相关数据,建立数据关联。

1.班级同学的foaf文件数据规范

在此处列出一个模板的FOAF文件

xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:foaf="http://xmlns.com/foaf/0.1/"
xmlns:admin="http://webns.net/mvcb/">

    
        
        
        
        
    

    
        涌全 杨
        Mr
        涌全
        
        大大菠菜
        1d2de67cfbf6ad11c7e1271579c52bcec85fbb70
        
        
        
        

        
            
                范玮
                f22657f594637e5958ab0c25cd78e5ff52a7218d
                
            
        

        
            
                许琰
                07612716117848bc9741029bd3488f9c1b86f733
            
        

        
            
                李霜
                5b46827f75c079c116f12b831d703b0830c47d0a
            
        
    

在班级同学的FOAF文件整理过程中,发现了有如下三个问题:

文件格式不正确。

错误代码为:Result: failed with message "Parse error: [line: 18, col: 12] Invalid byte 1 of 1-byte UTF-8 sequence."
解决方法:只需要把文件格式改为utf-8即可成功导入

标签的闭合不正确

错误代码为:Result: failed with message "Parse error: [line: 27, col: 14] {E202} Expecting XML start or end element(s). String data "??" not allowed. Maybe there should be an rdf:parseType='Literal' for embedding mixed XML content in RDF. Maybe a striping error."
建议使用代码格式化工具修改,也可以使用代码编辑器手动修改

&字符无法在xml中正确解析

错误代码为:Result: failed with message “Parse error: [line: 30, col: 92] The reference to entity ”ADSESSION“ must end with the ‘;’ delimiter.”
解决方法:把&修改为'&';

2.fuseki 的使用

fuseki简介
Fuseki is a SPARQL server. It provides REST-style SPARQL HTTP Update, SPARQL Query, and SPARQL Update using the SPARQL protocol over HTTP.
fuseki下载
http://jena.apache.org/download/index.cgi
fuseki使用
在window平台商下载安装包之后运行里面的bat文件,随后访问localhost:3030即可

RDF图及SPARQL初步感受_第2张图片

随后在web端新建一个dataset,并且将dataset里面把之前的FOAF文件upload进去

RDF图及SPARQL初步感受_第3张图片
RDF图及SPARQL初步感受_第4张图片

我们可以看到,我们的文件已经上传到fuseki的图数据库里面去了

3.saprql 的语法

关于SPARQL的语法网上都很多相关的文档,在这列出:
https://www.w3.org/TR/2013/REC-sparql11-query-20130321/#WritingSimpleQueries
https://www.ibm.com/developerworks/cn/web/wa-data-integration-at-scale_sparql/index.html

关于我们自己上传的同学FOAF文件,我使用SPARQL进行了简单的查询:

1.查询所有同学的名字
PREFIX rdf:   
PREFIX rdfs:   
PREFIX foaf:   
PREFIX admin:   
SELECT ?family_name ?givenname  
WHERE {  
   ?Perssssson foaf:family_name ?family_name;  
     foaf:givenname ?givenname.  
} 

得到结果:

RDF图及SPARQL初步感受_第5张图片
2.查询杨涌全的所有节点信息
    PREFIX rdf:   
    PREFIX rdfs:   
    PREFIX foaf:   
    PREFIX admin:   
    SELECT  ?name ?p ?o 
    WHERE {  
        ?a foaf:name  ?name;
        ?p ?o.
        values ?name {'涌全 杨'}.
    } 

得到结果:

RDF图及SPARQL初步感受_第6张图片
3.查询所有的朋友关系
    PREFIX rdf:   
        PREFIX rdfs:   
        PREFIX foaf:   
        PREFIX admin:   
        SELECT ?name ?kname
        WHERE {  
      ?a foaf:name ?name.      
      ?a foaf:knows ?x.
      ?x foaf:name ?kname.
        } 

得到结果:

RDF图及SPARQL初步感受_第7张图片

4.FOAF文件可视化人物网络

根据3.3的查询所有朋友关系的数据,再套用一个前端的插件,即可实现班级的可视化人物网络;
(待更新。。。)

你可能感兴趣的:(RDF图及SPARQL初步感受)