鱼吐泡泡水

知识工程课程实践

基于模板匹配的知识库问答系统

1. 整体任务说明
2. 数据准备
3.知识库导入Apache Jena Fuseki
4.设计问答系统
5.结语

1. 整体任务说明

主题：基于天津大学基本信息构建知识库，并实现基于模板匹配的知识库问答系统
目的：实践内容包括知识获取、知识表示、知识存储、知识管理、知识问答以及推理。通过实现一个知识库问答系统，将本课程所学的理论知识以及实践操作结合，并融会贯通到实际应用中。
所需软件以及编程环境：python3、Apache Jena Fuseki

2. 数据准备

本文选用的数据包括智算学部所有硕士生导师的信息、所有专业的信息、天津大学所有院系的信息、天津大学所有职能部门的信息，本文主要以智算学部所有导师的信息为例。
从数据所在的网址中获取请求URL和请求方式，在Chrome浏览器中打开网页，在网页中右击，选择“检查”，在Network中的Doc下面可以找到，如图所示：

然后在pycharm中来编写抓取数据的代码。
第一步：获取要爬虫的网页

url = 'http://cic.tju.edu.cn/jyjx/yjsjy/yjsdsml.htm'
strhtml = requests.get(url)
strhtml.encoding = 'utf-8'

第二步：从Elements中找到要爬取的内容所在的位置

找到网页中对应的块，然后提取出块中的信息。
以智算学部所有导师的信息为例，需要从教师名字超链接中进入教师的个人网页，然后爬取数据。在这里我先爬取教师的个人网页，然后保存在list中，再逐个读取并进入读取到的网址，获取每位教师的信息。

def get_teacher_id(url):
    strhtml = requests.get(url)
    strhtml.encoding = 'utf-8'
    soup = BeautifulSoup(strhtml.text, 'html.parser')
    #print(strhtml.text)
    data = soup.select('#vsb_content > table > tbody > tr > td > a')
    results = []
    for item in data:
        results.append(item.get('href'))
    #print(results)
    #print(len(results))
    list2 = []
    for i in results:
        if i not in list2:
            list2.append(i)
    #print(list2)
    #print(len(list2))
    return list2

第三步：因为并不是所有教师主页中都包含相同格式的内容，而且在后续将数据转为RDF时，需要按照标签来进行转换。因此我们设定每位老师需要爬取的信息，提取具有相同内容的教师的信息，若某位教师主页内容与我们设定的不同，我们则跳过这位老师。最后将所有爬取到的教师的信息以json格式保存到json文档中。

#从教师的个人主页中爬取数据，并以json格式保存到json文档中
for teacher_url in teacher_url:
    print(teacher_url)
    teacher_info_html = requests.get(teacher_url)
    teacher_info_html.encoding = 'utf-8'
    teacher_info_html = teacher_info_html.text
    #print(teacher_info_html)

    if getinfo(teacher_url, teacher_info_html) == 0:
        continue	# 信息不同，跳过，继续下一位老师
    else:
        final.append(getinfo(teacher_url, teacher_info_html))

with open(os.path.join('E:/kg', 'teacher.json'), 'w', encoding='utf-8') as opt_file:
    json.dump(final, opt_file, ensure_ascii=False)  # 将opt数据写入json文件

部分结果如图所示：

完整代码如下：

# -*- coding: utf-8 -*-
import re
import requests
from bs4 import BeautifulSoup
import json
import os

def get_teacher_id(url):
    strhtml = requests.get(url)
    strhtml.encoding = 'utf-8'
    soup = BeautifulSoup(strhtml.text, 'html.parser')
    #print(strhtml.text)
    data = soup.select('#vsb_content > table > tbody > tr > td > a')
    results = []
    for item in data:
        results.append(item.get('href'))
    #print(results)
    #print(len(results))
    list2 = []
    for i in results:
        if i not in list2:
            list2.append(i)
    #print(list2)
    #print(len(list2))
    return list2

def getinfo(teacher_id, teacher_info_html):
    """
    :param teacher_id:
    :param teacher_info_html:
    """
    teacher_soup = BeautifulSoup(teacher_info_html, 'html.parser')
    #print(teacher_info_html)
    info = []
    for p in teacher_soup.select('.v_news_content p')[1:2]:
        print(p)
        info.append(p.text.strip())
    print(len(info))
    print(info)
    if info == [''] or len(info)==0 :
        print("no infomation")
        return 0
    all_info = "".join(info[0].split())
    print(all_info)#str类型

    name_list = all_info.split("姓名：")
    if len(name_list) == 1:
        print("no infomation")
        return 0
    name = name_list[1].split("职称：")[0]
    print(name)

    title_list = name_list[1].split("职称：")  # 职称
    if len(title_list) == 1:
        print("no infomation")
        return 0
    title = title_list[1].split("所在系别：")[0]
    print(title)

    faculty_list = title_list[1].split("所在系别：")  # 所在系别
    if len(faculty_list) == 1:
        print("no infomation")
        return 0
    faculty = faculty_list[1].split("主讲课程：")[0]
    print(faculty)

    course_list = faculty_list[1].split("主讲课程：")  # 主讲课程
    if len(course_list) == 1:
        print("no infomation")
        return 0
    course = course_list[1].split("导师类型：")[0]
    course = re.split('[、，/。]',course)
    print(course)
    print(len(course))

    type_list = course_list[1].split("导师类型：")   # 导师类型
    if len(type_list) == 1:
        print("no infomation")
        return 0
    type = type_list[1].split("电子邮件：")[0]
    type = re.split("[、，/。]",type)
    print(type)
    print(len(type))

    email_list = type_list[1].split("电子邮件：")  # 电子邮件
    if len(email_list) == 1:
        print("no infomation")
        return 0
    email = email_list[1].split("研究领域：")[0]
    print(email)

    field_list = email_list[1].split("研究领域：")  # 研究领域
    if len(field_list) == 1:
        print("no infomation")
        return 0
    field = field_list[1].split("研究方向：")[0]
    print(field)

    direction_list = field_list[1].split("研究方向：") # 研究方向
    if len(direction_list) == 1:
        print("no infomation")
        return 0
    direction = direction_list[1].split("个人主页：")[0]
    print(direction)

    if len(direction_list[1].split("个人主页：")) == 1:
        print("no infomation")
        return 0
    homepage = direction_list[1].split("个人主页：")[1]  # 个人主页
    print(homepage)

    teacher_info_json = {
            'id': teacher_id,
            'name': name,
            'title': title,
            'faculty':faculty,
            'course': course,
            'type':type,
            'email': email,
            'field': field,
            'direction': direction,
            'homepage': homepage,
        }
    print(course,type,teacher_info_json)
    return teacher_info_json

if __name__ == '__main__':
    try:
        final = []
        url = 'http://cic.tju.edu.cn/jyjx/yjsjy/yjsdsml.htm'
        teacher_url = get_teacher_id(url)
        teacher_url.remove('../../info/1067/1147.htm')
        print(teacher_url)
        print(len(teacher_url))
        for teacher_url in teacher_url:
            print(teacher_url)
            teacher_info_html = requests.get(teacher_url)
            teacher_info_html.encoding = 'utf-8'
            teacher_info_html = teacher_info_html.text
            #print(teacher_info_html)

            if getinfo(teacher_url, teacher_info_html) == 0:
                continue
            else:
                final.append(getinfo(teacher_url, teacher_info_html))

        with open(os.path.join('E:kg', 'teacher.json'), 'w', encoding='utf-8') as opt_file:
            json.dump(final, opt_file, ensure_ascii=False)  # 将opt数据写入json文件
    except requests.exceptions.ConnectionError:
        print('Handle Exception')

然后将数据转为RDF数据，供后面进行SPARQL语句查询。

第一步：定义三元组的格式，如代码所示，其中‘%05d’会被教师的顺序所代替，“%s”会被原始数据代替

teacher_id = "  \"%s\" ."
name = "  \"%s\" ."
title = "  \"%s\" ."
faculty = "  \"%s\" ."
course = "  \"%s\" ."
type = "  \"%s\" ."
email = "  \"%s\" ."
field = "  \"%s\" ."
direction = "  \"%s\" ."
homepage = "  \"%s\" ."

第二步：逐行读取数据，然后按照定义好的三元组，将数据存为实体关系三元组。以教师——主讲课程和教师——类型三元组为例，每名教师可能教授几门课程，每门课程都要和对应的教师建立实体关系三元组，每名教师可能有多种类型，每种类型都要和对应的教师建立实体关系三元组

 for course_1 in load_dict[i]['course']:
     #print(course_1)
     course_str = course % (i+1, course_1)
     print(course_str)
     triples.append(course_str)
     triples_sum += 1

 for type_1 in load_dict[i]['type']:
     #print(type_1)
     type_str= type % (i+1, type_1)
     print(type_str)
     triples.append(type_str)
     triples_sum += 1

第三步：在后续操作中，需要对问题文本进行分词、词性标注，为了避免教师姓名分词出现错误，要提前制作教师姓名词性字典，代码如下所示


file_3 = open('E:/kg/triple/teachers_name.txt', 'w', encoding='UTF-8')

完整代码如下：

#!/usr/bin/env python
#encoding=utf-8

import random
import sys
import os
import json

teacher_id = "  \"%s\" ."
name = "  \"%s\" ."
title = "  \"%s\" ."
faculty = "  \"%s\" ."
course = "  \"%s\" ."
type = "  \"%s\" ."
email = "  \"%s\" ."
field = "  \"%s\" ."
direction = "  \"%s\" ."
homepage = "  \"%s\" ."

with open(os.path.join('E:/kg/triple', 'teacher.json'),'r',encoding='utf-8') as load_f:
    load_dict = json.load(load_f)
    print(load_dict)
    print(len(load_dict))

file_3 = open('E:/kg/triple/teachers_name.txt', 'w', encoding='UTF-8')

triples_sum  = 0
triples = []

for i in range(0, len(load_dict)) :
    print(i)
    id_str = teacher_id % (i+1, load_dict[i]['id'])
    triples.append(id_str)
    triples_sum += 1

    name_str = name % (i+1, load_dict[i]['name'])
    triples.append(name_str)
    triples_sum += 1
    file_3.write(load_dict[i]['name'] + ' ' + 'nr' + '\n')

    title_str = title % (i+1, load_dict[i]['title'])
    triples.append(title_str)
    triples_sum += 1

    faculty_str = faculty % (i+1, load_dict[i]['faculty'])
    triples.append(faculty_str)
    triples_sum += 1

    print(load_dict[i]['course'],len(load_dict[i]['course']))
    #print()
    for course_1 in load_dict[i]['course']:
        #print(course_1)
        course_str = course % (i+1, course_1)
        print(course_str)
        triples.append(course_str)
        triples_sum += 1

    for type_1 in load_dict[i]['type']:
        #print(type_1)
        type_str= type % (i+1, type_1)
        print(type_str)
        triples.append(type_str)
        triples_sum += 1

    email_str =  email % (i+1, load_dict[i]['email'])
    triples.append(email_str)
    triples_sum += 1

    field_str = field % (i+1, load_dict[i]['field'])
    triples.append(field_str)
    triples_sum += 1

    direction_str = direction % (i+1, load_dict[i]['direction'])
    triples.append(direction_str)
    triples_sum += 1

    homepage_str = homepage % (i+1, load_dict[i]['homepage'])
    triples.append(homepage_str)
    triples_sum += 1

filename = ("'E:/kg/triple/teacher_%d_triples.nt") % (triples_sum)
with open(filename,"w+",encoding='utf-8') as fd:
    fd.write("\n".join(triples))

部分结果如下：

3.知识库导入Apache Jena Fuseki

首先从官网下载Jena Fuseki，解压到指定位置安装。

然后启动cmd，进入Jena Fuseki所在的位置。然后启动Jena Fuseki，并创建数据库名称，命令如下图所示：

然后从浏览器中输入localhost:3030，进入Jena Fuseki。从dataset中选择刚刚建立的数据库testds，并将创建的RDF数据上传到数据库中。上传成功后，如下图所示

接下来就是设计问答系统

4.设计问答系统

第一步：要通过SPARQLWrapper包来连接数据库

sparql_base = SPARQLWrapper("http://localhost:3030/testds")

第二步：设计SPARQL查询语句的模板

# SPARQL模板
SPARQL_PREAMBLE = u"""
PREFIX school: 
"""

SPARQL_TEM = u"{preamble}\n" + \
             u"SELECT DISTINCT {select} WHERE {{\n" + \
             u"{expression}\n" + \
             u"}}\n"

SPARQL_TEM_count = u"{preamble}\n" + \
                    u"SELECT (COUNT({select}) AS {count}) WHERE {{\n" + \
                    u"{expression}\n" + \
                    u"}}\n"

SPARQL_ASK_TEM = u"{preamble}\n" + \
                u"ASK WHERE{{\n" + \
                u"{expression}\n" + \
                u"}}\n"

第三步：设计正则匹配
首先要对问句列表中的问句进行分词处理，为了避免教师姓名、学院、专业、职能部门名称分词有误，因此导入外部字典，代码如下所示：

# 引入外部字典
jieba.load_userdict("all_name.txt")

分词代码如下所示：

default_questions = [
    "天津大学有哪些学院？",
    "化工学院的简介是什么？",
    "化工学院电话？",
    "化工学院的网址是什么？",
    "天津大学有哪些职能部门？",
    "研究生院的介绍是什么？",
    "研究生院的电话是什么？",
    "研究生院的网址是什么？",
    "智算学部有哪些专业？",
    "教授类型有多少老师?",
    "老师类型有哪些?",
    "硕士生导师类型有哪些老师?",
    "硕士生导师类型有多少老师?",
    "动画专业的专业培养是什么？",
    "计算机专业的考研就业情况？",
    "王晓飞老师主讲了哪些课?",
    "王晓飞老师主讲了几门课?",
    "王晓飞老师的研究方向是什么?",
    "王晓飞老师是博士生导师吗?",
    "王晓飞老师的个人主页是什么?"
]
questions = default_questions[0:]
seg_lists = []
# tokenizing questions
for question in questions:
    words = pseg.cut(question)                             #分词 词性标注
    seg_list = [Word(word.encode("utf-8"), flag) for word, flag in words]           #分词后用Word类初始化，把words看成objects
    seg_lists.append(seg_list)

然后设置关键词，使正则匹配时可以根据关键词匹配到正确的问题

# 正则匹配关键词设置
tutor_type_master = (W("硕士生导师") | W("硕导")| W("硕士导师")| W("硕士生"))
tutor_type_PhD = (W("博士生导师") | W("博导")| W("博士导师")| W("博士生"))
teacher = (W(pos = "nr") | W(pos = "x"))
whose = (W("谁") | W("哪些"))
quantity = (W("多少") | W("几") | W("几门"))

institution = (W("学院")|W("职能部门"))
college = (W(pos="nr"))
attribute = (W("简介")|W("电话")|W("网址")|W("介绍"))

teacher_title=(W("老师"))
class_1=(W('类型'))
teacher_title_name=(W("教授"))
college_1=(W("智算学部"))
major=(W('计算机专业')|W('动画专业')|W('软件工程专业'))
development=(W('培养'))
work=(W('考研')|W('就业'))

direction = (W("方向") | W("研究方向"))
page = (W("个人主页") | W("主页"))

接下来编写正则匹配规则。以第一个Rule为例，condition表示当遇见关键词institution和whose时，就采用how_many_institution_question这个查询函数

# 正则匹配规则编写
rules = [
    #天津有哪些机构（学院或职能部门）？
    Rule(condition = Star(Any(), greedy=False) + whose + institution, action=how_many_institution_question),
    #某学院的电话？
    Rule(condition= college + Star(Any(), greedy=False) + attribute, action=what_attribute_institution_question),
    #某导师类型有哪些老师?
    Rule(condition = tutor_type_master + Star(Any(), greedy = False) + whose, action = who_is_master_tutor_question),
    #某导师类型有多少老师?
    Rule(condition = tutor_type_master + Star(Any(), greedy = False) + quantity, action = how_many_teachers_are_master_tutor_question),
    #老师类型有哪些？
    Rule(condition = teacher_title + Star(Any(), greedy = False)+ class_1,action=teacher_title_question),
    #教授类型有多少老师？
    Rule(condition = teacher_title_name + Star(Any(), greedy=False)+quantity,action=how_many_professor_question),
    #智算学部有哪些专业？
    Rule(condition = college_1 + Star(Any(), greedy = False)+ whose,action=which_majors_in_cal_question),
    #某专业的专业培养是什么？
    Rule(condition = major + Star(Any(), greedy = False)+ development,action=what_development_question),
    #某专业的考研就业情况？
    Rule(condition = major + Star(Any(), greedy = False)+ work,action=how_work_question),
    # 某老师主讲了哪些课?
    Rule(condition=teacher + Star(Any(), greedy=False) + whose, action=what_courses_teacher_question),
    # 某老师主讲了几门课?
    Rule(condition=teacher + Star(Any(), greedy=False) + quantity, action=how_many_courses_teacher_question),
    # 某老师的研究方向是什么?
    Rule(condition=teacher + Star(Any(), greedy=False) + direction, action=what_direction_teacher_question),
    # 某老师是博士生导师吗?
    Rule(condition=teacher + Star(Any(), greedy=False) + tutor_type_PhD, action=teacher_is_PhD_tutor_question),
    # 某老师的个人主页是什么?
    Rule(condition=teacher + Star(Any(), greedy=False) + page, action=what_homepage_teacher_question)
]

编写查询函数，部分查询函数如下所示：

# 某老师的研究方向是什么?
def what_direction_teacher_question(x):
    select = u"?x0"
    sparql = None
    for w in x:
        if w.pos == "nr":
            e=u"?teacherid school:teacher_name \"{person}\". " \
              u"?teacherid school:teacher_direction ?x0.".format(person=w.token.decode("utf-8"))
            sparql = SPARQL_TEM.format(preamble=SPARQL_PREAMBLE, select=select, expression=INDENT + e)
            break
    return sparql

# 某老师是博士生导师吗?
def teacher_is_PhD_tutor_question(x):
    sparql = None
    for w in x:
        if w.pos == "nr":
            e=u"?teacherid school:teacher_name \"{person}\". " \
              u"?teacherid school:teacher_type \"博导\".".format(person=w.token.decode("utf-8"))
            sparql = SPARQL_ASK_TEM.format(preamble=SPARQL_PREAMBLE, expression=INDENT + e)
            break
    return sparql

# 某老师的个人主页是什么?
def what_homepage_teacher_question(x):
    select = u"?x0"
    sparql = None
    for w in x:
        if w.pos == "nr":
            e=u"?teacherid school:teacher_name \"{person}\". " \
              u"?teacherid school:teacher_homepage ?x0.".format(person=w.token.decode("utf-8"))
            sparql = SPARQL_TEM.format(preamble=SPARQL_PREAMBLE, select=select, expression=INDENT + e)
            break
    return sparql

完整代码如下：

# coding: utf-8
# standard import
import re
from refo import finditer, Predicate, Star, Any
import jieba.posseg as pseg
from jieba import suggest_freq
import jieba
from SPARQLWrapper import SPARQLWrapper, JSON
import io

import importlib,sys
importlib.reload(sys)

# 引入外部字典
jieba.load_userdict("all_name.txt")
sparql_base = SPARQLWrapper("http://localhost:3030/testds")

# SPARQL config
# SPARQL模板
SPARQL_PREAMBLE = u"""
PREFIX school: 
"""

SPARQL_TEM = u"{preamble}\n" + \
             u"SELECT DISTINCT {select} WHERE {{\n" + \
             u"{expression}\n" + \
             u"}}\n"

SPARQL_TEM_count = u"{preamble}\n" + \
                    u"SELECT (COUNT({select}) AS {count}) WHERE {{\n" + \
                    u"{expression}\n" + \
                    u"}}\n"

SPARQL_ASK_TEM = u"{preamble}\n" + \
                u"ASK WHERE{{\n" + \
                u"{expression}\n" + \
                u"}}\n"

INDENT = "    "

class Word(object):
    """treated words as objects"""
    def __init__(self, token, pos):
        self.token = token
        self.pos = pos


class W(Predicate):
    """object-oriented regex for words"""
    def __init__(self, token=".*", pos=".*"):
        self.token = re.compile(token + "$")
        self.pos = re.compile(pos + "$")
        super(W, self).__init__(self.match)

    def match(self, word):
        m1 = self.token.match(word.token.decode('utf-8')) #.decode('utf-8')
        m2 = self.pos.match(word.pos)
        return m1 and m2


class Rule(object):
    def __init__(self, condition=None, action=None):
        assert condition and action
        self.condition = condition
        self.action = action

    def apply(self, sentence):
        matches = []                                    #  #finditer是要返回sentence中所有与self.condition相匹配的全部字串，返回形式为迭代器。 m为其中某个
        for m in finditer(self.condition, sentence):      
            i, j = m.span()                                          #以tuple的形式返回范围，m在sentence中的范围
            matches.extend(sentence[i:j])#将关键词依次放进matches中
        if __name__ == '__main__':
            print("----------applying %s----------" % self.action.__name__)
        return self.action(matches)#将关键词列表给action代表的函数

#   有哪些机构？
def how_many_institution_question(x):
    select ="?x0"
    sparql = None;
    for w in x:
        if w.token.decode("utf-8")=="学院" or w.token.decode("utf-8")=="职能部门":
            if w.token.decode("utf-8")=="学院":
                s = "college"
            if w.token.decode("utf-8")=="职能部门":
                s = "office"
            e="?id school:{institution}_name ?x0".format(institution=s)
            sparql=SPARQL_TEM.format(preamble=SPARQL_PREAMBLE, select=select,expression=INDENT + e)
            break
    return sparql

#   某机构的属性是什么？
def what_attribute_institution_question(x):
    s1=s2=s3="null"
    select = "?x0"
    sparql = None
    for w in x:
        if w.token.decode("utf-8")=="机械工程学院" or w.token.decode("utf-8")=="精密仪器与光电子工程学院" or w.token.decode("utf-8")=="电气自动化与信息工程学院" or w.token.decode("utf-8")=="微电子学院" or w.token.decode("utf-8")=="建筑工程学院" or w.token.decode("utf-8")=="建筑学院" or w.token.decode("utf-8")=="化工学院" or w.token.decode("utf-8")=="环境科学与工程学院" or w.token.decode("utf-8")=="管理与经济学部" or w.token.decode("utf-8")=="马克思主义学院" or w.token.decode("utf-8")=="理学院" or w.token.decode("utf-8")=="生命科学学院" or w.token.decode("utf-8")=="医学部" or w.token.decode("utf-8")=="教育学院" or w.token.decode("utf-8")=="国际教育学院":
            s1 = w.token.decode("utf-8")
            s3 = "college"
        if w.token.decode("utf-8")=="纪委、监察室" or w.token.decode("utf-8")=="研究生院" or w.token.decode("utf-8")=="党委离退休工作处" or w.token.decode("utf-8")=="发展战略研究中心" or w.token.decode("utf-8")=="党委教师工作部、人事处" or w.token.decode("utf-8")=="科学技术发展研究院（医科建设办公室）" or w.token.decode("utf-8")=="国际合作与交流处、港澳台事务办公室" or w.token.decode("utf-8")=="审计处" or w.token.decode("utf-8")=="保卫处":
            s1 = w.token.decode("utf-8")
            s3 = "office"
        if w.token.decode("utf-8")=="简介" or w.token.decode("utf-8")=="介绍":
            s2 = "introduction"
        if w.token.decode("utf-8")=="电话":
            s2 = "phone"
        if w.token.decode("utf-8") == "网址":
            s2 = "network"
        if s1!="null" and s2!="null":
            e = "?id school:{institution}_name \"{name}\".?id school:{institution}_{attribute} ?x0.".format(institution=s3,attribute=s2,name=s1)
            sparql = SPARQL_TEM.format(preamble=SPARQL_PREAMBLE, select=select,expression=INDENT + e)
            break
    return sparql

#某专业的专业培养是什么？#正确
def what_development_question(x):
    select = "?x0"
    sparql = None
    for w in x:
        if w.token.decode("utf-8") == "动画专业" or w.token.decode("utf-8") == "计算机专业" or w.token.decode("utf-8") == "软件工程专业" :
            e = "?projectid school:project_name \"{type}\". ?projectid school:project_cultivation ?x0.".format(type = w.token.decode("utf-8"))     
            sparql = SPARQL_TEM.format(preamble = SPARQL_PREAMBLE, select = select, expression = INDENT + e)
            break
    return sparql

#某专业的考研就业情况？ #正确
def how_work_question(x):
    select = "?x0"
    sparql = None
    for w in x:
        if w.token.decode("utf-8") == "计算机专业" or w.token.decode("utf-8") == "动画专业" or w.token.decode("utf-8") == "软件工程专业" :
            e = "?projectid school:project_name \"{type}\". ?projectid school:project_work ?x0.".format(type = w.token.decode("utf-8"))     
            sparql = SPARQL_TEM.format(preamble = SPARQL_PREAMBLE, select = select, expression = INDENT + e)
            break
    return sparql

#智算学部有哪些专业？ #正确
def which_majors_in_cal_question(x):
    select = "?x0"
    sparql = None
    for w in x:
        if w.token.decode("utf-8") == "智算学部" or w.token.decode("utf-8")== "哪些":
            e = "?projectid school:project_name ?x0"
            sparql = SPARQL_TEM.format(preamble = SPARQL_PREAMBLE, select = select, expression = INDENT + e)
            break
    return sparql

#老师类型有哪些？   #正确
def teacher_title_question(x):
    select = "?x0"
    sparql = None
    for w in x:
        if w.token.decode("utf-8") == "老师"or w.token.decode("utf-8") == "类型":
            e = "?teacherid school:teacher_title ?x0."       
            sparql = SPARQL_TEM.format(preamble = SPARQL_PREAMBLE,select = select, expression = INDENT + e)
            break
    return sparql

#教授类型有多少老师？   #正确
def how_many_professor_question(x):
    select = "?teacher"
    count= "?x0"
    sparql = None
    for w in x:
        if w.token.decode("utf-8") == "教授"or w.token.decode("utf-8") == "多少":
            e = "?teacherid school:teacher_title \"教授\". ?teacherid school:teacher_name ?teacher."      
            sparql = SPARQL_TEM_count.format(preamble = SPARQL_PREAMBLE,select = select,count = count, expression = INDENT + e)
            break
    return sparql

#某导师类型有哪些老师?  #正确
def who_is_master_tutor_question(x):
    select = "?x0"
    sparql = None
    for w in x:
        if w.token.decode("utf-8") == "硕士生" or w.token.decode("utf-8")== "哪些":
            e = "?x school:teacher_type \"{type}导师\". ?x school:teacher_name ?x0.".format(type = w.token.decode("utf-8"))     
            sparql = SPARQL_TEM.format(preamble = SPARQL_PREAMBLE, select = select, expression = INDENT + e)
            break
    return sparql

#某导师类型有多少老师?  #正确
def how_many_teachers_are_master_tutor_question(x):
    select = "?teachers"
    count = "?x0"
    sparql = None
    for w in x:
        if w.token.decode("utf-8") == "硕士生" or w.token.decode("utf-8") == "多少":
            e = "?teachers school:teacher_type \"{type}导师\".".format(type = w.token.decode("utf-8"))                     
            sparql = SPARQL_TEM_count.format(preamble = SPARQL_PREAMBLE, select = select, count = count, expression = INDENT + e)
            break
    return sparql

# 某老师主讲了哪些课?
def what_courses_teacher_question(x):
    select = u"?x0"
    sparql = None
    for w in x:
        if w.pos == "nr":
            e=u"?teacherid school:teacher_name \"{person}\". " \
              u"?teacherid school:teacher_course ?x0.".format(person=w.token.decode("utf-8"))
            sparql = SPARQL_TEM.format(preamble=SPARQL_PREAMBLE, select=select, expression=INDENT + e)
            break
    return sparql

# 某老师主讲了几门课?
def how_many_courses_teacher_question(x):
    select = u"?courses"
    count = u"?x0"
    sparql = None
    for w in x:
        if w.pos == "nr":
            e=u"?teacherid school:teacher_name \"{person}\". " \
              u"?teacherid school:teacher_course ?courses.".format(person=w.token.decode("utf-8"))
            sparql = SPARQL_TEM_count.format(preamble=SPARQL_PREAMBLE, select=select, count=count,
                                             expression=INDENT + e)
            break
    return sparql

# 某老师的研究方向是什么?
def what_direction_teacher_question(x):
    select = u"?x0"
    sparql = None
    for w in x:
        if w.pos == "nr":
            e=u"?teacherid school:teacher_name \"{person}\". " \
              u"?teacherid school:teacher_direction ?x0.".format(person=w.token.decode("utf-8"))
            sparql = SPARQL_TEM.format(preamble=SPARQL_PREAMBLE, select=select, expression=INDENT + e)
            break
    return sparql

# 某老师是博士生导师吗?
def teacher_is_PhD_tutor_question(x):
    sparql = None
    for w in x:
        if w.pos == "nr":
            e=u"?teacherid school:teacher_name \"{person}\". " \
              u"?teacherid school:teacher_type \"博导\".".format(person=w.token.decode("utf-8"))
            sparql = SPARQL_ASK_TEM.format(preamble=SPARQL_PREAMBLE, expression=INDENT + e)
            break
    return sparql

# 某老师的个人主页是什么?
def what_homepage_teacher_question(x):
    select = u"?x0"
    sparql = None
    for w in x:
        if w.pos == "nr":
            e=u"?teacherid school:teacher_name \"{person}\". " \
              u"?teacherid school:teacher_homepage ?x0.".format(person=w.token.decode("utf-8"))
            sparql = SPARQL_TEM.format(preamble=SPARQL_PREAMBLE, select=select, expression=INDENT + e)
            break
    return sparql

def encode(s):
    return ' '.join([bin(ord(c)).replace('0b', '') for c in s])

if __name__ == "__main__":
    default_questions = [
        "天津大学有哪些学院？",
        "化工学院的简介是什么？",
        "化工学院电话？",
        "化工学院的网址是什么？",
        "天津大学有哪些职能部门？",
        "研究生院的介绍是什么？",
        "研究生院的电话是什么？",
        "研究生院的网址是什么？",
        "智算学部有哪些专业？",
        "教授类型有多少老师?",
        "老师类型有哪些?",
        "硕士生导师类型有哪些老师?",
        "硕士生导师类型有多少老师?",
        "动画专业的专业培养是什么？",
        "计算机专业的考研就业情况？",
        "王晓飞老师主讲了哪些课?",
        "王晓飞老师主讲了几门课?",
        "王晓飞老师的研究方向是什么?",
        "王晓飞老师是博士生导师吗?",
        "王晓飞老师的个人主页是什么?"
    ]
    questions = default_questions[0:]
    seg_lists = []
    # tokenizing questions
    for question in questions:
        words = pseg.cut(question)                             #分词 词性标注
        seg_list = [Word(word.encode("utf-8"), flag) for word, flag in words]           #分词后用Word类初始化，把words看成objects
        seg_lists.append(seg_list)              

    # some rules for matching
    # TODO: customize your own rules here
    # 正则匹配关键词设置
    tutor_type_master = (W("硕士生导师") | W("硕导")| W("硕士导师")| W("硕士生"))
    tutor_type_PhD = (W("博士生导师") | W("博导")| W("博士导师")| W("博士生"))
    teacher = (W(pos = "nr") | W(pos = "x"))
    whose = (W("谁") | W("哪些"))
    quantity = (W("多少") | W("几") | W("几门"))
    
    institution = (W("学院")|W("职能部门"))
    college = (W(pos="nr"))
    attribute = (W("简介")|W("电话")|W("网址")|W("介绍"))
    
    teacher_title=(W("老师"))
    class_1=(W('类型'))
    teacher_title_name=(W("教授"))
    college_1=(W("智算学部"))
    major=(W('计算机专业')|W('动画专业')|W('软件工程专业'))
    development=(W('培养'))
    work=(W('考研')|W('就业'))
    
    direction = (W("方向") | W("研究方向"))
    page = (W("个人主页") | W("主页"))
    
    # 正则匹配规则编写
    rules = [        
        #天津有哪些机构（学院或职能部门）？
        Rule(condition = Star(Any(), greedy=False) + whose + institution, action=how_many_institution_question),
        #某学院的电话？
        Rule(condition= college + Star(Any(), greedy=False) + attribute, action=what_attribute_institution_question),        
        #某导师类型有哪些老师?
        Rule(condition = tutor_type_master + Star(Any(), greedy = False) + whose, action = who_is_master_tutor_question),
        #某导师类型有多少老师?
        Rule(condition = tutor_type_master + Star(Any(), greedy = False) + quantity, action = how_many_teachers_are_master_tutor_question),
        #老师类型有哪些？
        Rule(condition = teacher_title + Star(Any(), greedy = False)+ class_1,action=teacher_title_question),
        #教授类型有多少老师？
        Rule(condition = teacher_title_name + Star(Any(), greedy=False)+quantity,action=how_many_professor_question),
        #智算学部有哪些专业？
        Rule(condition = college_1 + Star(Any(), greedy = False)+ whose,action=which_majors_in_cal_question),
        #某专业的专业培养是什么？
        Rule(condition = major + Star(Any(), greedy = False)+ development,action=what_development_question),
        #某专业的考研就业情况？
        Rule(condition = major + Star(Any(), greedy = False)+ work,action=how_work_question),
        # 某老师主讲了哪些课?
        Rule(condition=teacher + Star(Any(), greedy=False) + whose, action=what_courses_teacher_question),
        # 某老师主讲了几门课?
        Rule(condition=teacher + Star(Any(), greedy=False) + quantity, action=how_many_courses_teacher_question),
        # 某老师的研究方向是什么?
        Rule(condition=teacher + Star(Any(), greedy=False) + direction, action=what_direction_teacher_question),
        # 某老师是博士生导师吗?
        Rule(condition=teacher + Star(Any(), greedy=False) + tutor_type_PhD, action=teacher_is_PhD_tutor_question),
        # 某老师的个人主页是什么?
        Rule(condition=teacher + Star(Any(), greedy=False) + page, action=what_homepage_teacher_question)
    ]

    file_3 = open('result.txt', 'w', encoding='UTF-8')

    # matching and querying
    for seg in seg_lists:#提取问题
        # display question each
        question = []
        for s in seg:
            print(str(s.token,encoding='utf-8'))#输出问题，分词后的版本
            question.append(s.token)
        
        for q in question:
            file_3.write(str(q,encoding='utf-8'))                #file_3.write(u','.join(question))
        print()

        for rule in rules:#提取一个rule
            query = rule.apply(seg)

            if query is None:
                continue
            print(query)
            file_3.write(query + '\n')

            if query:
                sparql_base.setQuery(query)
                sparql_base.setReturnFormat(JSON)
                results = sparql_base.query().convert()

                if "results" in results.keys():
                    if not results["results"]["bindings"]:
                        print("No answer found :(")
                        print('\n')
                        continue
                    for result in results["results"]["bindings"]:
                        print("Result: ", result["x0"]["value"])
                        file_3.write("Result: " + result["x0"]["value"] + '\n')
                        print('\n')
                    file_3.write('\n')                                        #add
                else:
                    print("Result: ", results["boolean"])
                    boo = str(results["boolean"])
                    if boo == "True":
                        file_3.write(u"Result: " + "True" + '\n')
                    else:
                        file_3.write(u"Result: " + "False" + '\n')

最终的输出结果部分如图所示：

5.结语

其余的数据处理过程类似，希望可以与大家互相交流~~

参考资料：
天津大学《知识工程》课程；
https://blog.csdn.net/u010744489/article/details/105923730。

你可能感兴趣的:(知识工程)

手机对小孩的影响及应对措施探究 China_Mr_Huang 智能手机
在信息技术日新月异的当下，手机早已超脱了单纯通讯工具的范畴，深度融入现代生活的每一处细节，成为人们日常生活中不可或缺的存在。对于正处于身心快速发展关键阶段的小孩而言，手机犹如一把双刃剑，一方面为他们打开了知识的宝库，提供了便捷获取信息、拓展视野的渠道，另一方面，也在不知不觉中埋下了诸多潜在风险的隐患。因此，深入且全面地剖析手机对小孩成长所产生的影响，并探寻切实可行、行之有效的应对举措，无疑具有极其
Java 中的包（Package）与导入（Import）详解小刘| java 开发语言
目录一、引言二、包的概念（一）包的定义与作用（二）JDK中主要的包三、导入的概念（一）导入的目的与用法（二）特殊情况的导入四、补充知识点（一）静态导入（二）包的访问权限（三）包的命名规范五、总结一、引言在Java编程中，包（Package）和导入（Import）是非常重要的概念。它们帮助我们更好地组织代码、管理项目结构、解决命名冲突以及控制访问权限。本文将详细介绍Java中的包和导入的相关知识，通
python 自动化数据提取之正则表达式_python 正则提取(2) m0_60607245 程序员 python 学习面试
一、Python所有方向的学习路线Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。二、Python必备开发工具工具都帮大家整理好了，安装就可直接上手！三、最新Python学习笔记当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理
如何将Docker运行的镜像写入数据后导出为新的镜像醉心编码脚本基础人工智能基础技术类 docker
如何将Docker运行的镜像写入数据后导出为新的镜像一、背景知识二、步骤详解1.查找并确认要导出的容器2.使用dockercommit命令保存容器为新的镜像3.验证新镜像4.（可选）导出新镜像为tar文件三、注意事项四、总结在Docker环境中，我们经常需要将运行中的容器保存为镜像，特别是当我们在容器中进行了数据写入或配置更改后。本文将详细介绍如何将Docker运行的镜像写入数据后导出为新的镜像。
Mysql学习笔记-Mysql基础进阶少年无为 Mysql Mysql 数据库多表查询数据库备份 Mysql查询
#知识点1.DQL:查询语句1.排序查询2.聚合函数3.分组查询4.分页查询2.约束3.多表之间的关系4.范式5.数据库的备份和还原#DQL:查询语句1.排序查询*语法：orderby子句*orderby排序字段1排序方式1，排序字段2排序方式2...*排序方式：*ASC：升序，默认的。*DESC：降序。*注意：*如果有多个排序条件，则当前边的条件值一样时，才会判断第二条件。2.聚合函数：将一列数
spring boot基于知识图谱的阿克苏市旅游管理系统python-计算机毕业设计 QQ1963288475 spring boot 知识图谱旅游 python vue.js django flask
目录功能和技术介绍具体实现截图开发核心技术：开发环境开发步骤编译运行核心代码部分展示系统设计详细视频演示可行性论证软件测试源码获取功能和技术介绍该系统基于浏览器的方式进行访问，采用springboot集成快速开发框架，前端使用vue方式，基于es5的语法，开发工具IntelliJIDEAx64，因为该开发工具，内嵌了Tomcat服务运行机制，可不用单独下载Tomcatserver服务器。由于考虑到
Python从0到100（三十九）：数据提取之正则（文末免费送书）是Dream呀 python mysql 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
（九万字）面向2025年BOSS直聘人工智能算法工程师高频面试题解析快撑死的鱼人工智能回归 python pytorch
面向2025年BOSS直聘人工智能算法工程师高频面试题解析1.机器学习（ML）理论解析机器学习是让计算机从数据中学习规律的一套方法论，包含监督学习、无监督学习和强化学习等范式。在监督学习中，给定带标签的数据，算法尝试学习从输入到输出的映射关系；无监督学习则在缺乏标签的情况下挖掘数据内在结构；强化学习则让智能体通过与环境交互、依据奖赏反馈来改进策略(Q-learning-Wikipedia)。机器学
AI 大模型：Intelligent Agent—— 开启智能新纪元 AI-入门人工智能学习产品经理面试 agi
在LLM语境下，Agent理解为在某种能自主理解、规划决策、执行复杂任务的智能体，LLM充当着智能体的“大脑”。从软件工程的角度，智能体是一种基于大语言模型的，具备规划思考能力、记忆能力、使用工具函数的能力，能自主完成给定任务的计算机程序。在基于LLM的智能体中，LLM的充当着智能体的“大脑”的角色，同时还有3个关键部分：规划（Planning）:智能体会把大型任务分解为子任务，并规划执行任务的流
ug12无法连接服务器系统,NX许可证错误：无法连接至许可证服务器系统。SPLM_LICENSE_SERVER错误[-15]... 逍遥药师 ug12无法连接服务器系统
问题原因这个问题可以说只要用过NX软件的工程师，都会遇到过，是最常见的NX许可证错误，可以说没有之一，因为这个提示只是告诉你，你的当前NX许可服务没有启动，就算是你安装完NX主程序不安装许可服务，也是这个提示。所以这个警告提示，实际上对你的问题参考没多大帮助。能让NX许可服务不能启动的原因有很多，所以只能自己去排查以下几种情况。解决方案1、检查你的NX许可服务有没有安装。(这是最基本，一般情况下不
DeepSeek-R1 技术全景解析：从原理到实践的“炼金术配方” ——附多阶段训练流程图与核心误区澄清... 雪停时偶遇一叶春流程图
合集-人工智能(5)1.如何改进AI模型在特定环境中的知识检索2024-09-242.深度学习与统计学中的时间序列预测2024-10-033.《使用coze搭建一个会搜索、写ppt、思维导图的Agent》2024-10-294.深入浅出：Agent如何调用工具——从OpenAIFunctionCall到CrewAI框架01-145.DeepSeek-R1技术全景解析：从原理到实践的“炼金术配方”—
计算机程序制作的小作品,义乌市中小学生电脑作品制作比赛201203 东南前哨计算机程序制作的小作品
《义乌市中小学生电脑作品制作比赛201203》由会员分享，可在线阅读，更多相关《义乌市中小学生电脑作品制作比赛201203(4页珍藏版)》请在人人文库网上搜索。1、浙江省义乌市教育研修院关于举办2012年义乌市中小学生电脑作品制作比赛暨首届青少年网络道德建设专题创作活动的通知各中小学：为进一步推进和加强中小学信息技术教育，普及信息技术知识，培养学生创新精神和实践能力，提高信息技术水平，根据上级文件
分布式数据库解析 qcidyu 文章归档数据分片高可用架构云数据库共识算法全球一致性分布式事务 CAP定理
title:分布式数据库解析date:2025/2/20updated:2025/2/20author:cmdragonexcerpt:通过金融交易、社交平台、物联网等9大真实场景，结合GoogleSpanner跨洲事务、DynamoDB毫秒级扩展等38个生产级案例，揭示分布式数据库的核心原理与工程实践。内容涵盖CAP定理的动态权衡策略、Paxos/Raft协议的工程实现差异、TrueTime时钟
HarmonyOS进程通信及原理拥有一颗学徒的心 HarmonyOS harmonyos 华为鸿蒙信息与通信分布式
大家好，我是学徒小z，最近在研究鸿蒙中一些偏底层原理的内容，今天分析进程通信给大家，请用餐文章目录进程间通信1.通过公共事件（@ohos.commonEventManager）公共事件的底层原理2.IPCKit能力LiteIPC的归属与特点1.所属内核2.核心思想3.公共事件子系统鸿蒙内核小知识进程间通信1.通过公共事件（@ohos.commonEventManager）公共事件的底层原理公共事件
Vue.js 基础与实战指南：从入门到跑路王嘉俊705 前端 javascript visual studio code html 前端 vue.js
一、Vue的两种使用方式扩展核心包开发直接通过引入Vue.js，适用于简单页面或局部功能增强。优点：轻量，无需构建工具。缺点：难以管理复杂项目，缺少工程化支持。工程化开发使用VueCLI、Vite等工具创建项目，结合Webpack/Vite构建。支持单文件组件（.vue文件），结构清晰（`,,）。插件生态丰富（如VueRouter、Vuex、Pinia）。二、Vue实例的深入理解核心配置项 new
【Python系列】Python 解释器的站点配置 Kwan的解忧杂货铺@新空间代码工作室 s1 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术点,如集合,jvm,并发编程redis,kafka,Spring,微服务,Netty等常用开发工具系列:罗列常用的开发工具,如IDEA,M
DeepSeek如何重塑我的编程学习：计算机新生的AI实践 EnigmaCoder DeepSeek 学习人工智能
目录前言邂逅DeepSeek：从困惑到惊喜初学编程的困境DeepSeek的优势️DeepSeek在编程学习中的运用注释算法逐步分析调试帮助跨语言迁移学习AI时代学习方法论革新知识获取方式转变新型学习能力培养反思与展望反思展望总结前言大家好！我是EnigmaCoder，本文我将介绍我的AI编程学习之旅。春节期间，DeepSeek横空出世，迅速登顶热榜。它功能强大，精准答疑、高效创作，瞬间点燃大众热情
马斯克的Grok-3：技术突破与行业冲击的深度解析 ♢.＊马斯克人工智能大模型 xAI Grok 3
一、技术架构与核心突破超大规模算力集群Grok-3基于xAI自研的Colossus超级计算机训练完成，搭载20万块英伟达H100GPU，累计消耗2亿GPU小时，算力投入是前代Grok-2的10倍48。这一规模远超行业平均水平，例如中国团队DeepSeek-V3的算力消耗仅为Grok-3的1/2634。技术挑战：团队在122天内完成首期10万块GPU部署，克服了散热、电力供应等工程难题1。思维链推理
从开发到部署，搭建离线私有大模型知识库_离线大模型 ai大模型应用开发数据库服务器 linux 语言模型人工智能自然语言处理深度学习
文末有福利！背景介绍最近一段时间搭建了一套完整的私有大模型知识库，目前完整的服务已经完成测试部署上线。基本之前的实践过程，从工程角度整理技术方案以及中间碰到的一些问题，方便后续对这个方向有需求的研发同学们。为什么做离线私有化部署在大模型火热起来之后，很多企业都有尝试相关服务。但是实际会碰到大模型不了解公司个性化的情况，无法针对公司情况给出个性化回答。因此就出现了针对大模型的知识库，通过提供公司内部
DeepSeek原理介绍以及对网络安全行业的影响 AI拉呱 Deepseek 人工智能
大家好，我是AI拉呱，一个专注于人工智领域与网络安全方面的博主，现任资深算法研究员一职，兼职硕士研究生导师；热爱机器学习和深度学习算法应用，深耕大语言模型微调、量化、私域部署。曾获多次获得AI竞赛大奖，拥有多项发明专利和学术论文。对于AI算法有自己独特见解和经验。曾辅导十几位非计算机学生转行到算法岗位就业。关注评审分享一起学习更多知识。1.DeepSeek公司介绍1.1DeepSeek是什么：wh
再有人问你DDD，把这篇文章丢给他聪明马的博客 Java java 开发语言
DDD（Domain-DrivenDesign，中文名领域模型设计）是一种软件开发方法论，它强调将业务领域中的知识融入到软件设计中。DDD强调将软件开发过程分为两个主要阶段：领域分析和领域建模。领域分析是指深入了解业务领域中的问题和需求，领域建模是将分析出的领域知识转化为软件模型。在本文中，我不再过多说明DDD的来龙去脉，我将用多个例子来详细说明使用DDD和不使用DDD的区别、优势和劣势。需求：假
Go 并发控制：semaphore 详解后端go面试并发编程信号量
今天我们来介绍一个Go官方库x提供的扩展并发原语semaphore，译为“信号量”。因为它就像一个信号一样控制多个goroutine之间协作。概念讲解我先简单介绍下信号量的概念，为不熟悉的读者作为补充知识。一个生活中的例子：假设一个餐厅总共有10张餐桌，每来1位顾客占用1张餐桌，那么同一时间共计可以有10人在就餐，超过10人则需要排队等位；如果有1位顾客就餐完成，则可以让排队等待的第1位顾客来就餐
焦虑驱动的成长：从Bushcraft到AI的启示
腾讯的IMA工具，将公众号和我个人的知识库融合在一起，精准地回答了这个问题：Bushcraft和Glamping玩法的区别是什么？我在想，2019年那时，我受长安邀请，参加了《天空下周末》的Glamping大会，我们创建了Bushcraft野营区，野性和Glamping的文明有些格格不入。那个时候，我被一个问题困扰：都是美好的生活方式，Glamping我喜欢，Bushcraft我也喜欢，到底应该选
知识图谱构建概念、工具、实例调研熟悉的黑曼巴知识图谱人工智能
一、知识图谱的概念知识图谱（Knowledgegraph）知识图谱是一种用图模型来描述知识和建模世界万物之间的关联关系的技术方法。知识图谱由节点和边组成。节点可以是实体，如一个人、一本书等，或是抽象的概念，如人工智能、知识图谱等。边可以是实体的属性，如姓名、书名或是实体之间的关系，如朋友、配偶。知识图谱的早期理念来自SemanticWeb（语义网络），其最初理想是把基于文本链接的万维网落转化为基于
LTC流程概述与核心要点--华为LTC流程专家许浩明老师分享心得体会华为LTC专栏流程管理专家许浩明华为LTC 项目管理数据库经验分享云计算区块链
销售关乎企业生死，可是很多企业的销售流程体系是散乱无序、效率低下；没能洞察市场寻找更多商机，项目线索不够多，即便有了项目线索也因为没能尽早有效跟踪培育线索而失去项目机会；难以快速响应客户需求；面向客户界面混乱，销售人员基本是单兵作战，难以形成战斗力，很多销售人员销售经验能力又不足，直接导致的结果就是：市场中标概率小、中标了交付也存在各种各样风险与问题、回款缓慢甚至最后成为“烂尾工程”应收帐款巨大…
FOKS-TROT: 一个高效、易用的全功能开源知识图谱生成工具柳旖岭
FOKS-TROT:一个高效、易用的全功能开源知识图谱生成工具项目简介FOKS-TROT是一个基于Python的全功能开源知识图谱生成工具，旨在帮助研究人员和开发者快速构建具有丰富信息的知识图谱。该项目由hkx3upper在GitCode上开发并维护。通过FOKS-TROT，您可以轻松地将各种数据源（如文本文件、数据库、API）转换为结构化的知识图谱，并对其进行可视化分析和机器学习任务。此外，该工
拯救者机型背光键盘无法开启 famous_pengfei 计算机外设笔记本电脑
如果你是联想拯救者系列笔记本电脑的用户，想必对背光键盘这一酷炫功能十分喜爱。然而，当背光键盘突然无法开启时，这无疑会让人感到困惑和沮丧。别担心，联想官方知识库已经为你准备好了详细的解决方案。文章中提到，Windows10系统下，用户可以通过开始菜单进入LenovoSettings来开启背光键盘。这个方法简单易懂，即使是电脑小白也能轻松上手。此外，文章还提供了详细的图文说明，帮助用户更直观地理解操作
入门网络安全工程师要学习哪些内容【2025年寒假最新学习计划】白帽黑客2659 学习 web安全安全网络安全密码学
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包大家都知道网络安全行业很火，这个行业因为国家政策趋势正在大力发展，大有可为!但很多人对网络安全工程师还是不了解，不知道网络安全工程师需要学什么?知了堂小编总结出以下要点。网络安全工程师是一个概称，学习的东西很多，具体学什么看自己以后的职业定位。如果你以后想成为安全产品工程师，学的内容侧重点就和渗透测试工程师不一样，如果你想成为安全开发
在项目中调用本地Deepseek（接入本地Deepseek） mr_cmx AI ai 前端 DeepSeek AI
前言之前发表的文章已经讲了如何本地部署Deepseek模型，并且如何给Deepseek模型投喂数据、搭建本地知识库，但大部分人不知道怎么应用，让自己的项目接入AI模型。文末有彩蛋哦！！！要接入本地部署的deepseek，我就要利用到我们之前部署时安装的ollama服务，并调用其API本地API接口1、生成文本（GenerateText）url:POST/api/generate功能：向模型发送提示
设计数据密集型应用之数据系统基础知识 xt01234
第一章可靠性针对系统的容错设计，提高系统错误的抛出率，而不是忽略它(除了安全这种不可恢复类型的)，尽量避免failure硬件错误硬件自身容许设计软件系统的灵活性与弹性。即容许整台机器异常，而不影响系统软件错误影响范围大，连锁反应，排查难。bug，依赖服务错误等避免：考虑全面，全面测试，处理隔离，监控人类错误最小化犯错机会的方式设计系统，全面测试，允许从错误中恢复，监控Scaliability(可扩
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理