chenmingwei000

kbqa基于复旦大学的实现代码解析完成步骤（一）

应大部分初学者的要求，本文主要针对实现的代码以及数据进行介绍；

整理后的代码放在https://github.com/chenmingwei00/upload_KBQA.git

训练好的数据参数在链接：https://pan.baidu.com/s/1Dv9Md94AUjlCk5JlWKll-g
提取码：qwkk
本次介绍的代码是按照执行顺序进行讲解，所以调式要按照这个顺序进行调式

1 数据导入步骤

（1）sqlserver的安装；

（2）数据的下载：http://www.openkg.cn/dataset/cndbpedia

这两个数据集，上面一个数据，网站有很清除的解绍，就不再做过多的介绍，全部是三元组数据，下面那一个是 mention2entity文件，例如 mention是张杰，当年是entity却有可能有好几个张杰，有可能是歌手，是作家等多个实体。

（3）导入sqlserver数据库，并且对entity这一列加索引（为了加快查询速度，并且查询都是基于entity这一列进行查询的）。

2. 代码的介绍

本次代码介绍准备以训练好的模型，倒序的方式进行介绍，方便大家理解，实现代码与文章有一定的出入；介绍代码顺序非常重要，也是按照执行代码顺序进行介绍的，需要的依赖请子机进行下载。

2.1 flask_robot.py

这个是运行代码的总函数，也就是利用了flask简单实现的接口进行运行的，看一下代码如下：

# -*- coding: utf-8 -*-
"""
Created on Fri Sep 15 11:00:22 2017

@author: Administrator
"""
from flask import Flask, request, render_template, jsonify
from urllib import parse
import main_qa
application1 = Flask(__name__)

robot = main_qa.Robots()

@application1.route("/")
def api_index():
    return render_template('index.html')

@application1.route('/get_answer',methods=['POST'])
def get_answer():
    que=parse.parse_qs(request.get_data().decode('utf-8'))
    print(que['text'][0],"11111")
    resu = robot.get_answer_qa(que['text'][0])
    print(resu,"3333333333333333333333333333333333")
    return jsonify({"key":resu})
if __name__ == "__main__":
    application1.run('127.0.0.1', 6550,debug=True)

从这个文件代码可以很清楚看到比较简单，1/  主要由一个route路径，传递的函数就是que这个用户的问题。2/导入了main_qa文件，并且利用了robot = main_qa.Robots() 实例化一个对象，利用了get_answer_qa函数获取答案，那么重点就在main_qa这个文件中。

2.2 main_qa.py

从文件的复杂性来看貌似很复杂，主要在于本人的编程代码能力有限，那么咱们从头一一给大家进行介绍；本次例子主要以“三国演义的作者是谁”这个问题进行介绍，用到的某些文件，会依次再进行介绍。

#! -*- coding:utf-8 -*-
import math
import pickle
import jieba
import gensim
import pandas as pd
import jieba.analyse
import jieba.posseg
from stanfordcorenlp import StanfordCoreNLP
from KBQA_small_data_version1.kbqa.connectSQLServer import connectSQL
from KBQA_small_data.kbqa.entity_recognize import Entity
import numpy as np
import re

包的依赖就不说了，只说自己的包
         1/   connectSQLServer数据库导入包，本次并没有用ORM对象所以自己写的sql语句有点不友好。
         2/   entity_recognize   比较明显是命名实体识别的文件

host = '172.16.211.128'
user = 'sa'
password = 'chentian184616_'
database= 'chentian'
querySQL = connectSQL(host, user, password, database)
pd.set_option('display.max_columns',5000)
pd.set_option('display.max_rows',5000)
pd.set_option('display.width',1000000)
pd.set_option('display.max_columns',None)
这些是数据库的一些配置，说实话不能这样写，如果从规则等方面，在此就不再说类似这样的话题，只说逻辑

class Robots:
    def __init__(self):
        pkl_file = open('../../KBQA_small_data/data/entity_template.pkl', 'rb')
        self.template_property = pickle.load(pkl_file)
        ppt_file=open('../../KBQA_small_data/data/ppt_update_update1.pkl', 'rb')
        self.ppt_property=pickle.load(ppt_file)
        concept_fre=open('../../KBQA_small_data/data/concept_count.pkl', 'rb')
        self.concept_fre=pickle.load(concept_fre)
        self.jieba_pos = ['i', 'j', 'l','nr', 'nt', 'nz', 'b', 'nrfg','zg']
        self.unused_pos=['b','c','dg','e','o','p','r','u','w','y','z','uj','x']
        self.stanford_pos=['NR']
        self.tf_idf = jieba.analyse.extract_tags
        self.nlp = StanfordCoreNLP(path_or_host='../../stanford-corenlp/stanford-corenlp-full-2017-06-09/',lang='zh')
        self.sql2 = "SELECT * FROM [chentian].[dbo].[baike_triples1] WHERE entity ='%s' "
        self.sql = "SELECT * FROM [chentian].[dbo].[baike_triples1] WHERE entity in %(name)s "
        self.sq3="SELECT * FROM [chentian].[dbo].[m2e1] where entity='%s'"
        self.entity_re=Entity()
        self.model = gensim.models.Word2Vec.load('../../w2vModel/corpus.model')


 本次模型的所有参数以及数据保存到了pkl中一次介绍：
       entity_template.pkl 实体对应模板概念的概率
       ppt_update_update1 模板对应属性的概率
       concept_count  应该是一个实体对应的概念的概率
       以下的是由于命名实体识别效果不好，用的词性做规则来识别实体，其实可以用自己训练的模型；来进行实体识别，效果会更好。
       实例化了一个entity用来识别实体。
       self.model是用来进行句子相似性匹配的。


    get_answer_qa实际是主函数接下来仔细分析来沟通整个函数的结果
    def get_answer_qa(self,sentence):
        """
        对用户问题进行实体识别，产生实体，然后找到实体类别，形成template，
        匹配对应template库寻找对应属性答案
        :return:
        """
        final_result = []
        final_result_final = []
        second_result = []
        question_template = []
        template_property={}#模板对应属性，属性已经排序成功
        entities = self.entity_recognize(sentence) 
        这是用原来的方法先进行实体识别

        for entity in entities:
            entity = entity.replace("'", "''")
            real_entity = [k.replace("'", "") for k in
                           self.entity_re.get_synonym1(entity)['real_entities']]  # 由于实体中可能包含',则替换为'' 在数据库中就认为是单引号，这一个过程就是把m2e文件的候选实体拿出来，标记一下，就是需要进一步分析的地方

            if len(real_entity) == 0:
                real_entity = "('" + str(entity) + "')"  # 如果m2e文件中没有多义词，则实体自己为real_entity
            elif len(real_entity) == 1:
                real_entity = "('" + str(real_entity[0]) + "')"
            else:
                real_entity = tuple(real_entity) 
以上是通过m2e获取候选实体，类型是 ('张杰（上海市浦东法院民五庭庭长）', '张杰（世界书画报社长总编辑）', '张杰（东北林业大学生命科学学院副教授）')类似于这样多个候选实际实体
            temp_sql = self.sql % {'name': real_entity}  # real_entity 是一个元组，
            result = querySQL.Query(temp_sql)  # 用sqlserver的in (e1,e2,e3)元组中得到所有的结果，不用再对real_entity实体循环多次select查找 ，这里的是所有候选实体的三元组对象。
           
            result['template_score']=''
            result['property_score']=''
            result['score']=''
            concepts = result[result['property'] == 'BaiduTAG']['value'] #对应所有概念
            for pro in concepts:
                temp_template = sentence.replace(entity, '$$$$$' + pro + "$$$$$")  # 对应concept形成问题模板
                # print("tempplte", temp_template)
                if temp_template in self.template_property: #看是否包含在训练好的模板中
                    predicts = self.template_property[temp_template]#模板对应的属性
                    property_fre = self.ppt_property[temp_template]#模板对应多个意图的概率数值，是以字典的形式构建。
                    property_fre=dict(sorted(property_fre.items(), key=lambda d: d[1], reverse=True)[:4]) #选中模型中模板对应的前四个意图概率较大的
                    template_property[temp_template]=property_fre
                    for predict in list(property_fre.keys()):
                        if predict=="BaiduTAG":continue
#result是一个dataframe结构，包含了候选答案的实体，属性，value数值
                        if predict=='BaiduCARD':final_result_final.append(result[result['property']=='BaiduCARD'])
                        elif len(result[result['property']==predict])!=0:
                            result.loc[result['property']==predict,['template_score']]=self.concept_fre[pro]#把对应模板的分数赋值，为模板排序做准备
                            result.loc[result['property'] == predict, ['property_score']]=property_fre[predict]
                            result.loc[result['property'] == predict, ['score']]=self.concept_fre[pro]*property_fre[predict] #利用了论文中的概率计算，相当于把计算之后的结果放在了score这一列中
                            final_result.append(result[result['property']==predict])
                second_result.append(result)


接下来的代码都比较简单，就是对计算结果进行排序
        if len(final_result)!=0:
            if len(final_result)!=0:
                final_result=pd.concat(final_result).drop_duplicates()
                tempresult=''.join(list(final_result.sort_values(by=['score'], ascending=False).loc[:,['entity','property', 'value']].iloc[0]))
                return tempresult
            else:return 'no_answer'
            # return self.sort_result(final_result)
        elif len(final_result_final)!=0:
            if len(final_result_final)!=0:
                final_result_final=pd.concat(final_result_final).drop_duplicates()
                return self.sort_result(final_result_final,sentence)
            else:return 'no_answer'
        else:
            if len(second_result)!=0:
                final_result= pd.concat(second_result).drop_duplicates()
                final_result=list(self.sort_result(final_result,sentence).reset_index().loc[0])[1:]
                return ''.join(final_result[:2])+"："+final_result[-1].replace("",'').replace('','')
            else:return 'no_answer'
    def sort_result(self,data_fream,sentence):
        """
        对最后结果按照热度进行排序
        :param data_fream: 输入数据
        :return:
        """
        entities = data_fream['entity']
        entities=list(set(entities))
        if len(entities)>=1:
            data_fream['score'] = ''
            data_fream['property_score']=''
            data_fream['cos_score']=''
            for ele in entities:
                if len(ele.split("（"))>1:
                    ele_temp=ele.split("（")[1].replace('）',"")
                    entity=ele.split("（")[0] #表示问句中的实体
                    important_words = self.tf_idf(ele_temp)
                    important_words = important_words[:math.ceil(len(important_words) * 0.8)]
                    scorce = 0
                    for word in important_words:
                        if word==entity:continue #如果修饰词中含有问句的实体，则不计为相似词 2017/12/27
                        try:
                            scorce += self.model.similarity(entity, word)
                        except:
                            scorce = 0
                    data_fream.loc[data_fream['entity'] == ele, ['score']] = scorce
                    property_word = []
                    rest_words = sentence.replace(entity, '')
                    pos_words=jieba.posseg.cut(rest_words)
                    for i in pos_words:
                        # print(i.word,i.flag)
                        if i.flag not in self.unused_pos:
                            property_word.append(i.word)
                    properties=list(data_fream['property'])
                    for pro in properties:
                        ask_vec=np.zeros(400);query_vec=np.zeros(400)
                        pro_words='|'.join(jieba.cut(pro)).split("|")
                        for wor in pro_words:
                            try:
                                ask_vec+=self.model[wor]
                            except:continue
                        # print(property_word)
                        for wor1 in property_word:
                            try:
                                query_vec+=self.model[wor1]
                            except:continue
                        cos_simil = self.cosSimil(ask_vec, query_vec)  # +perSimil
                        data_fream.loc[(data_fream['entity']==ele)&(data_fream['property']==pro),['cos_score']]=cos_simil
                else:
                    property_word = []
                    rest_words = sentence.replace(ele, '')
                    pos_words = jieba.posseg.cut(rest_words)
                    for i in pos_words:
                        # print(i.word,i.flag)
                        if i.flag not in self.unused_pos:
                            property_word.append(i.word)
                    properties = list(data_fream['property'])
                    for pro in properties:
                        ask_vec = np.zeros(400);
                        query_vec = np.zeros(400)
                        pro_words = '|'.join(jieba.cut(pro)).split("|")
                        for wor in pro_words:
                            try:
                                ask_vec += self.model[wor]
                            except:
                                continue
                        for wor1 in property_word:
                            try:
                                query_vec += self.model[wor1]
                            except:
                                continue
                        cos_simil = self.cosSimil(ask_vec, query_vec)  # +perSimil
                        data_fream.loc[
                            (data_fream['entity'] == ele) & (data_fream['property'] == pro), ['cos_score']] = cos_simil
            fin_data=[]
            arclen=math.ceil(len(data_fream)*0.3)
            fin_data.append(data_fream.sort_values(by='cos_score',ascending=False)[:arclen]) #后是属性排序)
            fin_data.append(data_fream.sort_values(by='score',ascending=False)[:arclen])
            return pd.concat(fin_data).loc[:,['entity','property','value']]
        else:
            return data_fream.loc[:,['entity','property','value']]
            # entity_score[ele]=scorce
        # entity_score=dict(sorted(entity_score.items(),key=lambda d:d[1] ,reverse=True))
        # 计算余弦相似度
    def cosSimil(self, v1, v2):
        return np.dot(v1, v2) / (
        math.sqrt(sum(v1 ** 2)) * math.sqrt(sum(v2 ** 2)) + 0.000000000000000000000000000000001)
    def entity_recognize(self,sentence):
        """
        识别出问题中对应的实体，根据训练数据集的train.json文件，特点，做了一系列的规则处理。
        :param sentence: 用户问题
        :return: 返回实体
        """
        if re.search('《.*》', sentence)!=None :
            return [re.search('《.*》', sentence).group().replace("《", "").replace("》", "")]
        if re.search('“.*”', sentence) :
            return [re.search('“.*”', sentence).group().replace("“", "").replace("”", "")]
        if re.search('‘.*’', sentence):
            return [re.search('‘.*’', sentence).group().replace("‘", "").replace("’", "")]
        jieba_cut = "|".join(jieba.cut(sentence)).split("|")
        if "是谁唱的" in sentence or "是谁写的" in sentence or "谁唱" in sentence or "谁写" in sentence:
            question_entity = ''
            for e in sentence:
                if e == "是" or e == "谁": break
                question_entity += e
            question_entity = [question_entity]
        else:
            question_entity = self.nlp.ner(sentence)  # 获得Stanford的实体识别的结果，以及切词结
            pos_jieba = jieba.posseg.cut(sentence)
            tf_idf = jieba.analyse.extract_tags
            JIE = tf_idf(sentence)
            if len(jieba_cut) < len(question_entity):#如果结巴切词比Stanford少，
                final_words = []
                for ele in jieba_cut:
                    tem_word = ''
                    flag = False
                    for el in question_entity:
                        if el[0] in ele:
                            if el[1] != 'O' and el[1] != 'NT' and el[1] != 'NUMBER': flag = True
                            tem_word += el[0]
                    if flag == True:
                        final_words.append(tem_word)
                question_entity = final_words
            else:
                question_entity = self.entity_re.entity_connect(question_entity)
            if len(question_entity)==0:
                stanford_pos = self.nlp.pos_tag(sentence)
                for wor in stanford_pos:
                    if wor[1] in self.stanford_pos:
                        question_entity=[wor[0]]
            if len(question_entity) == 0:
                for i in pos_jieba:
                    if i.flag in self.jieba_pos:
                        question_entity.append(i.word)
            # print(question_entity, "!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!1")
            # #对实体进行连接，相邻作为一个实体在kb中寻找，依次递减
            # 如果整个句子中不包含实体，则需要从m2e中寻找且此后对应的实体,从名词‘NN’中作为备选实体
            if len(question_entity) == 0:
                jieba_entity = []
                jieba_pos = jieba.posseg.cut(sentence)
                for i in jieba_pos:
                    if i.flag in self.jieba_pos:
                        jieba_entity.append(i.word)
                question_entity = jieba_entity
            if len(question_entity) == 0:
                # print(JIE)
                words_tag_jieba = JIE[:math.ceil(len(JIE) * 0.3)]  # 这是jieba切词结果，要比stanford更符合中文习惯，
                question_entities = []
                try:
                    words_tag = self.nlp.pos_tag("".join(words_tag_jieba))
                    # print(len(words_tag_jieba) , len(words_tag))
                    if len(words_tag_jieba) < len(words_tag):
                        final_words = []
                        for ele in words_tag_jieba:
                            tem_word = ''
                            for el in words_tag:
                                if el[0] in ele:
                                    tem_word += el[0]
                            final_words.append(tem_word)
                        question_entity = final_words
                    else:
                        for value in words_tag:
                            if value[1] in self.stanford_pos:
                                question_entities.append(value[0])
                        question_entity = question_entities
                except:
                    return 0
        if len(question_entity)==0:
            tf_idf = jieba.analyse.extract_tags
            JIE = tf_idf(sentence)
            if len(JIE)==0:JIE=[sentence]
            extract = {}  # 提取出问题中的实体以及答案中的value,还有对应的property ,类型为[entity,property,value]
            question_entity.append(JIE[0])
        # question_entity = self.connect_entity(jieba_cut, question_entity)
        # print(question_entity, "**************")
        return question_entity
    def connect_entity(self,question,question_entity):
        prio = []
        real_enity=[]
        for question_e in question_entity:
            if question_e in question:
                prio.append(question.index(question_e))
        k=1
        # print(question_entity)
        while k

 
  接下来请看二

guava loadingCache代码示例 IM 胡鹏飞 Java 工具类介绍
publicclassTest2{publicstaticvoidmain(String[]args)throwsException{LoadingCachecache=CacheBuilder.newBuilder()//设置并发级别为8，并发级别是指可以同时写缓存的线程数.concurrencyLevel(8)//设置缓存容器的初始容量为10.initialCapacity(10)//设置缓存
系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
什么是证书吊销列表？CRL 解释 WoTrusSSL ssl https
数字证书是安全在线互动的支柱，用于验证身份和确保加密通信。但是，当这些证书被盗用或滥用时，必须立即撤销它们以维持信任。这就是证书撤销列表(CRL)的作用所在。CRL由证书颁发机构(CA)维护，对于识别和撤销已撤销的证书，防止其造成危害至关重要。在本指南中，我们将探讨什么是CRL、它们如何运作以及为什么它们对网络安全至关重要。什么是证书吊销列表(CRL)？证书吊销列表(CRL)是证书颁发机构(CA)
有必要获得WHQL测试认证吗，有什么好处？
什么是WHQL认证？WHQL是MicrosoftWindowsHardwareQualityLab的缩写，中文意思是Windows硬件设备质量实验室，主要是对Windows操作系统的兼容性测试，检验硬件产品和驱动程序在windows系统下的兼容性和稳定性。当某一硬件或软件通过WHQL测试时，制造商可以在其产品包装和广告上使用“DesignedforWindows”标志。该标志可以证明硬件或软件已经
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
驱动程序为什么要做 WHQL 认证? GDCA SSL证书网络协议网络
驱动程序进行WHQL（WindowsHardwareQualityLabs）认证的核心价值在于解决兼容性、安全性和市场准入三大关键问题，具体必要性如下：️‌一、规避系统拦截，保障驱动可用性‌消除安装警告‌未认证的驱动在安装时会触发Windows的‌红色安全警告‌（如“无法验证发布者”），甚至被系统强制拦截。通过WHQL认证的驱动获得微软数字签名，用户可无阻安装‌。满足系统强制要求‌Windows1
求是网：“内卷式”竞争的突出表现和主要危害有哪些？加百力财经研究科技知识人工智能大数据
"内卷式"竞争主要表现为：企业层面的低价竞争、同质化竞争和营销"逐底竞争"；地方政府层面的违规优惠政策、盲目重复建设和设置市场壁垒。危害体现在三个层面：微观上导致"劣币驱逐良币"，损害消费者利益；中观上破坏行业生态，挤压产业链利润空间；宏观上扭曲资源配置，抑制创新活力。什么是“内卷式”竞争？概括其一般特征，是指经济主体为了维持市场地位或争夺有限市场，不断投入大量精力和资源，却没有带来整体收益增长的
WHQL签名怎么申请 GDCA SSL证书 windows
WHQL（WindowsHardwareQualityLabs）签名是微软对硬件和驱动程序进行认证的一种方式，以确保它们与Windows操作系统的兼容性和稳定性。以下是申请WHQL签名的基本步骤，供您参考：1.准备阶段准备硬件设备和驱动程序：确保您的硬件设备已经准备好，并且对应的驱动程序已经经过充分的测试，能够在各种配置和环境下正常工作。获取EV代码签名证书：根据微软的要求，驱动程序进行WHQL认
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
发票合并工具小朋的软件园前端 javascript java html 服务器
"发票合并工具"是一款专为高效整理票据设计的实用工具，支持将来自不同渠道的发票文件（如PDF文档、各类图片格式）快速整合为排版规范的PDF文件，尤其适用于财务报销场景下的批量票据处理需求。核心功能亮点多格式兼容：无缝导入PDF文件及常见图片格式（.png/.jpg/.jpeg/.bmp），适配多来源发票整合需求。智能布局配置：提供灵活的页面布局选项（每页2/3/4张发票），其中"2合1"模式针对报
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
k8s:安装 Helm 私有仓库ChartMuseum、helm-push插件并上传、安装Zookeeper 云游 docker helm helm-push
ChartMuseum是Kubernetes生态中用于存储、管理和发布HelmCharts的开源系统，主要用于扩展Helm包管理器的功能核心功能‌集中存储‌：提供中央化仓库存储Charts，支持版本管理和权限控制。‌‌跨集群部署‌：支持多集群环境下共享Charts，简化部署流程。‌‌离线部署‌：适配无网络环境，可将Charts存储在本地或局域网内。‌‌HTTP接口‌：通过HTTP协议提供服务，用户
上位机知识篇---SD卡&U盘镜像
常用的镜像烧录软件balenaEtcherbalenaEtcher是一个开源的、跨平台的工具，用于将操作系统镜像文件（如ISO和IMG文件）烧录到SD卡和USB驱动器中。以下是其使用方法、使用场景和使用注意事项的介绍：使用方法下载安装：根据自己的操作系统，从官方网站下载对应的安装包。Windows系统下载.exe文件后双击安装；Linux系统若下载的是.deb文件，可在终端执行“sudodpkg-
【LeetCode 热题 100】24. 两两交换链表中的节点——（解法一）迭代+哨兵 xumistore LeetCode leetcode 链表算法 java
Problem:24.两两交换链表中的节点题目：给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表操作问题：两两交换链表中的节点(SwapNodesinPairs)。问题要求将链表中每两个相邻的节点进行交换
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
LeetCode 148. 排序链表：归并排序的细节解析进击的小白菜 2025 Top100 详解 leetcode 链表算法
文章目录题目描述一、方法思路：归并排序的核心步骤二、关键实现细节：快慢指针分割链表1.快慢指针的初始化问题2.为什么选择`fast=head.next`？示例1：链表长度为偶数（`1->2->3->4`）三、完整代码实现四、复杂度分析五、总结题目描述LeetCode148题要求对链表进行排序，时间复杂度需为O(nlogn)，且空间复杂度为O(logn)。由于链表的特殊结构（无法随机访问），归并排序
前端项目架构设计要领
1.架构设计的核心目标在设计前端项目架构时，核心目标是模块化、可维护、可扩展、可测试，以及开发效率的最大化。这些目标可以通过以下几个方面来实现：组件化：将UI功能封装为可复用的组件。模块化：将业务逻辑分解为独立的模块或服务。自动化构建与部署：实现自动化构建、测试和部署流程，减少人为操作的错误。代码规范化与检查：确保团队协作时，代码风格和质量一致。2.项目目录结构设计一个清晰合理的目录结构对大型项目
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
xml解析小猪猪08 xml
1、DOM解析的步奏准备工作： 1.创建DocumentBuilderFactory的对象 2.创建DocumentBuilder对象 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 4.通过Document的getElem
每个开发人员都需要了解的一个SQL技巧 brotherlamp linux linux视频 linux教程 linux自学 linux资料
对于数据过滤而言CHECK约束已经算是相当不错了。然而它仍存在一些缺陷，比如说它们是应用到表上面的，但有的时候你可能希望指定一条约束，而它只在特定条件下才生效。使用SQL标准的WITH CHECK OPTION子句就能完成这点，至少Oracle和SQL Server都实现了这个功能。下面是实现方式： CREATE TABLE books ( id &
Quartz——CronTrigger触发器 eksliang quartz CronTrigger
转载请出自出处：http://eksliang.iteye.com/blog/2208295 一.概述 CronTrigger 能够提供比 SimpleTrigger 更有具体实际意义的调度方案，调度规则基于 Cron 表达式，CronTrigger 支持日历相关的重复时间间隔（比如每月第一个周一执行），而不是简单的周期时间间隔。二.Cron表达式介绍 1）Cron表达式规则表 Quartz
Informatica基础 18289753290 Informatica Monitor manager workflow Designer
1. 1）PowerCenter Designer：设计开发环境，定义源及目标数据结构；设计转换规则，生成ETL映射。 2）Workflow Manager：合理地实现复杂的ETL工作流，基于时间，事件的作业调度 3）Workflow Monitor：监控Workflow和Session运行情况，生成日志和报告 4）Repository Manager：
linux下为程序创建启动和关闭的的sh文件，scrapyd为例酷的飞上天空 scrapy
对于一些未提供service管理的程序每次启动和关闭都要加上全部路径，想到可以做一个简单的启动和关闭控制的文件下面以scrapy启动server为例，文件名为run.sh： #端口号，根据此端口号确定PID PORT=6800 #启动命令所在目录 HOME='/home/jmscra/scrapy/' #查询出监听了PORT端口
人--自私与无私永夜-极光
今天上毛概课,老师提出一个问题--人是自私的还是无私的,根源是什么? 从客观的角度来看,人有自私的行为,也有无私的
Ubuntu安装NS-3 环境脚本随便小屋 ubuntu
将附件下载下来之后解压，将解压后的文件ns3environment.sh复制到下载目录下（其实放在哪里都可以，就是为了和我下面的命令相统一）。输入命令： sudo ./ns3environment.sh >>result 这样系统就自动安装ns3的环境，运行的结果在result文件中，如果提示 com
创业的简单感受 aijuans 创业的简单感受
2009年11月9日我进入a公司实习，2012年4月26日，我离开a公司，开始自己的创业之旅。今天是2012年5月30日，我忽然很想谈谈自己创业一个月的感受。当初离开边锋时，我就对自己说：“自己选择的路，就是跪着也要把他走完”，我也做好了心理准备，准备迎接一次次的困难。我这次走出来，不管成败
如何经营自己的独立人脉 aoyouzi 如何经营自己的独立人脉
独立人脉不是父母、亲戚的人脉，而是自己主动投入构造的人脉圈。“放长线，钓大鱼”，先行投入才能产生后续产出。现在几乎做所有的事情都需要人脉。以银行柜员为例，需要拉储户，而其本质就是社会人脉，就是社交！很多人都说，人脉我不行，因为我爸不行、我妈不行、我姨不行、我舅不行……我谁谁谁都不行，怎么能建立人脉？我这里说的人脉，是你的独立人脉。以一个普通的银行柜员
JSP基础百合不是茶 jsp 注释隐式对象
1,JSP语句的声明 <%! 声明 %> 　　声明：这个就是提供java代码声明变量、方法等的场所。表达式 <%= 表达式 %> 　　这个相当于赋值，可以在页面上显示表达式的结果，程序代码段/小型指令　<% 程序代码片段 %> 2,JSP的注释
web.xml之session-config、mime-mapping bijian1013 java web.xml servlet session-config mime-mapping
session-config 1.定义： <session-config> <session-timeout>20</session-timeout> </session-config> 2.作用：用于定义整个WEB站点session的有效期限，单位是分钟。 mime-mapping 1.定义： <mime-m
互联网开放平台（1） Bill_chen 互联网 qq 新浪微博百度腾讯
现在各互联网公司都推出了自己的开放平台供用户创造自己的应用，互联网的开放技术欣欣向荣，自己总结如下： 1.淘宝开放平台(TOP) 网址：http://open.taobao.com/ 依赖淘宝强大的电子商务数据，将淘宝内部业务数据作为API开放出去，同时将外部ISV的应用引入进来。目前TOP的三条主线： TOP访问网站：open.taobao.com ISV后台：my.open.ta
【MongoDB学习笔记九】MongoDB索引 bit1129 mongodb
索引可以在任意列上建立索引索引的构造和使用与传统关系型数据库几乎一样,适用于Oracle的索引优化技巧也适用于Mongodb 使用索引可以加快查询,但同时会降低修改,插入等的性能内嵌文档照样可以建立使用索引测试数据 var p1 = { "name":"Jack", "age&q
JDBC常用API之外的总结白糖_ jdbc
做JAVA的人玩JDBC肯定已经很熟练了，像DriverManager、Connection、ResultSet、Statement这些基本类大家肯定很常用啦，我不赘述那些诸如注册JDBC驱动、创建连接、获取数据集的API了，在这我介绍一些写框架时常用的API，大家共同学习吧。 ResultSetMetaData获取ResultSet对象的元数据信息
apache VelocityEngine使用记录 bozch VelocityEngine
VelocityEngine是一个模板引擎，能够基于模板生成指定的文件代码。使用方法如下： VelocityEngine engine = new VelocityEngine();// 定义模板引擎 Properties properties = new Properties();// 模板引擎属
编程之美-快速找出故障机器 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; public class TheLostID { /*编程之美假设一个机器仅存储一个标号为ID的记录，假设机器总量在10亿以下且ID是小于10亿的整数，假设每份数据保存两个备份，这样就有两个机器存储了同样的数据。 1.假设在某个时间得到一个数据文件ID的列表，是
关于Java中redirect与forward的区别 chenbowen00 java servlet
在Servlet中两种实现： forward方式：request.getRequestDispatcher(“/somePage.jsp”).forward(request, response); redirect方式：response.sendRedirect(“/somePage.jsp”); forward是服务器内部重定向，程序收到请求后重新定向到另一个程序，客户机并不知
[信号与系统]人体最关键的两个信号节点 comsci 系统
如果把人体看做是一个带生物磁场的导体,那么这个导体有两个很重要的节点,第一个在头部,中医的名称叫做百汇穴, 另外一个节点在腰部,中医的名称叫做命门如果要保护自己的脑部磁场不受到外界有害信号的攻击,最简单的
oracle 存储过程执行权限 daizj oracle 存储过程权限执行者调用者
在数据库系统中存储过程是必不可少的利器，存储过程是预先编译好的为实现一个复杂功能的一段Sql语句集合。它的优点我就不多说了，说一下我碰到的问题吧。我在项目开发的过程中需要用存储过程来实现一个功能，其中涉及到判断一张表是否已经建立，没有建立就由存储过程来建立这张表。 CREATE OR REPLACE PROCEDURE TestProc IS fla
为mysql数据库建立索引 dengkane mysql 性能索引
前些时候，一位颇高级的程序员居然问我什么叫做索引，令我感到十分的惊奇，我想这绝不会是沧海一粟，因为有成千上万的开发者（可能大部分是使用MySQL的）都没有受过有关数据库的正规培训，尽管他们都为客户做过一些开发，但却对如何为数据库建立适当的索引所知较少，因此我起了写一篇相关文章的念头。最普通的情况，是为出现在where子句的字段建一个索引。为方便讲述，我们先建立一个如下的表。
学习C语言常见误区如何看懂一个程序如何掌握一个程序以及几个小题目示例 dcj3sjt126com c 算法
如果看懂一个程序，分三步 1、流程 2、每个语句的功能 3、试数如何学习一些小算法的程序尝试自己去编程解决它，大部分人都自己无法解决如果解决不了就看答案关键是把答案看懂，这个是要花很大的精力，也是我们学习的重点看懂之后尝试自己去修改程序，并且知道修改之后程序的不同输出结果的含义照着答案去敲调试错误
centos6.3安装php5.4报错 dcj3sjt126com centos6
报错内容如下: Resolving Dependencies --> Running transaction check ---> Package php54w.x86_64 0:5.4.38-1.w6 will be installed --> Processing Dependency: php54w-common(x86-64) = 5.4.38-1.w6 for
JSONP请求 flyer0126 jsonp
使用jsonp不能发起POST请求。 It is not possible to make a JSONP POST request. JSONP works by creating a <script> tag that executes Javascript from a different domain; it is not pos
Spring Security（03）——核心类简介 234390216 Authentication
核心类简介目录 1.1 Authentication 1.2 SecurityContextHolder 1.3 AuthenticationManager和AuthenticationProvider 1.3.1 &nb
在CentOS上部署JAVA服务 java--hhf java jdk centos Java服务
本文将介绍如何在CentOS上运行Java Web服务，其中将包括如何搭建JAVA运行环境、如何开启端口号、如何使得服务在命令执行窗口关闭后依旧运行第一步：卸载旧Linux自带的JDK ①查看本机JDK版本 java -version 结果如下 java version "1.6.0"
oracle、sqlserver、mysql常用函数对比[to_char、to_number、to_date] ldzyz007 oracle mysql SQL Server
oracle &n
记Protocol Oriented Programming in Swift of WWDC 2015 ningandjin protocol WWDC 2015 Swift2.0
其实最先朋友让我就这个题目写篇文章的时候，我是拒绝的，因为觉得苹果就是在炒冷饭，把已经流行了数十年的OOP中的“面向接口编程”还拿来讲，看完整个Session之后呢，虽然还是觉得在炒冷饭，但是毕竟还是加了蛋的，有些东西还是值得说说的。通常谈到面向接口编程，其主要作用是把系统设计和具体实现分离开，让系统的每个部分都可以在不影响别的部分的情况下，改变自身的具体实现。接口的设计就反映了系统
搭建 CentOS 6 服务器(15) - Keepalived、HAProxy、LVS rensanning keepalived
（一）Keepalived （1）安装 # cd /usr/local/src # wget http://www.keepalived.org/software/keepalived-1.2.15.tar.gz # tar zxvf keepalived-1.2.15.tar.gz # cd keepalived-1.2.15 # ./configure # make &a
ORACLE数据库SCN和时间的互相转换 tomcat_oracle oracle sql
SCN（System Change Number 简称 SCN）是当Oracle数据库更新后，由DBMS自动维护去累积递增的一个数字，可以理解成ORACLE数据库的时间戳，从ORACLE 10G开始，提供了函数可以实现SCN和时间进行相互转换；　　用途：在进行数据库的还原和利用数据库的闪回功能时，进行SCN和时间的转换就变的非常必要了；　　操作方法：　　1、通过dbms_f
Spring MVC 方法注解拦截器 xp9802 spring mvc
应用场景，在方法级别对本次调用进行鉴权，如api接口中有个用户唯一标示accessToken,对于有accessToken的每次请求可以在方法加一个拦截器，获得本次请求的用户，存放到request或者session域。 python中，之前在python flask中可以使用装饰器来对方法进行预处理，进行权限处理先看一个实例,使用@access_required拦截： ?

kbqa基于复旦大学的实现代码解析完成步骤 （一）

1 数据导入步骤

2. 代码的介绍

2.1 flask_robot.py

2.2 main_qa.py

你可能感兴趣的:(kbqa基于复旦大学的实现代码解析完成步骤 （一）)

kbqa基于复旦大学的实现代码解析完成步骤（一）

你可能感兴趣的:(kbqa基于复旦大学的实现代码解析完成步骤（一）)