cuguanren

基于顺承关系的事理图谱的构建

前言

一.数据获取

二.顺承事件的抽取

三.顺承关系图谱的构建

四.顺承关系图谱的展示

五.总结

前言

事理图谱中一般认为主要包含四种逻辑，本文主要讨论了基于顺承关系的事理图谱的构建过程。

一.数据获取

通过从旅游网站爬取博主的旅游经验及心得作为原始语料。该爬虫基于scrapy实现，爬取数据存储在mongo数据库中。

import scrapy
# from urllib import request
import request
import pymongo
from lxml import etree
from travelspider.items import TravelspiderItem

class TravelSpider(scrapy.Spider):
    name = 'travel'
    '''资讯采集主控函数'''
    def start_requests(self):
        for index in range(1, 505831):
            url = 'http://you.ctrip.com/travels/china110000/t3-p%s.html'%index
            response = request.urlopen(url)
            page = response.read().decode('utf-8')
            urls = self.get_urls(page)
            if urls:
                for url in urls:
                    try:
                        print(url)
                        param = {'url': url}
                        yield scrapy.Request(url=url, meta=param, callback=self.page_parser, dont_filter=True)
                    except:
                        pass

    '''获取url列表'''
    def get_urls(self, content):
        selector = etree.HTML(content)
        urls = ['http://you.ctrip.com' + i for i in selector.xpath('//a[starts-with(@class,"journal-item")]/@href')]
        return set(urls)

    '''网页解析'''
    def page_parser(self, response):
        selector = etree.HTML(response.text)
        title = selector.xpath('//title/text()')[0]
        paras = [p.xpath('string(.)').replace('\xa0', '') for p in selector.xpath('//div[@class="ctd_content"]/p') if
                 p.xpath('string(.)').replace('\xa0', '')]
        if not paras:
            paras = [p.xpath('string(.)').replace('\xa0', '') for p in
                     selector.xpath('//div[@class="ctd_content wtd_content"]/p') if
                     p.xpath('string(.)').replace('\xa0', '')]
        if not paras:
            paras = [p.xpath('string(.)').replace('\xa0', '') for p in selector.xpath('//div[@class="ctd_content"]')]
        content = "\n".join([i.replace('\r', '').replace('\n', '') for i in paras])
        item = TravelspiderItem()
        item['url'] = response.meta['url']
        item['title'] = title
        item['content'] = content
        yield item
        return

import pymongo

class TravelspiderPipeline(object):
    def __init__(self):
        conn = pymongo.MongoClient()
        self.col = conn['travel']['doc2']

    '''处理采集资讯, 存储至Mongodb数据库'''
    def process_item(self, item, spider):
        try:
            self.col.insert(dict(item))
        except (pymongo.errors.WriteError, KeyError) as err:
            raise DropItem("Duplicated Item: {}".format(item['name']))
        return item

爬取原始数据一览：

二.顺承事件的抽取

首先从原始语料中通过人为构建的顺承关系关键词模板提取出具有顺承关系的句子，对这些句子进行处理后，进行顺承关系库的构建。

具体的构建步骤如下：

1.输入原始语料

2.对原始语料进行长句的切分（认为每一个短句包含一个事件）

3.基于人为构建的顺承关系关键词模板，提取具有顺承关系的句子

4.对得到的句子再进行短句切分处理（处理括号，顿号等符号）

5.对第4步得到的句子进行谓语的提取（认为句子中的谓语是体现事件的核心词）

6.对提取出的谓语成分进行组成，构成一个由谓语成分组成的长句集合

7.以滑窗方式构建顺承关系事件对

8.将第7步中的事件对进行整合，获得具有顺承关系的事件库

9.对事件库进行筛选，去除频次过低的事件，构造最终的顺承关系库


#依存句法分析
import os
from pyltp import Segmentor, Postagger, Parser, NamedEntityRecognizer

class LtpParser():
    def __init__(self):
        LTP_DIR = "./ltp_data"
        self.segmentor = Segmentor()
        self.segmentor.load(os.path.join(LTP_DIR, "cws.model"))

        self.postagger = Postagger()
        self.postagger.load(os.path.join(LTP_DIR, "pos.model"))

        self.parser = Parser()
        self.parser.load(os.path.join(LTP_DIR, "parser.model"))

        self.recognizer = NamedEntityRecognizer()
        self.recognizer.load(os.path.join(LTP_DIR, "ner.model"))

    '''ltp基本操作'''
    def basic_parser(self, words):
        postags = list(self.postagger.postag(words))
        netags = self.recognizer.recognize(words, postags)
        return postags, netags

    '''ltp获取词性'''
    def get_postag(self, words):
        return list(self.postagger.postag(words))

    '''基于实体识别结果,整理输出实体列表'''
    def format_entity(self, words, netags, postags):
        name_entity_dist = {}
        name_entity_list = []
        place_entity_list = []
        organization_entity_list = []
        ntag_E_Nh = ""
        ntag_E_Ni = ""
        ntag_E_Ns = ""
        index = 0
        for item in zip(words, netags):
            word = item[0]
            ntag = item[1]
            if ntag[0] != "O":
                if ntag[0] == "S":
                    if ntag[-2:] == "Nh":
                        name_entity_list.append(word+'_%s ' % index)
                    elif ntag[-2:] == "Ni":
                        organization_entity_list.append(word+'_%s ' % index)
                    else:
                        place_entity_list.append(word + '_%s ' % index)
                elif ntag[0] == "B":
                    if ntag[-2:] == "Nh":
                        ntag_E_Nh = ntag_E_Nh + word + '_%s ' % index
                    elif ntag[-2:] == "Ni":
                        ntag_E_Ni = ntag_E_Ni + word + '_%s ' % index
                    else:
                        ntag_E_Ns = ntag_E_Ns + word + '_%s ' % index
                elif ntag[0] == "I":
                    if ntag[-2:] == "Nh":
                        ntag_E_Nh = ntag_E_Nh + word + '_%s ' % index
                    elif ntag[-2:] == "Ni":
                        ntag_E_Ni = ntag_E_Ni + word + '_%s ' % index
                    else:
                        ntag_E_Ns = ntag_E_Ns + word + '_%s ' % index
                else:
                    if ntag[-2:] == "Nh":
                        ntag_E_Nh = ntag_E_Nh + word + '_%s ' % index
                        name_entity_list.append(ntag_E_Nh)
                        ntag_E_Nh = ""
                    elif ntag[-2:] == "Ni":
                        ntag_E_Ni = ntag_E_Ni + word + '_%s ' % index
                        organization_entity_list.append(ntag_E_Ni)
                        ntag_E_Ni = ""
                    else:
                        ntag_E_Ns = ntag_E_Ns + word + '_%s ' % index
                        place_entity_list.append(ntag_E_Ns)
                        ntag_E_Ns = ""
            index += 1
        name_entity_dist['nhs'] = self.modify_entity(name_entity_list, words, postags, 'nh')
        name_entity_dist['nis'] = self.modify_entity(organization_entity_list, words, postags, 'ni')
        name_entity_dist['nss'] = self.modify_entity(place_entity_list,words, postags, 'ns')
        return name_entity_dist

    '''entity修正,为rebuild_wordspostags做准备'''
    def modify_entity(self, entity_list, words, postags, tag):
        entity_modify = []
        if entity_list:
            for entity in entity_list:
                entity_dict = {}
                subs = entity.split(' ')[:-1]
                start_index = subs[0].split('_')[1]
                end_index = subs[-1].split('_')[1]
                entity_dict['stat_index'] = start_index
                entity_dict['end_index'] = end_index
                if start_index == entity_dict['end_index']:
                    consist = [words[int(start_index)] + '/' + postags[int(start_index)]]
                else:
                    consist = [words[index] + '/' + postags[index] for index in range(int(start_index), int(end_index)+1)]
                entity_dict['consist'] = consist
                entity_dict['name'] = ''.join(tmp.split('_')[0] for tmp in subs) + '/' + tag
                entity_modify.append(entity_dict)
        return entity_modify

    '''基于命名实体识别,修正words,postags'''
    def rebuild_wordspostags(self, name_entity_dist, words, postags):
        pre = ' '.join([item[0] + '/' + item[1] for item in zip(words, postags)])
        post = pre
        for et, infos in name_entity_dist.items():
            if infos:
                for info in infos:
                    post = post.replace(' '.join(info['consist']), info['name'])
        post = [word for word in post.split(' ') if len(word.split('/')) == 2 and word.split('/')[0]]
        words = [tmp.split('/')[0] for tmp in post]
        postags = [tmp.split('/')[1] for tmp in post]

        return words, postags

    '''依存关系格式化'''
    def syntax_parser(self, words, postags):
        arcs = self.parser.parse(words, postags)
        words = ['Root'] + words
        postags = ['w'] + postags
        tuples = list()
        for index in range(len(words)-1):
            arc_index = arcs[index].head
            arc_relation = arcs[index].relation
            tuples.append([index+1, words[index+1], postags[index+1], words[arc_index], postags[arc_index], arc_index, arc_relation])

        return tuples

    '''为句子中的每个词语维护一个保存句法依存儿子节点的字典'''
    def build_parse_child_dict(self, words, postags, tuples):
        child_dict_list = list()
        for index, word in enumerate(words):
            child_dict = dict()
            for arc in tuples:
                if arc[3] == word:
                    if arc[-1] in child_dict:
                        child_dict[arc[-1]].append(arc)
                    else:
                        child_dict[arc[-1]] = []
                        child_dict[arc[-1]].append(arc)
            child_dict_list.append([word, postags[index], index, child_dict])

        return child_dict_list

    '''parser主函数'''
    def parser_main(self, words, postags):
        tuples = self.syntax_parser(words, postags)
        child_dict_list = self.build_parse_child_dict(words, postags, tuples)
        return tuples, child_dict_list

    '''基础语言分析'''
    def basic_process(self, sentence):
        words = list(self.segmentor.segment(sentence))
        postags, netags = self.basic_parser(words)
        name_entity_dist = self.format_entity(words, netags, postags)
        words, postags = self.rebuild_wordspostags(name_entity_dist, words, postags)
        return words, postags




import pymongo
import re
import jieba
from sentence_parser import *

class EventGraph:
    def __init__(self):
        #连接mongo客户端
        conn = pymongo.MongoClient()
        #顺承关系模板
        self.pattern = re.compile(r'(.*)(其次|然后|接着|随后|接下来)(.*)')
        #选择mongo中的数据库
        self.col = conn['travel']['doc']
        self.col_insert = conn['travel']['events']
        #依存句法分析
        self.parse_handler = LtpParser()

    '''长句切分'''
    def seg_long_sents(self, content):
        return [sentence for sentence in re.split(r'[？?！!。；;：:\n\r….·]', content.replace(' ','').replace('\u3000','')) if len(sentence) > 5]

    '''短句切分'''
    def process_subsent(self, content):
        return [s for s in re.split(r'[,、，和与及且跟（）~▲．]', content) if len(s)>1]

    '''处理数据库中的文本'''
    def process_doc(self):
        count = 0
        #find返回数据库中所有数据
        for item in self.col.find():
            content = item['content']
            events_all = self.collect_event(content)
            if events_all:
                data = {}
                data['events'] = events_all
                self.col_insert.insert(data)
            else:
                continue

    '''统计收集EVENT'''
    def collect_event(self, content):
        events_all = []
        sents= self.seg_long_sents(content)
        for sent in sents:
            events = self.event_extract(sent)
            if events:
                events_all.append(events)
        return events_all

    '''顺承事件抽取'''
    def event_extract(self, sent):
        result = self.pattern.findall(sent)
        if result:
            event_seqs = []
            for tmp in result:
                pre = tmp[0]
                post = tmp[2]
                pre_sents = self.process_subsent(pre)
                post_sents = self.process_subsent(post)
                if pre_sents and post_sents:
                    event_seqs += pre_sents
                    event_seqs += post_sents
                else:
                    continue
            '''对事件进行结构化'''
            if event_seqs:
                events = self.extract_phrase(event_seqs)
                return events
            else:
                pass
        return []


    '''将一个长句中的句子进行分解，提取出其中的vob短语'''
    def extract_phrase(self, event_seqs):
        events = []
        for event in event_seqs:
            vobs = self.vob_exract(event)
            if vobs:
                events += vobs
        return events

    '''提取VOB关系'''
    def vob_exract(self, content):
        vobs = []
        words = list(jieba.cut(content))
        if len(words) >= 300:
            return []
        postags = self.parse_handler.get_postag(words)
        tuples, child_dict_list = self.parse_handler.parser_main(words, postags)
        for tuple in tuples:
            rel = tuple[-1]
            pos_verb= tuple[4][0]
            pos_object = tuple[2][0]
            if rel == 'VOB' and (pos_verb, pos_object) in [('v', 'n'), ('v', 'i')]:
                phrase = ''.join([tuple[3], '#', tuple[1]])
                vobs.append(phrase)
        return vobs

handler = EventGraph()
handler.process_doc()

三.顺承关系图谱的构建

利用JS中的VIS插件实现顺承关系图谱在网页上的构建和呈现。




'''构造显示图谱'''
class CreatePage:
    def __init__(self):
        self.base = '''
    
    
      
      
      
    
    

    
    
    
    
    '''

    '''生成数据'''
    def collect_data(self, nodes, edges):
        node_dict = {node:index for index, node in enumerate(nodes)}
        data_nodes= []
        data_edges = []
        for node, id in node_dict.items():
            data = {}
            data["group"] = 'Event'
            data["id"] = id
            data["label"] = node
            data_nodes.append(data)

        for edge in edges:
            data = {}
            data['from'] = node_dict.get(edge[0])
            data['label'] = '顺承'
            data['to'] = node_dict.get(edge[1])
            data_edges.append(data)
        return data_nodes, data_edges

    '''生成html文件'''
    def create_html(self, data_nodes, data_edges):
        f = open('travel_event_graph.html', 'w+' ,encoding='utf-8')
        html = self.base.replace('data_nodes', str(data_nodes)).replace('data_edges', str(data_edges))
        f.write(html)
        f.close()

'''顺承关系图谱'''
class EventGraph:
    def __init__(self):
        self.event_path = './seq_events.txt'

    '''统计事件频次'''
    def collect_events(self):
        event_dict = {}
        node_dict = {}
        for line in open('seq_events.txt' ,encoding='utf-8'):
            event = line.strip()
            if not event:
                continue
            nodes = event.split('->')
            for node in nodes:
                if node not in node_dict:
                    node_dict[node] = 1
                else:
                    node_dict[node] += 1
            if event not in event_dict:
                event_dict[event] = 1
            else:
                event_dict[event] += 1
        return event_dict, node_dict

    '''过滤低频事件,构建事件图谱'''
    def filter_events(self, event_dict, node_dict):
        edges = []
        nodes = []
        for event in sorted(event_dict.items(), key=lambda asd: asd[1], reverse=True)[:500]:
            e1 = event[0].split('->')[0]
            e2 = event[0].split('->')[1]
            if e1 in node_dict and e2 in node_dict:
                nodes.append(e1)
                nodes.append(e2)
                edges.append([e1, e2])
            else:
                continue
        return edges, nodes

    '''调用VIS插件,进行事件图谱展示'''
    def show_graph(self, edges, nodes):
        handler = CreatePage()
        data_nodes, data_edges = handler.collect_data(nodes, edges)
        handler.create_html(data_nodes, data_edges)


handler = EventGraph()
event_dict, node_dict = handler.collect_events()
edges, nodes = handler.filter_events(event_dict, node_dict)
handler.show_graph(edges, nodes)

四.顺承关系图谱的展示

展示如下：

五.总结

1.本文中提到对于从原始语料中提取具有顺承关系的句子是采用的人为构建的关键词模板，但考虑到关键词由人为确定，且具有顺承关系的句子不一定含有这些标志词，因此基于这种方法的提取过程并不能称得上“精准”，后续可以通过人为构造神经网络训练好模型，对原始语料进行文本分类完成提取。

2.本文认为句子的谓语成分主要由动宾，也就是依存关系中的VOB关系体现，因此在谓语成分的识别中，只对VOB关系进行了识别，显然这种方法既会遗漏一定数量的谓语成分，也会引入一些非谓语成分，有待后续对该过程的完善。

MySQL之show profile相关总结
MySQL中的SHOWPROFILE性能分析详解在数据库优化过程中，SHOWPROFILE是MySQL提供的一个强大工具，用于分析查询的执行性能。通过展示查询在不同阶段的执行时间和资源消耗，开发人员可以精准定位性能瓶颈，从而进行有效优化。本文将详细介绍如何使用SHOWPROFILE进行性能分析，并结合实例解释其应用方法。1.SHOWPROFILE概述SHOWPROFILE用于分析单条查询语句的执行
数据库：mysqldump用法详解
mysqldump用法详解：MySQL数据库备份工具mysqldump是MySQL提供的一款用于备份和恢复数据库的命令行工具，能够将数据库的数据和结构导出为SQL文件，便于后续的数据迁移、恢复或灾难恢复等操作。通过合理使用mysqldump，可以灵活地备份数据库的不同部分，并保证数据的安全性。下面将对mysqldump的常用命令进行详细说明。1.备份整个数据库备份整个数据库时，只需使用以下命令：m
python程序设计期末大作业,python大作业代码100行 chatgpt001 人工智能
大家好，小编来为大家解答以下问题，python期末大作业代码200行带批注，python程序设计期末大作业，今天让我们一起来看看吧！#题目：利用Python实现一个计算器，可以计算小数复数等importredefcalculator(string):#去除括号函数defget_grouping(string):flag=Falseret=re.findall('$([^()]+)$',stri
解决MySQL与Redis缓存一致性的问题
解决MySQL与Redis缓存一致性问题的策略在分布式系统中，MySQL数据库与Redis缓存的配合是常见的设计模式，尤其在高并发场景下，通过缓存来减轻数据库压力。然而，缓存和数据库的同步问题常常成为瓶颈，主要体现在缓存数据与数据库数据的一致性问题。为了有效解决这一问题，我们可以采取以下几种策略：1.缓存穿透缓存穿透是指查询的数据在缓存和数据库中都不存在的情况。为了避免恶意请求导致数据库压力过大，
PolarDB分布式版V2.0：安全可靠的集中分布式一体化数据库管理软件 mysql数据库sql
阿里云PolarDB数据库管理软件（分布式版）V2.0（简称PolarDB分布式版V2.0）采用Shared-nothing架构，兼容MySQL开源生态构建产品竞争力，支持集中式和分布式一体化形态，具备金融级数据高可用、高可靠和分布式水平扩展能力。目前有以下产品方案供用户选择：PolarDB分布式版V2.0（公有云版本）立即查看方案PolarDB分布式版V2.0（混合云版本）立即咨询PolarDB
华为OD机试E卷 - 单词接龙（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为od java python javascript c++C
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述单词接龙的规则是：可用于接龙的单词首字母必须要前一个单词的尾字母相同；当存在多个首字母相同的单词时，取长度最长的单词，如果长度也相等，则取字典序最小的单词；已经参与接龙的单词不能重复使用。现给定一组全部由小写字母组成单词数组，并指定其中的一个单词作为起始单词，进行单词接龙，请输出最长的单词串，单词串是单词拼接而成，中间
Java 大视界 -- Java 大数据平台迁移与升级策略：平滑过渡的方法（十四）青云交大数据新视界 Java 大视界大数据平台迁移升级大数据平台升级平滑过渡数据迁移应用程序适配性能测试 java
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
Java 大视界 -- Java 大数据测试框架与实践：确保数据处理质量（十二）青云交大数据新视界 Java 大视界大数据大数据测试框架 Java 大数据测试测试框架数据处理质量数据清洗数据采集 java
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
Java 大视界 -- Java 分布式协调服务：Zookeeper 在大数据中的应用（十一）青云交 Java 大视界大数据新视界大数据 Zookeeper 分布式协调数据存储应用场景性能优化节点操作 java
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
Java 大视界 -- Java 与大数据存储优化：HBase 与 Cassandra 应用（十）青云交大数据新视界 #HBase 之道 Java 大视界大数据 hbase Cassandra 大数据存储优化性能优化数据处理社交网络 java
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
50个 Java 最佳实践小技巧
Java是一种广泛使用的面向对象编程语言，凭借其平台无关性、丰富的类库和强大的功能，已经成为了软件开发中的主流语言之一。为了提高代码质量、性能和可维护性，开发者在写Java程序时可以遵循一些最佳实践。以下是50个Java最佳实践小技巧，帮助开发者提高代码质量，写出更高效、可读、可维护的Java程序。1.使用合适的命名规则类名：采用大驼峰命名法（PascalCase），例如UserAccount。方
XXL-TOOL v1.3.2 发布 | Java工具类库后端javaspring
ReleaseNotes1、【新增】新增多个工具类模块，包括：Md5Tool、HexTool、HttpTool等；2、【完善】工具类单测完善；3、【升级】升级依赖版本，如freemarker、junit…等。简介XXL-TOOL是一个Java工具类库，致力于让Java开发更高效。包含“集合、字符串、缓存、并发、Excel、Emoji、Response、Pipeline……”等数十个模块。文档地址中
Java 大视界 -- Java 开发 Spark 应用：RDD 操作与数据转换（四）青云交大数据新视界 Java 大视界 Spark RDD 数据转换大数据数据分区性能优化社交网络 java
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
Linux 下 kill 孙子进程（qbit）
qbit在使用Python的FastAPI框架，在Python脚本中用os.system调用了uvicorn启动程序，调用链条大致如下python3main.py#进程1--shpython3uvicorn#进程2--python3uvicorn#进程3qbit发现直接kill进程1或进程2，并不能终止进程3。即kill某个进程，并不一定能终止该进程的子进程和孙子进程。于是通过找到孙子进程的方式来
玩转前端正则表达式正则表达式前端后端
文章首发本人博客，由于格式和图片解析问题，可以前往阅读原文JavaScript中的正则是Perl的大子集，但Perl内部的一些表达式却没有继承正则表达式是用于匹配字符串中字符组合的模式(可参考MDN教程)扫码关注公粽号，查看更多优质文章一个例子使用正则将一个数字以科学计数法进行表示，如：//10000000=>10,000,000现在用一个正则来解决conststr='10000000'const
WSL ubuntu 20.04安装python3
在WSLUbuntu20.04上安装Python3的详细步骤✨在WSL（WindowsSubsystemforLinux）的Ubuntu20.04环境中安装Python3，可以按照以下步骤进行。每一步都提供了详细的解释，确保您能够顺利完成安装过程。1.打开WSL终端️首先，启动您的WSLUbuntu20.04终端。这可以通过在Windows搜索栏中输入“WSL”或“Ubuntu”来找到并打开。2.
理解静态类型：为什么选择TypeScript？
本文我们要讨论一个非常关键的概念——静态类型，以及它是如何帮助我们更好地编写代码的，特别是为什么在开发中选择TypeScript而不是传统的JavaScript。我们可能已经听说过静态类型这个词，但是它到底是什么意思？它对我们编写代码有哪些帮助？今天我们就带你一起深入理解静态类型，探讨TypeScript的优势。4.1什么是静态类型？首先，让我们明确一下静态类型这个概念。简单来说，静态类型是指变量
深度剖析 JavaScript 变量提升与暂时性死区：原理、实战与避坑指南
在JavaScript中，变量提升与暂时性死区影响着着程序的运行逻辑、性能表现以及可维护性。接下来将从底层原理、实际场景案例以及最佳实践全方位展开深度剖析。变量提升：JavaScript引擎背后的“隐形重构”JavaScript在执行代码前，引擎会率先开启编译流程，其中变量提升堪称关键一环。使用var关键字声明的变量以及函数声明，都会被自动“提升”至所在作用域的顶部。这一过程并非物理层面挪动代码，
Redis内存设置、缓存淘汰策略、LRU 算法与手写实现后端javaredis算法
1.生产环境中Redis内存设置思路？在生产环境中，Redis内存设置通常取决于以下因素：数据量大小：Redis数据库中存储的数据量大小，尤其是缓存数据。需要根据实际的数据量来设置内存。服务器内存大小：Redis是内存数据库，通常会根据可用的内存量来配置Redis。如果内存设置过大，可能会导致系统其他应用程序的内存不足。Redis的使用场景：如作为缓存使用时，通常只需要配置较小的内存限制；作为持久
大数据新视界 --大数据大厂之 Cassandra 分布式数据库：高可用数据存储的新选择青云交大数据新视界 Cassandra 数据库 Cassandra 分布式数据库高可用可扩展快速读写金融数据物联网社交媒体性能优化新兴技术
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
SSL context 中设置TLS版本无效的原因和有效解决办法 ecmascript-6
如果在设置SSL/TLS上下文时，指定的TLS版本无效，可能有多种原因。这里列出了一些常见的问题及其解决方法：1.TLS版本设置方法不正确在很多编程语言和框架中，设置TLS版本的方法各不相同。如果你没有正确配置或选择正确的API，TLS版本的设置可能不会生效。确保你按照相应的文档或官方指导进行配置。例如，在Python中，使用ssl.create_default_context()设置TLS版本：
NodeJS项目架构设计，看这一篇就足够了！
NodeJS项目架构设计，看这一篇就足够了！前言大家好，我是倔强青铜三。我是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。1.整洁架构简介CleanArchitecture（整洁架构）由RobertC.Martin（UncleBob）提出，它强调应用程序内部关注点的分离。该架构提倡业务逻辑应与任何框架、数据库或外部
教你玩转JavaScript元编程
教你玩转JavaScript元编程大家好，我是倔强青铜三。我是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。JavaScript元编程：深度解析Proxy、Reflect和对象属性控制JavaScript元编程超越了典型编程的范畴，为开发人员提供了一套创建高度灵活、高效和响应式代码库的工具。让我们深入探讨Proxy
基于jQuery / 原生JS两种方式流畅实现半屏悬浮窗池泽123 js jQuery javascript jquery 前端
本篇分别用jQuery和原生两种方式实现悬浮窗功能和样式的切换，兼容IE完成样式示例使用技术栈：jquery、javaScript、HTML/CSS一、基础版面悬浮窗可以有很多样式，但基础结构可以大致分为触发按钮、遮罩层、内容三部分。触发按钮通常设置在屏幕边缘，我这里举例一个右下的位置展示；联系我们/*悬浮窗触发按钮样式*/.Suspended_window_box{width:150px;hei
[Python基础](5) Python列表( list )详细解读 apk___ Python python 开发语言 list
作者制作不易，关注、点赞、收藏一下吧!目录1.列表的基本概念2.一维列表2.1.创建一维列表与访问元素2.2.在一维列表中修改元素、添加元素、删除元素2.3.列表排序2.4.一维列表遍历重点！2.5.列表切片3.二维列表3.1.创建二维列表和访问元素3.2.在二维数组中修改元素、添加元素、删除元素3.3.二维列表遍历3.4.二维列表切片4.拓展NumPy数组1.列表的基本概念在Python中，列表
JavaScript防抖与节流的运用 Enti7c javascript 开发语言 ecmascript
防抖（Debounce）概念：防抖是指在事件被触发n秒后再执行回调，如果在这n秒内又被触发，则重新计时。防抖的主要目的是将多次连续触发的事件合并为一次执行，适用于例如输入框输入搜索内容时，避免频繁发送请求，只在用户停止输入一段时间后才发送请求。实现思路：创建一个定时器。当事件触发时，清除之前的定时器。重新创建一个新的定时器，在指定延迟时间后执行回调函数。functiondebounce(func,
Java中的内存管理：垃圾回收机制详解
在Java开发中，内存管理是一个至关重要的话题。Java通过其内建的垃圾回收机制（GarbageCollection，GC）来管理内存，自动处理对象的内存分配和释放，从而减轻了开发者的负担。然而，尽管Java的垃圾回收机制极大地提高了程序的稳定性和开发效率，但它的背后却是一个复杂的机制，理解其工作原理对于优化性能和调试内存相关问题至关重要。本文将专注于Java的垃圾回收机制，深入分析它是如何运作的
Java基础面试：Java中的方法
Java中的方法什么是方法方法是Java中的一段可重用的代码块，用于执行特定的任务，是程序中的最小执行单元。参数：方法可以接受一个或多个参数，这些参数是传递给方法的值，用于方法内部的逻辑运算。返回值：方法可以返回一个值，叫做方法的返回值，返回值的类型在方法声明中指定，无返回值使用关键字void声明。方法的声明：修饰符返回值方法名（参数数据类型参数名称）{方法体}方法有哪些种构造方法：构造方法是一种
【JAVA】接口和抽象类有什么区别？
Java中接口（Interface）与抽象类（AbstractClass）的区别详解️在Java编程中，接口和抽象类是实现抽象化的重要工具。它们在设计和实现上有诸多区别，理解这些差异对于编写高效、可维护的代码至关重要。本文将从多个方面详细对比接口和抽象类，帮助开发者在实际项目中做出最佳选择。1.继承关系抽象类单继承：一个类只能继承一个抽象类。用途：用于表达类之间的“is-a”关系，构建类的层次结构
Python | 经典类与新式类，静态方法、类方法与实例方法详解！ chaochao️ Python python 面向对象编程新式类经典类
创作不易，来了的客官点点关注，收藏，订阅一键三连❤前言“人生苦短，我用python”，我是一个即将毕业的大学生，超超。如果你也爱python，不妨跟着萌新超超一起学习python，拿下python，一起加油，共同努力，拿到理想offer！系列文章目录Python——什么是面向对象？类的定义、self和继承详解Python——函数大全及使用方法！lambda？global?Python——流程控制，
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S

基于顺承关系的事理图谱的构建

前言

一.数据获取

二.顺承事件的抽取

三.顺承关系图谱的构建

四.顺承关系图谱的展示

五.总结

你可能感兴趣的:(数据库,java,开发语言,python,知识图谱)