__盛夏光年__

知识图谱（七）——事件抽取

文章目录

一、任务概述
- 1、事件的定义
- 2、事件抽取的定义
- 3、相关评测和语料资源
二、限定域事件抽取
- 1、基于模式匹配的事件抽取方法
- - 1）有监督的事件模式匹配
  - 2）弱监督的事件模式匹配
  - 3）优缺点：
- 2、基于机器学习的事件抽取方法
- - 1）有监督事件抽取方法
  - - （1）基于特征工程的方法
    - （2）基于神经网络的方法
  - 2）弱监督事件抽取方法
  - - （1）基于 Bootstrapping 的事件抽取
    - （2）基于Distant Supervison的事件抽取
三、开放域事件抽取
- 1、基于内容特征的事件抽取方法
- 2、基于异常检测的事件抽取方法
四、事件关系抽取
- 1、事件共指关系
- 2、事件因果关系
- 3、子事件关系
- 4、事件时序关系

一、任务概述

1、事件的定义

没有统一的定义，在知识图谱领域，自动内容抽取（ACE）评测会议中对事件的定义如下：

事件是发生在某个特定的时间点或时间段、某个特定的地域范围内，由一个或多个角色参与的一个或多个动作组成的事情或状态的改变。

2、事件抽取的定义

研究：如何从描述事件信息的文本中抽取出用户感兴趣的事件信息并以结构化的形式呈现出来。重点在从非结构化文本中进行事件抽取。

过程：首先从非结构文本中识别出事件及其类型，然后抽取出该事件所涉及的事件元素。

3、相关评测和语料资源

MUC会议（Message Understanding Conference，消息理解会议）
TDT会议（Topic Detection and Tracking，话题识别与跟踪）：以事件的形式组织新闻事件，对其进行研究与评测。
- 话题（Topic）是TDT中的最基本的概念，一个话题是指由某种原因引起的，发生在特定时间点或时间段，在某个地域范围内，并可能导致某些必然结果的一个事件。
- 事件 vs 话题：起初含义相同，后来话题含义为包括一个核心事件以及与之直接相关的事件的集合。
- TDT的五个子任务：新闻报道切分、新事件识别、报道关系识别、话题识别、话题跟踪。
ACE会议（Automatic Context Extraction，自动内容抽取）：ACE的事件是预定义类型的、句子级的事件，语料中标注事件的类型、触发词、事件元素及其在事件中扮演的角色。
- 使用最广泛：ACE2005事件语料数据集
- ACE中将事件定义为一个动作的发生或状态的改变。事件包含事件触发词和事件元素两部分。ACE中定义8大类23小类事件类型。
- ACE语料的标注格式采用XML方式，每个事件都标注了事件触发词、事件类型、事件子类型、事件元素和事件元素扮演的角色信息，此外还有四种属性：
  - 事件的极性（polarity）:表示肯定的事件或表示否定的事件
  - 事件的时态（tense）：过去发生的事件、正在发生的事件、将来即将发生的事件，以及无法确定时态的事件
  - 事件的指属（genericity）:特指（specific）事件和泛指（generic）事件
  - 事件的形态（modality）：语气非常肯定（asserted）的事件和信念事件（believed event）、假设事件（hypothetical event）等
KBP会议（Knowledge Base Population）：研究从自然语言文本中抽取信息，并且链接到现有知识库的相关技术。
BioNLP会议：从生物医学文献中抽取出事件触发词、事件类型和事件元素等生物事件信息。
TimeBank语料库：面向问答系统的时间和事件的识别会议
等等

二、限定域事件抽取

按照事件类别方式不同，可分为：

限定域事件抽取：在抽取之前，预先定义好目标事件的类别及每种类型的具体结构（包含哪些事件元素）。
- 根据抽取方法的不同，可分为：基于模式匹配的方法、基于机器学习的方法
开放域事件抽取

1、基于模式匹配的事件抽取方法

基于模式匹配的事件抽取方法：对某种类别事件的识别和抽取是在某一些模式的指导下进行的，匹配的过程就是事件识别和事件抽取的过程。

过程：模式获取和模式匹配。模式准确性尤为重要。

1）有监督的事件模式匹配

模式的获取完全基于人工标注的语料，学习效果高度依赖人工标注效果。

步骤：

语料的人工标注：需人工预先标注大量的语料。
模式的学习：通过各种学习模型方法得到相应的抽取模式。
模式的匹配：利用学习得到的模式与待抽取文档进行匹配，进而完成事件抽取。

典型系统：AutoSlog、PALKA模式抽取系统

2）弱监督的事件模式匹配

不需要对语料完全标注，只需要人工对语料进行一定的预分类或者制定少量种子模式，由机器根据预分类语料或者种子模式自动学习事件模式。

步骤：

语料的人工预分类或种子模式的制定
模式的学习：利用机器根据预分类语料或者种子模式自动学习事件模式。

典型系统：AutoSlog-TS系统、ExDisco系统、GenPAM系统、NEXUS系统

3）优缺点：

在特定领域中性能较好。
然而，依赖于文本的具体形式，获取模板的过程费时费力，具有很强的专业性，而且制定的模式很难覆盖所有的事件类型，当语料发生变化时，需要重新获取模式。
可移植性不强，召回率低。

2、基于机器学习的事件抽取方法

根据所需监督数据不同，可分为：有监督事件抽取方法和弱监督事件抽取方法

1）有监督事件抽取方法

步骤：

训练样本的表示。eg：基于特征向量方法中特征向量的抽取与构建
选择分类器并训练模型，优化参数。
未标注数据中事件抽取。

（1）基于特征工程的方法

需显式地将事件实例 =》特征向量（如何提取具有区分性的特征）

步骤：

特征抽取：提取词汇、句法和语义等特征并收集起来，产生描述事件实例的各种局部和全局特征。
模型训练：训练分类器
事件抽取：用分类器对非结构化文本进行分类，进而完成事件抽取

典型方法：2006年，Ahn提出的一个两阶段的多分类问题。
事件触发词的特征：

词汇特征：词汇，词汇小写形式，词干，词性标签，相邻词特征
句子级特征：依存路径，依存词汇，候选词在依存树的深度，依存词汇的词性标签，句子中的实体类型，最近距离范围内的实体类型等
外部知识：在wordnet中的同义词id

事件元素分类的特征：

触发词特征
词汇特征
句子级特征

不足：

过程过分依赖词性标注器、句法分析器等传统的NLP工具 ==》造成累计误差
很多语言没有NLP工具

（2）基于神经网络的方法

步骤：

特征表示：将纯文本表示为分布式特征信息，eg：词表示为词向量。
神经网络的构建与高层特征学习：涉及搭建神经网络模型并基于基本特征自动捕获高层特征。
模型训练：利用标注数据，优化网络参数，训练网络模型。
模型分类：利用训练的模型对新样本进行分类，进而完成事件抽取。

典型方法：2015，动态多池化卷积神经模型，该方法将事件抽取当作一个二阶段的多分类问题，第一阶段为触发词抽取，第二阶段为元素抽取（更为复杂，以此为例进行说明）。

词向量学习：通过非监督信息得到每个词的向量化表示。
词汇级特征表示：利用词向量捕获词汇级语义。
- 将候选词（候选触发词和候选事件元素）的词向量和候选词上下文的词向量拼接起来作为事件元素抽取段的词汇级表示。
句子级特征表示：利用动态多池化CNN学习句子内部的组合语义特征。
- 为了处理一句话有多个事件的情况，利用动态多池化技术，根据触发词和候选元素动态地捕获一个句子中的事件信息。
事件元素分类：利用Softmax分类器为每个候选事件元素计算扮演不同角色的概率。

模型训练：定义训练的目标函数，然后利用随机梯度下降等训练方法优化模型参数，进而训练整个网络的参数。为防止过拟合，可使用Adadelta等更新规则。

其他方法：联合循环神经网络进行事件抽取

2）弱监督事件抽取方法

有监督方法：人工标记数据耗时费力、一致性差，尤其在面向海量异构的网络数据时；
无监督方法：得到的事件信息没有规范的语义标签（事件类别、角色名称等）。
弱监督方法：为了得到规范的语义标签，需要给出具有规范语义标签的标注训练数据，与有监督方法不同，获得大规模标注语料（关键）的途径主要有两种：
- 利用 Bootstrapping 方法扩展语料。首先人工标注部分数据，然后自动扩展数据规模。
- 利用 Distant Supervison 方法自动生成大规模语料。主要利用结构化的事件知识回标非结构化文本，获取大规模训练样本后完成事件的抽取。

（1）基于 Bootstrapping 的事件抽取

基本框架：

核心思想：首先利用小部分标记数据训练抽取模型，然后利用训练好的模型对未标注数据进行分类，从中选取高置信度的结果加入到训练数据中，再次训练分类器，上述过程反复迭代进而完成标注数据的自动扩充和事件的自动抽取。

现状：基于弱监督的事件抽取方法还处于起步阶段，迫切需要自动生成大规模的、高质量的标注数据法人方法来提升性能。

（2）基于Distant Supervison的事件抽取

基本框架：

核心思想：首先提出回标的假设规则（即 Distant Supervison），然后利用结构化事件知识去非结构化文本中进行回标，将回标的文本当作标注样本，然后利用标注的样本训练模型，进而完成事件的抽取。

代表方法：2017年，Chen提出的事件语料的大规模自动生成方法，其框架如下图所示。

核心元素检测：自动区分每个类型的事件中元素的重要程度并找到每个事件类型的核心事件元素。
事件触发词检测：利用核心元素回标可能包含相应事件实例的句子并检测其中的事件触发词。
事件触发词过滤和扩展：用语言学知识FrameNet过滤上一模块中发现的噪声触发词，并扩展确实的触发词，进而提高触发词的正确率和召回率；
标注数据的自动生成：利用本文提出的远距离监督方法自动从非结构化文本中标注事件信息。

不足：该方法无法自动生成篇章级标注数据并进行篇章级事件抽取（具有重要价值和现实意义）。

三、开放域事件抽取

开放域事件抽取主要基于无监督的方法，该方法主要基于分布假设（Distributional Hypothesis）理论，将候选词的上下文作为表征事件语义的特征。按照所用方法的不同，可分为 基于内容特征的事件抽取方法 和 基于异常检测的事件抽取方法。

无监督事件抽取的关键：寻找更好的文本表示方式、文本相似度衡量指标

难以应用到其他NLP任务中。

1、基于内容特征的事件抽取方法

步骤：

文本表示：对表示事件的句子、段落或者文档进行预处理，并表示为同一的特征形式，为后面的模块做准备。
事件聚类与新事件发现：基本文本表示，利用无监督方法将同类事件表示聚类，并发现新事件。

代表方法：1998年，Yang等提出 组平均聚类方法。

文本表示：对每篇文档首先进行句子划分和去停用词等预处理操作，然后对篇章中的词计算TF-IDF并据此进行排序，利用 Top K 个词的 TF-IDF 值组成的特征向量代表整个篇幅。
事件聚类与新事件发现：组平均聚类方法（Group Average Clustering）
- ① 将待聚类文本按时间顺序排序，把每篇文档都当作一个类。（原因：数据观察得出，新闻对事件的报告在时间上具有时效性（一般周期为两个月）和集中性）
- ② 将现有的结果划分成连续但不重叠的固定个数的部分。
- ③ 对每个部分利用聚类算法进行聚类，将底层的类聚类为高层的类。知道每个部分聚类为指定的规模。
- ④ 取消部分的边界限制，对所有的类进行聚类，并更新第②步中的划分。
- ⑤ 重复第②~⑤步，直到所有的类别到达指定的规模。

不足：可以发现新的事件，但其发现的新事件往往是相似模板的聚类，难以规则化，很难被用于构建知识库，需要将其同现有知识库的事件框架进行对齐，或者通过人工方式来给每个聚类事件簇赋予语义信息。

2、基于异常检测的事件抽取方法

基本假设：某个重大事件的发生会导致新闻媒体或社交网络上涌现出大量的相关报道或讨论；反之关于某一主题的报道或讨论突然增多则暗示着某一重大事件的发生。

通用方法：对文档整体的异常情况进行分析或对每个词频进行异常检测

四、事件关系抽取

核心任务：以事件为基本语义单元，实现事件逻辑关系的深层检测和抽取。

现状：目前没有清晰统一的框架和定义，比较公认的有事件共指关系、事件因果关系、子事件关系和事件时序关系等。

1、事件共指关系

定义：当两个事件指称项指向真实世界的同一个目标事件，则认为这两个事件具有共指关系。有助于在多源数据中发现相同事件，对事件信息的不全和验证有积极作用。

eg：“2014年10月，联想集团正式完成对摩托罗拉移动的收购” 和 “联想集团以29.1亿美元的价格收购了摩托罗拉移动”描述的是同一个事件。

核心问题：计算两个指称项之间的相似度，一般会利用两类特征：

事件指称的文本语义相似度；
事件类型和事件元素之间的相似度

数据集：ECB（Event Coreference Bank）

2、事件因果关系

定义：因果关系反映了事件间先后相继、由因及果的一种关系。对文本的深层语义理解有重要意义，有助于掌握事件演变的过程，从而为决策者提供重要的决策信息。

难点：

因果关系错综复杂，一个事件的发生可能包含多个原因，须同时考虑多个因果事件间的传递作用。
- eg：“睡前喝咖啡导致失眠”，“失眠导致上班迟到”，“上班迟到导致被老板批评”是一个因果关系链。
在某些情况下，单独从文本中很难抽取出因果关系，需要背景知识的辅助推断。
- eg：“近日国家公布消息称在未来五年将继续加大对新能源汽车行业的扶持力度”和“今天比亚迪汽车的国家开盘10分钟就涨停了”。借助背景知识：“比亚迪是一家中国新能源汽车制造厂商。”，就可以推断出两个事件是因果关系。

3、子事件关系

定义：子事件关系反映了事件之间的粒度和包含关系，例如：“地震事件”一般包含“伤亡”、“救援”、“捐款”和“重建”等子事件。eg：连续报道、专题报道。

典型方法：基于先验的增量子事件学习模型、基于概率的贝叶斯网络结构学习方法、端到端的上下文相关的层次LSTM模型。

4、事件时序关系

定义：事件时序关系是指在时间上的先后顺序。可以辅助其他事件关系的发现。

目前，绝大多数事件时序关系的研究都集中在英文文本上，最广泛应用的语料是TimeBank；主流方法是基于机器学习方法的事件时序关系抽取，该类方法一般将事件时序关系识别转化为一个多分类问题。

语料库：

TimeBank的标注遵循TimeML标注体系，TimeML是一种标识新闻语料中事件、事件以及它们之间关系的标注体系，它将时序关系分为13种。eg：之前（Before）、之后（After）、包含（Includes）、被包含（Is Included）和同时（SImultinous）等。
TimeEval将时序关系分为之前（Before）、之后（After）和重叠（Overlap）三类。

《八角笼中》经典台词浪漫樱花_eebf
这两天，被电影《八角笼中》刷屏了。这部取材于真实事件的电影，这部现实版的“我命由我不由天”，截至7月15日，票房已突破13亿元。电影《八角笼中》将焦点对准了大山里的贫困儿童，电影讲述了向腾辉（王宝强饰）倾注心血，想通过练习格斗把当地无人照料的孩子培养成才，这让生活本没有出路的孩子们看到了一丝通向未来的曙光。该电影的现实主义叙事手法，让我们从喜剧的外表中体会到了悲剧的核心。电影《八角笼中》中的台词，
Python 协程 & 异步编程(asyncio) GeekAGI python 开发语言
文章目录协程&异步编程(asyncio)1.协程的实现1.1greenlet1.2yield1.3asyncio1.4async&awit1.5小结2.协程的意义2.1爬虫案例2.2小结3.异步编程3.1事件循环3.2协程和异步编程3.2.1基本应用3.2.2await3.2.3Task对象3.2.4asyncio.Future对象3.2.5futures.Future对象3.2.6异步迭代器3.
python asyncio模型事件循环 __xa__ py 异步异步基础模型事件循环 asyncio
异步建立在事件循环上.简单来说事件循环:1.把要执行的函数放入队列2.取出函数,执行3.看看还要不要继续放入此函数4.继续第一步一个简单的例子说明:"""1.yield挂起当前函数.2.使用调度器循环3.使用next唤醒此函数继续执行"""deff1():foriinrange(3):print('f1%d'%i)yielddeff2():foriinrange(5):print('f2%d'%i
简单理解 Python EventLoop 事件循环 Python_P叔 python 开发语言数据库
简介在python3中，加入了asyncio模块，来实现协程，其中一个很重要的概念是事件循环，整个异步流程都是事件循环推动的。下面自己实现一个相对简单的EventLoop，了解一下事件循环是如何进行运转的。事件循环下面看一下整个流程的实现过程将以下代码写入spider_event_loop.py文件：#spider_event_loop.pyimporttimeimportosimportsock
中篇小说（一）狐狸的一家37下千秋大梦
“无需多想，不管千是谁，他都是我们的孩子，他的奇特也无须过多关注，只要我们能和和睦睦地生活在一起，我就满足了，其余的顺其自然吧！无望，无欲，从从容容，平平淡淡才是真。”月心细入微，察觉到苏波光粼粼的内心，刹那间回忆过去，忆苦思甜如是说。千陡然一惊，他发觉自己越来越走偏了，无关他人，是自己沉迷于事件本身，没有跳脱出来。苏一时满脸羞愧，久久不能言语。回来说一下千。千挺纳闷，不过没事，婵不过来找他玩，他
初始Java中的继承七十二小時 Java SE java 开发语言
为什么需要继承Java中使用类对现实世界中实体来进行描述，类经过实例化之后的产物对象，则可以用来表示现实中的实体，但是现实世界错综复杂，事物之间可能会存在一些关联，那在设计程序是就需要考虑。比如：狗和猫，它们都是动物。那能否将这些共性抽取呢？面向对象思想中提出了继承的概念，专门用来进行共性抽取，实现代码复用。继承概念继承(inheritance)机制：是面向对象程序设计使代码可以复用的最重要的手段
Python 事件循环与 asyncio 的底层实现代码界的灵魂舞者 python java 数据库
```htmlPython事件循环与asyncio的底层实现Python事件循环与asyncio的底层实现在现代的异步编程中，事件循环扮演着至关重要的角色。Python的asyncio模块是其核心，它提供了一种优雅的方式来处理异步任务和并发操作。本文将深入探讨Python中事件循环的概念以及asyncio的底层实现。什么是事件循环？事件循环（EventLoop）是一种控制流机制，它负责管理任务队列
Python异步编程：深入理解事件循环与协程
引言：从餐厅服务员说起想象你是一家高档餐厅的服务员。传统方式下，你接到顾客A的点餐后，需要一直等在厨房，直到菜品做好才能去服务顾客B。这显然效率很低。聪明的服务员会这样做：接到顾客A的订单后，把单子交给厨房，然后立即去服务顾客B、C、D…当厨房通知某个菜做好了，再去取餐送给相应的顾客。这就是事件循环的工作方式——不傻等，而是充分利用等待时间去做其他事情。一、事件循环：异步编程的心脏1.1什么是事件
《在与众不同的教室里》读书笔记（3）河南张俊红
第三位老师：菲利普.比格勒1998年，美国国家年度教师，美国著名教师曾长期任教高中。菲利普比格勒，它的特点就是在教室里历史模拟，让学生学活历史。克林顿总统评价他说，在一个举国重视教育的实质内容的时代，它向我们展示了即是历史学家，又是杰出导师的教师的风采。历史课堂大多是过去发生的事情，学生们学起来枯燥无味，而菲利普比格勒进行互动式历史模拟，虽然模拟的结果不需要与真实的历史一致，但能够让他们对历史事件
从零开始构建AI原生应用的认知架构 AI原生应用开发 AI-native 架构 ai
从零开始构建AI原生应用的认知架构关键词：AI原生应用、认知架构、机器学习、知识图谱、神经网络、智能决策、系统设计摘要：本文深入探讨如何从零开始构建AI原生应用的认知架构。我们将从基本概念出发，逐步解析认知架构的核心组件，包括知识表示、推理机制和学习能力等。通过生动的比喻和实际代码示例，帮助读者理解如何设计一个能够模拟人类认知过程的AI系统。文章还将介绍当前最先进的认知架构模型，并展望未来发展趋势
8月1日秋水长天_2fad
事件：导师祈福群里又有人阴阳怪气地挖苦，怒怼了她感受：痛快兴奋，舒畅想法：都已经一个月了，天天这样，像宫斗剧里的女人似的，阴阳怪气，你不喜欢就退群啊，没人让你一直在这里呆着，本来这些人的活法就和你不一样，你不喜欢就别吱声，指指点点，说三道四，挑战别人是吧？好那我就接招。别人的感受：委屈，生气期待：对别人知道尊重别人对自己表达自己要表达的，不压抑自己。别人对我：别说我，我是无辜的应对：狠狠地怼她，让
2023-09-05水逆【日更830天】平白书
从周日开始陆陆续续接到几个不太好的“信息”或者事件。一是我和老公帮老爸挪动位置的时候发现他热乎乎的。结合我周末在家听到他震天动地的咳嗽声，让我心惊肉跳的。第一次测右边咯吱窝，36.7度。第二次测左侧咯吱窝，老公看了脱口而出37.8度，我直接瞪眼了。后来老公瞬间改口36.8度……我真！第三次测右边咯吱窝，36.9度。好吧，我开始找药，还失神打破了一只体温计。二是老二中耳炎后，上周日忽然对我们说听力下
Netty组件与编码
ServerSocketChannel.open()->ServerSocketChannelSelector.open()->Selector把ServerSocketChannel的accept事件注册给selector进行监听accept事件就表示有一个客户端要向服务端进行连接Selector.select()是一个阻塞函数，一直等待他监听的事件，这个函数触发代表着有一个SocketChan
2023-06-15 Sunny06e
总感觉我们人类，不能把一切的工作，全部都交给机器来做，纵然这样能使我们在非常轻松的状态下，就很便捷的完成了手头上的工作，但这机器必竟是机器，总有它的缺点和它自身的拘限性，所以它始终就不能完全代替我们自身。这不是吗，这两天我的这部手机好像就是闹出了一个乌龙事件。前两天，本人在简村这里保存下了一张图片，之后，我在无意中，查看了一下这张图片的生成日期，没有想到的是，这图片生成的日期竟然是在1970年的某
告诫!北恒高级班创投杯量化私募大赛套路太深，本金别被套牢，承诺收益都是骗局套路! 天权顾问
警惕!量化私募实盘大赛周一丰马建军是骗子吗？骗人资金盘被骗无法取款。北恒私募高级班周一丰马建军量化私募实盘大赛助力不正规！被骗真相令人唾弃!近期，我们收到多起关于诈骗分子在北恒私募高级班周一丰的骗局！北恒私募高级班周一丰在社交群组中打着“量化私募实盘大赛”和“积分投票”等噱头进行诈行骗的事件。这些诈骗分子利用投资者对私募助力大赛排名等其他新领域发展的关注，精心策划了一系列骗局，意图骗取大家的钱财。
docker命令 cherishSpring #docker容器 docker java eureka
目录1、常用命令2、容器生命周期管理创建一个新容器并运行一个命令杀掉一个运行中的容器删除一个或多个容器3、容器操作列出容器获取容器/镜像的元数据从服务器获取实时事件将文件系统作为一个tar归档文件导出到STDOUT4、容器rootfs命令从容器创建一个新的镜像检查容器里文件结构的更改容器与主机之间的数据拷贝5、镜像仓库登陆到Docker镜像仓库登出Docker镜像仓库从镜像仓库中拉取或者更新指定镜
Python爬虫实战：深入无限滚动页面抓取原理与Playwright实现 Python爬虫项目 python 爬虫开发语言区块链 json
一、前言：无限滚动页面的挑战在现代Web开发中，「无限滚动（InfiniteScrolling）」早已取代了传统的分页模式。以微博热搜流、知乎首页、抖音推荐页为例，用户向下滚动时会自动加载更多内容，这种体验虽提升了交互性，却让传统爬虫面临巨大挑战：页面初始只加载一部分内容剩余内容由JavaScript在滚动事件中动态加载requests类爬虫无法感知页面行为为什么传统爬虫抓不到数据？因为页面数据不
小仙女之翻身农奴把歌唱✌ 敏敏_7b1d
时间过得真快啊！一转眼的功夫，我已经是个四个半月的宝宝了✌自从嘟嘴事件之后，妈妈果然对我好了许多，不在对我吆五喝六横眉冷对颐指气使了我也过上了相对较轻松无压力的生活了，即使妈妈对我迟迟不肯主动翻身的行为颇有微词，也只能采取听之任之保留意见的态度，嘿嘿！任性妄为的感觉可不是一般的爽歪歪哦最近一个星期，奶奶的主要任务是想让我学会翻身，看着奶奶在床上左翻右滚的，我只是被逗得傻笑不止，让我翻身门都没有……
大语言模型应用指南：网页实时浏览 AGI大模型与大数据研究院 AI大模型应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型应用指南：网页实时浏览作者：禅与计算机程序设计艺术1.背景介绍1.1大语言模型的崛起1.1.1自然语言处理的发展历程1.1.2Transformer模型的突破1.1.3预训练语言模型的优势1.2网页浏览的痛点1.2.1信息过载与检索困难1.2.2内容理解与知识提取1.2.3个性化与智能化需求1.3大语言模型与网页浏览的结合1.3.1智能问答与对话系统1.3.2知识图谱与语义搜索1.3.3
UniApp TabBar 用户头像方案：绕过原生限制的实践金翅 uni-app
需求场景：在UniApp项目中，需要将TabBar首页项(index)的图标替换为当前用户的网络图片，并实现：放大且圆形显示。点击该图标时，页面滚动回顶部。切换到其他分类时，首页Tab项恢复为普通首页图标。尝试方案与问题：自定义TabBar：○可实现功能：网络图片、样式定制、点击事件。○致命缺点：页面切换时TabBar闪烁，页面重新加载，体验极差。❌放弃原生TabBar：○优点：切换流畅无闪烁，体
除了FastJson,你还有选择: Gson简易指南闻人的技术博客
前言这个周末被几个技术博主的同一篇公众号文章fastjson又被发现漏洞，这次危害可导致服务瘫痪！刷屏，离之前漏洞事件没多久，fastjson又出现严重Bug。目前项目中不少使用了fastjson做对象与JSON数据的转换，又需要更新版本重新部署，可以说是费时费力。与此同时，也带给我新的思考，面对大量功能强大的开源库，我们不能盲目地引入到项目之中，众多开源框架中某个不稳定因素就足以让一个项目遭受灭
C++11与MFC多线程控制：暂停与继续实践征途阿韦
本文还有配套的精品资源，点击获取简介：本项目深入探讨了在C++编程中，特别是在MFC框架下，如何管理和控制线程的暂停、继续和退出。涵盖了C++11标准库中std::thread的使用以及在MFC中CWinThread的继承和Run方法的重写。介绍了使用同步对象如条件变量、事件和信号量等实现线程暂停与继续的策略，并强调了线程退出的正确方式和多线程编程中的挑战，如同步、通信、避免死锁和竞态条件。1.C
机器学习入门（五）：线性回归—从模型函数到目标函数米饭超人
从数据反推公式假设我们获得了这样一张表格，上面列举了美国纽约若干程序员职位的年薪：enterimagedescriptionhere大家可以看到，表格中列举了职位、经验、技能、国家和城市几项特征。除了经验一项，其他都是一样的。不同的经验（工作年限），薪水不同。而且看起来，工作年头越多，工资也就越高。那么我们把Experience与Salary抽取出来，用x和y来分别指代它们。enterimaged
认识ETL流程：数据工程的基石淦暴尼数仓 etl 原型模式数据仓库
1.ETL流程简介2.ETL流程设计的关键步骤2.1需求分析2.2数据抽取（Extract）2.3数据转换（Transform）2.4数据加载（Load）2.5调度与监控3.ETL设计模式3.1批处理ETL3.2流式ETL3.3Lambda架构4.主流ETL技术栈选择4.1技术栈一览表4.2各环节简要说明4.3典型技术组合建议5.ETL最佳实践与完整流程示例5.1ETL最佳实践5.2完整ETL流程
少年的你爱生活之上善若水任方圆
文/上善若水图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App或许长大后我们都无法理解曾经发生在校园里的那些暴力事件，我们也曾年轻过，却不知道长大后意味着什么。年少的他们在那个校园暴力环境中是如何生存的，除了坚持走出那个校园他们无能为力！……电影看完了，我的内心却久久不能平静，终究那句“你保护世界，我保护你。
物联网系统中-告警配置功能的定义小赖同学啊 test Technology Precious 物联网 struts servlet
物联网系统中的告警配置功能是用户定义异常事件触发条件、通知方式和处理流程的核心管理模块。它通过对设备数据、系统状态的实时监控，在满足预设规则时主动推送风险信息，确保运维人员及时响应。以下是其详细定义与技术实现要点：一、核心定义告警配置功能允许用户通过可视化界面或API，为物联网系统设定异常检测规则与响应策略，包含三大核心要素：触发条件：基于设备数据/系统指标的逻辑判断（如温度＞100℃持续5分钟）
微信小程序开发中常用的组件介绍 DTcode7 微信小程序相关微信小程序小程序移动端前端源码
微信小程序开发中常用的组件介绍基础概念组件是什么？为什么要使用组件？常用组件详解视图容器组件view示例一：基础使用示例二：绑定点击事件文本显示组件text示例三：显示动态文本图像显示组件image示例四：显示网络图片表单组件forminput示例五：简单表单导航组件navigator示例六：页面跳转列表组件scroll-view示例七：垂直滚动列表实际开发中的技巧结合实际经验的案例分析案例一：商
人的行为读书笔记，2-7 夕颜剑主
第二章人的行为科学在认识论层次的一些问题第七节历史的范畴和专门的研究方法1.历史的研究范畴与历史家如何进行真正的历史工作历史的范畴是研究所有关于人的行为的经验资料。历史学家收集、批判、筛选所有可以取得的文件，以这种证据为基础，着手进行真正的历史工作。2.错误的历史研究方法有人说，历史的任务是揭露一些事件实际上是如何发生的，不允许有所遐想，亦不许有价值判断（也即，对于一切价值判断保持中立）。他们认为
C# 委托与事件：从函数指针到事件驱动的终极指南墨夶 C#学习资料 c#开发语言
**为什么说委托与事件是C#的“灵魂”？**在C#的世界里，委托（Delegate）与事件（Event）是两个看似简单却深藏玄机的核心概念。你是否曾想过：一个按钮点击事件背后，是如何将“点击动作”与“响应方法”无缝连接的？你是否遇到过：需要动态传递方法、实现回调或构建观察者模式时的“无从下手”？你是否渴望：掌握一套完整的“异步通信”机制，用于构建高内聚、低耦合的系统？答案来了：✅委托是“方法的容器
2021-09-19心态的变化笑笑狗尾草
昨天那通失望的心情，就是老甘偏让我回去开例会，结果说的却是一个患者的投诉事件，我失望透顶，为什么不当面找人对质，就说是医生的不对，罢了，这种地方，也说不清，不过对于单位的归属感，立马尽失。所以从现在开始，我要让自己成为机器人，不要带有任何感情，对人对事，都要如此。还有时刻就保持那种心态，如果生命只有九十天的时候，你会做什么，有什么态度对人对事，就那种心态，我觉得它会让我坚强而自主，这种心态蛮好的，
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul