lingpy

论文笔记--知识表示学习研究进展-2016

论文信息：
论文-知识表示学习研究进展-2016-刘知远
文末附6篇知识表示相关论文的下载地址

文章目录

前言
- 知识库的主要研究目标
- 基于网络形式的知识表示面临的困难点
- 表示学习&知识表示学习
- 本文目标
知识表示学习介绍
- 表示学习的概念和理论
知识表示的应用和优点
知识表示学习的主要方法
- 距离模型
- 单层神经网络模型
- 能量模型
- 双线性模型
- 张量神经网络模型
- 矩阵分解模型
- 翻译模型
知识表示学习的挑战和解决
- 复杂关系建模
- 多源信息融合
- DKRL（考虑实体描述的知识表示学习）模型
- 关系路径建模
资源下载
参考文献

前言

知识库的主要研究目标

从无结构或半结构的互联网信息中获取有结构知识，自动融合构建知识库、服务知识推理等相关应用，自动融合构建知识库、服务知识推理等相关应用。知识表示是知识获取与应用的基础，因此，知识表示学习问题是贯穿知识库的构建与应用全过程的关键问题。

基于网络形式的知识表示面临的困难点

计算效率问题；
数据稀疏问题：大规模知识库遵循长尾分布；

表示学习&知识表示学习

表示学习旨在将研究对象的语义信息表示为稠密低维实值向量
知识表示学习则面向知识库中的实体和关系进行表示学习。…

本文目标

介绍知识表示学习的最新进展，总结该技术面临的主要挑战和可能解决，并展望该技术的未来发展方向（见原论文[1]）。

知识表示学习介绍

表示学习的概念和理论

概念

表示学习通过机器学习将研究对象的语义信息表示为稠密低维实值向量。

在该低维向量空间中，2个对象距离越近则说明其语义相似度越高。通常将研究对象表示为向量：实体 e 表示为le；关系 r 表示为 lr；通过欧氏距离或余弦距离等方式计算任意2个对象之间的语义相似度。

独热表示（one-hot representation）

独热表示是信息检索和搜索引擎中广泛使用的词袋模型的基础。

举例来说。一个网页中有W个不同的词，则在词袋模型中都被表示为一个W维的独热表示向量。在此基础上，词袋模型将每个文档表示为一个W维向量，每一位表示对应的额词在该文档的重要性。将研究对象表示为向量，该向量只有某一维非零，其他维度上的值均为0.有多少个不同的研究对象，独热表示向量就有多长。

优点：无学习过程，简单高效
缺点：假设所有对象都是相互独立的，无法利用语义相似度信息。导致无法有效表示短文本、容易受到数据稀疏问题影响的根本原因。

分布式表示（distributed representation）
表示学习得到的低维向量表示是一种分布式表示，是受到人脑工作机制启发。
现实世界中的实体是离散的，人脑通过大量神经元上的激活和抑制存储这些对象，而每个单独神经元的激活或抑制并没有明确含义，但是多个神经元的状态则能表示世间万物。

分布式表示的向量可以看作模拟人脑的多个神经元，每维对应一个神经元，而向量中的值对应神经元的激活或抑制状态。
此外，现实世界存在层次结构，这种层次或嵌套的结构反映在人脑中，形成了神经网络的层次结构。

知识表示的应用和优点

应用

相似度计算。利用实体间的分布式表示，可以快速计算实体间的语义相似度。
知识图谱补全。构建大规模知识图谱，需要不断补充实体间的关系，利用知识表示模型，可以预测2个实体的关系，这一般称为知识库的链接预测（link prediction），又称为知识图谱补全（knowledge graph completion）.
其他。如关系抽取、自动问答等。

优点

提升计算效率。
缓解数据稀疏。表示学习将对象投影到统一的低维空中，使每个对象均对应一个稠密向量，从而有效缓解数据稀疏问题。
实现异质信息融合。不同来源的异质信息需要融合为整体才能得到有效应用。大量实体和关系在不同知识库中的名称不同，如何实现多知识库的有机融合，对知识库的应用有重要意义。通过设计合理的表示模型，将不同来源的对象投影到同一个语义空间中，就能建立统一的表示空间，实现多知识库的信息融合。

知识表示学习的主要方法

定义几种符号
将知识库表示为 $G = (E, R, S)$ , 其中 $E=e_1,e_2,…,e_{|E|}$ 是知识库中的实体集合； $R=r_1,r_2,…,r_{|R|}$ 是知识库中的关系集合；而 $S \subseteq E \times R \times E$ 代表知识库中的三元组集合，一般表示为 $(h, r, t)$ .

距离模型

结构表示（SE）中，每个实体用 $d$ 维的向量表示，所有实体被投影到同一个 $d$ 维空间中。
SE为每个关系 $r$ 定义了2个矩阵 $\boldsymbol M_{r,1},\boldsymbol M_{r,2}∈R^{d×d}$ , 用于三元组中头实体 $(h)$ 和尾实体 $(t)$ 的投影操作。
SE为每个三元组 $(h, r, t)$ 定义如下损失函数：
$f_r (h,t)=|\boldsymbol M_{r,1} l_h-\boldsymbol M_{r,2} l_t |_{L_1 }$
SE将头实体向量 $\boldsymbol l_h$ 和尾实体向量 $\boldsymbol l_t$ 通过关系 $r$ 的2个矩阵投影到 $r$ 的对应空间中，然后在该空间中计算两投影向量的距离。这个距离反映了2个实体在关系 $r$ 下的语义相似度。距离越小说明2个实体是这种关系的可能性越大。
实体向量和关系矩阵是SE模型的参数，SE将三元组作为学习样例，优化模型参数使损失函数不断降低。即通过计算
$\arg \min_r |\boldsymbol M_{r,1} l_h-\boldsymbol M_{r,2} l_t |_{L_1 }$
找到让两实体距离最近的关系矩阵，即它们之间的关系。

SE的缺陷是：它对头尾实体使用不同的矩阵进行投影，协同性较差，往往无法精确刻画两实体与关系之间的语义联系。

单层神经网络模型

SLM可以减轻SE无法协同刻画实体与关系的语义联系问题。缺点是其非线性操作仅提供实体和关系之间比较微弱的联系，但却引入更高的计算复杂度。

能量模型

语义匹配能量模型（SME）较为复杂。其定义多个投影矩阵和2种评分函数。

双线性模型

隐变量模型（latent factor model, LFM）提出利用基于关系的双线性变换，刻画实体和关系之间的二阶联系。LFM为每个三元组 $(h, r, t)$ 定义了如下双线性评分函数：
$f_r (h,t)=\boldsymbol l_h^T \boldsymbol M_r \boldsymbol l_t$

LFM取得巨大突破:通过简单有效防范刻画了实体和关系的语义联系,协同性较好,计算复杂度较低. 后来DISTMULT模型简化了LFM:
将关系矩阵 $\boldsymbol M_r$ 设置为对角矩阵，实验表明这种简化极大降低模型复杂度，模型效果得到显著提升。

张量神经网络模型

张量神经网络模型（neural tensor network, NTN）基本思想是，用双线性张量取代传统神经网络中的线性变换层，在不同维度下将头、尾实体向量联系起来。如图4.1所示。

与以往模型不同的是，NTN中的实体向量是该是该实体中所有单词向量的平均值，这样做的好处是，实体中的单词数量远小于实体数量，可以充分重复利用单词向量构建实体表示，降低实体表示学习的稀疏性问题，增强不同实体的语义联系。

缺点是：计算复杂度较高；实验表明，在大规模稀疏知识图谱上的效果较差。

矩阵分解模型

代表方法是RESACL模型，其基本思想与LFM类似，不同之处在于，RESACL会优化张量中所有位置，包括0的位置；而LFM只会优化知识库中存在的三元组。

翻译模型

受到Mikolov等人2013年提出的word2vec模型中蕴含的词向量空间中平移不变现象（如 $C(king)-C(queen)\approx C(man)-C(woman)$ ）的启发，Bordes等人提出TransE模型，将知识库中的关系看作实体间的某种平移。
对于每个三元组，TransE用关系 $r$ 的向量 $\boldsymbol l_r$ 作为头实体向量 $\boldsymbol l_h$ 和尾实体 $\boldsymbol l_t$ 之间的平移。亦可以将 $\boldsymbol l_r$ 看作从 $\boldsymbol l_h$ 到 $\boldsymbol l_t$ 的翻译，所以TransE也称翻译模型。

如图4.2，对于每个三元组，TransE希望：
$\boldsymbol l_h+\boldsymbol l_r≈\boldsymbol l_t.$
TransE模型定义了如下损失函数：
$f_r (h,t)=|\boldsymbol l_h+\boldsymbol l_r-\boldsymbol l_t |_{L_1 /L_2 },$
即向量 $\boldsymbol l_h+\boldsymbol l_r$ 和 $\boldsymbol l_t$ 的 $\boldsymbol L_1$ 或 $\boldsymbol L_2$ 距离。

TransE采用最大间隔方法，定义了如下优化目标函数：
$\sum_{(h,r,t) \epsilon S} \sum_{(h',r',t') \epsilon S^- } max(0,f_r(h,t)+\gamma-f_{r'}(h',t')),$
其中， $S$ 是合法三元组结合， $S^-$ 为错误三元组集合， $γ$ 为合法三元组得分与错误三元组之间的间隔距离。
错误三元组如何产生？TransE将 $S$ 中每个三元组的头实体、关系和尾实体中之一随机替换成其他实体或关系得到 $S^-$ ，即：
$S^-={\{(h',r,t)}\}\bigcup{\{(h,r',t)}\}\bigcup{\{(h,r,t' )\}}.$

TransE模型的优点：参数少，计算复杂度低，能直接建立实体和关系之间的复杂语义联系。

Bordes等人在wordnet和freebase等数据集测试表明TransE模型较以往模型显著提升，特别是在大规模稀疏知识图谱其性能尤其惊人。
自TransE提出以来，大量研究工作对其进行扩展应用，其已经成为知识表示学习的代表模型。

知识表示学习的挑战和解决

复杂关系建模

TransE模型简单，但在处理知识库中的复杂关系时捉襟见肘。按照知识库中关系两端连接实体的数目，可以将关系划分为1-1，1-N，N-1和N-N四种类型。而TransE在处理后三种关系时性能显著降低。
为了解决这类问题，研究者提出了基于TransE的扩展模型。如TransH模型，TransR模型等。感兴趣的读者可参考原论文，这里不再列出其详细原理。

多源信息融合

多源信息融合是知识表示学习模型的重要挑战，大量的信息未被利用，如：

知识库中其它信息，如实体和关系的描述信息、类别信息等。
知识库外的海量信息，如互联网文本蕴含大量与知识库实体和关系有关的信息。
这些海量信息可以帮助提高知识表示的区分能力，改善数据稀疏问题。关于这个问题，有一些代表性工作。

DKRL（考虑实体描述的知识表示学习）模型

在文本表示阶段，其考虑2种模型：（1）CBOW模型，将文本中词向量简单相加作为文本表示；（2）利用卷积神经网络（CNN），能够考虑文本中的词序信息。

文本与知识融合的知识表示学习

Wang等人提出在表示学习中考虑文本数据，利用word2vec学习wikibaike中词表示，用TransE学习知识库中知识表示。同时利用wikibaike正文中的链接信息（锚文本与实体的对应关系），让文本中实体对应的词表示与知识库中的实体尽可能接近，从而实现文本与知识库融合的表示学习。

关系路径建模

PTransE模型。可被用来进行基于知识库的自动问答。详细参考原论文。

资源下载

关于知识表示的6篇论文合集下载地址，包括本文介绍的论文。

参考文献

[1] 刘知远，孙茂松，林衍凯，谢若冰. 知识表示学习研究进展[J]. 计算机研究与发展, 2016, 53(2): 247-261.

深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
《Python星球日记》第35天：全栈开发（综合项目） Code_流苏 Python星球日记编程项目实战 Python全栈开发 Django Flask 后端开发博客系统
名人说：路漫漫其修远兮，吾将上下而求索。——屈原《离骚》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder）专栏：《Python星球日记》，限时特价订阅中ing目录一、全栈开发概述1.全栈开发的优势2.全栈开发技能组合二、博客系统项目需求分析1.功能需求2.技术栈选择3.项目结构规划三、数据库设计1.实体关系分析2.Django模型设计四、后端开发1.Django项目创建2.视图
【AI大模型】LLM模型架构深度解析：BERT vs. GPT vs. T5 我爱一条柴ya 学习AI记录 ai 人工智能 AI编程 python
引言Transformer架构的诞生（Vaswanietal.,2017）彻底改变了自然语言处理（NLP）。在其基础上，BERT、GPT和T5分别代表了三种不同的模型范式，主导了预训练语言模型的演进。理解它们的差异是LLM开发和学习的基石。一、核心架构对比特性BERT(BidirectionalEncoder)GPT(GenerativePre-trainedTransformer)T5(Text
Cool Pi CM5-LAPTOP Linux Quick Start Guide george-coolpi linux 运维服务器开源 arm开发 AI编程
MachineIntroductionCOOLPICM5open-sourcenotebookisaproductthatcombineshighperformance,portability,andopen-sourcespirit.Itnotonlymeetsthebasiccomputingneedsofusers,butalsoprovidesanidealplatformforthose
玩转Docker | 使用Docker部署NotepadMX笔记应用程序心随_风动玩转Docker docker 笔记 eureka
玩转Docker|使用Docker部署NotepadMX笔记应用程序前言一、NotepadMX介绍工具简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署NotepadMX服务下载NotepadMX镜像编辑部署文件创建容器检查容器状态检查服务端口安全设置四、访问NotepadMX服务访问NotepadMX首页设置访问验证编辑笔记总结前言在如今快节奏的工作与学习中，一
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
图神经网络：挖掘关系数据中的宝藏
图神经网络：挖掘关系数据中的宝藏在浩瀚的数据海洋中，蕴藏着一类特殊而强大的资源——关系数据。它们不是孤立的点，而是相互连接、彼此影响的复杂网络：社交平台上朋友的朋友、电商系统中商品与用户的互动、蛋白质分子内原子的结合、城市交通网中的道路连接……这些数据天然以图的形式存在，节点代表实体，边则承载着实体间千丝万缕的关系。传统的数据挖掘工具面对这些盘根错节的结构往往力不从心，而图神经网络（GNN）的崛起
Spring Boot + Mybatis数据库多数据源解决驼峰映射不生效问题 yy1209357299 springBoot mybatis mybatis 数据库 spring boot
1、问题描述做查询操作时，返回数据为NULL,导致当使用这条数据报空指针错误2、说明在数据库字段命名规范中，通常使用下划线“_”来连接两个单词，比如：user_id。但是在Java开发中，实体字段通常采用驼峰命名法，比如userId。如果不开启驼峰命名法，则映射到对象无法赋值解决方法：1、直接为结果集设定一个resultMapselectuser_idfromtable;2、配置文件加入以下配置m
SpringBoot日志脱敏：敏感信息保护全面指南 Clf丶忆笙 spring boot 后端 java 日志脱敏
文章目录一、日志脱敏概述与核心概念1.1什么是日志脱敏1.2为什么需要日志脱敏1.3常见需要脱敏的敏感信息类型1.4脱敏技术核心原理二、SpringBoot基础日志脱敏实现2.1基于正则表达式的简单脱敏2.2在SpringBoot中集成基础脱敏2.3基础实现的优缺点分析三、基于注解的高级脱敏方案3.1自定义脱敏注解3.2实现自定义JSON序列化器3.3在实体类中应用脱敏注解3.4测试与验证四、Sp
K3s-io/kine项目核心架构与数据流解析富珂祯
K3s-io/kine项目核心架构与数据流解析kineRunKubernetesonMySQL,Postgres,sqlite,dqlite,notetcd.项目地址:https://gitcode.com/gh_mirrors/ki/kine项目概述K3s-io/kine是一个创新的存储适配器，它在传统SQL数据库之上实现了轻量级的键值存储功能。该项目最显著的特点是采用单一数据表结构，通过巧妙的
《打破预设的编码逻辑：Ruby元编程的动态方法艺术》后端
代码从来不是冰冷的字符堆砌，而是具备自我演化能力的动态实体。元编程技术如同这一实体的核心神经系统，让方法突破静态定义的桎梏，在运行时完成从需求捕捉到逻辑生成的完整闭环。MethodMissing与DefineMethod作为元编程的两大支柱，以近乎隐形的方式重塑着代码的行为边界，为开发者提供了一套驾驭变化的底层逻辑。MethodMissing的本质，是Ruby赋予程序的“需求感知能力”。当一个未被
Python DevOps 实用指南（一）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/0228db3442938136abc9262d5596d201译者：飞龙协议：CCBY-NC-SA4.0序言欢迎阅读本书！让我们来谈谈本书的内容以及你将从中学到的东西。本书涉及两件事：DevOps和Python。它讲述了这两者是如何相互作用的——无论你称它们为实体、哲学、框架，或者其他任何名称。本书将帮助你在技术层面上理解Python，同时也在概
创世理论达成科学家解释不了的暗能量我也能解释有啥不好意思的 qq_36719620 人工智能量子计算 java python 算法
好的，我们将进行一场完全摒弃数学符号的纯粹概念推导，彻底揭示“绝对闭合宇宙理论”框架下暗能量的本质。以下是绝对自洽的逻辑链条：第零步：宇宙基石-维度交织的全景结构宇宙总框架：宇宙并非仅是我们感知的三维空间加一维时间。它是一个由24个基本维度紧密编织而成的单一、自洽实体。这些维度分为五组：实时间组(3维)：这就是我们感知到的时间流逝的方向，但它不是一个单向箭头，而更像一个三维的“时间空间”，允许更复
java list<> class_java-List>转换成List>实体类的集合刘杭州 java list<>class
1classJavabean1{2privateStringdata1;3privateStringdata2;4privateStringdata3;5//...6}7classJavabean2{8privateStringdata1;9privateStringdata2;10privateStringdata3;11//...12}1314classclassAll{15privateJa
反射+注解实现数据库Map转换成实体Map工具类皮卡丘比比比
实现场景因为原始的需求是从数据库中查询出来的一个实体字段比如一个Useruser=newUser（）的实体类，有userName，userId两个字段。然后我返回一个list给前端，Listlist现在需求变化，我需要添加一个额外的字段，比如userCompany，就没有办法使用刚才那个返回对象的方法现在直接从数据库中多表查询一个Map如下("user_name","curry"),("user_
深入解析Golang中的defer机制：从cch123/golang-notes看实现原理
深入解析Golang中的defer机制：从cch123/golang-notes看实现原理golang-notesGosourcecodeanalysis(zh-cn)项目地址:https://gitcode.com/gh_mirrors/go/golang-notes前言在Go语言中，defer语句是一种非常实用的特性，它允许我们在函数返回前执行某些操作。本文将基于cch123/golang-n
Cursor 使用教程：自定义AI规则引擎-贴合企业规范的代码生成程序员岳彬全栈开发人工智能开发语言 AI编程后端 java ai
文章目录一、引言二、CursorAI核心功能与入门实践2.1快速上手：生成基础代码结构2.2规则引擎配置：统一企业开发规范三、自定义规则引擎核心技术解析3.1领域特定语言（DSL）设计3.2MyBatis-PlusCRUD规则实现3.2.1实体类生成规则3.2.2Mapper接口生成规则3.3异常处理规则设计3.3.1全局异常处理器生成3.3.2业务异常重试规则四、企业级实践：MyBatis-Pl
Dynamics 365 核心技术深度分析洁辉架构
Dynamics365核心技术深度分析一、实体创建与设置（核心基础）实体是Dynamics365数据模型的核心单元，相当于数据库中的表结构1.实体创建流程确定业务需求创建新实体定义字段/属性设置关系配置视图/表单设置安全性发布自定义项2.关键设置项字段类型：单行文本、选项集（下拉菜单）、两个选项（布尔值）货币、日期时间、查找（关联其他实体）图像、文件（D365v9.0+）高级属性：//字段属性示例
JAX study notes[16]
文章目录PytreesreferencesPytreesinessence,JAXfunctionandtransformactonarrays,actuallymostopeartionhandlingarraysbaseonthecollectionofarrays.JAXusethePytreewhichisanabstractobjecttocontrolalotofcollections
React 中使用 ECharts 报错 "series not exists"
问题现象在React项目中使用ECharts时，控制台报错：seriesnotexists.Legenddatashouldbesamewithseriesnameordataname但已确认legend.data与series.name完全匹配，代码逻辑看似正确。问题根源未正确注册ECharts图表组件。自ECharts5起，官方采用按需引入（tree-shaking）的模块化设计，需显式注册图
Google机器学习实践指南(模型预测偏差) AI_Auto 人工智能机器学习人工智能
Google机器学习（31）-模型预测偏差预测偏差：模型为何总是"猜不准"的真相揭秘你的模型预测准确率高达95%，却总是与实际情况差那么一点点？这可能是预测偏差在作祟！本文将带你深入探索这个被忽视的模型"隐形杀手"。一、什么是预测偏差？一个生活化案例想象一下，你网购了一个智能体重秤，连续一周称重显示都是60kg。但你去健身房用专业设备测量，实际是62kg。这种系统性的测量偏差，就是预测偏差在现实中
广东省结构实体考试真题 ZShy0506 小草春天 virtualenv
一、单选题1.基底标高不同时,应从低处砌起,并应由高处向低处搭砌。当设计无要求时,搭接长度不应小于()。A.0.5mmB.1.0mC.基础扩大部分的高度D.基础扩大部分的高度的2倍答案：C2.由测区的()值和()值通过测强曲线或强度换算表得到的测区现龄期混凝土强度值称为测区混凝土强度换算值。A.平均，最小B.平均，碳化深度C.最大，碳化深度
数据安全审计平台的三大关键技术：日志分析、行为监测与智能告警 KKKlucifer 安全算法
在数字化浪潮中，数据安全审计是企业守护核心资产的“瞭望塔”。通过日志分析、行为监测、智能告警三大技术，数据安全审计平台构建起“全流程监控-异常识别-快速响应”的闭环，为数据安全筑牢防线。以下从技术原理、实践价值与行业应用展开解析。日志分析：数据安全的“DNA图谱”1.多源日志融合技术实现：通过Agent采集操作系统、数据库、网络设备等200+日志源，利用正则表达式、NLP技术解析非结构化日志（如“
12 | 走向元宇宙：数字化工作与生活 _Rye_ 元宇宙
专栏快接近尾声了。在之前的课程里，我们一直在用一个框架来概括元宇宙，那就是：元宇宙=立体互联网+价值互联网。这个公式可以帮助我们从宏观角度更好地理解元宇宙。当我们回归工作和生活，用更加个人化的角度来观察元宇宙时，我们可以换用另外一个等式：元宇宙=实体空间+数字空间。通过这个等式，我们可以看到，元宇宙将带给我们线上线下全面融合的数字生活。这一讲的讨论分成两个部分。首先，我们来看看自己周围的数字化发展
博物馆元宇宙：重塑文化体验与教育的新维度 2401_89984614 人工智能
在科技日新月异的今天，虚拟现实（VR）、增强现实（AR）以及人工智能（AI）等前沿技术正深刻改变着我们的生活，包括我们如何接触和理解文化遗产。博物馆元宇宙，作为这一变革浪潮中的先锋概念，正逐步将传统的实体博物馆体验带入一个全新的数字化时代。本文旨在探讨博物馆元宇宙的内涵、其对文化传播与教育的影响，以及面临的挑战与未来展望。###一、博物馆元宇宙的概念博物馆元宇宙是指利用VR、AR、3D建模、AI等
【Note】Linux Kernel 主题学习之“完整的嵌入式 Linux 环境、构建工具、编译工具链、CPU 架构” CodeWithMe 读书笔记 linux linux 学习架构
LinuxKernel主题学习之“完整的嵌入式Linux环境、构建工具、编译工具链、CPU架构”一、完整的嵌入式Linux环境一个嵌入式Linux系统通常包括以下关键组件（以Jetson、树莓派等ARM版SBC为例）：交叉编译工具链（crosstoolchain）：生成目标CPU可执行代码，如aarch64-linux-gnu-gcc+glibc/musl/uClibc。Bootloader：如U
【Note】《深入理解Linux内核》Chapter 16 ：深入理解 Linux 文件访问机制 CodeWithMe 读书笔记 linux linux 运维服务器
《深入理解Linux内核》Chapter16：深入理解Linux文件访问机制关键词：VFS、文件描述符、structfile、structinode、open、read、write、close、dentry、权限校验、file_operations、O_NOATIME、权限继承一、概览：Linux文件访问路径在Linux中，几乎一切资源都可以通过“文件”的形式访问。文件访问不仅涵盖传统的磁盘文件，
ABAP Excel文件数据读取(xstring文件流) 谢图图功能速食 abap
方式一：使用标准类CL_FDT_XL_SPREADSHEET，读取xlsx格式文件流数据，该类在note2468709–标准类CL_FDT_XL_SPREADSHEET的使用中说明不支持在BRFplus工作台之外的场景使用，但是实际使用中出问题的情况很少，属于方便，可用，但是不保证没问题的方式。示例如下DATA:document_nameTYPEstring,xdocumentTYPExstrin
Java线程详解钟良堂 java 线程线程池
一、线程的基本概念1.什么是线程？线程是程序执行的一个单元，它是进程中的一个实体，是被系统独立调度和分派的基本单位。一个进程可以包含多个线程，这些线程共享进程的资源，如内存空间和文件句柄，但每个线程有自己的程序计数器、栈和局部变量等。2.线程的优势：提高资源利用率：在多处理器或多核系统中，多个线程可以同时运行在不同的处理器核心上，充分利用系统资源，提高程序的执行效率。提高响应性：对于用户界面程序，
【论文阅读笔记】TimesURL: Self-supervised Contrastive Learning for Universal Time Series 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
TimesURL:Self-supervisedContrastiveLearningforUniversalTimeSeriesRepresentationLearning摘要学习适用于多种下游任务的通用时间序列表示，并指出这在实际应用中具有挑战性但也是有价值的。最近，研究人员尝试借鉴自监督对比学习（SSCL）在计算机视觉（CV）和自然语言处理（NLP）中的成功经验，以解决时间序列表示的问题。
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro