PaperWeekly

BERT+知识图谱：北大-腾讯联合推出知识赋能的K-BERT模型

作者丨周鹏

单位丨腾讯

研究方向丨自然语言处理、知识图谱

背景

近两年，谷歌 BERT 等无监督预训练语言表示模型在多个 NLP 任务中均取得了可喜的成果。这些模型在大规模开放域语料库上进行了预训练，以获得通用的语言表示形式，然后在特定的下游任务中进行了微调，以吸收特定领域的知识。但是，由于预训练和微调之间的领域差异，这些模型在知识驱动的任务上表现不佳。例如，在医疗领域处理电子病历（EMR）分析任务时，经过 Wikipedia 预训练的 Google BERT 无法充分发挥其价值。

当阅读特定领域文本时，普通人只能根据其上下文理解单词，而专家则可以利用相关领域知识进行推断。目前公开的 BERT、GPT、XLNet 等预训练模型均是在开放领域语料预训练得到的，其就像一个普通人，虽然能够读懂通用文本，但是对于专业领域文本时却缺乏一定的背景知识。

解决这一问题的一个方法是使用专业语料预训练模型，但是预训练的过程是十分耗时和耗计算资源的，普通研究者通常难以实现。例如，如果我们希望模型获得“扑热息痛可以治疗感冒”的知识，则在训练语料库中需要大量同时出现“扑热息痛”和“感冒”的句子。不仅如此，通过领域语料预训练的方式引入专家知识，其可解释性和可控性较差。

除了以上策略，我们还能做些什么来使模型成为领域专家？知识图谱（Knowledge Graph，KG）是一个很好的解决方案。

随着知识细化为结构化形式，许多领域的 KG 都被构建起来，例如，医学领域的 SNOMED-CT，中国概念的 HowNet。如果 KG 可以集成到预训练语言模型中，它将为模型配备领域知识，从而提高模型在特定领域任务上的性能，同时降低大规模的预训练成本。此外，知识图谱具有很高的可解释性，因为可以手动编辑注入的知识。

目前，将知识图谱与语言模型结合的研究有哪些呢？最具代表性的就是清华的 ERNIE，其使用一个独立的 TransE 算法获得实体向量，然后再将实体向量嵌入到 BERT 中。清华 ERNIE 的工作很有借鉴意义，但是仍然存在一些可改进的地方，例如：

1. 知识图谱中的关系信息没有被用到；

2. 实体向量和词向量是使用不同的方法得到的，可能存在空间的不一致；

3. 对于实体数量巨大的大规模知识图谱，实体向量表将占据很大的内存。

另外，将过多的知识引入到语言表示模型中，可能会改变原来句子的含义，本文称为知识噪声问题。为了解决以上问题，本文的研究人员尝试不区分实体向量和词向量，使用统一的向量空间将知识注入语言表示模型中。

方法

基于以上想法，研究人员对 Google BERT 进行了一定的改进，提出了 K-BERT 模型。下面介绍 K-BERT 的具体思想，图 1 是 K-BERT 的总体架构图。

▲ 图1. K-BERT总体架构图

当一个句子“Tim Cook is currently visiting Beijing now”输入时，首先会经过一个知识层（Knowledge Layer），知识层将知识图谱中关联到的三元组信息（Apple-CEO-Tim Cook、Beijing-capital-China 等）注入到句子中，形成一个富有背景知识的句子树（Sentence tree）。

可以看出，通过知识层，一个句子序列被转换成了一个树结构或图结构，其中包含了句子中原本没有的背景知识，即我们知道“苹果的 CEO 现在在中国”。

得到了句子树以后，问题出现了。传统的 BERT 类模型，只能处理序列结构的句子输入，而图结构的句子树是无法直接输入到 BERT 模型中的。如果强行把句子树平铺成序列输入模型，必然造成结构信息的丢失。在这里，K-BERT 中提出了一个很巧妙的解决办法，那就是软位置（Soft-position）和可见矩阵（Visible Matrix）。下面我们详细看看具体的实现方法。

众所周知，在 BERT 中将句子序列输入到模型之前，会给句子序列中的每个 token 加上一个位置编码，即 token 在句子中的位次，例如“Tim(0) Cook(1) is(2) currently(3) visiting(4) Beijing(5) now(6)”。如果没有位置编码，那 BERT 模型是没有顺序信息的，相当于一个词袋模型。

在 K-BERT 中，首先会将句子树平铺，例如图 2 中的句子树平铺以后是“[CLS] Tim Cook CEO Apple is currently visiting Beijing capital China is_a City now”。

▲ 图2. 软位置（Soft-position）和硬位置（Hard-position）

显然，平铺以后的句子是杂乱不易读的，K-BERT 通过软位置编码恢复句子树的顺序信息，即“[CLS](0) Tim(1) Cook(2) CEO(3) Apple(4) is(3) visiting(4) Beijing(5) capital(6) China(7) is_a(6) City(7) now(6)”,可以看到“CEO(3)”和“is(3)”的位置编码都 3，因为它们都是跟在“Cook(2)”之后。

只用软位置还是不够的，因为会让模型误认为 Apple (4) 是跟在 is (3) 之后，这是错误的。K-BERT 中最大的亮点在于 Mask-Transformer，其中使用了可见矩阵（Visible matrix）将图或树结构中的结构信息引入到模型中。

回顾一下 BERT 中 Self-attention，一个词的词嵌入是来源于其上下文。Mask-Transformer 核心思想就是让一个词的词嵌入只来源于其同一个枝干的上下文，而不同枝干的词之间相互不影响。这就是通过可见矩阵来实现的，图 2 中的句子树对应的可见矩阵如图 3 所示，其中一共有 13 个 token，所以是一个 13*13 的矩阵，红色表示对应位置的两个 token 相互可见，白色表示相互不可见。

▲ 图3. 可见矩阵（Visible matrix）

有了可见矩阵以后，可见矩阵该如何使用呢？其实很简单，就是 Mask-Transformer。对于一个可见矩阵 M，相互可见的红色点取值为 0，相互不可见的白色取值为负无穷，然后把 M 加到计算 self-attention 的 softmax 函数里就好，即如下公式。

以上公式只是对 BERT 里的 self-attention 做简单的修改，多加了一个 M，其余并无差别。如果两个字之间相互不可见，它们之间的影响系数 S[i,j] 就会是 0，也就使这两个词的隐藏状态 h 之间没有任何影响。这样，就把句子树中的结构信息输入给 BERT 了。

▲ 图4. [Apple]只能通过[Cook]间接作用于[CLS]，降低了知识噪声的影响

总结一下，Mask-Transformer 接收句子树作为输入的过程如图 5。

▲ 图5. 句子树的输入过程

其实就是对应了原论文中的结构图，如图 6，对于一个句子树，分别使用 Token 序列保存内容，用可见矩阵保存结构信息。

▲ 图6. 句子树转化为Embedding representation和可见矩阵

从图 6 中可以看出，除了软位置和可见矩阵，其余结构均与 Google BERT 保持一致，这就给 K-BERT 带来了一个很好的特性——兼容 BERT 类的模型参数。K-BERT 可以直接加载 Google BERT、Baidu ERNIE、Facebook RoBERTa 等市面上公开的已预训练好的 BERT 类模型，无需自行再次预训练，给使用者节约了很大一笔计算资源。

实验结果

下面我们来看看 K-BERT 的实验效果。首先，本文采用了三个知识图谱，分别是 CN-DBpedia、知网（HowNet）和自建的医学知识图（MedicalKG）。用于测评的任务分为两类，分别是开放领域任务和专业领域任务。开放领域任务一共有 8 个，分别是 Book review、Chnsenticorp、Shopping、Weibo、XNLI、LCQMC、NLPCC-DBQA、MSRA-NER，实验结果如下表。

可以看出，K-BERT 相比于 Google BERT，在开放领域的任务上有一点微小的提升，但是提升不是很明显。可能的原因在于开放领域的任务并不需要背景知识。

为了测试在需要“背景知识”的任务上的效果，研究者使用了四个特定领域的任务，分别是金融问答、法律问答、金融实体识别和医学实体识别。实验效果见下图。

可以看出，在特定领域任务上的表现还是不错的，这些特定领域任务对背景知识的要求较高。总体而言，知识图谱适合用于提升需要背景知识的任务，而对于不需要背景知识的开放领域任务往往效果不是很显著。

目前，本工作已被 AAAI-2020 收录。研究者还指出，目前 K-BERT 还存在很多问题需要被解决，例如：当知识图谱质量过差时如何提升模型的鲁棒性；在实体关联时如何剔除因一词多义造成的错误关联。研究者希望将结构化的知识图谱引入到 NLP 社区中，目前还需要做很多努力。K-BERT 还不够完善，将来还会不断更新，欢迎大家关注。

后记

K-BERT的代码已开源，论文原文和项目地址如下：

论文地址：https://arxiv.org/abs/1909.07606v1

项目地址：https://github.com/autoliuweijie/K-BERT

如果你对自然语言处理、知识图谱感兴趣，希望从事这方面的研究，欢迎与我们联系。

联系邮箱：[email protected]

联系邮箱：[email protected]

参考文献

[1] Devlin, J.; Chang, M.-W.; Lee, K.; and Toutanova, K. 2018. BERT: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805.

[2] Zhang, Z.; Han, X.; Liu, Z.; Jiang, X.; Sun, M.; and Liu, Q. 2019. ERNIE: Enhanced language representation with informative entities. arXiv preprint arXiv:1905.07129.

[3] Xu, B.; Xu, Y.; Liang, J.; Xie, C.; Liang, B.; Cui, W.; and Xiao, Y. 2017. Cn-dbpedia: A never-ending chinese knowl- edge extraction system. International conference industrial, engineering and other applications applied intelligent sys- tems 428–438.

[4] Dong, Z.; Dong, Q.; and Hao, C. 2006. Hownet and the computation of meaning.

点击以下标题查看更多期内容：

AAAI 2020 | 语义感知BERT（SemBERT）
从Word2Vec到BERT
近期值得读的知识图谱论文，这里帮你总结好了
后BERT时代的那些NLP预训练模型
BERT的成功是否依赖于虚假相关的统计线索？
从三大顶会论文看百变Self-Attention

#投稿通道#

让你的论文被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体，缩短读者寻找优质内容的成本呢？答案就是：你不认识的人。

总有一些你不认识的人，知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁，促使不同背景、不同方向的学者和学术灵感相互碰撞，迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人，在我们的平台上分享各类优质内容，可以是最新论文解读，也可以是学习心得或技术干货。我们的目的只有一个，让知识真正流动起来。

???? 来稿标准：

• 稿件确系个人原创作品，来稿需注明作者个人信息（姓名+学校/工作单位+学历/职位+研究方向）

• 如果文章并非首发，请在投稿时提醒并附上所有已发布链接

• PaperWeekly 默认每篇文章都是首发，均会添加“原创”标志

???? 投稿邮箱：

• 投稿邮箱：[email protected]

• 所有文章配图，请单独在附件中发送

• 请留下即时联系方式（微信或手机），以便我们在编辑发布时和作者沟通

????

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击「交流群」，小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 下载论文 & 源码

团队研发文化和价值观建设与传承 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
团队研发文化和价值观建设与传承1.背景介绍在现代软件开发中，技术的进步和工具的更新固然重要，但团队的研发文化和价值观同样不可忽视。一个高效的团队不仅需要技术上的卓越，还需要在文化和价值观上有一致的认同和传承。本文将深入探讨如何在团队中建立和传承研发文化和价值观，帮助团队在技术和文化上共同进步。2.核心概念与联系2.1研发文化研发文化是指团队在软件开发过程中所遵循的行为准则、工作习惯和价值观。它包括
SapphireRapids NVMe Aggregate Performance with灵活IO测试--学习笔记（二）向阳生活学习笔记网络
4.主机系统配置由于NVMe控制器使用队列和数据缓冲区，这些队列和数据缓冲区可以托管在主机系统内存空间的任何位置，因此假设主机系统具有足够的内存容量和内存带宽来同时处理多个NVMe访问，以避免受到内存带宽限制。主机系统是Sapphire-Rapid2S系统，每个插槽上配置了8个DDR564GB,1DPC,运行在每个插槽上的速度为4800MTS（例如，共1TB内存容量）。4.1根端口的硬盘数量Sap
equine在神经网络中建立量化不确定性 struggle2025 神经网络人工智能深度学习
一、软件介绍文末提供程序和源码下载众所周知，用于监督标记问题的深度神经网络（DNN）可以在各种学习任务中产生准确的结果。但是，当准确性是唯一目标时，DNN经常会做出过于自信的预测，并且无论测试数据是否属于任何已知标签，它们也总是进行标签预测。EQUINEwascreatedtosimplifytwokindsofuncertaintyquantificationforsupervisedlabel
CARLsim开源程序是一个高效、易用、GPU 加速的软件框架，用于模拟具有高度生物细节的大规模脉冲神经网络（SNN）模型。 struggle2025 神经网络人工智能深度学习
一、软件介绍文末提供程序和源码下载CARLsim是一个高效、易用的GPU加速库，用于模拟具有高度生物学细节的大规模脉冲神经网络（SNN）模型。CARLsim允许在通用x86CPU和标准现成GPU上以逼真的突触动力学执行Izhikevich脉冲神经元网络。该模拟器在C/C++中提供了一个类似PyNN的编程接口，允许在突触、神经元和网络级别指定详细信息和参数。二、CARLsim6的新功能包括：CUDA
【C++】C++的虚析构函数
C++的虚析构函数1.语法规则：2.用途：3.原理：示例代码：4.下面解释为什么基类未定义为析构函数时，析构子类(派生类)对象也能把基类对象析构的原因4.1核心原理：编译器自动生成的析构函数调用链4.1.1对象构造与析构的镜像对称原则4.1.2编译器在派生类析构函数中插入隐式代码4.2底层机制分步解析4.3技术细节说明4.3.1.this指针调整4.3.2.继承链处理4.3.3.与虚函数无关1.语
vmvare如何给centos7 设置静态IP地址 Roc-xb 服务器 tcp/ip php 服务器
本章教程，主要介绍如何在vmvare中如何给虚拟机中设置静态IP地址。本章教程中使用的linux发行版是centos7。目前没有静态IP地址，并且不能联网，此时我们需要给它配置一个静态IP，并且可以实现联网功能。一、前置步骤1、网络设置2、添加网络添加一个虚拟机网络，选择VMnet8，如果被占用了，可以选择其他的名字。3、选择NAT模式
设计与实现淘客返利APP的数据安全与隐私保护：架构师的实践经验
设计与实现淘客返利APP的数据安全与隐私保护：架构师的实践经验大家好，我是阿可，微赚淘客系统及省赚客APP创始人，是个冬天不穿秋裤，天冷也要风度的程序猿！数据安全与隐私保护的重要性在淘客返利APP中，数据安全与隐私保护是至关重要的。用户数据不仅涉及个人隐私，还可能包含敏感信息，如身份证号、银行卡号等。一旦数据泄露，不仅会损害用户利益，还会对平台的声誉造成严重影响。因此，设计和实现一个安全可靠的数据
质量管理重要理论知识和质量管理工具
一、质量管理核心理论1.戴明循环（PDCA）理论：通过“计划（Plan）→执行（Do）→检查（Check）→改进（Act）”实现持续改进。例子：问题：某电子厂PCBA焊接不良率高达5%。Plan：分析发现回流焊温度曲线不稳定；Do：调整炉温参数，设定梯度升温；Check：一周后不良率降至1.2%；Act：将新参数写入标准作业指导书（SOP）。2.朱兰三部曲理论：质量策划→质量控制→质量改进。例子：
C++类的友元函数详解 _越谷小鞠 c++开发语言
一、什么是友元函数？在C++中，类的友元函数是被类声明为“朋友”的函数。友元函数可以直接访问类的私有成员和保护成员，而无需通过公有成员函数进行访问。友元函数可以是：普通的非成员函数。另一个类的成员函数。全局函数。通过使用友元函数，我们能够方便地解决某些类之间的耦合问题，使代码更简洁高效。二、友元函数的定义与声明友元函数需要在类的内部使用关键字friend进行声明，具体格式如下：class类名{fr
OneMessage：打造高效跨平台消息框架蒋闯中Errol
OneMessage：打造高效跨平台消息框架OneMessage一个基于发布-订阅模型的多线程消息框架，用于嵌入式平台，纯C实现，性能和灵活性极高项目地址:https://gitcode.com/gh_mirrors/on/OneMessage项目介绍OneMessage是一个基于发布-订阅模型的跨平台消息框架，使用纯C语言编写，以其卓越的性能和高度灵活性而著称。它集成了红黑树、链表、队列、CRC
centos 7+hadoop 2.7.3 mozhw c/c++linu/unix java
安装JDK版本:jdk-8u131-linux-x64.tar.gz需要先删除系统自带的openjdk先查找java再移除[hadoop@localhost~]$rpm-qa|grepjavajava-1.7.0-openjdk-1.7.0.111-2.6.7.8.el7.x86_64python-javapackages-3.4.1-11.el7.noarchtzdata-java-2016g-
PMP备考神器:免费刷题小程序推荐才聚PMP 人工智能职场和发展
【PMP考试通】是一款专门为备考PMP的免费刷题小程序。【PMP考试通】涵盖了考试中的所有考点，能帮你顺利通过PMP考试。还有最新的考试咨讯提供给大家，随时了解考试的动态，考试更安心。有两种练习模式，可以实现不同的练习需求。1、考试模式:完全模拟考试，做完之后计算得分，并可以查看相应解析2、练习模式:练习与学习，遇到不能解答的题目时，可以直接查看解析，学习当前知识点3、做题类型:章节练习、每日一练
tiktok开店注意事项 Bella12300 tiktok 新手开店
想在tiktok上开店先别急着砸广告费，摸清平台的隐形规则更重要。tiktok现在没有面对大陆用户开放，稍有不慎就可能被扣保证金、封号，甚至钱货两空，今天就带大家了解一些tiktok开店的注意事项。一、资质审核营业执照：公司名称、经营范围必须与销售商品类目一致，比如卖美妆的营业执照如果写五金建材，审核会直接驳回。个体户只能入驻东南亚市场，且一个执照最多开5国店铺。法人信息：上传身份证需高清无边框，
透视广告流量交易“黑箱”：MergeX是如何实现广告交易链路透明化的？
在数字营销领域，广告流量交易的不透明性一直是行业内外普遍关注的问题。这种不透明性不仅影响了广告主的投放效果，也阻碍了开发者流量变现的潜力。广告流量交易中的“三不”陷阱?一、链路不透明在传统的广告交易链路中，多层中间商如同一道道关卡，截留了本应属于开发者的收益。这种复杂的层级结构使得真实流量价值的溯源变得困难重重，广告主难以准确判断自己的投入是否真正转化为了有效的曝光和点击。二、规则不清晰竞价机制作
C2远控篇&Golang&Rust&冷门语言&Loader加载器&对抗优势&减少熵值特征
#C2远控-ShellCode-认知&环境1.创建工程时关闭SDL检查2.属性->C/C++->代码生成->运行库->多线程(/MT)如果是debug则设置成MTD3.属性->C/C++->代码生成->禁用安全检查GS4.关闭生成清单属性->链接器->清单文件->生成清单选择否#C2远控-ShellCode-分析&提取ShellCode的本质其实就是一段可以自主运行的代码。它没有任何文件结构，它不
前端React和Vue框架的区别
React和Vue作为前端Web开发的两大主流框架，虽然都用于构建用户界面，但在设计理念、语法风格、生态系统等方面存在显著差异。以下从多个维度对比两者的核心区别，帮助你在技术选型时做出更合适的决策。一、设计理念与架构1.数据流控制React：强制单向数据流（One-WayDataFlow），状态变化只能通过父组件→子组件传递，如需反向通信（如子组件修改父组件状态），需通过回调函数实现。复杂应用中需
nnv开源神经网络验证软件工具
一、软件介绍文末提供程序和源码下载用于神经网络验证的Matlab工具箱，该工具箱实现了可访问性方法，用于分析自主信息物理系统（CPS）领域中带有神经网络控制器的神经网络和控制系统。二、相关工具和软件该工具箱利用神经网络模型转换工具（nnmt）和闭环系统分析、混合系统模型转换和转换工具（HyST）以及CONTINUOUSReachabilityAnalyzer（CORA）三、无需安装即可执行NNV可
嵌入式通信协议框架的四层架构设计与实现比特冬哥嵌入式领域开发嵌入式通信协议分层框架
文章目录一、硬件抽象层：数据收发的基石1.1设计要点1.2代码示例二、协议管理层：智能路由中枢2.1设计要点2.2代码示例三、协议处理层：协议具体实现3.1设计要求3.2代码示例3.2.1协议公共定义3.2.2协议一设计3.2.3协议二设计四、应用层：业务逻辑实现4.1设计要点4.2代码示例4.2.1协议一处理4.2.2协议二处理五、四层协作流程5.1收发流程5.2代码示例总结在嵌入式系统开发中，
微服务：从“大锅菜“到“自助餐“的架构进化 MarkSea. 架构微服务云原生
在软件开发的世界里，架构就像是烹饪艺术。传统的单体应用就像一锅东北大锅菜，所有食材（功能）混在一起熬煮，香是香，但想单独调整某种食材的味道？对不起，得掀翻整锅重来。而微服务架构则像现代化的自助餐厅，每道菜（服务）独立存在，想吃什么拿什么，想调整哪道菜只需要处理那一小部分，其他客人（用户）还能继续享用其他美食。什么是微服务？——火锅店里的"自助小料台"理论将应用拆成多个独立小服务，通过轻量级API（
演练纪实丨同创永益同天支持三家银行灾备切换演练圆满完成数字韧性前端
2025年6月22日，同创永益单日同时支持河南农商联合银行、苏州农商银行、昆山农商银行组织开展2025年灾备切换演练圆满完成。其中共涉及44套关键业务系统，700余个节点，成功率100%，且全部满足恢复指标要求。同创永益于同日成功支持三家银行完成灾备切换演练，充分彰显了企业卓越的交付能力与技术底蕴。此次演练中，最显著的突破在于支持某行银行灾备切换演练时，将灾备技术切换的时间从原本的5分钟压缩至1分
【ES6新特性】解构赋值常见用法小钟H呀 ES6新特性学习手册 es6 前端 javascript
ES6解构赋值用法详解一、解构赋值基础概念解构赋值（DestructuringAssignment）是ES6新增的语法，可以快速从数组或对象中提取值并赋给变量。1.1传统取值方式vs解构赋值//传统方式constarr=[1,2,3];consta=arr[0];constb=arr[1];//解构赋值const[x,y]=[1,2,3];console.log(x);//1console.log
Unity团结引擎实战：鸿蒙游戏开发全指南编号:0517 鸿蒙 harmonyos5.0 unity 华为鸿蒙
鸿蒙游戏开发实战：Unity团结引擎适配指南与代码示例文/技术探索随着鸿蒙生态的快速扩张，Unity游戏向鸿蒙OS（OpenHarmony）的迁移已成为开发者新需求。本文将基于Unity团结引擎（专为鸿蒙定制的Unity分支），详解适配流程并提供可运行的代码示例。一、团结引擎：鸿蒙原生适配的核心工具Unity中国推出的团结引擎（基于Unity2022LTS定制）是当前唯一官方支持的鸿蒙适配方案，其
继 Evo 2 之后，Arc Institute 发布首个虚拟细胞模型 STATE，训练数据涉及 70 种不同细胞系 hyperai
众所周知，人体由不同类型的细胞组成——免疫细胞在感染发生时可引发炎症反应以抵御病原体；干细胞具有分化潜能，可生成多种组织类型；而癌细胞则通过逃避生长调控信号，实现异常增殖。尽管这些细胞在功能和形态上差异巨大，但它们几乎都拥有相同的基因组。细胞的独特性并非来自DNA序列本身的差异，而是源于它们如何调控和使用相同的基因信息。换言之，细胞的特性源于基因表达的差异，而一个细胞的基因表达模式不仅决定了它属于
SpreadJS 迷你图：数据趋势可视化的利器 spreadjs
引言在数据处理和分析领域，直观地展示数据趋势对于理解数据和做出决策至关重要。迷你图作为一种简洁而有效的数据可视化方式，在显示数据趋势方面发挥着重要作用，尤其在与他人共享数据时，能够快速传达关键信息。SpreadJS作为一款强大的电子表格组件，对迷你图功能提供了丰富的支持。本文将详细介绍SpreadJS迷你图的特点、优势、创建方式以及与GcExcel的兼容情况。迷你图的概述与作用迷你图是单个工作表单
数据库设计三范式详解与注意事项步行cgn 数据库数据库 oracle 服务器
数据库设计三范式详解与注意事项数据库设计三范式（NormalForms）是关系型数据库设计的核心理论，用于减少数据冗余、提高数据一致性和完整性。下面我将详细解释三范式的概念、应用场景和实际注意事项。一、三范式核心概念1.第一范式(1NF)：原子性定义：每个列都是不可再分的原子值每行有唯一标识（主键）示例：--不符合1NFCREATETABLEorders(order_idINTPRIMARYKEY
数据库 DML 语句详解：语法与注意事项步行cgn 数据库数据库 oracle
数据库DML语句详解：语法与注意事项DML（DataManipulationLanguage，数据操作语言）用于操作数据库中的数据，主要包括SELECT、INSERT、UPDATE、DELETE等语句。下面我将详细说明每种操作的语法、使用场景和关键注意事项。一、SELECT查询语句基本语法SELECT[DISTINCT]column1,column2,...FROMtable_name[WHERE
数据库级联操作详解：级联删除、更新与置空步行cgn 数据库数据库 oracle sql
数据库级联操作详解：级联删除、更新与置空在数据库设计中，级联操作（CASCADE）是管理关联数据的关键机制，它能自动处理主表与从表之间的数据一致性。下面详细介绍级联删除、更新和置空的语法、使用场景及注意事项。一、级联操作语法1.级联删除（ONDELETECASCADE）--创建表时定义CREATETABLEorders(order_idINTPRIMARYKEY,customer_idINT,FO
切换自定义键盘导致系统键盘收起，小窗模式组件不应该失焦，如何解决？ bug菌¹ 全栈Bug调优(实战版)harmonyos 切换自定义键盘小窗模式组件
本文收录于《全栈Bug调优(实战版)》专栏，致力于分享我在项目实战过程中遇到的各类Bug及其原因，并提供切实有效的解决方案。无论你是初学者还是经验丰富的开发者，本文将为你指引出一条更高效的Bug修复之路，助你早日登顶，迈向财富自由的梦想！同时，欢迎大家关注、收藏、订阅本专栏，更多精彩内容正在持续更新中。让我们一起进步，Up！Up！Up！备注：部分问题/难题源自互联网，经过精心筛选和整理，结合数
【JS-6-ES6中的let和const】深入理解ES6中的let和const：块级作用域与变量声明的新范式 AllenBright #JS javascript es6 开发语言
在ES6(ECMAScript2015)之前，JavaScript中只有var一种变量声明方式，这导致了许多作用域相关的问题。ES6引入了let和const两种新的变量声明方式，彻底改变了JavaScript的作用域规则。本文将深入探讨let和const的特性、优势以及它们与var的区别。1.var的问题与ES6的解决方案1.1var的局限性在ES5及之前版本中，var声明存在几个主要问题：函数作
项目立项主要内容及实例小赖同学啊 test Technology Precious 项目管理
项目立项主要内容及实例项目立项主要内容项目基本信息项目名称：清晰明确地概括项目核心内容，让读者能快速了解项目大致方向。项目发起人：通常是提出项目想法或需求的个人、部门或组织，在项目中有一定决策权和影响力。项目负责人：即项目经理，全面负责项目的规划、执行、监控和收尾等工作。项目起止时间：明确项目开始和预计结束的时间节点，有助于合理安排资源和进度计划。项目背景与必要性背景阐述：分析项目所处的行业环境、
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那

BERT+知识图谱：北大-腾讯联合推出知识赋能的K-BERT模型

背景

方法

实验结果

后记

参考文献

你可能感兴趣的:(BERT+知识图谱：北大-腾讯联合推出知识赋能的K-BERT模型)