JamSlade

人工智能笔记13 --知识图谱（1）

概况

搜索核心需求：让搜索通往答案
Ø无法理解搜索关键词
Ø无法精准回答
根本问题
Ø缺乏大规模背景知识
Ø传统知识表示难以满足需求

知识图谱狭义概念

知识图谱(Knowledge Graph, KG)本质上是一种大规模语义网络，是互联网时代的语义网知识表示框架。

Ø 富含实体(entity)、概念(concepts)及其之间的各种语义关系(semantic relationships)知识图谱的狭义概念

作为一种语义网络，大数据时代知识表示的重要表达方式之一

知识图谱是一种以图形化的(Graphic)形式通过节点和边表达知识的方式，其基本组成元素是节点和边

KG组成-实体与节点
实体（Entity）：又称为对象（Object）或实例Instance）
Ø 指客观世界中具有可区别性且独立存在的某种事物

概念（Concept）：又称为类别（Type）、类Category、Class）
Ø 反映一组实体的种类或对象类型，如哲学家、唯心主义哲学家

属性值（Property Value / Attribute Value）：指实体特定属性的值
Date
Ø 特朗普出生日期 1946年6月14日
String
Ø 特朗普简介 “唐纳德·特朗普（Donald Trump），第45任美国总统，1946年6月14日生于纽约，美国共和党籍政治家
Numeric
Ø 特朗普年龄 71

关系（Relation）
Ø 侧重实体之间的关系，如“柏拉图”和“苏格拉底”这两个实体存在“导师”关系

属性（Property/Attribute/Quality）
Ø 指某个实体可能具有的特征以及参数，如“苏格拉底”具有“出生时间”这个特征

优点

实体/概念覆盖率高
各种语义关系覆盖率高
质量高
Ø 基于大数据自动构建: 各种数据源之间交叉验证，可靠性高
Ø 基于众包构建:依赖人工，质量高
结构化组织
Ø 基于RDF三元组，每条知识对应一个（Subject，Predicate，Object）三元组
Ø 基于图（节点表示实体/概念/属性值，边表示关系）

不足

• 提升知识图谱的规模往往会付出质量方面的代价
Ø 可以预先定义人的“身高”取值范围为0.5m ~ 2.3m，但可能存在某个人，其身高达到2.31m
Ø “黄晓明”的妻子曾经是“杨颖”，但现在并非如此

• 知识图谱在设计模式时通常会采取一种“经济、务实”的做法：也就是允许模式（Schema）定义不完善，甚至缺失

模式定义不完善或缺失对知识图谱中的数据语义理解以及数据质量控制提出了挑战

• 传统数据库与知识库的应用通常建立在封闭世界假设（CWA）基础之上。 CWA 是假定数据库或知识库中不存在（或未观察到）的事实即为不成立的事实
• 大多数开放性应用不遵守这一假设。也就是说，在这些应用中缺失的事实或知识未必为假
Ø 很难保证知识图谱中关于柏拉图的信息完整，很可能会缺失柏拉图父母的信息。但常识告诉我们柏拉图一定有父母。

不遵守CWA 给知识图谱上的应用带来了巨大的挑战

• 传统知识工程依赖专家完成知识获取，这一方式难以实现大规模知识获取，难以满足知识图谱的规模要求。
• 大规模自动化知识获取是知识图谱与传统语义网络的根本区别。
• 大规模自动化知识获取和图谱构建
Ø 词汇挖掘
Ø 实体识别
Ø 关系抽取

词汇挖掘

• 知识图谱中的节点
Ø 实体，eg，复旦大学
Ø 概念，eg, 学校
Ø 属性值（依附于实体存在），eg，1946年6月14日

实体、概念、属性值都是词汇

• 理解一个领域往往是从理解领域词汇开始的
• 与图书情报领域的叙词表（主题词表）构建相关
• 词汇知识是理解用户意图的关键知识
• 广泛应用
Ø 比如，猎头如果要寻找知识图谱领域的专家或学者，只需要判断候选人的简历或者论文题目中是否包含知识图谱的领域词汇

• 词汇挖掘指的是从给定的领域语料中自动挖
掘属于该领域的高质量词汇的过程。
• 高质量词汇
Ø 高频率：一个 N-Gram在给定的文档集合中要出现得足够频繁才能被视作高质量词汇（N-Gram：N个连续的词组成的短语）
Ø 一致性：N-Gram 中不同单词的搭配是否合理或者是否常见
Ø 信息量:一个高质量词汇应该传达一定的信息，表达一定的主题或者概念
• 比如，“机器学习”与“这篇论文”
Ø 完整性:一个高质量词汇还必须在特定的上下文中是一个完整的语义单元。
• 比如，“学习” vs“机器学习”

输入领域预料（人工智能论文集）输出高质量词汇（支持向量机、卷积神经网络、机器学习）

挖掘方法

• 基于规则
• 通过预定义的词性标签（POS Tag）规则来识别文档中的高质量名词短语。

• 缺陷：
Ø 规则一般是针对特定领域手工设计的，难以适用于其他领域。
Ø 人工定义规则代价高昂，难以穷举所有的规则，因此在召回率存在一定的局限性

基于统计学习
• 无监督学习
Ø 通过计算候选短语的统计特征从而给词汇打分、排序来进行领域词汇挖掘。

• 有监督学习
Ø 根据人工标注或远程监督标注的高质量词汇，建立高质量词汇分类模型。

无监督学习

候选短语生成：N-Gram得到高频候选短语。
统计特征计算：如计算TF-IDF和PMI等。
质量评分：融合这些特征的值（如加权求和等）得到短语的最终分数。
排序输出：取topK或根据阈值筛选词汇输出。

有监督学习

样本标注：人工标注或者远程监督标注样本。
分类器学习：根据正负样本，学习一个二元分类器。分类器模型可以是逻辑斯蒂回归、决策树或者支持向量机。对于每个样本，使用统计指标（TF-IDF、C-value以及 PMI 等）构造相应的特征向量。

有监督学习+迭代式优化

• 语料切割：
利用模型来识别高质量短语，再根据已经发现的高质量短语对语料进行切割，在切割的基础上重新统计词频，改进词频统计的精度。

语料切割与高质量词汇挖掘两者互相增强

TF-IDF（词频-逆文档频率）

• 高质量短语：
Ø 词频：在领域语料中频繁出现，即词频（term frequency，tf）高

Ø 逆文档频率：在外部文档中很少出现，即文档频率（documentfrequency, df）低，逆文档频率（inverse document frequency,idf) 高
【“的”、“是”和“由于”等词汇过于普遍，不适合用来刻画该领域语料的特征】
TF-IDF：反义ing词汇重要程度
$T F - I D F (u) = t f * i d f$
$tf(u)=\frac{f(u)}{\sum_{u'}f(u')}$
$idf(u)=log\frac{|D|+\delta}{|\{j:u\in d_j\}|+\delta}$

统计特征： C-value

• 高质量短语：
Ø 考虑长度：一般而言，在很多专业领域（比如医学领域）越长的短语越有可能是专有名词, 从而极可能是高质量短语。
Ø 优化词频：子短语在其父短语中的重复统计会带来频次估计的偏差“支持向量机”（父短语）是个高质量短语，那么“向量机”和“支持向量”（子短语）的词频就不应该重复计数

$C-value(u)=\left\{\begin{array}{l} log_2|u|f(u)&u无父短语\\ log_2|u|(f(u)-\frac{1}{T_u}\sum_{b\in T_u}f(b)&u有父短语 \end{array}\right.$

统计特征： NC-value

在C-value的基础上利用短语丰富的上下文信息
Ø 先通过 C-value 值对短语进行初步排序，再选取前 5%候选短语的上下文中所出现的单词作为b。
Ø 上下文单词 b 的重要性值为weight(b) ，weight(b)越大，说明 b 越倾向于出现在高质量短语的上下文中，因此越有助于找到高质量短语。
$NC-value(u)=0.8C-value(u)+0.2\sum_{b\in C_u}f_u(b)weight(b)$
$weight(b)=\frac{t(b)}{n}$

统计特征： PMI（点互信息）

• 主要思想：
如果两部分共同出现的概率远大于两者在独立情况下随机出现的概率，说明这两个部分的共现是一个有意义的搭配，预示着两者应该组成一个有意义的短语而非纯粹
偶然共现。
• PMI 值：刻画短语组成部分之间的一致性Concordance）

假设某个短语 $u$ 由 $u_l$ 与 $u_r$ 两部分组成
$OMI(u_l,u_r)=log\frac{p(u)}{p(u_l)p(u_r)}$

$u_l$ 与 $u_r$ 的PMI值越大， $u$ 越有可能是 $u_l$ 与 $u_r$ 的一个有意义组合

Ø 对于候选短语，枚举所有可能的拆分方式（如“电影院”可拆分成“电影”和“院”，“电”和“影院” ）
Ø 计算相应的PMI，取最小的PMI值作为候选短语的最终PMI值
Ø PMI（“电影”，“院”）> PMI(“的”，“电影”)
“电影院”比“的电影”质量更高

统计特征：左（右）邻字熵

主要思想：
一个词汇的左（右）邻熵越大，左（右）搭配越丰富，则该词汇越有可能是个好的词汇。

“亚里士多”这个短语的右邻字比较集中，总是“德”字，所以一般不会把
它当作一个完整短语，而应将“亚里士多德”当作一个完整短语。

左（右）邻字熵：描述词汇的自由搭配程度，也就是用来衡量一个词的左(右)邻字集合的丰富程度
$H(u)=-\sum_{x\in X}p(x)logp(x)$
$X:u的所有左（右）邻字集合\quad$ $p (x) : 某个左（右）邻字 x 出现的概率$

常用统计特征	作用
TF-IDF	挖掘能够有效代表某篇文档特征的短语
C-value	考虑了短语与其父短语的关系来挖掘高质量短语
NC-value	在C-value 的基础上进一步考虑了上下文来挖掘高质量短语
PMI	挖掘组成部分一致性较高（经常一起搭配）的短语左（右）邻字熵挖掘左（右）邻丰富的短语

在领域词汇挖掘中要融合多种统计特征，取长补短，挖掘出高质量的领域短语。只考虑单一特征不足以挖掘高质量短语。

实体识别

• 命名实体（ Named Entity ）
Ø 文本中具有特定意义或者指代性强的词汇，通常包括：
3大类：实体类、时间类、数字类
7小类：人名、地名、组织机构名、时间、日期、货币、比例数值
Ø 具有标识和区别作用

命名实体识别（Named Entity Recognition, NER）：
Ø 在文本中定位命名实体并分类为预定义类别
Ø Input：词序列 $s = < w_{1}, \dots \dots, w_{N} >$
Ø Output： $\{\}$
$< I_{S}, I_{e}, t >$ 表示某个命名实体的开始、结束
位置和实体类型

• 命名实体识别可以分为：
Ø 粗粒度、细粒度
• 人物，还可以进一步细分为导演、演员等
Ø 多标签、单标签
• 如：“吴京”既是演员又是导演。

基于规则

• 依赖词典、模板、正则表达式（无监督学习）
Ø 基于规则的NER系统：
LaSIE-II，NetOwl，Facile，
SAR，FASTUS和LTG
如“White, 33”中的“White”为人名

• 依赖语言专家手工构造规则，代价高昂，难以穷举所有的规则。
• 基于规则的命名实体识别系统往往还需要借助实体词典，对候选实体进行进一步的确认。当词典详尽无遗时，基于规则的系统效果很好

基于传统机器学习

• 建模为序列标注任务，为输入文本选择概率最大的标注序列（有监督学习）
• BIO标注
Ø 其中 B 表示实体的起始位置，I 表示实体的内部位置，O 表示相应字符不是实体

B-PER 表示这个字符是一个人物命名实体的起始位置。
I-PER 表示相应字符为人物实体的内部位置。
类似的，B-LOC 与 I-LOC 代表地点名的起始和内部位置。

• 常用模型：条件随机场（CRF）

依赖特征工程：需提取输入文本X和实体标签Y的多种特征
$P (Y ∣ X) = P (B - P E R, I - P E R, I - P E R ∣ 刘，德，华)$

深度学习

基于深度学习的NER框架包含三个模块（有监督学习）：
Ø 输入的分布式表示
（distributed representation）
Ø 上下文编码器
（context encoder）
Ø 标签解码器
（tag decoder）

• 常用模型：BiLSTM-CRF
Ø 是基于深度学习的NER最常见的架构
Ø 由分布式表示层、双向 LSTM 层，以及 CRF 层构成。

• 相比于传统机器学习方法，基于深度学习的NER方法有以下优点：
Ø 并不需要特定的人工制定规则或者繁琐的特征工程
Ø 易于从输入提取隐含的语义信息
Ø 灵活且便于迁移到新的领域或其他语

conclusion

知识图谱概况：
• 节点（实体、概念、属性值）
• 边（关系、属性）
• 知识图谱的优势和不足
• 知识图谱的主要问题：如何大规模自动化获取知识
• 知识图谱构建（节点部分）：
• 词汇挖掘：
-基于规则
-基于统计学习（无监督、有监督）
• 实体识别：
-基于规则
-基于传统机器学习
-基于深度学习

模型微调：让AI更懂你的魔法棒带上一无所知的我 pytorch 人工智能 python
模型微调：让AI更懂你的魔法棒✨在人工智能的世界里，模型微调（Fine-tuning）就像是一位魔法师用魔法棒对预训练模型进行“个性化改造”，让它更适应特定的任务。今天，我们就来深入探讨模型微调的技术细节，让你也能像魔法师一样，轻松驾驭AI模型！什么是模型微调？模型微调是指在预训练模型的基础上，通过少量的特定任务数据进行训练，使模型更好地适应新任务的技术。预训练模型通常是基于大规模数据集（如Ima
从 DeepSeek 到 AI 工具箱：Websoft9 应用托管平台赋能高校教学与科研人工智能deepseek
从DeepSeek到AI工具箱：Websoft9应用托管平台赋能高校教学与科研人工智能技术的快速发展正在重塑高校的教学与科研生态。从智能教学辅助到跨学科研究，AI工具的应用场景不断扩展，而技术落地的复杂性也带来新的挑战。在这一背景下，如何将大模型能力与多样化AI工具无缝整合，构建安全、易用的科研教学环境，成为高校数字化转型的关键命题。一、高校智能化转型的三大痛点技术门槛高•AI工具部署依赖专业运维
聊聊关于Python与人工智能那些事小G-biu- python 人工智能 tensorflow
Python与人工智能：介绍Python在人工智能方面的应用Python是一种广泛使用的编程语言，也是人工智能领域中最受欢迎的语言之一。Python提供了许多用于构建和训练人工智能模型的库和框架。本文将介绍一些常见的人工智能技术以及Python在这些技术中的应用。OpenAIOpenAI是一个非营利组织，旨在推动人工智能的发展并促进其对人类的利益。OpenAI通过开发人工智能技术、研究人工智能的影
当现代教育技术遇上仓颉---探秘华为仓颉编程语言与未来教育技术的接轨想成为高手499 华为服务器 php
引言随着人工智能、物联网、区块链等新兴技术的发展，编程语言的需求也在不断演化。据市场研究机构发布的数据显示，全球编程语言市场规模预计在未来五年内将以每年10%的速度增长。此外，越来越多的企业和高校正在积极推动基于分布式系统和硬件优化的新型语言开发，这进一步表明对高性能编程语言的需求日益旺盛。近年来，华为推出了自研编程语言“仓颉”，以其高效的语法设计、灵活的语义表达能力和强大的跨平台适配性能引发了编
Python在人工智能与机器人开发中的应用与实践一键难忘 python 人工智能机器人
Python在人工智能与机器人开发中的应用与实践Python已经成为人工智能和机器人开发的主要编程语言之一，凭借其简洁的语法、强大的库支持和广泛的社区资源，Python为开发者提供了一个高效且易于学习的平台。在这篇文章中，我们将深入探讨如何使用Python进行人工智能（AI）和机器人开发，并通过实际代码示例展示核心技术和应用。1.Python在人工智能中的应用人工智能（AI）领域的核心任务包括机器
C语言入门第七天字符串输入输出函数和控制语句 Do vis824 算法 c#c语言 linux
一：字符串输入输出函数1:字符串输入函数getsa:格式:char*gets(char*s)现在指针不懂的可以直接写成gets（s）b:功能:从键盘输入一以回车结束的字符串放入字符数组中，并自动加'\0',c:输入串长度应小于字符数组维数d:与scanf函数不同，gets函数并不以空格作为字符串输入结束的标志e:代码展示#includeintmain(){chara[5];gets(a);prin
不要再走弯路了2025最全的黑客入门学习路线在这渗透代老师学习网络安全 web安全网络 python
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包在大多数的思维里总觉得[学习]得先收集资料、学习编程、学习计算机基础，这样不是不可以，但是这样学效率太低了！你要知道网络安全是一门技术，任何技术的学习一定是以实践为主的。也就是说很多的理论知识其实是可以在实践中去验证拓展的，这样学习比起你啃原理、啃书本要好理解很多。所以想要学习网络安全选对正确的学习方法很重要，这可以帮你少走很多弯路。
202年充电计划——自学手册网络安全（黑客技术）网安康sir web安全安全网络 python linux
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包前言什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习
自学网络安全（黑客技术）2025年 —90天学习计划网安CILLE web安全学习安全网络网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包前言什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习
智慧交通是什么，可以帮助我们解决什么问题? Guheyunyi 运维大数据人工智能信息可视化前端
智慧交通是什么？智慧交通（SmartTransportation）是指利用物联网（IoT）、大数据、人工智能（AI）、云计算、5G通信等先进技术，对交通系统进行智能化管理和优化，以提高交通效率、减少拥堵、降低事故率、提升出行体验，并实现交通资源的合理配置和可持续发展。智慧交通的核心是通过数据采集、分析和应用，实现交通系统的智能化、自动化和协同化，从而构建一个高效、安全、绿色、便捷的交通生态系统。智
零基础怎么开始学网络安全（非常详细）零基础入门到精通，收藏这一篇就够了程序员羊羊 web安全安全网络 php 学习
一、学习建议1.了解基础概念：开始之前，了解网络安全的基本概念和术语是很重要的。你可以查找网络安全入门教程或在线课程，了解网络安全领域的基本概念，如黑客、漏洞、攻击类型等。2.网络基础知识：学习计算机网络基础知识，了解网络通信原理，不同网络协议（如TCP/IP）的工作方式，以及网络拓扑结构等。3.操作系统知识：了解常见的操作系统，特别是Windows和Linux。掌握基本的命令行操作和系统管理技能
网络安全入门教程（非常详细）从零基础入门到精通，看完这一篇就够了白帽黑客坤哥 web安全网络安全 python windows
href="https://csdnimg.cn/release/blogv2/dist/mdeditor/css/editerView/kdoc_html_views-1a98987dfd.css"rel="stylesheet"/>href="https://csdnimg.cn/release/blogv2/dist/mdeditor/css/editerView/ck_htmledit_v
Redis 使用入门与进阶指南 ohn.yu 技术杂谈 redis 数据库缓存
Redis（RemoteDictionaryServer）是一个高性能的开源内存数据存储系统，常被用作数据库、缓存和消息队列。它以速度快、支持多种数据结构和简单易用而著称。本文将带你从Redis的基础用法开始，逐步深入到适合中级技术人员的实际应用场景。如果你是一个初学者或有一定经验的技术人员，这篇博客会帮助你更好地掌握Redis。什么是Redis？Redis是一个键值对存储系统，但它不仅仅是简单的
若依框架入门指南：快速上手SpringBoot+前后端分离版小小鸭程序员 spring java spring boot 后端 intellij-idea
若依（RuoYi）是一款基于SpringBoot的快速开发平台，集成了权限管理、代码生成、监控管理等功能。本文将以SpringBoot+Vue前后端分离版本为例，带你快速上手若依框架。一、环境准备基础环境：JDK1.8+MySQL5.7+Redis5.0+Maven3.6+Node.js14+（前端）下载项目：#后端项目gitclonehttps://gitee.com/y_project/Ruo
Deno入门教程：Node.js 的替代品 xiaoweids 编程语言 JavaScript node.js javascript 开发语言
转自：微点阅读https://www.weidianyuedu.com这几天假期，我学习了一下Deno[1]。它是Node.js的替代品。有了它，将来可能就不需要Node.js了。这篇文章就是Deno的一个初步介绍，尝试回答为什么Node.js不能满足需要，以及Deno能够带给我们什么？以下内容主要基于BertBelder[2]和RyanDahl[3]的最新演讲。0、进入主题之前，先说一下Deno
在线视频创作平台（Vidnami） deepdata_cn 视频生成视频剪辑视频创作
Vidnami是一款功能强大的在线视频创作平台，前身为ContentSamurai，于2015年推出，2020年更名为Vidnami。它运用人工智能技术，能够分析输入的文本，自动从大量素材中选取合适的图像和视频片段，将文字快速转化为具有专业外观的视频，无需用户具备视频编辑经验。该平台提供多种视频模板、全主题定制功能以及内置的免版权媒体库，包括3000万张图片和3万首音乐，还支持自动配音，用户可以录
Vue.js的watch监听阿珊和她的猫 vue.js 前端 javascript
前端开发工程师、技术日更博主、已过CET6阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1牛客高级专题作者、打造专栏《前端面试必备》、《2024面试高频手撕题》、《前端求职突破计划》蓝桥云课签约作者、上架课程《Vue.js和Egg.js开发企业级健康管理项目》、《带你从入门到实战全面掌握uni-app》文章目录引言`watch`选项的基本概念`watch`选项的基本语法`watch
OpenCV第1课OpenCV 介绍及其树莓派下环境的搭建嵌入式老牛树莓派之OpenCV opencv 人工智能计算机视觉
1.机器是如何“看”的我们人类可以通过眼睛看到五颜六色的世界，是因为人眼的视觉细胞中存在分别对红、绿、蓝敏感的3种细胞。其中的光感色素根据光线的不同进行不同比例的分解，从而让我们识别到各种颜色。对人工智能而言，学会“看”也是非常关键的一步。那么机器人是如何看到这个世界的呢？这就涉及到人工智能方向重要的分支--机器视觉。机器视觉即用机器人代替人眼来做测量和判断，通过机器视觉产品（即图像摄取装置，分C
Rust为Node.js开发者设计：入门到实战平依佩Ula
Rust为Node.js开发者设计：入门到实战rust-for-node-developersAnintroductiontotheRustprogramminglanguageforNodedevelopers.项目地址:https://gitcode.com/gh_mirrors/ru/rust-for-node-developers项目介绍欢迎来到《Rust为Node.js开发者设计》的实践
31天Python入门——第7天:集合·字典你真的懂了吗? 安然无虞 Python手把手教程 python 开发语言后端
你好，我是安然无虞。文章目录1.集合1.1集合的定义1.2集合的常用操作1.3集合练习2.字典2.1字典的定义2.2嵌套字典和字典的取值2.3字典的常用操作补充知识:字典的优势是查找值效率高2.4字典推导式2.5字典练习很重要的补充练习:希望你能掌握练习一练习二1.集合在之前的章节中,我们学习了列表,元组,字符串.已经可以覆盖七成的使用场景了.那么为什么还要学习集合类型呢.列表:有序可变,元素可重
Linux安装Anaconda和Jupyter 硬水果糖人工智能 Linux linux jupyter 运维
一、了解Anaconda和Jupyter引言：Anaconda是一个流行的开源数据科学平台，广泛用于数据分析、机器学习、人工智能等领域。它是一个集成了大量科学计算和数据科学工具的Python和R编程语言环境。Anaconda的主要目标是简化数据科学和机器学习的开发流程，提供一个易于安装和管理的环境。而预装了大量常用的Python和R库，这些库涵盖了数据科学的各个方面，包括：数据分析：Pandas、
JVM技术八股文小麟School JVM jvm java 开发语言
JVM面试八股文，整理了出来。排版不太好！目录JVM入门部分为什么要学习JVM？你了解哪些JVM产品？JVM的构成有哪几部分？JVM类加载部分你知道哪些类加载器？为什么需要多个类加载器？什么是双亲委派类加载模型？双亲委派方式加载类有什么优势、劣势？描述一下类加载时候的基本步骤是怎样的？什么情况下会触发类的加载？类加载时静态代码块一定会执行吗？如何理解类的主动加载和被动加载？为什么要自己定义类加载器
DeepSeek 大模型落地成都高新区：科技赋能警务的创新变革 AGI大模型学习科技人工智能 DeepSeek 大模型 chatgpt 大模型应用 AI大模型
在科技飞速发展的当下，人工智能正以前所未有的速度融入各个领域，深刻改变着人们的生活与工作方式。公安领域也不例外，积极拥抱科技创新，成为提升警务效能、维护社会稳定的关键路径。全国第一例警用DeepSeek大模型落地成都高新区，这一突破性举措在警务智能化发展进程中具有里程碑意义，为公安工作带来了全方位的革新。一、警用DeepSeek大模型落地的时代背景近年来，国产AI蓬勃发展，不断涌现出令人瞩目的成果
C++协程入门教程 ox0080 #北漂+滴滴出行 C++协程 VIP 激励 c++开发语言
一、环境搭建（Docker+双编译系统）1.全能Docker环境配置FROMubuntu:22.04#基础工具链RUNapt-getupdate&&DEBIAN_FRONTEND=noninteractiveapt-getinstall-y\build-essentialcmakebazelgitg++-12libcppcoro-dev\openssh-serverrsyslogcurlgnupg
大数据和人工智能概念全面解析就犯得上方法
一、大数据和人工智能大数据是伴随着信息数据爆炸式增长和网络计算技术迅速发展而兴起的一个新型概念。根据麦肯锡全球研究所的定义，大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合，具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据能够帮助各行各业的企业从原本毫无价值的海量数据中挖掘出用户的需求，使数据能够从量变到质变，真正产生价值
opencv + opengl显示摄像头视频流 jbjhzstsl opencv 计算机视觉
完整代码github建议学习LearnOpenGL教程，学到入门的纹理一节1.OpenGL依赖安装1.1.安装GLFWsudoaptinstalllibglfw3libglfw3-devlibglfw3：GLFW运行时库libglfw3-dev：GLFW开发库（用于编译）1.2.安装OpenGL相关依赖sudoaptinstalllibgl1-mesa-devxorg-devlibgl1-mesa
【mysql】mysql之主从部署以及介绍向往风的男子 DBA mysql 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
DeepSeek爆火，背后模型竟藏着这些秘密！ qq_23519469 ai
DeepSeek是什么来头最近，AI圈可是被一个名字刷爆了屏，那就是DeepSeek！它就像一颗横空出世的超级新星，在全球范围掀起了一阵狂热的追捧潮，这热度，简直了！大家都在疯狂讨论它，各种测评、对比层出不穷。它到底有啥过人之处，能让这么多人都为之疯狂？今天咱就来好好唠唠。DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，是一家专注于开发先进大语言模型（LLM）和相关技术的企业。它成
Docker入门篇:安装与加速 slamml Docker docker 容器运维
今天接着上一篇文章来写，本来计划以paopaorobot/dvo为例带入docker的基本操作，然后中间插播一下docker的安装和加速，但是发现写的有点罗嗦，刚写完安装与加速就挺大篇幅了，所以决定将docker基本操作放到下一篇介绍，对不住～对不住～。docker安装在这里，针对Windows、Ubuntu平台介绍docker的安装。Windows平台（本机win7）前提要求机器是64bit的，
Docker入门篇-安装Docker CE 极客编程玩家
安装DockerCE有两种方法可以在Centos上安装DockerCE：YUM存储库：设置Docker存储库并从中安装DockerCE。这是推荐的方法，因为使用YUM管理安装和升级更容易。(后面我们使用这种方式)RPM包：下载RPM包，手动安装，手动管理升级。在无法访问互联网的系统上安装DockerCE时，这非常有用。先决条件要安装DockerCE，您需要CentOS7的维护版本。不支持或测试存档
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那