马良神笔

知识图谱开发笔记

概念：本质上看，知识图谱，是一种大规模语义网络，可以算作是知识工程学科的代表。

形式：网链结构，有核心节点，是大数据的价值载体。

应用：知识图谱的使用较为灵活，一方面，可以单独进行使用，作为数据的加工方，直接对接原始数据，从源头进行数据清洗和知识数据图谱关联呈现；另一方面，还可与其他系统进行对接，在有数据沉淀一方，进行实体抽离，在知识图谱端进行知识加工，最终将知识网络和潜在关系，提供到知识使用人员。

https://blog.csdn.net/xs1997/article/details/125061428

https://jishuin.proginn.com/p/763bfbd379d3

https://ir.sdu.edu.cn/~zhuminchen/KG/6.htm

https://github.com/qq547276542/Agriculture_KnowledgeGraph

https://blog.csdn.net/shengeng_hu/article/details/126420102?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_baidulandingword~default-1-126420102-blog-121156478.pc_relevant_3mothn_strategy_and_data_recovery&spm=1001.2101.3001.4242.2&utm_relevant_index=4

https://github.com/baiyang2464/chatbot-base-on-Knowledge-Graph

本体设计是图应用中的重中之重，一切的图展示、图计算、图分析、图挖掘、图模式匹配...的基础在图构建，而图构建的核心是本体设计。”

如何设计领域本体

设计本体的过程一般包括如下步骤：

• 定义点类型（实体分类）

• 定义点类型的分类关系（即子类 - 父类的分类树），本体中的点类型，可以有最高抽象点类型（如：人类、自然人），也可以有子点类型（如：男人、女人、欧洲人、亚洲人），甚至可以更细分（如：中国人、美国人、北京人）。

• 定义边类型、边类型的有向型（是否有向，有向为出向还是入向）

• 定义点、边类型属性以及属性值取值范围

• 设定点、边类型属性取值的缺省值

知识图谱搜索引擎Magi

构建知识图谱是包括这样的生命周期或这样的部分，包括定义、知识的抽取、知识的融合、存储、知识的推理、知识的应用，这样的循环迭代的过程。

目前主流的几款图数据库，Titan、Graph、Neo4J这个三个分别都是开源的，然后Titan是阿帕奇下面的，Graph是MIT，Neo4J是开源的一种商业的，既有商业版，也有也有开源免费版。

知识推理，知识推理这边有几种方法，首先是基于符号推理，我们上面说的三元组的结构，比如说左边的RDF，有概念，就是实例的结合，然后基于概念进行推理。我在最开始讲的 Google 的例子就是基于符号三元组形成的简单推理。

还有一种是基于深度学习的推理，这里的一个例子是利用了卷积神经网络对实体进行关系的分类的，它不一样的地方是什么？是它把依存树作为输入，就是将词在树中的不同的位置的嵌入式的表示拼接到这个词向量当中来学习，同时对面相树结构设计了独特的卷积盒。这种方法在实体分类的任务上，相较于未使用位置关系的信息，效果会有一定的提升，这也是其中一种方法。

随着智能信息服务应用的发展，知识图谱已广泛应用于智能搜索、智能问答、个性化推荐、情报分析、反欺诈等领域。另外，通过知识地图，可以将Web上的信息、数据、链接关系作为知识进行收集，使信息资源的计算、理解、评价变得容易，可以形成Web语义知识库。

知识图谱有三元组和自顶向下两种构建方式。

自上而下的构建是利用百科全书等结构化数据源，从高质量的数据中提取主体和模式信息，添加到知识库中；自下而上构建是指运用一定的技术手段，从公开收集的数据中提取资源模式，从中选择可靠的新模式，人工审核后添加到知识库中。

实体：是指可区别且独立存在的某种东西。实体是知识图谱中最基本的要素，不同实体之间有不同的关系。

关系：关系是连接不同实体的，是指实体之间的联系。

信息抽取：从各种类型的数据源中提取出实体、属性以及实体间的相互关系，在此基础上形成本体化的知识表达；

知识融合：在获得新知识之后，需要对其进行整合，以消除矛盾和歧义，比如某些实体可能有多种表达，某个特定称谓也许对应于多个不同的实体等；

知识加工：对于经过融合的新知识，需要经过质量评估之后（部分需要人工参与甄别），才能将合格的部分加入到知识库中，以确保知识库的质量。

其实我们的构建知识图谱的过程，就是信息抽取、知识融合、知识加工三个过程，但是这三个过程都有各自的难点，下文通过从这三个模块出发，解析这三个模块说要解决的问题，会遇到的难点。

信息抽取是一种自动化地从半结构化和无结构数据中抽取实体、关系以及实体属性等结构化信息的技术。

涉及的关键技术包括：实体抽取、关系抽取和属性抽取。

5.1 实体抽取(Entity Extraction)

实体抽取又称为命名实体识别（named entity recognition，NER），是指从文本数据集中自动识别出命名实体。实体抽取的质量（准确率和召回率）对后续的知识获取效率和质量影响极大，因此是信息抽取中最为基础和关键的部分。

一种思路是根据已知的实体实例进行特征建模，利用该模型处理海量数据集得到新的命名实体列表，然后针对新实体建模，迭代地生成实体标注语料库。

另一种思路是利用搜索引擎的服务器日志，事先并不给出实体分类等信息，而是基于实体的语义特征从搜索日志中识别出命名实体，然后采用聚类算法对识别出的实体对象进行聚类。

5.2 关系抽取(Relation Extraction)

文本语料经过实体抽取，得到的是一系列离散的命名实体，为了得到语义信息，还需要从相关的语料中提取出实体之间的关联关系，通过关联关系将实体（概念）联系起来，才能够形成网状的知识结构，研究关系抽取技术的目的，就是解决如何从文本语料中抽取实体间的关系这一基本问题。

人工构造语法和语义规则（模式匹配）统计机器学习方法基于特征向量或核函数的有监督学习方法研究重点转向半监督和无监督开始研究面向开放域的信息抽取方法将面向开放域的信息抽取方法和面向封闭领域的传统方法结合

5.3 属性抽取(Attribute Extraction)

属性抽取的目标是从不同信息源中采集特定实体的属性信息。例如针对某个公众人物，可以从网络公开信息中得到其昵称、生日、国籍、教育背景等信息。属性抽取技术能够从多种数据来源中汇集这些信息，实现对实体属性的完整勾画。

6. 知识融合

知识融合包括2部分内容：实体链接，知识合并

6.1 实体链接

实体链接（entity linking）：是指对于从文本中抽取得到的实体对象，将其链接到知识库中对应的正确实体对象的操作。

其基本思想是首先根据给定的实体指称项，从知识库中选出一组候选实体对象，然后通过相似度计算将指称项链接到正确的实体对象。

实体链接的流程：

从文本中通过实体抽取得到实体指称项。进行实体消歧和共指消解，判断知识库中的同名实体与之是否代表不同的含义以及知识库中是否存在其他命名实体与之表示相同的含义。在确认知识库中对应的正确实体对象之后，将该实体指称项链接到知识库中对应实体。实体消歧：专门用于解决同名实体产生歧义问题的技术，通过实体消歧，就可以根据当前的语境，准确建立实体链接，实体消歧主要采用聚类法。其实也可以看做基于上下文的分类问题，类似于词性消歧和词义消歧.共指消解：主要用于解决多个指称对应同一实体对象的问题。在一次会话中，多个指称可能指向的是同一实体对象。利用共指消解技术，可以将这些指称项关联（合并）到正确的实体对象，由于该问题在信息检索和自然语言处理等领域具有特殊的重要性，吸引了大量的研究努力。共指消解还有一些其他的名字，比如对象对齐、实体匹配和实体同义。

6.2 知识合并

在构建知识图谱时，可以从第三方知识库产品或已有结构化数据获取知识输入。

常见的知识合并需求有两个，一个是合并外部知识库，另一个是合并关系数据库。

将外部知识库融合到本地知识库需要处理两个层面的问题：

数据层的融合，包括实体的指称、属性、关系以及所属类别等，主要的问题是如何避免实例以及关系的冲突问题，造成不必要的冗余

通过模式层的融合，将新得到的本体融入已有的本体库中

然后是合并关系数据库，在知识图谱构建过程中，一个重要的高质量知识来源是企业或者机构自己的关系数据库。为了将这些结构化的历史数据融入到知识图谱中，可以采用资源描述框架（RDF）作为数据模型。业界和学术界将这一数据转换过程形象地称为RDB2RDF，其实质就是将关系数据库的数据换成RDF的三元组数据。

7. 知识加工

在前面，我们已经通过信息抽取，从原始语料中提取出了实体、关系与属性等知识要素，并且经过知识融合，消除实体指称项与实体对象之间的歧义，得到一系列基本的事实表达。

然而事实本身并不等于知识。要想最终获得结构化，网络化的知识体系，还需要经历知识加工的过程。

知识加工主要包括3方面内容：本体构建、知识推理和质量评估。

7.1 本体构建

本体（ontology）是指公认的概念集合、概念框架，如“人”、“事”、“物”等。

本体可以采用人工编辑的方式手动构建（借助本体编辑软件），也可以以数据驱动的自动化方式构建本体。因为人工方式工作量巨大，且很难找到符合要求的专家，因此当前主流的全局本体库产品，都是从一些面向特定领域的现有本体库出发，采用自动构建技术逐步扩展得到的。

自动化本体构建过程包含三个阶段：

实体并列关系相似度计算实体上下位关系抽取本体的生成

比如对下面这个例子，当知识图谱刚得到“阿里巴巴”、“腾讯”、“手机”这三个实体的时候，可能会认为它们三个之间并没有什么差别，但当它去计算三个实体之间的相似度后，就会发现，阿里巴巴和腾讯之间可能更相似，和手机差别更大一些。

这就是第一步的作用，但这样下来，知识图谱实际上还是没有一个上下层的概念，它还是不知道，阿里巴巴和手机，根本就不隶属于一个类型，无法比较。因此我们在实体上下位关系抽取这一步，就需要去完成这样的工作，从而生成第三步的本体。

当三步结束后，这个知识图谱可能就会明白，“阿里巴巴和腾讯，其实都是公司这样一个实体下的细分实体。它们和手机并不是一类。”

7.2 知识推理

在我们完成了本体构建这一步之后，一个知识图谱的雏形便已经搭建好了。但可能在这个时候，知识图谱之间大多数关系都是残缺的，缺失值非常严重，那么这个时候，我们就可以使用知识推理技术，去完成进一步的知识发现。

我们可以发现：如果A是B的配偶，B是C的主席，C坐落于D，那么我们就可以认为，A生活在D这个城市。

根据这一条规则，我们可以去挖掘一下在图里，是不是还有其他的path满足这个条件，那么我们就可以将AD两个关联起来。除此之外，我们还可以去思考，串联里有一环是B是C的主席，那么B是C的CEO、B是C的COO，是不是也可以作为这个推理策略的一环呢？

当然知识推理的对象也并不局限于实体间的关系，也可以是实体的属性值，本体的概念层次关系等。

推理属性值：已知某实体的生日属性，可以通过推理得到该实体的年龄属性；

推理概念：已知(老虎，科，猫科)和（猫科，目，食肉目）可以推出（老虎，目，食肉目）

这一块的算法主要可以分为3大类，基于逻辑的推理、基于图的推理和基于深度学习的推理。

https://www.zhangshilong.cn/work/51362.html

知识图谱的存储方式通常分为以下两种——

RDF存储格式
主要常用Jena

图数据库(Graph Database)
主要常用neo4j

采用图数据库而不是关系数据库的原因？

简单的知识图谱可以用关系数据库，但是一旦知识图谱变复杂，在关联查询的效率上会比传统的存储方式有显著的提高。当我们涉及到2,3度的关联查询，基于知识图谱的查询效率会高出几千倍甚至几百万倍。

基于图的存储在设计上会非常灵活，一般只需要局部的改动即可。

把实体和关系存储在图数据结构是一种符合整个故事逻辑的最好的方式。

知识图谱的架构

知识图谱的架构主要可以被分为

逻辑架构

技术架构

3-1逻辑架构

在逻辑上，我们通常将知识图谱划分为两个层次：数据层和模式层。

模式层：在数据层之上，是知识图谱的核心，存储经过提炼的知识，通常通过本体库来管理这一层这一层（本体库可以理解为面向对象里的“类”这样一个概念，本体库就储存着知识图谱的类）。

数据层：存储真实的数据。

如果还是有点模糊，可以看看这个例子——

模式层：实体-关系-实体，实体-属性-性值
数据层：比尔盖茨-妻子-梅琳达·盖茨，比尔盖茨-总裁-微软

构建方式

知识图谱有自顶向下和自底向上2种构建方式。

自顶向下：
借助百科类网站等结构化数据源，从高质量数据中提取本体和模式信息，加入到知识库中；

自底向上
借助一定的技术手段，从公开采集的数据中提取出资源模式，选择其中置信度较高的新模式，经人工审核之后，加入到知识库中。

构建技术

【这里提到的构建技术主要是自底向上的构建方式里会涉及到的构建技术】

如前所述，构建知识图谱是一个迭代更新的过程，根据知识获取的逻辑，每一轮迭代包含三个阶段——

信息抽取：从各种类型的数据源中提取出实体、属性以及实体间的相互关系，在此基础上形成本体化的知识表达；

知识融合：在获得新知识之后，需要对其进行整合，以消除矛盾和歧义，比如某些实体可能有多种表达，某个特定称谓也许对应于多个不同的实体等；

知识加工：对于经过融合的新知识，需要经过质量评估之后（部分需要人工参与甄别），才能将合格的部分加入到知识库中，以确保知识库的质量。

信息抽取

信息抽取（infromation extraction）是知识图谱构建的第1步，其中的关键问题是——

如何从异构数据源中自动抽取信息得到候选指示单元。
信息抽取是一种自动化地从半结构化和无结构数据中抽取实体、关系以及实体属性等结构化信息的技术。
涉及的关键技术包括：实体抽取、关系抽取和属性抽取。

实体抽取

实体抽取，也称为命名实体识别（named entity recognition，NER），是指从文本数据集中自动识别出命名实体。

研究历史：

面向单一领域，关注如何识别出文本中的人名、地名等专有名词和有意义的时间等实体信息

启发式算法+人工规则，实现自动抽取实体的原型系统

统计机器学习方法辅助解决命名实体抽取问题

有监督学习+先验知识

开始关注开放域（open domain）的信息抽取问题，不再限定于特定的知识领域，而是面向开放的互联网，研究和解决全网信息抽取问题。

人工建立科学完整的命名实体分类体系

基于归纳总结的实体类别，基于条件随机场模型进行实体边界识别，最后采用自适应感知机实现对实体的自动分类

采用统计机器学习的方法，从目标数据集中抽取出与之具有相似上下文特征的实体，从而实现实体的分类和聚类。

迭代扩展实体语料库

通过搜索引擎的服务器日志，聚类获取新出现的命名实体。——已应用于自动补全技术

关系抽取

文本语料经过实体抽取，得到的是一系列离散的命名实体，为了得到语义信息，还需要从相关语料中提取出实体之间的关联关系，通过关系将实体联系起来，才能够形成网状的知识结构。这就是关系抽取需要做的事。

研究历史：

人工构造语法和语义规则（模式匹配）

统计机器学习方法

基于特征向量或核函数的有监督学习方法

研究重点转向半监督和无监督

开始研究面向开放域的信息抽取方法

将面向开放域的信息抽取方法和面向封闭领域的传统方法结合

4-1-3 属性抽取

属性抽取的目标是从不同信息源中采集特定实体的属性信息，如针对某个公众人物，可以从网络公开信息中得到其昵称、生日、国籍、教育背景等信息。

研究历史：

将实体的属性视作实体与属性值之间的一种名词性关系，将属性抽取任务转化为关系抽取任务。

基于规则和启发式算法，抽取结构化数据

基于百科类网站的半结构化数据，通过自动抽取生成训练语料，用于训练实体属性标注模型，然后将其应用于对非结构化数据的实体属性抽取。

采用数据挖掘的方法直接从文本中挖掘实体属性和属性值之间的关系模式，据此实现对属性名和属性值在文本中的定位。

4-2 知识融合

通过信息抽取，我们就从原始的非结构化和半结构化数据中获取到了实体、关系以及实体的属性信息。

如果我们将接下来的过程比喻成拼图的话，那么这些信息就是拼图碎片，散乱无章，甚至还有从其他拼图里跑来的碎片、本身就是用来干扰我们拼图的错误碎片。

也就是说——

拼图碎片（信息）之间的关系是扁平化的，缺乏层次性和逻辑性；

拼图（知识）中还存在大量冗杂和错误的拼图碎片（信息）

那么如何解决这一问题，就是在知识融合这一步里我们需要做的了。

知识融合包括2部分内容：

实体链接

知识合并

4-2-1 实体链接

实体链接（entity linking）是指对于从文本中抽取得到的实体对象，将其链接到知识库中对应的正确实体对象的操作。

其基本思想是首先根据给定的实体指称项，从知识库中选出一组候选实体对象，然后通过相似度计算将指称项链接到正确的实体对象。

研究历史：

仅关注如何将从文本中抽取到的实体链接到知识库中，忽视了位于同一文档的实体间存在的语义联系。

开始关注利用实体的共现关系，同时将多个实体链接到知识库中。即集成实体链接（collective entity linking）

实体链接的流程：

从文本中通过实体抽取得到实体指称项；

进行实体消歧和共指消解，判断知识库中的同名实体与之是否代表不同的含义以及知识库中是否存在其他命名实体与之表示相同的含义；

在确认知识库中对应的正确实体对象之后，将该实体指称项链接到知识库中对应实体。

实体消歧是专门用于解决同名实体产生歧义问题的技术，通过实体消歧，就可以根据当前的语境，准确建立实体链接，实体消歧主要采用聚类法。其实也可以看做基于上下文的分类问题，类似于词性消歧和词义消歧。
共指消解技术主要用于解决多个指称对应同一实体对象的问题。在一次会话中，多个指称可能指向的是同一实体对象。利用共指消解技术，可以将这些指称项关联（合并）到正确的实体对象，由于该问题在信息检索和自然语言处理等领域具有特殊的重要性，吸引了大量的研究努力。共指消解还有一些其他的名字，比如对象对齐、实体匹配和实体同义。

4-2-2 知识合并

在前面的实体链接中，我们已经将实体链接到知识库中对应的正确实体对象那里去了，但需要注意的是，实体链接链接的是我们从半结构化数据和非结构化数据那里通过信息抽取提取出来的数据。

那么除了半结构化数据和非结构化数据以外，我们还有个更方便的数据来源——结构化数据，如外部知识库和关系数据库。

对于这部分结构化数据的处理，就是我们知识合并的内容啦。

一般来说知识合并主要分为两种——

合并外部知识库

合并关系数据库

合并外部知识库：

需要处理两个层面的问题：

数据层的融合，包括实体的指称、属性、关系以及所属类别等，主要的问题是如何避免实例以及关系的冲突问题，造成不必要的冗余

模式层的融合，将新得到的本体融入已有的本体库中

一般有以下四个步骤：

获取知识

概念匹配

实体匹配

知识评估

合并关系数据库：

在知识图谱构建过程中，一个重要的高质量知识来源是企业或者机构自己的关系数据库。为了将这些结构化的历史数据融入到知识图谱中，可以采用资源描述框架（RDF）作为数据模型。业界和学术界将这一数据转换过程形象地称为RDB2RDF，其实质就是将关系数据库的数据换成RDF的三元组数据。

4-3 知识加工

然而事实本身并不等于知识。

要想最终获得结构化，网络化的知识体系，还需要经历知识加工的过程。

知识加工主要包括3方面内容：本体构建、知识推理和质量评估。

4-3-1 本体构建

本体（ontology）是对概念进行建模的规范，是描述客观世界的抽象模型，以形式化的方式对概念及其之间的联系给出明确定义。其最大特点在于它是共享的，本体中反映的知识是一种明确定义的共识。在知识图谱中，本体位于模式层，用于描述概念层次体系，是知识库中知识的概念模板。

本体是同一领域内的不同主体之间进行交流的语义基础。

自动化本体构建过程包含三个阶段——

实体并列关系相似度计算

用于考察任意给定的2个实体在多大程度上属于同一概念分类的指标测度，相似度越高，表明这2个实体越有可能属于同一语义类别。

如“中国”和“美国”作为国家名称的实体，具有较高的并列关系相似度；而“美国”和“手机”这两个实体，属于同一语义类别的可能性较低，因此具有较低的并列关系相似度

主流计算方法：模式匹配法和分布相似度。

实体上下位关系抽取

用于确定概念之间的隶属（IsA）关系，这种关系也称为上下位关系。

如词组（导弹，武器）构成上下位关系，其中的“导弹”为下位词，“武器”为上位词。

主要研究方法：①基于语法模式（如Hearst模式）抽取IsA实体对；②利用概率模型判定IsA关系和区分上下位词，通常会借助百科类网站提供的概念分类知识来帮助训练模型，以提高算法精度；③用跨语言知识链接的方法来构建本体库；

本体的生成

本体生成主要是对各层次得到的概念进行聚类，并对其进行语义类的标定，即为该类中的实体指定1个或多个公共上位词。

主要研究方法：实体聚类方法

4-3-2 知识推理

知识推理是指从知识库中已有的实体关系数据出发，进行计算机推理，建立实体间的新关联，从而拓展和丰富知识网络。知识推理是知识图谱构建的重要手段和关键环节，通过知识推理，能够从现有知识中发现新的知识。

比如——

如果我们知道这两个信息(A,father,B),(B,father,C)，那么知识推理就可以帮助我们得到(A,grandfather,C)的事实。

当然知识推理的对象也并不局限于实体间的关系，也可以是实体的属性值，本体的概念层次关系等。

比如——

推理属性值：已知某实体的生日属性，可以通过推理得到该实体的年龄属性；
推理概念：已知(老虎，科，猫科)和（猫科，目，食肉目）可以推出（老虎，目，食肉目）

知识推理方法目前可以分为3大类，基于逻辑的推理、基于图的推理和基于深度学习的推理

基于逻辑的推理方法主要采用抽象或具象的Horn子句建模，然后基于一阶逻辑谓词、描述逻辑以及规则进行推理。

基于图的推理方法主要思想是将实体和关系映射到一个低维的embedding空间中，基于知识的语义表达进行推理建模。

基于深度学习的推理方法主要考虑使用神经网络进行建模，并且往往会和上面两种推理方法结合起来进行建模。

https://xz.aliyun.com/t/2139

你可能感兴趣的:(人工智能,AI,知识图谱,人工智能)

全网最新最全AI写作工具大汇总（含14个AI写作工具）一只贴代码君 AI写作 chatgpt 机器学习算法人工智能数据库
笔灵AI写作网址：https://ibiling.cn/?from=ai-bot描述：面向专业写作领域的AI写作工具。Paperpal网址：https://www.editage.cn/paperpal?utm_source=ai-bot&utm_medium=Banner&utm_campaign=Banner描述：英文论文写作助手。新华妙笔网址：https://miaobi.xinhuaskl
题目 1127: C语言训练-尼科彻斯定理星海燚燚 C语言刷题 c语言
验证尼科彻斯定理，即：任何一个整数m的立方都可以写成m个连续奇数之和。输出典例：131313=2197=157+159+161+163+165+167+169+171+173+175+177+179+181#includeintmain(){intn,st;scanf("%d",&n);st=n*n-n+1;printf("%d*%d*%d=%d=%d",n,n,n,n*n*n,st);for(i
java语句翻译_java基础语句翻译我爱专利 java语句翻译
publicstaticvoidmain(String[]args){System.out.println("人生中的第一个代码-----");}}package包的关键字类文件的首行位置com.zhiyou100包名；结束标志语句的结束com.zhiyou100com。zhiyou100包说明当前类HelloWorld是在com。zhiyou100包内public关键字修饰符公共的修饰符权限任何
尼科彻斯定理c语言,尼科彻斯定理！销号le 尼科彻斯定理c语言
该楼层疑似违规已被系统折叠隐藏此楼查看此楼#include"stdio.h"voidmain(){inti,j,k=0,l,n,m,sum,flag=1;printf("输入一个数:");scanf("%d",&n);m=n*n*n;i=m/2;if(i%2==0){i=i+1;}while(flag==l&&i>=1){sum=0;k=0;while(l){sum+=(i-2*k);k++;if
linux文本编辑的几种退出方法 web15085181368 java java 后端
1.使用Vim的时候便捷方式：（1）ctrl+z退出，fg进入（2）正常模式下输入“：sh”进入linux环境，离开Linuxe环境进入Vim使用exit参考：https://blog.csdn.net/A632189007/article/details/78263459一般方式：输入“：wq”然后回车就退出了，表示先保存再退出按“:q”退出：在任何情况先按键盘上面的ESC按键，接着按冒号：q回
AI 大模型创业：如何利用商业优势？ AI天才研究院大数据AI人工智能 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
第1章：AI大模型概述1.1AI大模型的概念与演进AI大模型（Large-scaleArtificialIntelligenceModels）是指通过大规模数据训练得到的复杂神经网络模型。这些模型通常具有数十亿甚至千亿个参数，能够实现从自然语言处理到计算机视觉、语音识别等广泛领域的任务。AI大模型的概念起源于20世纪80年代，当时研究人员提出了深度学习（DeepLearning）这一概念。深度学习
选择排序和冒泡排序午言若 c++
1.冒泡排序：#include#includeusingnamespacestd;voidBubbleSort(vector&v){intn=v.size();for(inti=1;iv[j+1]){flag=1;swap(v[j],v[j+1]);}}if(flag==0){return;}}}intmain(){vectorv={1,5,4,1,3,2,6};BubbleSort(v);for
GPU-CUDA编程学习(一) ☞北海北☜ c++
Hello,CUDA最近在学习GUP编程，故此记录下学习进度。#include__global__voidmyfirstkernel(void){}intmain(void){myfirstkernel>>();printf("hello,CUDA!\n");return0;}不难看出CUDA代码基本上和ANSIC代码一样，只是增加了一些关键字来利用数据并行性global相当于声明函数在设备中运行
AI时代，大厂要被重新定义 AI浩编程哲学人工智能
在DeepSeekV3和DeepSeekR1爆火之后，李彦宏的预言又被人扒出来活了。他说：“中国不会再有OpenAI出现了，OpenAI能够成功是因为大厂都不会看好这个方向，现在，国内大厂都参与进来了，别的公司成功的概率就非常低了”。这样的观点放在互联网和移动互联网的时代，是非常正确的。从曾经的电商大战，到后来的团购争夺、再到后来的滴滴快滴的打车大战和共享单车之间厮杀无一例外的都是大厂背后的较量。
Foxmail 搜索功能找不到全部邮件问题的解决方法漫无目的行走的月亮 vpn 2010
Foxmail搜索功能找不到全部邮件问题的解决方法2010-07-1510:07经常使用Foxmail办公收发邮件，发现Foxmail搜索功能找不到全部邮件，原来问题出在搜索上：举例说明，迁移到Foxmail后，王卡卡同志给我发过3封邮件，可是我用据称无比强大的Foxmail搜索邮件时，输入关键字"root"，只能找到一封，输入某封他发的邮件的标题中的关键字"VPN"，找到0封/han，输入关键字
c语言网 1127 尼科彻斯定理 Xzh0423 算法 c++数据结构
原题题目描述验证尼科彻斯定理，即：任何一个整数m的立方都可以写成m个连续奇数之和。输入格式任一正整数输出格式该数的立方分解为一串连续奇数的和样例输入13样例输出13*13*13=2197=157+159+161+163+165+167+169+171+173+175+177+179+181#includeusingnamespacestd;intmain(){intm;cin>>m;intm_c
Java代码-八种数组排序方法忧郁小王子x 算法 java
一.冒泡排序1.1概述对于一组，多次将数组中的数两两比较，较大或者较小的数向后排（经过一轮比较后，最大/最小的数就会到结尾），循环直至有序排列。1.2代码实现importjava.lang.reflect.Array;importjava.util.Arrays;importjava.util.Scanner;publicclassmaopao{publicstaticvoidmain(Strin
AI绘画能取代设计师吗？网络安全我来了 IT技术 AI作画
AI绘画能取代设计师吗？在日益数字化的时代，人工智能（AI）正在快速渗透我们的生活和工作中。特别是在设计领域，AI绘画这一新兴技术引发了热烈讨论。你是否也曾好奇，AI绘画是否有可能取代设计师的工作？让我们一同探讨这个引人深思的话题。1.AI绘画的现状1.1AI绘画技术的形成与发展AI绘画的背后，离不开图像风格迁移、图文预训练模型和扩散模型这三大技术的共同推动。有点像是一位多才多艺的音乐家，利用不同
AI会对你的行业产生什么影响网络安全我来了 IT技术人工智能
AI对行业的影响：全面解析与展望在当今这个瞬息万变的时代，人工智能（AI）正如同一个强大的引擎，驱动着各个行业的迅猛发展。这不仅仅是一种技术的崛起，更是全球经济和社会结构的深刻变革。今天，让我们深入解析AI，尤其是生成式AI，如何影响我们的工作与生活，以及我们可以期待的未来。生成式AI的迅猛崛起生成式AI的定义与特点生成式AI，简单来说，就是机器学习的一个分支，通过学习大量数据，生成新的内容。这就
stm32hal库can使用记录田彼南山 stm32 嵌入式硬件单片机
一、单片机最小系统板使用can资料：https://blog.csdn.net/yoie01/article/details/136921034https://blog.csdn.net/qq_36561846/article/details/117431769这里面有一个问题，最小系统板没有can收发器，所以没法直接用，只能测试一下回环模式二、stm32f103vet6测试达妙电机我用的是正点原
tomcat系统架构及运用极致人生-010 tomcat 系统架构 java
文章目录下面是Tomcat架构的详细解析：1.**Server（服务器）**2.**Service（服务）**3.**Container（容器）**-分层结构4.**Connectors（连接器）**5.**类加载器（ClassLoader）**6.**Catalina**7.**配置文件与目录结构**8.**监听器（Listeners）**9.**安全性**10.**性能调优与监控**Tomca
【C语言】Main函数解析 Nebula嵌入式 c语言
目录前言Main函数解析代码前言我们从刚才是学习编程就学习了main函数，在linux中你执行一个可执行文件./a.out此时你同时想传入参数那应该怎么办呢？这时你就要了解main函数的一些用法才能实现上面的目的。Main函数解析intmain(intargc,char*argv[])也可以写成intmain(intargc,char**argv)。一般我们都习惯写前者。argc表示程序运行时发送
cursor 的组件以及使用一只很懒很懒的虫人工智能
写在前面：如果你没有使用过cursor,建议先看这篇文章：先自己随便点点，使用一下，然后再看看这些概念的东西会有一个更高效的认知。不拘泥于概念，但是又不能不了解概念。当然这些介绍也只是皮毛，在运用中才有更深的体会认识cursor基本布局：可以通过Ctrl+I打开最右边的cursorAI助手的智能面板，ctrl+N创建一个新的对话窗口Cursor三种不同的模式Chat：这个功能和你在kimi或者豆包
AI 编程工具—Cursor 对话模式详解 Chat、Composer 与 Normal/Agent 模式不二人生大模型 cursor 人工智能 composer cursor
CursorAI对话模式详解：Chat、Composer与Normal/Agent模式一、简介Cursor是一个强大的AI辅助编程工具，它提供了多种对话模式来满足不同的开发需求。主要包括：Chat模式：直接对话交互Composer模式：结构化编程助手Normal/Agent模式：不同的AI响应策略打开Chat的快捷键是command+L打开Composer的快捷键是command+i二、Chat模
Cursor AI Anjgst 人工智能
CursorAI完整指南：AI驱动的新一代编程工具目录简介主要特性安装与设置核心功能详解使用技巧价格方案常见问题简介CursorAI是一个基于VSCode的革命性AI驱动代码编辑器，它将人工智能与传统编程环境完美结合，为开发者提供更智能、更高效的编程体验。主要特性1.AI智能补全Tab智能补全：通过AI预测并补全多行代码上下文感知：理解整个项目结构和编码风格多语言支持：支持所有主流编程语言2.代码
cursor软件的chat和composer分别是什么 hunter206206 人工智能 python
Cursor是一款基于人工智能的代码编辑器，集成了类似ChatGPT的功能，旨在帮助开发者更高效地编写代码。以下是Cursor中Chat和Composer的具体功能：1.ChatCursor中的Chat是一个基于AI的聊天功能，类似于ChatGPT，但专门为编程场景优化。它的主要用途包括：代码解释：帮助你理解代码的功能或逻辑。代码生成：根据自然语言描述生成代码片段。代码优化：提供代码优化建议或重构
java编程根据订单编号查询订单状态_java生成订单编号工具赖明星
直接code，用了线程执行，加上了锁publicclassTestOrderextendsThread{privatestaticlongorderNum=0l;privatestaticStringdate;publicstaticvoidmain(String[]args)throwsInterruptedException{for(inti=0;i<10000;i++){System.out
Android车机DIY开发之学习篇(七)NDK交叉工具构建勿忘初心91 车机DIY 学习嵌入式硬件 arm开发单片机
Android车机DIY开发之学习篇(七)NDK交叉工具构建1.ubuntu安装GCCsudoapt-getupdatesudoapt-getinstallgccg++sudogcc--versionsudog++--version2.测试GCCVSCODE中新建Hello.c编译#includeintmain(void){printf(“Hello,thisisaprogramcompiledb
最新版pyvideotrans3.46整合包，将视频从一种语言翻译为另一种语言，同时支持语音识别转录、语音合成、字幕翻译，AI自动视频翻译配音加字幕软件，解压即用 struggle2025 人工智能语音识别机器学习自然语言处理语言模型
一、pyvideotrans3.46介绍（文末提供下载）官方地址：GitHub-jianchang512/pyvideotrans:Translatethevideofromonelanguagetoanotherandadddubbing.将视频从一种语言翻译为另一种语言，同时支持语音识别转录、语音合成、字幕翻译。本文信息以及图片来源于开源官方地址这是一个视频翻译配音工具，可将一种语言的视频翻译
PostgreSQL 常用运维SQL整理尚雷_TechTalk01 PostgreSQL postgresql 运维 sql
一、查询并杀会话--查询会话selectpid,usename,client_addr,client_port,query_start,query,wait_eventfrompg_stat_activity;--杀会话selectpg_terminate_backend('pid号');--使用如下命令自动生成杀会话语句selectdatid,datname,pid,usesysid,usena
AI编译器之——为什么大模型需要Relax？ FF-Studio 人工智能深度学习自然语言处理机器学习语言模型
放在最前：Relax的关键创新深度学习模型（比如ChatGPT这种大模型）在运行时经常遇到“输入尺寸不固定”的情况。比如你问它一个问题，这次输入是10个字，下次可能是100个字。传统编译器处理这种“变来变去”的尺寸很笨——要么只能按固定尺寸优化（导致变尺寸时性能暴跌），要么每次都要重新编译（慢到没法用）。Relax的创新：符号形状：让编译器学会“代数”Relax允许编译器用“符号变量”（比如n）表
实战LLM强化学习——使用GRPO（DeepSeek R1出圈算法） FF-Studio DeepSeek R1 算法语言模型人工智能自然语言处理机器学习
——关于使用Unsloth库、LoRa微调及GRPOTrainer自定义奖励函数实现“只输出10个英语单词”的探索为什么要进行“只输出10个英文单词”的极端尝试？在大模型的训练或微调当中，大多数场景我们都希望它能“自由发挥”，给出越丰富越好的答案。但，为了更好的理解强化学习在LLM训练过程中发挥的意义，也为了学习GPRO这个强化学习算法，笔者出此题目，方便大家学习理解。GRPO（GroupRela
Android Room 使用 francisHuang android学习 android Room 数据库
官网介绍：https://developer.android.google.cn/training/data-storage/roomRoom是在SQLite上提供了一个抽象层，以便在充分利用SQLite的强大功能的同时，能够流畅地访问数据库。Room包含3个重要部分：数据库：包含数据库持有者，并作为应用已保留的持久关系型数据的底层连接的主要接入点。Entity：表示数据库中的表。DAO：包含用于
【2024年-12月-续篇-开源社区openEuler实践记录】go-from-mod 我明天再来学Web渗透开源社区OpenEuler 开源 golang 开发语言 copilot 架构开源软件后端
前言初学Go语言，下面仅为个人所学以及小结，若有错误之处，还请指教。Go语言基础入门篇的一二节课，其中我对每个讲到的语法都重写或者本地测试运行过，其中第二节课的第三个小项目尚未实现（本人对网络连接那块的脚本尚不熟悉，）部分代码不能太多，所以贴图了有些。Go基础语法目前学过的Go语法只有课程内的，下面是一些小小的笔记。导包和输出packagemainimport"fmt"funcmain(){fmt
【AI中数学-数理统计-综合实例-包括python实现】揭开数据的面纱：真实样本数据的探索与可视化云博士的AI课堂 AI中的数学人工智能 python 数理统计数据预处理数据探索数据可视化机器学习
第五章：数理统计-综合实例1.揭开数据的面纱：真实样本数据的探索与可视化在人工智能（AI）应用中，数据是构建算法和模型的基石，而数理统计则为我们提供了理解和处理这些数据的工具。数据探索和可视化是数理统计中至关重要的步骤，它们不仅能帮助我们理解数据的分布、关系和趋势，还能够为后续的建模工作提供依据。本节将通过五个实际案例，展示如何使用数理统计和可视化技术对真实样本数据进行探索。每个案例都包括具体的描
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源