修罗神天道

第14章数据仓库与数据挖掘

数据仓库技术所解决的问题是如何更合理和更有效地组织企业的数据体系，以更好地满足企业信息型应用对数据的要求,降低企业的数据管理、数据获取和数据集成的成本,提高数据系统响应速度，提高数据质量和数据的一致性。数据挖掘技术所解决的问题是如何针对具体的分析对象和分析需求，尝试通过智能和自动化的手段把数据转换为有用的信息和知识。

14.1决策支持系统的发展

14.1.1决策支持系统及其演化
14.1.2基于数据仓库的决策支持系统
数据仓库的决策支持系统提出目的是为了解决在“蜘蛛网结构”中存在的一系列问题。
数据仓库将企业决策支持所需的数据集成在一起，构成一个集成的、一致而稳定的数振源。企业内部的操作型系统和一些外部数据源构成了数据仓库的数据源。这种体系结构如下图所示：
在数据仓库体系结构中，数据仓库是核心，操作型系统是基本数据源，决策支持系统是数据的需求者。
其中主要存在下面两类数据：
⚫ 原始数据：一般来自于企业操作型系统，也可以称之为操作型数据。
⚫ 导出数据：为了提高数据查询和管理效率，根据操作型数据计算得到的数据，常用于支持分析型应用。一般将这种数据称为分析型数据。

14.2数据仓库技术概述

14.2.1数据仓库的概念与特性
建立数据仓库的主要目的：根据决策需求对企业的数据采取适当的手段进行集成，形成一个综合的、面向分析的数据环境，用于支持企业的信息型、决策型的分析应用。对于什么是数据仓库，人们提出了许多不同的概念。
概念：数据仓库是一个面向主题的、集成的、非易失的，且随时间变化的数据集合，用来支持管理人员的决策。
数据仓库的几个重要特性如下所示。
⚫ 面向主题性。
⚫ 集成性。
⚫ 不可更新性。
⚫ 时间特性。
1.面向主题性
⚫ 在传统的 OLTP 环境下，数据库系统的数据一般是以面向企业基本业务应用的方式进行组织的。
在数据仓库中数据是以面向主题的方式进行组织的，主题是一个抽象的概念，主题也可以称为分
析主题或分析领域，用于表达某一宏观的分析领域所涉及的对象，以及与对象有关的数据集合。
⚫ 数据仓库主题数据的实现一般还是采用关系型数据库技术，即主题的对象以及对象所相关的数据是通过一组关系表来实现。
⚫ 在面向分析主题的数据组织方式中，需要先确定系统中所涉及的主题。
2.集成性
⚫ 继承是数据仓库第二个特性，也是最为重要的特性。在数据进入数据仓库时，要采用各种集成方法来消除应用层的许多不一致性。
⚫ 数据仓库的数据集成功能分成数据抽取、转换、清理（过滤）和装载 4 项任务。
⚫ 数据集成主要完成从数据源获取数据，并按目标数据模型要求操作，装载入目标数据体系中。如数据仓库核心层模型的要求对数据进行转换，并清除错误或无效数据。
3.不可更新性
⚫ 在操作型环境下，数据访问和处理一般以单条方式进行的，数据一般是会被更改或更新的。
⚫ 在数据仓库中，数据通常是以批量方式载入与访问的，并不进行一般意义上的更新。
⚫ 不可更新并不意味着不再向数据仓库追加新的数据，只是表示一般不再对进入数据仓库的原始数据进行修改。
4.时间特性
⚫ 数据仓库的时变性是指数据仓库中的每个数据单元都有时间标志，记录一般都加有时戳，有时记录中可能包含有事务的发生时间。
⚫ 数据仓库随时间变化的特性还指数据仓库在运行中必须不断捕捉操作型环境中数据，并将新的数据集成后追加到其中。
14.2.2数据仓库的体系结构与环境
从数据层次角度看，典型的数据仓库的数据体系结构包括的内容如下图所示。
从功能结构上看数据仓库的数据体系功能包括的内容如下图所示。

14.2.3数据仓库的数据组织
1.数据组织结构
来自操作型环境中的源数据经过集成后进入当前细节级。根据系统需要，可能需要对当前细节级的数据进行轻度的综合（汇总）或进一步的高度综合，得到轻度综合级数据和高度综合级数据。老化以后的细节数据将进入早期细节级。数据仓库的数据组织结构如下图所示。 2.粒度
概念：系统中存在不同综合级别的数据，一般将综合级别称为粒度。粒度越大，表示综合程度越高；粒度越小，表示综合程度越低。
在数据仓库环境中，粒度的设计会影响到数据仓库的数据量以及系统能回答的查询的类型（粒度越小，细节程度越高，能回答的查询就越多）。但存在的两个问题：
⚫ 在数据仓库环境中，需要存储低粒度级的细节数据，数据量就比较大，空间代价也大。
⚫ 如果数据仓库不保存低粒度级数据，只有粗粒度级的数据，则需要存储的数据量较少，但这样就无法回答一些细节问题，查询代价就大。
一般，在进行数据仓库的数据组织时，需要根据当前应用的需求来进行多粒度级设计，针对某一主题，在可用的存储空间中保存粗细程度不同的主题数据，以尽可能满足各种应用的多角度、多层次数据查询要求，同时在总体上提高查询的计算效率。
3.数据分区
在数据仓库中，数据分区可以解决用一个物理表来存储模式相同的数据而造成数据管理和查询效率低下。
恰当的数据分区能有效提高数据仓库各种数据处理功能的效率，合适的分区能使数据的增长和管理都容易实现。
分区的选择一般是由开发者来决定的，最常见的是按照时间标准来划分，也可以按照其他的标准进行划分，或者多个分区标准组合起来对数据进行分割。
数据分区的方式如下所示，两者之间存在一定的区别：
①系统层分区是数据库系统提供的机制，各个分区在逻辑上是一个表，在物理上属于不同的分区。
系统层分区数据库管理系统知道各分区间的逻辑关系，也就是说数据库管理系统管理逻辑上的表和物理上的分区之间的关系。
数据分区的方式
②应用层分区由应用代码实现，不同的分区在逻辑上和物理上都属于不同的表，如何分区由开发
应用层分区者和程序员控制，数据库管理系统并不知道分区间存在什么逻辑关系。 14.2.4元数据
元数据（Meta Data）是数据仓库中的重要数据，是关于数据的数据，或者叫作描述数据的数据。
元数据描述了数据的结构、内容、链和索引等项内容。
⚫ 在传统的数据库中：元数据描述了数据库中的各个对象，如数据库中的数据字典就是一种元数据。
⚫ 在关系数据库中：元数据描述对数据库、表、列等其他对象的定义。
⚫ 在数据仓库中：元数据定义了数据仓库中许多对象——表、列、查询、商业规则及数据仓库内部的数据转移等。
在数据仓库中建立元数据的目的主要在于让用户能更快地找到所需的数据，让前台工具和管理员更好地理解和管理数据。
在数据仓库中，元数据一般分成技术型元数据和业务型元数据两类，其内容一般包括主题描述、外部数据和非结构化数据的描述、层间数据映射关系、逻辑模型定义、集成时的数据转换规则、数据的抽取历史、数据分区定义以及有关存储路径和结构的描述等。
技术元数据是描述关于数据仓库技术细节的数据，这些元数据应用于开发、管理和维护数据仓库。
业务元数据从业务角度描述了数据仓库中的数据，它提供了介于使用者和实际系统之间的语义层，使得不懂计算机技术的业务人员也能够“读懂”数据仓库中的数据，也使得技术人员在开发、管理和维护数据仓库时更易于理解实际业务背景、满足实际业务需求。
元数据的作用：
⚫ 在数据仓库中建立元数据的目的主要在于让用户能更快地找到所需的数据，让前台工具和管理员更好地理解和管理数据。
⚫ 从元数据的类型和作用来看，元数据实际上要解决何人在何地为了什么原因及如何使用数据仓库的问题。
⚫ 元数据在数据仓库管理员眼中是数据仓库中的包含了所有内容和过程的完整知识库和文档，而在最终用户（数据分析人员）眼中，元数据是数据仓库的信息地图。
14.2.5操作型数据存储
在作为数据源的操作型系统与数据仓库之间存在一个“操作性数据存储（ODS）”的数据层。
提出这个数据存储层的最初目的是支持一些特殊的应用功能，主要包括即时OLAP和全局型OLTP应用。
存在 ODS 中的数据归结出 4 个基本特点：即面向主题的、集成的、可变的、数据是当前或接近当前的。
分别与 OLTP 环境和数据仓库环境中的数据互有异同。
根据从数据源到 ODS 的数据传送更新频率的高低,ODS 被分成了如下 3 类：
①ODS I:第一类 ODS 数据更新频率是秒级的，即操作型系统中的数据发生改变以后,几乎是立即传送到 ODS 中，这类 ODS 建设难度很大,但随着软硬件技术的进展，越来越多的企业在开始尝试建立这种 ODS。
②ODS II:第二类 ODS 的数据更新频率是小时级，如 4 小时更新一次，这类 ODS 建设难度低。
③0DS III:第三类 ODS 的数据更新频率是天级，一般隔夜后将数据更新到 ODS 中。
以上三类ODS是根据数据更新的速度划分的第四类ODS即ODS IV是根据数据来源方向和类型区分的。
第四类 ODS 的数据不仅包含来自操作型环境的数据，也包含由数据仓库层和数据集市层的应用反馈给 ODS
的一些决策结果或一些报表信息,这样可以由这类 ODS 向企业内外部提供相关的一些信息服务。

14.3设计与建造数据仓库

14.3.1数据仓库设计的需求与方法
1.数据仓库设计需求
⚫ 数据体系设计：指数据仓库决策支持应用程序的集合，为企业提供决策支持。
⚫ 应用体系设计：最终将反映为对数据的需求，构成数据体系的建设需求
⚫ 用户的需求：体现为对企业基本数据模型的建立和基于企业的基本数据模型的不断变化的数据需求，会影响主题划分和主题的建立顺序。
2.设计方法
数据仓库系统设计目标主要在于建立主题数据环境，强调的是数据的集成性，目标在于建立一个全局的一致的数据环境，建立企业的信息资源体系结构的数据核心，并在此基础上，建立基本的决策支持分析应用。
数据仓库的数据组织是面向主题的，按照一定的主题域分别设计，而不是面向报表的，要对各个报表进行统计分析、归类，划分为不同的主题进行建模。设计方法如下：
⚫ CLDS（SDLC 的逆序）方法：针对需求变化比较大的数据仓库应用系统建立过程。
⚫ OLAP 产品中多维分析功能：通过动态的数据综合引擎来提高数据仓库的数据体系对动态变化的需求的响应。
只要当数据仓库中当前主题集无法满足新的数据需求是，才有必要重新建立新的主题来满足新的数据需求。
14.3.2数据仓库的数据模型
数据仓库的数据模型与普通数据库系统的数据模型一样，一般划分为概念、逻辑和物理这三级数据模型。但这两种 3 级模型之间有如下区别:
⚫ 数据仓库的数据模型中一般不包含纯操作型数据。
⚫ 数据仓库的数据模型一般需要扩充关键字结构，在其中加入时间属性。
⚫ 数据仓库的数据模型中常常需要增加导出数据。
1.概念模型
概念模型是用于描述客观世界中的对象及其属性的一种概念性工具。数据仓库中的概念模型常见的表示方法还是实体关系图，即 ER 图，用于描述实体以及实体之间的联系。
下图是销售主题的 ER 图。
2.逻辑模型
数据仓库的逻辑模型可以采用关系型模型，也可以采用多维数据模型，也可以通过关系型模型来表示多维模型。
在常见的数据仓库系统中，多数还是采用关系模型作为关系逻辑描述工具。
3.物理模型
物理模型就是逻辑模型在具体的数据存储平台上的物理定义，也就是逻辑模型在数据仓库中的实现，主要包括：物理存取方式、数据存储结构、数据存放位置和存储分配。
在建立物理模型时需要考虑的因素主要有各种操作的存取时间和数据仓库存储空间利用率和数据仓
库主题维护代价。
常见的用来优化物理模型的设计技术包括引入冗余措施、分区、生成导出数据、表合并、细分数据和索引等。
14.3.3数据仓库设计步骤
1.数据仓库设计步骤  2.数据集成
数据集成在数据仓库设计中是必不可少的一环。数据集成是将源自不同数据源的数据经过抽取、转换、清理、装载等操作载入数据仓库的过程，是实施数据仓库的重要步骤。一个简单的数据集成过程如下图所示。

ETL 是实现数据集成的主要技术，即填充更新数据仓库的数据抽取、转换、装载的数据采集过程。对于复杂的数据抽取转换载入过程，一般使用工具协助 ETL 开发，并运用内建的元数据机制来储存源自于目的的映射和转换函数。
越大量的资料、越复杂的转换逻辑越倾向于使用 ELT。

14.4数据仓库的运行与维护

数据仓库维护的基本思想是：根据某种维护策略，在一定条件下触发维护操作；维护操作捕捉到数据源中的数据变化；通过一定策略对数据仓库中的数据进行相应的更新操作，以保持两者的一致性。
数据仓库环境建立以后，需要对数据仓库进行日常管理工作，主要包括：
⚫ 操作型数据环境中新生成的数据的集成、载入、刷新数据仓库中的细节数据。
⚫ 导出数据（物化视图）、将过时的数据转移到磁带等存储设备上。
⚫ 清除不在使用的数据、对元数据进行管理等。
14.4.1数据仓库数据的更新维护
1.维护策略
数据仓库中的数据维护策略分为 3 种：实时维护、延时维护和快照维护。
⚫ 实时维护：实时维护在数据源发生变化时，立即更新数据仓库中数据。实时维护操作的触发条件是数据源进行了数据的更新操作。这种策略能够保证用户总查到最新的数据。
⚫ 延时维护：延时维护工作并不是在数据源的更新事务中完成，而是在数据仓库中的视图被查询时完成更新。延时维护操作的触发条件是用户在数据源发生变化后首次对数据仓库执行查询操作。
⚫ 快照维护：快照维护策略定期对数据仓库进行维护，维护操作的触发条件是时间。这种策略不会给源数据的更新事务或者数据仓库的查询事务增加任何负担，但通常无法提供最新的数据。
2.捕捉数据源的变化
对数据仓库中的相关数据进行更新需要通过某种机制来告知数据仓库源数据发生了变化。
通过对源数据变化的监听和捕获来告知告知数据仓库哪些源数据发生了变化，典型的方法有：
⚫ 触发器
⚫ 修改数据源应用程序。
⚫ 通过日志文件。
⚫ 快照比较法。
3.导出数据的刷新
对数据仓库中导出数据的维护方法有两种：一是根据维护对象的数据源对其进行重新计算。二是根据数据源的变化量在维护对象原有数据的基础上进行数据添加和修改，即增量式维护。
数据仓库的数据更新维护操作通常放在夜间完成，维护过程必须在第二天清晨完成（因为该操作需要执行大量的表数据更新操作，在此过程中用户无法获取数据仓库中的数据）
用户不可存取数据仓库时间的长短是衡量数据维护效率的重要指标。一个有效的方法是将维护过程分为“聚集”和“更新”两部分。
⚫ 聚集：聚集操作预先生成一部分更新用的聚集数据，存放在附加表中，不涉及对数据修改，这样
用户仍能存取导出数据表。
⚫ 更新：更新操作具体执行维护对象的更新，用户不可存取数据仓库时间缩短为“更新”操作所消
耗的时间。
14.4.2 数据仓库监控与元数据管理
1.数据仓库监控
对数据仓库的数据量进行监控的原因：因数据仓库的存储容量是有限，数据仓库中的数据量可能会由于不断增长而超过存储限量。
根据监控情况对数据仓库的存储和设计进行必要的调整，例如增加一些设备，减少一些视图，导出一些数据等措施。
对数据库管理员来说：需要对数据仓各种数据的使用率进行监控，以了解不同数据的用户和使用情况，并根据监控的情况对设计进行调整。
同时，对数据仓库环境的网络通信情况、网络数据流量、数据源数据变化情况、集成和维护工具运行效率、查询响应时间、应用支持效率等各种工具、对象的状态、参数等，都需要进行必要的监控，以维持数据仓库的有效运行。
2.元数据管理
技术元数据：描述数据仓库结构，存储关于数据仓库系统技术细节的数据，如数据仓库监控的过程代码和结果。
业务元数据：提供企业概念模型和多维数据模型，表示出了数据的业务视图。
在数据仓库中必须建立元数据管理机制，以合理的管理数据仓库中的数据。
在实践中，一般采用元数据库来存储和管理元数据。在设计、安装、使用、操作和管理数据仓库的工具和处理过程中，共享元数据库中的数据。
元数据记录企业详细信息，保存数据存储位置，生成维护数据之间的关系以及数据的转换过程，保证了数据仓库数据的一致性和准确性，支持强大的查询和报表生成工具，为企业进行数据质量管理提供数据依据和决策支持信息。

14.5联机分析处理与多维数据模型

14.5.1OLAP简介
OLAP 主要用于支持复杂的分析操作，侧重对决策人员和高层管理人员的决策支持。可以针对分析人员的要求，快速、灵活地进行大数据量的复杂查询处理，并以直观易懂的形式将查询结果提供给决策人员，使他们准确掌握企业的经营状况，了解市场需求，制定正确方案，提高效益。
14.5.2多维分析的基本概念
描述：数据的多维分析是指针对数据仓库中以多维形式组织起来的数据，从多个角度、不同层次，采用各种数据分析技术，对数据进行剖析，以使用户能从不同角度和不同层次观察和分析数据。
一般用多维视图的概念来描述多维分析系统中用户所看到的数据。多维模型的数据视图或数据集为多维空间中的点集，这样的数据视图被称为多维视图。
多维视图中的属性分为维属性和度量属性，一个多维视图MDV的模式一般是（d1 ,d2 ,…,d n,m1 ,m 2,…,mn ）前面 n 个维属性构成一个多维空间，后面 m 个度量属性是多维空间中的指标集。
14.5.3多维分析的基本操作
多维分析的基本操作有：
注意：这些活动是多维分析工具应该具有的最为基本的多维空间切换活动和单个空间内数据选择和角度变换活动，并不包括在数据之上其他分析功能。
14.5.4OLAP的实现方式有种

14.6数据挖掘技术

数据挖掘可以简单地理解为从大量数据中提取或挖掘知识，许多人把数据挖掘视为数据库知识发现
(KDD)的同义词，更准确的观点应该是把数据挖掘视为数据库知识发现的一个步骤。
14.6.1数据挖掘步骤
数据挖掘作为知识发现的过程，一般由 3 个主要阶段组成：数据准备、数据挖掘、结果的解释评估。
知识的发现可以描述为这 3 个阶段的反复过程，如下图所示。 1.数据准备
数据准备过程可以针对数据仓库也可以是普通数据文件。数据准备分为 3 个子步骤：
⚫ 数据选取：目的是确定挖掘任务的操作对象，根据用户的需求从原始数据库中抽取一组数据。
⚫ 数据预处理：一般包括消除噪声、推导计算缺值数据、消除重复记录，完成数据类型转换等。当
数据挖掘的对象是数据仓库时，一般数据预处理已经在生成数据仓库时完成了。
⚫ 数据变换：目的是将数据转换成适合数据挖掘需要的形式，如将文档信息转换成数值向量形式。
2.数据挖掘
数据挖掘的过程如下：
⚫ 首先确定挖掘的任务或目的：如分类、聚类、关联规则发现或序列模式发现等。
⚫ 决定使用什么样的挖掘算法：选择实现算法有两个考虑因素：数据特点、用户或实际运行系统的要求。
3.结果解释评估
数据挖掘可以分成两大类任务：分类预测任务和描述型任务。
⚫ 分类预测任务：从已经分类的数据中学习模型，并使用学习出来的模型去解决新的未分类的数据。
常见的分类预测型方法有决策树、神经网络、规则归纳、支持向量机、贝叶斯、粗糙集、回归分析、
K-最近邻等。
⚫ 描述型任务：根据数据内部具有的固有联系，生成对数据集中的数据关系或整个数据集的概要描
述。典型的描述型任务包括摘要、聚类和依赖分析等。
14.6.2关联规则挖掘
关联规则主要是用于发现数据库中数据间没有关系的实体组合在一起可以产生很好的效果。如超市中
“啤酒”和“尿布”这两个看上去没有关系的商品摆放在一起进行销售并获得很好的销售收益，这种现象
就是卖场中商品之间的关联性。
关联规则主要对象是事务型数据库，其中针对的应用则是售货数据、也称为货篮数据。 ⚫ 关联规则需要考虑支持度和可信度，需要给定两个阈值：最小支持度和最小可信度。
⚫ 最小支持度：用户规定的关联规则必须满足的，表示了一组物品集在统计意义上需要满足的最低程序；
⚫ 最小可信度：用户规定的关联规则必须满足的，反映了关联规则的最低可靠程度。
⚫ 同时满足最小可信度阈值和最小支持度阈值的关联规则称为强关联规则。
14.6.3分类挖掘
分类在数据挖掘中是一项非常重要的任务，是目前在商业上应用最多的一种数据挖掘方法。分类步骤如下：
⚫ 通过已知数据集（训练集），建立分类函数，构造分类器。评价分类器的标准：预测准确率、速度、健壮性、可扩展性、易理解性
⚫ 利用所获得的分类函数对未知类别标记的数据项进行分类操作。
14.6.4聚类挖掘
⚫ 聚类：将一个数据集中的数据进行分组，使得每一组内的数据尽可能的相似而不同组间的数据尽可能的不同。
⚫ 聚类方法包括统计方法、机器学习方法、神经网络方法、面向数据库的方法等。
⚫ 在统计方法中，聚类称为聚类分析，它是多元数据分析的三大方法之一。在数据仓库中，使用数据挖掘的聚类算法进行分析，得出聚类结果，可以让管理者更加有效的决策。
⚫ 在机器学习中，聚类称为无监督（或无教师）归纳，聚类算法所处理的数据对象一般都没有标记。
14.6.5时间序列分析
时间序列分析也可以称为数据演变分析，它能描述行为随时间变化的对象的规律或趋势，并对其进行建模。
对于时间序列的数据类型，时间序列从不同的角度可以分为：
⚫ 一元时间序列和多元时间序列；
⚫ 等间隔时间序列和不等间隔时间序列；
⚫ 平稳时间序列和非平稳时间序列。

Python从0到100（四十九）：数据库设计及Django ORM使用是Dream呀 python 数据库 django
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Oracle备份恢复工作：Oracle数据库的导出与导入。杨云龙666 数据库
当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障(硬件故障、软件故障、网络故障、进程故障和系统故障)影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库该处理称为数据库恢复，而要进行数据库的恢复必须要有数据库的备份工作。1整库导出与导入注意：（整库导出与导入：数据量比较大，耗
软考中级-数据库工程师。以下三个专题是数据库系统工程师下午案例非SQL部分的解题思路。干货不断，敬请关注点赞收藏转发~ 杨云龙666 经验笔记数据库
本人于20240525通过软考中级数据库工程师。以下三个专题是数据库系统工程师下午案例非SQL部分的解题思路。专题一：数据库故障与恢复检查点机制（CHECKPOINT）：在日志中设置检查点，当发生故障需要利用日志文件恢复时，反向扫描日志文件，找到检查点，确认检查点时刻正在执行的事务（活动事务），即检查点前有事务开始标志但没有事务结束标志。对于检查点后提交的事务，执行REDO（重做）对于检查点后未提
数据库-SqlServer面试题系列 001 code36 C#&.Net面试题 Java面试题数据库 sqlserver
一、数据库基础知识（通用）篇1.说说主键、外键、超键、候选键超键：在关系中能唯一标识元组的属性集称为关系模式的超键。一个属性可以为作为一个超键，多个属性组合在一起也可以作为一个超键。超键包含候选键和主键。候选键：是最小超键，即没有冗余元素的超键。主键：数据库表中对储存数据对象予以唯一和完整标识的数据列或属性的组合。一个数据列只能有一个主键，且主键的取值不能缺失，即不能为空值（Null）。外键：在一
【云原生】Docker 部署 Nacos使用详解逆风飞翔的小叔运维 docker搭建nacos详解 docker部署nacos docker安装nacos 腾讯云搭建nacos centos7搭建nacos
目录一、前言二、使用Docker部署Nacos2.1环境准备2.2搭建Nacos操作过程2.2.1拉取Nacos镜像2.2.2创建配置数据库2.2.3启动容器2.2.4删除nacos容器2.2.5再次启动容器2.2.6访问nacos三、基于Centos7搭建Nacos3.1搭建过程3.1.1服务器环境3.1.2mysql环境3.1.3提前下载安装包3.1.4初始化sql脚本3.1.5修改配置文件3
【LangChain编程：从入门到实践】数据库问答场景 AI天才研究院计算 AI大模型企业级应用开发实战大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】数据库问答场景作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在现代信息社会中，数据的爆炸性增长使得如何高效地从海量数据中提取有用信息成为一个重要课题。数据库问答系统（DatabaseQuestionAnsweringSystem,DBQA）作为一种能够直接从数据库中获取答案的技术，
SQLAlchemy 呀儿呦丶 Python #SQLAlchemy 数据库 python mysql
1.介绍SQLAlchemy以其对象关系映射器（ORM）而闻名，它是一个提供数据映射器模式的可选组件，其中类可以以开放式、多种方式映射到数据库——允许对象模型和数据库模式在一个从一开始就干净地解耦。简单来讲只需要用python的语法来操作对象，就能被自动映射为sql语句。sqlalchemy第三方orm框架（对象关系映射）,可以单独使用。底层依附于pymysql2.安装pipinstallsqla
能说说MyBatis的工作原理吗？ java1234_小锋 java java 开发语言
大家好，我是锋哥。今天分享关于【能说说MyBatis的工作原理吗？】面试题。希望对大家有帮助；能说说MyBatis的工作原理吗？1000道互联网大厂Java工程师精选面试题-Java资源分享网MyBatis是一个流行的持久化框架，它简化了数据库操作，通过映射SQL语句与Java对象之间的关系，使得开发者可以专注于业务逻辑，而不需要处理大量的数据库底层操作。它的工作原理主要围绕以下几个核心概念：1.
能说说MyBatis的工作原理吗？ java1234_小锋 java java 开发语言
大家好，我是锋哥。今天分享关于【Redis为什么这么快?】面试题。希望对大家有帮助；能说说MyBatis的工作原理吗？MyBatis是一款流行的持久层框架，它通过简化数据库操作，帮助开发者更高效地与数据库进行交互。MyBatis允许开发者使用XML或注解来配置SQL语句并映射数据库中的记录到Java对象。它的工作原理可以从以下几个方面来解释：1.MyBatis核心组件MyBatis的工作原理基于几
mysql 单进程多线程_关于单线程数据库与多线程数据库性能兰德水 mysql 单进程多线程
这是我的意见：通常,DB系统的瓶颈(或最慢的部分)是磁盘.CPU仅在算术运算,处理或CPU执行的任何其他任务期间出现峰值.通过适当的体系结构,多线程可以帮助将查询的负载抵消到CPU上,而不是进行慢速磁盘读/写操作.在某些情况下,使用CPU周期计算值更快,而不是创建计算列(之前已保存到磁盘)并从磁盘读取此列.在某些RDBMS中,有一个临时DB(tempdb),该实例上的所有DB都使用它来进行排序,散
【mysql】mysql多线程绝世好阿狸 mysql mysql 线程数据库内存
mysql是一个单进程多线程的数据库，在innodb中大概有一下几种线程：（1）MasterThread：这是主线程，非常核心，其用途主要是做一些周期性的任务，在不同的innodb版本其功能不同，这里就看最早期的版本。早起的innodbMaster线程会有两种频率的任务，一种是每1秒一次的，还有每10秒一次的。每1秒的工作：1.刷新日志；2.刷新至多100个脏页3.合并插入缓冲；4.如果空闲切为b
Django ORM解决Oracle表多主键的问题 zZeal django python 后端 oracle
现状以Django3.2为例DjangoORM设计为默认使用单一主键（通常是自增的id字段），这一选择主要基于以下核心原因：简化ORM设计与操作统一访问方式外键关联简化避免歧义冲突主键语义明确防止隐式依赖性能与数据库兼容索引效率优化跨数据库兼容替代方案成熟unique_together约束Oracle现状原始业务表，很多都使用多主键。使用Django映射现有Oracle数据库无法处理多主键问题。O
java访问数据库视图_java 访问数据库视图金小夕 java访问数据库视图
工作多年调用视图到多次,自己写代码使用视图还是头一回,也觉得新鲜,那就开始呗,数据库系统是Oracle1我用的数据库连接客户端是Navicat,首先创建视图,其实视图就是调用表的操作,提取自己需要的数据放到视图下面,相对于java来说,可以把视图看成是特殊的表对待,这里说的特殊指的是通过hql语句调用访问数据库的时候涉及到关联表的问题.创建视图如下:然后通过myeclipse的hiberanger
MySQL优化系列9-MySQL控制查询优化器Hints 只是甲 MySQL从小工到专家之路 #MySQL优化 mysql hints MySQL调整执行计划
备注:测试数据库版本为MySQL8.0文章目录一.控制查询计划评估二.可切换的优化三.优化器的Hints3.1优化器Hints概述3.2优化器Hints语法3.3连接顺序优化器Hints3.4表级别的优化器Hints3.5索引级别优化器Hints3.6子查询相关优化器的Hints3.7语句执行时间优化器Hints3.8可变设定Hints语法3.9资源组Hint语法3.10命名查询块的优化器Hint
实验三数据库完整性技术计算机小白的笔记数据库 database
实验三数据库完整性技术【实验目的】1、掌握完整性的概念；2、熟悉MySQL的完整性技术。3、了解MySQL的违反完整性处理措施。【实验性质】验证性实验【实验学时】2H【实验内容】写出完整、详尽的SQL语句，根据实验记录结果并总结。(空位不够请自行续页)一、定义完整性。(5分)/*创建表s、p、j、spj*/定义s表；sno主码，sname非空、city缺省值定义p表；pno主码，pname非空、c
实验三数据库完整性 (头歌) 霸敛笔记数据库 sql oracle
实验三数据库完整性(头歌)制作不易！点个关注！给大家创造更多的价值！目录实验三数据库完整性(头歌)`制作不易！点个关注！给大家创造更多的价值！`第一关：定义s表完整性相关知识MySQL约束概述主键约束非空约束默认值约束查看表中的约束编程要求第二关：定义p表完整性相关知识MySQL检查约束（CHECK）编程要求代码如下：第3关：定义j表完整性编程要求代码如下：第4关：定义spj表完整性相关知识MyS
Python Django ORM qq_15654157 Python python
一、ORM介绍1.什么是ORM?ORM全拼Object-RelationMapping.中文意为对象-关系映射.在MVC/MVT设计模式中的Model模块中都包括ORM2.ORM优势（1）只需要面向对象编程,不需要面向数据库编写代码.对数据库的操作都转化成对类属性和方法的操作.不用编写各种数据库的sql语句.（2）实现了数据模型与数据库的解耦,屏蔽了不同数据库操作上的差异.不在关注用的是mysql
计算机毕业设计JAVA房屋租赁系统mybatis 煦洋cxsj985 mybatis java 开发语言
计算机毕业设计JAVA房屋租赁系统mybatis计算机毕业设计JAVA房屋租赁系统mybatis+源码+调试部署+系统+数据库+lw本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：MySQL5.7/8.0源码地址：https://pan
多线程与高并发（6）——CAS详解（包含ABA问题）李王家的翠花 java 多线程 java 开发语言
一、乐观锁和悲观锁乐观锁和悲观锁都是用于解决并发场景下的数据竞争问题，不局限于某种编程语言或数据库。1、乐观锁：就是很乐观，每次去拿数据的时候都认为别人不会修改，所以不会上锁，但是在更新的时候会判断一下在此期间别人有没有去更新这个数据。乐观锁的实现方式：主要有两种，一种是CAS机制，一种是版本号机制。（1）版本号机制：在数据中增加一个version字段用来表示该数据的版本号，每当数据被修改版本号就
Django ORM查询示例：获取主键为1的记录标题 Leon_Jinhai_Sun django 数据库 oracle
>>>Entry.objects.values_list('headline',flat=True).get(pk=1)'Firstentry'这段代码是使用Django框架的ORM（Object-RelationalMapping，对象关系映射）系统来查询数据库中的一条记录。下面是代码的详细解释：Entry.objects.values_list('headline',flat=True).ge
数据库用户管理比特知识工坊 MySQL专栏数据库 adb android
数据库用户管理1.创建用户MySQL在安装是，会默认创建一个名位root的用户，该用户拥有超级权限，可以控制整个MySQL服务器。在对MySQL的日常管理和操作中，通常创建一些具有适当权限的用户，尽可能的不用或少用root登录系统，以此来确保数据的安全访问。可以使用createuse语句创建用户，并设置相应密码：createuser用户[indentifiedby[password]'passwo
第七章 C - D 开头的术语 yaoxin521123 IRIS相关术语 oracle 数据库
文章目录第七章C-D开头的术语当前设备(currentdevice)当前目录(currentdirectory)基于游标的SQL(cursor-basedSQL)游标(cursor)自定义存储(customstorage)以D开头的术语数据库(database)数据库缓存(databasecache)数据库加密(databaseencryption)数据库加密密钥(database-encrypt
实验九视图的使用无尽罚坐的人生数据库 oracle java
实验九视图的使用一、实验目的1．熟悉视图的操作。二、实验内容及要求用SQL语句完成下列功能。使用数据库为SCHOOL数据库。1．建立一视图View_CSTeacher，列出计算机系各个老师的资料(姓名、性别、职称)。createviewView_CSTeacher(姓名,性别,职称)asselectteac_id,teac_sex,techpostfromteachert,deparmentdwh
SQLite 附加数据库 zhang.fang 数据库 sqlite oracle
假设这样一种情况，当在同一时间有多个数据库可用，您想使用其中的任何一个。SQLite的ATTACHDATABASE语句是用来选择一个特定的数据库，使用该命令后，所有的SQLite语句将在附加的数据库下执行。语法SQLite的ATTACHDATABASE语句的基本语法如下：ATTACHDATABASEfile_nameASdatabase_name;如果数据库尚未被创建，上面的命令将创建一个数据库，
Python使用FastApi开发接口冉成未来 python fastapi 开发语言
文章目录python开发web框架简介FastApi安装安装依赖包代码编写创建数据库连接模块database.py创建数据库实体模块model.py创建实体类模型模块schemas.py创建操作数据库模块curd.py创建接收请求模块main.py创建运行模块run.py项目运行编写完以上代码，通过以下命令进行项目启动查看项目接口pyinstalle打包FastApi项目项目通过uvicorn运行
【手写数据库内核组件】0301 缓存模型介绍，缓存分层架构与缓存映射算法，以及缓存淘汰替换算法，同步一致的策略韩楚风 C语言实战-手写数据库内核组件数据库缓存架构 c语言数据结构
0301缓存介绍专栏内容：postgresql使用入门基础手写数据库toadb并发编程个人主页：我的主页管理社区：开源数据库座右铭：天行健，君子以自强不息；地势坤，君子以厚德载物.文章目录0301缓存介绍一、概述二、多样的数据造就各异的缓存三、缓存的架构四、缓存算法4.1缓存组织算法4.2缓存映射算法4.3缓存替换算法4.4缓存同步算法五、总结结尾
数据库查询优化：提升性能的关键实践 qcidyu 文章归档 DBA最佳实践性能调优查询执行计划索引 SQL 数据库性能查询优化
title:数据库查询优化：提升性能的关键实践date:2025/1/30updated:2025/1/30author:cmdragonexcerpt:在当今数据驱动的商业环境中，数据库的性能直接影响着应用程序的响应速度和用户体验。查询优化是性能调优的重要组成部分，通过对SQL查询的分析与改进，减少查询执行时间和资源消耗，从而提升整体系统效率。categories:前端开发tags:查询优化数据
数据库物理备份：保障数据完整性和业务连续性的关键策略 qcidyu 数据库
title:数据库物理备份：保障数据完整性和业务连续性的关键策略date:2025/1/29updated:2025/1/29author:cmdragonexcerpt:在现代企业中，数据被视为最重要的资产之一。因此，确保数据的安全性、完整性和可用性是每个数据库管理员（DBA）的首要任务。在数据管理的过程中，备份与恢复是必不可少的策略，尤其是物理备份。物理备份通过直接复制数据库的物理文件，从而实
《告别监控焦虑！Kylin系统Zabbix保姆级安装手册》入眼皆含月 kylin zabbix 大数据
一、概况Zabbix是一个广泛使用的企业级开源监控解决方案，能够监控网络、服务器、虚拟机和云服务等IT基础设施。它通过灵活的通知机制，使用户能够为几乎所有事件配置基于电子邮件的警报，从而快速响应服务器问题。二、Zabbix的主要功能（1）全面的监控能力：能够监控几乎所有类型的IT组件，包括操作系统性能、网络设备、数据库、应用程序等。（2）灵活的数据收集方式：支持多种数据收集方法，如SNMP、IPM
对 oracle 19.9 数据库安装 19.13 补丁步骤 whn1977
前提检查df-h磁盘空间要充足crsctlstatres集群状态要正常，最好重启主机再检查一遍（时钟不同步可能起不来，权限、密码可能导致不正常）selectname,database_role,open_modefromgv$database;数据库角色是primary，open_mode=readwrite上传介质到/ora_softRU19.13介质:p33248471_190000_Linu
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round

第14章 数据仓库与数据挖掘