iltaek

数据挖掘语言浅析

本文介绍了几种数据挖掘语言及其标准化方面的研究进展，提出了数据挖掘语言分类的方法，在此基础上，对数据挖掘语言的结构和组成进行了探讨和研究，最后指出了数据挖掘语言的发展趋势，以及若干待解决的问题。

【关键词】数据挖掘，查询语言，建模语言，XML

1. 引言

随着网络技术的发展和计算机使用的日益广泛，电子化数据越来越多，人们正面临“数据丰富而知识贫乏”的问题。八十年代末兴起的数据挖掘（data mining）技术或数据库中的知识发现（knowledge discovery in database，KDD）技术为解决此问题开辟了一条道路。数据挖掘是在大量的数据中发现潜在的、有价值的模式和数据间关系（知识）的过程。经过十多年的工作，数据挖掘技术的研究与应用已取得了很大的成果，然而，我们还面临着许多问题：（1）各种数据挖掘问题及挖掘方法基于不同的模型和技术，彼此互相孤立，联系很少；（2）缺少简明精确的问题描述方法，挖掘的语义通常是由实现方法决定的；（3）数据挖掘系统仅提供孤立的知识发现功能，难于嵌入大型应用；（4）数据挖掘引擎与数据库系统是松散耦合，T.Imielinski 和 H.Mannila 称其为"文件挖掘(file mining)系统"，它没有提供应用独立的操作原语。

到目前为止，数据挖掘行业是高度分散的，公司和研究机构独立开发各自的数据挖掘系统和平台，没有形成开放性的标准；同时数据挖掘本身是一门多学科综合跨度非常大的技术，这两点是上述问题存在的根本原因。近年来数据挖掘语言的研究为解决上列问题，提出一个新的研究方向。

本文组织结构如下：在第2节提出了数据挖掘语言分类的方法，将数据挖掘语言分为：查询语言，建模语言，以及通用语言三种类型，然后，分别在2.1、2.2与2.3小节举例阐述这三种数据挖掘语言的特点。在第3节对三种数据挖掘语言进行分析与评价，指出了各自的优缺点。最后指出了数据挖掘语言的发展趋势，以及若干待解决的问题。

2. 数据挖掘语言的分类

设计一个好的数据挖掘语言的重要性可以通过观察关系数据库系统的历史来证实。在数据库市场上，关系数据库系统已经占支配地位数十年了。关系查询语言的标准化，发生在关系数据库开发的早期阶段，关系数据库领域的成功广泛地依赖于关系数据库查询语言的标准化。尽管每个商业的关系数据库系统都有各自的图形用户接口GUI，每个接口的根本的核心仍然是标准化的关系数据库查询语言。关系查询语言的标准化为关系数据库的开发和发展提供了基础。它使得信息交换更加容易，同时提升了关系数据库技术的商业性和被广泛接受的程度。因此，有一个好的数据挖掘语言可以有助于数据挖掘系统平台的标准化的开发，甚至可以象HTML推动Internet的发展一样，推动数据挖掘行业的开发和发展。

设计全面的数据挖掘语言是一个巨大的挑战，因为数据挖掘覆盖了宽广的任务，从数据特征化到挖掘关联规则，数据分类，聚集和偏差检测，等等。每个任务都有不同的需求。设计一个有效的数据挖掘语言需要对各种不同的数据挖掘任务的能力、限制、以及运行机制都有深入地理解。

数据挖掘语言的研究经历了两个阶段，第一个阶段是研究单位和公司自行研究和开发阶段；第二阶段是研究单位和公司组成联盟，研制和开发数据挖掘语言标准化的阶段。这两个阶段趋势界限是很明显的。第一个阶段成果包括Jiawei Han等研制的DMQL；Imielinski和Virmani提出的MSQL；Meo、Psaila、和Ceri提出MINE RULE操作器；等。第二阶段主要包括数据挖掘组织协会（DMG）提出的预言模型标记语言PMML，以及微软公司提出的OLE DB for Data Mining规范。

对于上述数据挖掘语言，根据功能和侧重点不同，我们将其分为三种类型：数据挖掘查询语言；数据挖掘建模语言；通用数据挖掘语言。第一阶段的数据挖掘语言一般属于查询语言；PMML属于建模语言；OLE DB for DM属于通用数据挖掘语言。下面我们分别介绍其特点和功能。

2.1 数据挖掘查询语言[1,2]

数据挖掘系统应该有能力支持特殊的和交互的数据挖掘(sad-hoc and interactive data mining)，目的是为了灵活和有效的知识发现。数据挖掘查询语言即是设计用来支持这个特点的。我们首先以加拿大Simon Franser大学Jiawei Han等开发的数据挖掘系统DBMiner中数据挖掘查询语言DMQL（Data Mining Query Language）来介绍查询语言的特点，接着简单介绍其它研究工作。

数据挖掘查询语言DMQL由数据挖掘原语组成，数据挖掘原语用来定义一个数据挖掘任务。用户使用数据挖掘原语与数据挖掘系统通信，使得知识发现更有效。这些原语有以下几个种类：数据库一部分的规范以及用户感兴趣的数据集（包括感兴趣的数据库属性或数据仓库的维度）；挖掘知识的种类；在指导挖掘过程中有用的背景知识；模式估值的兴趣度测量；以及挖掘出的知识如何可视化表示。数据挖掘原语允许用户在挖掘过程中从不同的角度或深度与数据挖掘系统进行交互式地通信。

数据挖掘查询的基本单位是数据挖掘任务，通过数据挖掘查询语言，数据挖掘任务可以通过查询的形式输入到数据挖掘系统中。一个数据挖掘查询由以下五种基本的数据挖掘原语定义：

1）任务相关数据原语

这是被挖掘的数据库的一部分。挖掘的数据不是整个数据库，只是和具体商业问题相关、或者用户感兴趣的数据集，即是数据库中一部分表，以及表中感兴趣的属性。该原语包括以下具体的内容：数据库或数据仓库的名称；数据库表或数据仓库的立方体；数据选择的条件；相关的属性或维；数据分组定义。

2）被挖掘的知识的种类原语

该原语指定被执行的数据挖掘的功能，在DMQL中将挖掘知识分为五种类型，即五种知识的表达：特征规则；辨别规则；关联规则；分类/预言；聚集。

3）背景知识原语

用户能够指定背景知识，或者关于被挖掘的领域知识。这些知识对于引导知识发现过程和评估发现的模式都是非常有用的。背景知识原语包括：概念层次（concept hierarchy）；对数据关系的用户信任度（user beliefs about relationships in the data）。

4）兴趣度测量原语

这个功能是将不感兴趣的模式从知识中排除出去。兴趣度测量能够用来引导数据挖掘过程，或者在发现后评估被发现的模式。不同种类的知识有不同种类的兴趣度测量方法。例如对关联规则来说，兴趣度测量包括支持度（support）和可信度（confidence）。低于用户指定的支持度和可信度阈值的规则被认为是不感兴趣的。兴趣度测量原语包括：简单性（simplicity）；确定性（certainty，比如：可信度）；效用（utility，比如：支持度）；新颖性（novelty）。

5）被发现模式的表示和可视化原语

这个原语定义被发现的模式显示的方式，用户能够选择不同的知识表示形式。该原语包括：规则，表格，报告，图表，图形，决策树，和立方体；向下钻入和向上累积（drill-down and roll-up）。

DMQL正是基于这些原语设计的数据挖掘查询语言。它允许从关系数据库和数据仓库中多个抽象层次上特殊（ad-hoc）和交互地挖掘多种种类的知识。DMQL采用类似SQL语言的语法，因此它能够很容易地和关系查询语言SQL集成。

除了DMQL以外，我们简单介绍其它一些数据挖掘查询语言的研究工作。MSQL是一个数据挖掘查询语言，它有Imielinski和Virmani提出。这个语言使用了类似SQL的语法和SQL原语（包括排序、分组、和其它原语）。既然在数据挖掘中可能产生大量的规则，MSQL提供了一个称作GetRule和SelectRule的原语，用于规则产生和规则选择。它统一地对待数据和规则，因此，能够在执行数据选择，以及基于查询的规则产生时进行优化工作，同时也能在操纵或者查询产生规则的集合时进行优化。其它在数据挖掘语言设计方面的研究工作包括Meo、Psaila、和Ceri提出MINE RULE操作器。它同样遵循类似SQL的语法，是为挖掘关联规则设计的规则产生查询语言。

2.2 数据挖掘建模语言[3]

数据挖掘建模语言是对数据挖掘模型进行描述和定义的语言。如果我们设计一种标准的数据挖掘建模语言，使得数据挖掘系统在模型定义和描述方面有标准可以遵循，那么各系统之间可以共享模型，既可以解决目前各数据挖掘系统之间封闭性的问题，有可以在其它应用系统中间嵌入数据挖掘模型，解决孤立的知识发现问题。“预言模型标记语言”（Predictive Model Markup Language，PMML）正是这样一种数据挖掘建模语言。

PMML被一个称作数据挖掘协会（The Data Mining Group ，http://www.dmg.org/，DMG）的组织开发。该组织由Angoss， Magnify， NCR， SPSS和芝加哥Illinois大学等企业和单位组成，它的目的是开发预言模型开放标准，策略是将此标准推荐给W3C工作组，使PMML成为W3C的正式推荐物。目前DMG宣布了定义预言模型开放标准的第一个版本PMML 1.0。PMML主要目的是允许应用程序和联机分析处理（OLAP）工具能从数据挖掘系统获得模型，而不用独自开发数据挖掘模块。另一个目的是能够收集使用大量潜在的模型，并且统一管理各种模型的集合。这些能力在商业应用领域是有效的配置分析模型的基础。

PMML是一种基于XML的语言，用来定义预言模型。它为各个公司定义预言模型和在不同的应用程序之间共享模型提供了一种快速并且简单的方式。通过使用标准的XML解析器对PMML进行解析，应用程序能够决定模型输入和输出的数据类型，模型详细的格式，并且按照标准的数据挖掘术语来解释模型的结果。

PMML提供了一个灵活机制来定义预言模型的模式，同时支持涉及多个预言模型的模型选择和模型平衡（model averaging）。对于那些需要全部学习、部分学习和分布式学习（ensemble learning, partitioned learning, and distributed learning）的应用程序，这种语言被证明是非常有用的。另外，它使得在不同的应用程序和系统之间移动预言模型变得容易、方便。特别地，PMML非常适合部分学习、元学习、分布式学习、以及相关领域。

使用PMML进行模型定义由以下几部分组成：

1) 头文件（a header）

2) 数据模式（a data schema）

3) 数据挖掘模式（a data mining schema）

4) 预言模型模式（a predictive model schema）

5) 预言模型定义（definitions for predictive models）

6) 全体模型定义（definitions for ensembles of models）

7) 选择和联合模型和全体模型的规则（rules for selecting and combining models and ensembles of models）

8) 异常处理的规则（rules for exception handling）

其中第5项组件是必不可少的。另外预言模型的模式必须被定义，这能够利用一个或多个模式（组件3，4，5）来定义。其它几项组件是可选的。

PMML1.0标准版提供了一个小的DTD（文档类型定义，XML术语）集合，DTD详细说明了决策树和多项式回归模型的实体和属性。DTD1.0遵循着一个通用模式，该模式将一个数据字典和一个或多个模型的定义相结合，数据字典能够立即应用于模式。数据字典的元素是非常简单的。

DMG当前正在制定PMML版本1.1，该版本提供独立于应用程序定义模型的方法，使得版权问题和不兼容问题不再成为应用程序之间交换模型的障碍。

2.3 通用数据挖掘语言[4]

通用数据挖掘语言合并了上述两种语言的特点，既具有定义模型的功能，又能作为查询语言与数据挖掘系统通信，进行交互和特殊的挖掘。通用数据挖掘语言的标准化是解决目前数据挖掘行业出现问题的最优的解决方案。2000年3月，微软公司推出了一个数据挖掘语言，称作OLE DB for Data Mining（DM）。这是朝数据挖掘语言原语标准化方面最显著的努力。我们将OLE DB for DM归类成通用数据挖掘语言。

OLE DB for DM的规范包括创建原语以及许多重要数据挖掘模型的定义和使用（包括预言模型和聚集）。它是一个基于SQL预言的协议，为软件商和应用开发人员提供了一个开放的接口，该接口将数据挖掘工具和能力更有效地和商业以及电子商务应用集成。同时，OLE DB for DM 已经与DMG发布的PMML标准结合。通过与PMML标准结合，微软将数据挖掘分析应用带入了一个更加强大的开放规范。这意味着大量的组织或公司现在都可以有一种简单的并且易实现的方式将数据挖掘模型与他们自己构建的应用相结合，增强了应用系统的分析能力，却没有增加复杂性。

OLE DB for DM扩充了SQL语言语法，使得商业分析和开发人员只是调用单一确定的API（应用程序接口）函数即可实现数据挖掘功能，而不需要特殊的数据挖掘技能。它与关系数据库自然的集成能够加快数据挖掘进入高利润的电子商务应用领域，例如站点个性化设计和购物篮分析。

微软的目的是为数据挖掘提供行业标准，以至于任何数据挖掘软件的算法，只要符合这个标准，都能容易地嵌入应用程序中。OLE DB for DM支持多种流行的数据挖掘算法。使用OLE DB for DM，数据挖掘应用能够通过OLE DB生产者接进任何表格式的数据源，数据挖掘分析现在能够依赖一个关系数据库直接进行。

为了更容易访问，OLE DB for DM没有增加任何新的OLE DB 接口；相反，这个规格定义了一个简单的查询语言，它的语法非常类似于SQL语言，它专门研究了模式的行集合（rowset），经过OLE DB或者ADO，消费者应用程序能够使用行集合与数据挖掘生产者进行通信。

为了填补传统的数据挖掘技术和目前流行的关系数据库管理系统之间的缝隙，OLE DB for DM定义了重要的新的概念和特点，包括如下几点：

1）数据挖掘模型（Data Mining Model，DMM）

DMM类似一个关系表，但是它包含了一些特殊的列，这些列被数据挖掘中的数据训练和预言制定使用。DMM 既可以用来创建预言模型，又可以产生预言。不象标准的关系表存储原始数据，DMM存储被数据挖掘算法发现的模式。对于从事基于WEB数据挖掘项目的开发人员，DMM所有的结构和内容都可以用XML字符串表示。

2）预言联接操作（Predication Join Operation）

这是一个简单的操作，类似于SQL语法中的联接操作，它在一个训练好的数据挖掘模型和设计的输入数据源之间映射一个联接查询，开发人员能够容易地产生确切符合商业需求的度身定制的预言结果。这个预言结果通过OLE DB的行集合或者ADO记录集（recordset）发送到消费者应用程序内。

3）OLE DB for DM模式行集合（Schema Rowsets）

这些特殊目的的模式行集合允许消费者应用发现临界的信息，例如可以利用的挖掘服务，挖掘模型，挖掘列，和模型内容。数据挖掘生产者在模型创建和训练阶段组装模式行集合。

目前OLE DB for DM规范最新版本是1.0。

3. 分析与评价

数据挖掘查询语言能与数据挖掘系统通信，进行交互和特殊的挖掘。它提供了独立于应用的操作原语，简明精确的问题描述方法。但是，由于各查询语言是研究机构和公司为自己的数据挖掘系统开发，没有形成标准，它并没有实质性地解决各个数据挖掘系统彼此互相孤立，难于嵌入大型应用的问题。

PMML为处理和交换预言模型提供了一个简单、开放的构架，使得各公司能够更加迅速地使用他们从在线和传统的数据中挖掘出的信息。这种标准使得公司在IT基础构架中更加容易构建商业智能。PMML允许用户在一个软件商的应用程序内开发模型，而使用其它软件商的应用程序对模型可视化、分析、估值或者以别的方式使用该模型。它使得在不同应用程序之间能够无缝地交换模型变为可能，解决了数据挖掘系统彼此孤立，难于嵌入大型应用的问题。

然而，PMML是预言模型标记语言，数据挖掘模型包括预言模型和描述模型，因此PMML并不是全面的数据挖掘模型定义语言。同时，PMML1.0不是一个全面的集合，我们期望PMML最终将发展成一个全面的、具有丰富建模能力的模型定义语言。我们预见并且盼望这个标准接下来的版本能够介绍优化，比如种类字段（categorical fields）的位向量扩充（bit vector expansions）或者连续字段（continuous fields）的log 变换。PMML，或者类似于PMML的事物，随着商业系统对统计和数据挖掘工具与技术需求的日益增加，对它的要求显得特别迫切。

OLE DB for DM规范的发布在预言和描述分析模型被商业应用广泛使用的道路上是一个重大的里程碑。它同时具备了数据挖掘查询和建模语言的优点，它的推广必将推动数据挖掘行业的发展。但是，对于一些数据挖掘模型，比如：概念描述（特征和辨别规则）和关联规则，还有数据仓库模型，OLAP的创建和使用，在目前的版本中仍然没有涉及。我们期望微软公司将继续动态地扩充和丰富它的内容。

4．总结

本文介绍了数据挖掘语言及其标准化方面的研究进展，分析并比较了几种商用数据挖掘语言的特点，我们发现标准化是数据挖掘语言发展的趋势。开发一种全面的开放的数据挖掘语言标准，必然将是各公司和研究机构的核心课题。但是，正如关系数据库查询语言SQL由关系代数理论的支持，数据挖掘语言的标准化也需要一种理论的基础，基于高阶逻辑和Rough Sets理论的数据挖掘问题的分类描述理论，将作为今后我们进一步深入研究的课题。

【参考文献】

[1] Jiawei Han, Yongjian Fu, Wei Wang, Krzysztof Koperski, Osmar Zaiane. “DMQL:A Data Mining Query Language for Relational Database”. VLDB’96

[2] Jiawei Han, Micheline Kamber. ”Data Mining: Concepts and Techniques” 97-116.Morgan Kaufmann Publishers. August 2000

[3] Robert Grossman, Stuart Bailey, Ashok Ramu, Balinder Malhi, Michael Cornelison, Philip Hallstrom, and Xiao Qin. “The Management and Mining of Multiple Predictive Models Using the Predictive Modeling Markup Language (PMML)”,AFCEA’99

[4] Microsoft Corporation. ”OLE DB for Data Mining Specification” Version 1.0. July 2000

Data Mining Language Analysis

Zhu Jianqiu, Zhang xiaohui, Cai Weijie, Zhu Yangyong

（Department of Computer Science, Fudan University, Shanghai, 200437）

【Abstract】The article introduces some research work about some kinds of data mining languages and standardization, presents a kind of classification of data mining language. Then the article states structure and compose of the data mining languages. At the end it points out the trend of data mining language growing and some un-solved problems.

【Key Words】data mining，query language，modeling language，XML

本文得到国家863（863-306-02-05）基金和“上海市教育委员会重点学科”基金的资助。

作者简介

朱建秋男（1974-）博士研究生

研究方向：数据仓库，数据挖掘

工作单位：复旦大学计算机科学系数据库研究中心

联系地址：复旦大学计算机科学系数据库研究中心527

EMAIL：[email protected]

你可能感兴趣的:(Journal,DATA,MINING)

pandas :将时间戳转换为 datetime.date 潮易 pandas
pandas:将时间戳转换为datetime.date首先，我们需要导入`pandas`库。然后，我们可以使用`pd.to_datetime()`函数将时间戳转换为日期对象。最后，我们可以使用`.dt.date`属性来获取日期部分。以下是详细的步骤：1.导入`pandas`库：```pythonimportpandasaspd```2.创建一个包含时间戳的DataFrame：```pythonda
Java 大视界 -- Java 开发 Spark 应用：RDD 操作与数据转换一只蜗牛儿 java spark 开发语言
ApacheSpark是一个强大的分布式计算框架，提供了高效的数据处理能力，广泛应用于大数据分析与机器学习。Spark提供了多种高级API，支持批处理和流处理。Spark提供了两种主要的数据抽象：RDD（弹性分布式数据集）和DataFrame。本文将重点介绍如何使用Java开发Spark应用，并深入探讨RDD的操作与数据转换。一、Spark环境搭建首先，确保您的环境中安装了Java和Spark。您
深入HDFS——DataNode启动源码黄雪超大数据基础 #深入HDFS hdfs hadoop 大数据
引入上一篇我们看完了NameNode的启动源码，对于NameNode我们已经很熟悉了，今天我们接着来看看它的“得力干将”——DataNode。首先，自然还是从元数据管理篇提到的DataNode类（org.apache.hadoop.hdfs.server.datanode.DataNode）开始。不过在深入启动源码前，我们先看看它的源码注释：DataNodeisaclass(andprogram)
使用eclipse连接mysql数据库步骤 m0_67401134 面试学习路线阿里巴巴数据库 mysql eclipse 后端 python
1.导入连接MySQL数据库驱动包（例如mysql-connector-java-5.1.7-bin.jar），并测试。步骤：1）在eclipse里面点击右上角的图标，如下图所示。2）选中DatabaseConnections右键，点new。3）选择MySQL，点击next。4）如图所示：2.引用MySQL驱动包jar在项目右键一个文件夹lib,把驱动包复制进去，然后右键驱动包点BuildPath
《计算机组成及汇编语言原理》阅读笔记：p128-p132 python
《计算机组成及汇编语言原理》学习第10天，p128-p132总结，总计5页。一、技术总结1.8088organizationandarchitecture8088处理器是16位电脑，寄存器是16位，数据总线(databus)是8位，地址总线是20位。(1)general-purposeregister8088处理器(processor)包含的通用寄存器有8个：AX,BX,CX,DX,SI,DI,B
Linux从0到1——线程自定义封装 -指短琴长- Linux linux c++运维
Linux从0到1——线程自定义封装1.Thread.hpp2.main.cc1.Thread.hpp#pragmaonce#include#include#includetemplateusingfunc_t=std::function;templateclassThread{public:Thread(func_tfunc,conststd::string&threadname,Tdata):
springboot + redis 实现多数据源小橘快跑 redis spring boot redis java
1、引用pom依赖org.springframework.bootspring-boot-starter-data-redisredis.clientsjedis2、application.yml配置文件spring:redis:timeout:20000cluster:nodes:127.0.0.1:6379,127.0.0.1:6380maxRedirects:3pool:max-active
gd32 exmc 连接 mcu 8080TFT 驱动（8pin/16pin)ST7789,40帧每秒240*320； qq_24158561 c++算法 c语言驱动开发 stm32
#include"gd32e50x.h"#if0//RS~A2316根数据线#defineBANK0_LCD_D((uint32_t)0x61000000)//LCDdataaddress,RS~A2316线2^23*2=0x1000000#defineBANK0_LCD_C((uint32_t)0x60000000)//LCDregisteraddressAlternate2:EXMC_NE0=
oracle同步数据adg_oracle11g ADG主备切换 weixin_39536630 Oracle数据库主备切换日志实时应用备库切换状态
1、主库操作将主库切换成备库点击(此处)折叠或打开selectopen_mode,database_role,protection_mode,protection_level,switchover_statusfromv$database;altersystemswitchlogfile;altersystemarchivelogcurrent;alterdatabasecommittoswitc
Oracle DataGuard 主备正常切换 (Switchover) J.P.August Oracle DataGuard oracle 数据库
前言众所周知，DataGuard的切换分为两种情况：系统正常情况下的切换：这种方式称为switchover，是无损切换，不会丢失数据。灾难情况下的切换：这种情况下一般主库已经启动不起来了，称为failover，有可能会丢失数据，并且切换后原主库不再是该DataGuard配置的一部分。OracleDataGuard主备切换可以使用传统的手动命令切换，也可以使用dgmgr切换，本文将重点介绍在正常情况
Vue 开发者的 React 实战指南：表单处理篇
作为Vue开发者，在迁移到React开发时，表单处理的差异是一个重要的适应点。本文将从Vue开发者熟悉的角度出发，详细介绍React中的表单处理方式和最佳实践。基础表单处理对比Vue的表单处理在Vue中，我们习惯使用v-model进行双向绑定：用户名：密码：记住我：登录exportdefault{data(){return{form:{username:'',password:'',remembe
《计算机组成及汇编语言原理》阅读笔记：p200-p240 java
《计算机组成及汇编语言原理》学习第15天，p200-p240总结，总计40页。一、技术总结1.derivedtype(1)定义Arepresentationfordatabuiltupbycombiningbasictypes.Forexample,afractiontypecouldbederivedfromtwointegers,thenumeratorandthedenominator.(2
Zabbix 组件 Fly_阳 Zabbix
Zabbix监控系统包含四个主要组件：ZabbixServer、Zabbixproxy、ZabbixDatabase和ZabbixGUI。每个组件都有自己的特点和要求：ZabbixServer：核心引擎，负责收集和接收来自被监控设备的数据，用来与ZabbixAgents、Zabbixproxy和ZabbixDatabase进行通信。它是最重要的组件，管理着所有的规则，包括收集监控数据、触发器、告警
ADG主备切换switchover 小紫稣数据库 oracle
1.检查主、备convert参数showparameterdb_file_name_convertshowparameterlog_file_name_convert核对主备库DB_NAME、DB_UNIQUE_NAME,并设置：altersystemsetdb_file_name_convert='+DATADG/{备库DB_UNIQUE_NAME}','+DATA/{DB_NAME}'scop
Memcached 可观测性最佳实践 memcached
Memcached介绍Memcached是一个高性能、分布式的内存对象缓存系统，用于动态Web应用程序以减轻数据库负载。它通过将数据缓存在内存中，极大地减少了数据库查询的次数，从而提高应用程序的响应速度。Memcached最早由LiveJournal的DangaInteractive开发，目前已成为许多大型互联网公司使用的基础技术之一。Memcached的监控是保障应用性能和稳定性的关键措施，通过
鸿蒙数据可视化系列之使用McCharts框架代码bug记录比较好记 bug java 开发语言鸿蒙
1.目前发现在折线图里面series的data数据类型定义有bug，应该是data：Array，代码位置oh_modules/.ohpm/[email protected]/oh_modules/@mcui/mccharts/src/main/ets/utils/chartInterface.ts//数据层的特征接口interfaceSeriesInterface{name:string,color?
ORACLE 数据库ADG切换 ThinkerFuther 数据库 oracle
主备库切换一、Switchover方式切换一般SWITCHOVER切换都是计划中的切换，特点是在切换后，不会丢失任何的数据，而且这个过程是可逆的，整个DATAGUARD环境不会被破坏，原来DATAGUARD环境中的所有物理和逻辑STANDBY都可以继续工作。在进行DATAGUARD的物理STANDBY切换前需要注意：1）确认主库和从库间网络连接通畅；2）确认没有活动的会话连接在数据库中；3）PRI
SQLite3 使用Python快速操作单体文件的sqlite数据库 XLY23333 SQL Python 数据库 sqlite python
PY-SQLite3Note:XLY23333RAWVideo:checkPythonVersion:3.11SQL基础操作可参考文章：[CSDN]SQLBasicVERSION1[CSDN]SQLBasicVERSION2DataBase基础概念关系型数据库常见操作即SQL(StructuredQueryLanguage)语法创建/删除/修改表CREATE/DROP/ALTERTABLE新增/删
HDFS 在上传文件的时候，如果其中一个 DataNode 突然挂掉了怎么办？思维导图代码示例（java 架构) 用心去追梦 hdfs java 架构
当在HDFS中上传文件时，如果其中一个DataNode突然挂掉，HDFS有内置的机制来确保数据的完整性和可靠性。以下是详细的处理流程、Java架构代码示例以及创建思维导图的建议。HDFS上传文件时遇到DataNode故障的处理1.检测DataNode故障心跳机制：每个DataNode定期向NameNode发送心跳信号。如果NameNode在一段时间内没有收到某个DataNode的心跳，它会将该节点
电商项目-基于ElasticSearch实现商品搜索功能(三) kong7906928 项目功能 Java框架 elasticsearch 电商项目商品搜索
本系列文章主要介绍基于SpringDataElasticsearch实现商品搜索的后端代码，介绍代码逻辑和代码实现。主要实现功能：根据搜索关键字查询、条件筛选、规格过滤、价格区间搜索、搜索查询分页、搜索查询排序、高亮查询。主要应用技术:canal，Eureka，微服务架构（MicroservicesArchitecture），SpringDataElasticsearch一、搜索分页1分页分析基于
Data Mesh：《华为数据之道》中的数据治理和**Data Mesh**架构的理念差异 PersistDZ 数据架构华为架构 data mesh 数据之道
《华为数据之道》中的数据治理和DataMesh架构的理念有一定的差异，尽管两者都强调如何有效管理和利用数据，但它们的侧重点、方法论和适用场景有所不同。以下是它们的异同、优劣势及适用场景的详细比较：1.数据治理与DataMesh的定义数据治理（《华为数据之道》中的数据治理）数据治理是一个全面的过程，旨在通过规范化、标准化、系统化的数据管理，使数据成为企业的核心资产。书中提出了数据治理的五化模型（标准
【HarmonyOS NEXT应用开发】案例65：Fabric 自定义组件开发指导青少年编程作品集 c语言 c++开发语言华为 harmonyos 华为云华为od
1.编写RN调用Fabric组件的代码编写MarqueeViewNativeComponent.tsx，注意，如果要使用Codegen，文件必须以NativeComponent命名。在文件中使用codegenNativeComponent创建MarqueeView组件，其中MarqueeViewProps里声明了src属性和onStop事件：typeOnStopEventData=Readonly
mindspeed-llm源码解析（一）preprocess_data 人工智能
mindspeed-llm是昇腾模型套件代码仓，原来叫"modelLink"。这篇文章带大家阅读一下数据处理脚本preprocess_data.py（基于1.0.0分支），数据处理是模型训练的第一步，经常会用到。文章中贴的源码加了相关注释，同学们可以把源码和注释结合起来看。首先来看一下main函数defmain():#获取入参，通过后面的代码可以知道有哪些关键参数args=get_args()#参
ProtonBase 荣获 Datafun “数智技术最佳探索奖”
2024年，数智领域迎来技术创新的高峰，尖端技术和用户案例呈现井喷式增长，成为引领时代潮流的关键词。DataFun社区作为数智前沿阵地，汇聚全球数智精英，推动技术革新和知识共享，助力技术加速发展。由DataFun社区颁发的“星空奖-数智技术最佳探索奖”旨在表彰数智技术领域取得显著成就的创新技术，特别是那些具有卓越创新性、实用性和自主知识产权的产品，解决了用户的实际需求，产生了积极的社会和经济效益。
如何在SpringBoot/MySQL事务中并行执行多条SQL？ springboot
在SpringBoot和MySQL事务中并行执行多条SQL语句，可以通过以下步骤实现：1、配置事务管理器在SpringBoot项目中，需要配置事务管理器来管理事务。通常，可以使用DataSourceTransactionManager作为事务管理器。在配置类中添加如下代码：importorg.springframework.context.annotation.Bean;importorg.spr
单例模式的几种实现方式 dlwlrma-IU LeetCode刷题企业面试真题 java 开发语言
单例模式单例模式是一种常见的设计模式，而关于单例模式的实现又有以下几种实现方式：饿汉单例，懒汉单例，双重校验锁，静态内部类等实现饿汉单例该懒汉单例是线程安全的，但是存在资源浪费的情况，在程序启动时就会创建该类的实例。/***@author:dlwlrma*@data2025年01月15日16:34*@Description单例模式之懒汉单例*/publicclassSingleton{//私有静态
linux安装oracl19c
安装OracleDatabase19c（以下简称Oracle19c）在Linux系统上的详细步骤如下。每一步都经过专业分析，确保安装过程顺利且高效。️1.下载安装包首先，从Oracle官方网站下载OracleDatabase19c的安装包。确保选择与您的Linux发行版和系统架构相匹配的版本。#示例命令（实际下载需通过浏览器或Oracle工具进行）wgethttps://download.orac
XSAN数据恢复-数据从XSAN迁移到STORNEXT过程中丢失的数据恢复案例数据恢复
XSAN数据恢复环境：昆腾存储+MACOS操作系统，存储数据主要是视频类数据如MXF、MOV等格式文件。该昆腾存储中有9个数据卷：1个META信息卷和8个DATA信息卷。XSAN故障情况：将存储空间从XSAN架构迁移到STORNEXT架构后，发现存储空间中数据全部丢失。XSAN数据恢复过程：1、将昆腾存储的存储空间以只读方式进行完整镜像，后续的数据分析和数据恢复操作都基于镜像文件进行，避免对原存储
Flutter本地持久化数据工具类ShareLocalDataTool，方便二次开发
在使用前先倒入shared_preferences:^2.0.15import'package:shared_preferences/shared_preferences.dart';//本地持久化存储工具类classShareLocalDataTool{ShareLocalDataTool._();staticFuturesaveStringList(Stringkey,Listvalues)a
js，scss常用的方法 javascriptcss
获取网页参数functiongetExtraDataByKey(key){varparams={},query=window.location.search.substring(1),arr=query.split('&'),rt;if(arr&&Array.isArray(arr)){arr.forEach(function(item,i){vartmp=item.split('='),key=
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str