lihaifeng555

异常点检测算法分析与选择

1.1 常见异常点检测算法

在数据库中包含着少数的数据对象，它们与数据的一般行为或特征不一致，这些数据对象叫做异常点 (Outlier) ，也叫做孤立点。异常点的检测和分析是一种十分重要的数据挖掘类型，被称之为异常点挖掘 ^{[28 ]}。

对于异常数据的挖掘主要是使用偏差检测，在数学意义上，偏差是指分类中的反常实例、不满足规则的特例，或者观测结果与模型预测值不一致并随时间的变化的值等等。偏差检测的基本目标是寻找观测结果与参照值之间有意义的差别，主要的偏差技术有聚类、序列异常、最近邻居法、多维数据分析等。除了识别异常数据外，异常数据挖掘还致力于寻找异常数据间隐含模型，用于智能化的分析预测。对于异常数据分析方法的研究是论文的重要内容之一，通过研究异常数据，找到适合出口企业产品质量深入分析和有效监管的方法和策略。

1.1.1 基于统计的异常点检测算法

从 20 世纪 80 年代起，异常检测问题就在统计学领域里得到广泛研究，通常用户用某个统计分布对数据点进行建模，再以假定的模型，根据点的分布来确定是否异常。许许多多针对不同分布的异常测试 (Discordancy Test) 方法发展起来，它们分别适用于不同的情形：①数据分布状况；②数据分布参数是否已知；③异常数据数量；④异常数据类型 ( 高于或低于一般抽样值 ) 。这方面比较有代表性的有 1967 年 Mikey ， Dunn & Clark 提出的基于“均数漂移”模型的单点诊断量， 1970 年 Gentleman &Wilk 提出的群组诊断量， 1972 年 Tietjen &Moore 提出的单样本 k 个离群点的统计量 E _k ， 1985 年 Marasinghe 提出的改进的 E _k 统计量 F _k ， 1989 年 Rosner 提出的单样本多个离群检测算法 ESD(Generalized Extreme Studentized Deviate) 方法， 1991 年 Paul & Fung 改进了 ESD 方法参数 k 选择的主观性，提出了回归分析的 GESR (Generalized Extreme Studentized DeviateResi2dual) 方法。近年来，多样本的离群检测方法也得到了一定的发展，总的思路是先尽量得到一个不含离群点的“干净集”，然后在此基础上对剩余的其他数据点进行逐步离群检测 ^{[29 ]}。

目前利用统计学研究异常点数据有了一些新的方法，如通过分析统计数据的散度情况，即数据变异指标，来对数据的总体特征有更进一步的了解，对数据的分布情况有所了解，进而通过数据变异指标来发现数据中的异常点数据。常用的数据变异指标有极差、四分位数间距、均差、标准差、变异系数等等，变异指标的值大表示变异大、散布广；值小表示离差小，较密集。

基于统计的方法检测出来的离群点很可能被不同的分布模型检测出来，可以说产生这些离群点的机制可能不唯一，解释离群点的意义时经常发生多义性，这是基于统计方法的一个缺陷。其次，基于统计的方法在很大程度上依赖于待挖掘的数据集是否满足某种概率分布模型，模型的参数、离群点的数目等对基于统计的方法都有非常重要的意义，而确定这些参数通常都比较困难。为克服这一问题，一些人提出对数据集进行分布拟合，但分布拟合存在两个问题：①给出的分布可能不适合任一标准分布。②即使存在一个标准分布，分布拟合的过程耗时太长。此外，基于统计的离群检测算法大多只适合于挖掘单变量的数值型数据，目前几乎没有多元的不一致检验，对于大多数的应用来说，例如图像和地理数据，数据集的维数却可能是高维的。实际生活中，以上缺陷都大大限制了基于统计的方法的应用，使得它主要局限于科研计算，算法的可移植性较差。

1.1.2 基于距离的异常点检测算法

用什么标准判定一个数据对象是孤立点呢？即便是对给定的距离量度函数，对孤立点也有不同的定义，以下是使用较多的几个：

l 基于距离的离群点最早是由 Knorr 和 Ng 提出的，他们把记录看作高维空间中的点，离群点被定义为数据集中与大多数点之间的距离都大于某个阈值的点，通常被描述为 DB ( pct ， d _min ) ，数据集 T 中一个记录 O 称为离群点，当且仅当数据集 T 中至少有 pct 部分的数据与 O 的距离大于 d _min 。换一种角度考虑，记 M =N × (1 - pct) ，离群检测即判断与点 O 距离小于 d _min 的点是否多于 M 。若是，则 O 不是离群点，否则 O 是离群点 ^{[4 ][36 ]}。

l 孤立点是数据集中到第 k 个最近邻居的距离最大的 n 个对象 ^{[37 ]}。

l 孤立点是数据集中与其 k 个最近邻居的平均距离最大的 n 个对象 ^{[38 ]}。

基于距离的离群点定义包含并拓展了基于统计的思想，即使数据集不满足任何特定分布模型，它仍能有效地发现离群点，特别是当空间维数比较高时，算法的效率比基于密度的方法要高得多 ^{[39 ]}。算法具体实现时，首先给出记录间距离的度量，常用的是绝对距离 ( 曼哈顿距离 ) 、欧氏距离和马氏距离 ^{[40 ]}。在给出了距离的度量并对数据进行一定的预处理以后，任意给定参数 pct 和 d _min 就可以根据离群的定义来检测离群。 Rastogi 和 Ramaswamy 在上面基于距离的离群点定义的基础上，提出改进的基于距离的 k 最近邻 (k － NN ) 离群检测算法 ^{[37 ][41 ][42 ]}。

基于距离的离群检测方法中，算法需要事先确定参数 pct 和 d _min ，对于不同的数据集这往往是一件比较困难的事情，特别是 d _min ，不同聚类密度的数据集 d _min 会有很大的差异，而这一般没有规律可循，因此，对于给定的不同 d _min ，异常检测结果通常具有很大的不稳定性 ^{[43 ]}。另一方面，基于距离的方法理论上能处理任意维任意类型的数据，当属性数据为区间标度等非数值属性时，记录之间的距离不能直接确定，通常需要把属性转换为数值型 ^{[37 ][44 ]}，再按定义计算记录之间的距离。当空间的维数大于三维时，由于空间的稀疏性，距离不再具有常规意义，因此很难为异常给出合理的解释。针对这个问题，一些人通过将高维空间映射转换到子空间的办法来解决数据稀疏的问题，此方法在聚类算法中用得比较多 ^{[45 ][46 ]}， Agarwal R.^{[45 ]} 等人曾试着用这种投影变换的方法来挖掘离群。总的来说，基于距离的离群检测方法具有比较直观的意义，算法比较容易理解，因此在实际中应用得比较多。

目前比较成熟的基于距离的异常点检测的算法有：

1 ．基于索引的算法 (Index-based) ：给定一个数据集合，基于索引的算法采用多维索引结构 R- 树， k-d 树等，来查找每个对象在半径 d 范围内的邻居。假设 M 为异常点数据的 d 领域内的最大对象数目。如果对象 O 的 M+l 个邻居被发现，则对象 O 就不是异常点。这个算法在最坏情况下的复杂度为 O(k*n ²) ， k 为维数， n 为数据集合中对象的数目。当 k 增加时，基于索引的算法具有良好的扩展性 ^{[44 ]}。

2 ．嵌套循环算法 (Nested-loop) ：嵌套一循环算法和基于索引的算法有相同的计算复杂度，但是它避免了索引结构的构建，试图最小化 I/O 的次数。它把内存的缓冲空间分为两半，把数据集合分为若干个逻辑块。通过精心选择逻辑块装入每个缓冲区域的顺序， I/O 效率能够改善 ^{[44 ]}。

3 ．基于单元的算法 (cell-based)^{[47 ]} ：在该方法中，数据空间被划为边长等于 d /(2*k ^1/2) 的单元。每个单元有两个层围绕着它。第一层的厚度是一个单元，而第二层的厚度是 [2*k ^1/2-1] 。该算法逐个单元地对异常点计数，而不是逐个对象地进行计数。对于一个给定的单元，它累计三个计数：单元中对象的数目 (cell_count) 、单元和第一层中对象的数目 (cell_+_1_layer_count) 单元和两个层次中的对象的数目 (cell_+_2_layers_count) 。该算法将对数据集的每一个元素进行异常点数据的检测改为对每一个单元进行异常点数据的检测，它提高了算法的效率。它的算法复杂度是 O(c ^k +n ) ，这里的 c 是依赖于单元数目的常数， k 是维数。它是这样进行异常检测的：若 cell_+_1_layer_count>M ，单元中的所有对象都不是异常；若 cell_+_2_layers_count<=M ，单元中的所有对象都是异常；否则，单元中的某一些数据可能是异常。为了检测这些异常点，需要逐个对象加入处理。基于距离的异常点检测方法要求用户设置参数 P 和 d ，而寻找这些参数的合适设置可能涉及多次试探和错误。

基于距离的方法与基于统计的方法相比，不需要用户拥有任何领域知识，与序列异常相比，在概念上更加直观。更重要的是，距离异常接近 Hawkins 的异常本质定义。然而，三种类型的基于距离的离群检测算法中，基于索引的算法和循环——嵌套算法需要 O (k *n ² ) 的时间开销，因此在大数据集中还有待于改进；而基于单元的算法，虽然与 n 具有线性的时间关系，但是它与 k 成指数关系，这限制了它在高维空间中的应用，此外，基于单元的算法还需要事先确定参数 pct ， d _min 以及单元的大小，这使得算法的可行性比较差；高维空间中，基于索引的方法由于需要事先建立数据集的索引，建立与维护索引也要花大量的时间。因此三种方法对于高维空间中的大数据集，算法的效率都不高 ^{[44 ]}。

1.1.3 基于密度的异常点检测算法

基于密度的离群检测算法一般都建立在距离的基础上，某种意义上可以说基于密度的方法是基于距离的方法中的一种，但基于密度的异常观点比基于距离的异常观点更贴近 Hawkins 的异常定义，因此能够检测出基于距离的异常算法所不能识别的一类异常数据——局部异常。基于密度的方法主要思想是将记录之间的距离和某一给定范围内记录数这两个参数结合起来，从而得到“密度”的概念，然后根据密度判定记录是否为离群点。

Breunig 等人提出的基于局部离群因子的异常检测算法 LOF 是基于密度方法的一个典型例子。它首先产生所有点的 MinPts 邻域及 MinPts 距离，并计算到其中每个点的距离；对低维数据，利用网格进行 k － NN 查询，计算时间为 O (n ) ；对中维或中高维数据，采用如 X2 树等索引结构，使得进行 k2NN 查询的时间为 O (logn ) ，整个计算时间为 O (nlogn ) ；对特高维数据，索引结构不再有效，时间复杂度提高到 O ( n ² ) 。然后计算每个点的局部异常因子，最后根据局部异常因子来挖掘离群。 LOF 算法中，离群点被定义为相对于全局的局部离群点，这与传统离群的定义不同，离群不再是一个二值属性 ( 要么是离群点，要么是正常点 ) ，它摈弃了以前所有的异常定义中非此即彼的绝对异常观念，更加符合现实生活中的应用。

LOF 算法中充分体现了“局部”的概念，每个点都给出了一个离群程度，离群程度最强的那几个点被标记为离群点。此外， Aggarwal 也提出了一个结合子空间投影变换的基于密度的高维离群检测算法。

1.1.4 基于深度的异常点检测算法

基于深度的离群点检测算法的主要思想是先把每个记录标记为 k 维空间里的一个点，然后根据深度的定义 ( 常用 Peeling Depth Contours 定义 ) 给每个点赋予一个深度值；再根据深度值按层组织数据集，深度值较小的记录是离群点的可能性比深度值较大的记录大得多，因此算法只需要在深度值较小的层上进行离群检测，不需要在深度值大的记录层进行离群检测。基于深度的方法比较有代表性的有 Struyf 和 Rousseeuw 提出的 DEEPLOC 算法。虽然，理论上基于深度的识别算法可以处理高维数据，然而实际计算时， k 维数据的多层操作中，若数据集记录数为 N ，则操作的时间复杂度为Ω (N ^{[k/2 ]}) 。因此，当维数 k ≤ 3 时处理大数据集时还有可能是高效的，而当 k ≥ 4 时，算法的效率就非常低。也就是说，已有的基于深度的离群点检测算法无法挖掘高维数据，只有当 k ≤ 3 时计算效率才是可接受的。

1.1.5 基于偏移的异常点检测算法

基于偏移的离群检测算法 (Deviation-based Outlier Detection) 通过对测试数据集主要特征的检验来发现离群点。目前，基于偏移的检测算法大多都停留在理论研究上，实际应用比较少。以下三种是比较有代表性的 : ① Arning 采用了系列化技术的方法来挖掘离群，由于算法对异常存在的假设太过理想化，因此并没有得到普遍的认同，对于现实复杂数据，其效果不太好，经常遗漏了不少的异常数据 ; ② Sarawagi 应用 OLAP 数据立方体引进了发现驱动的基于偏移的异常检测算法 ; ③ Jagadish 给出了一个高效的挖掘时间序列中异常的基于偏移的检测算法。虽然，基于偏移的离群检测算法理论上可以挖掘各种类型的数据，但是由于要事先知道数据的主要特征，而现实世界中的数据集一方面由于数据量比较大，另一方面由于属性比较多，因此这方面的特征往往不容易发现，当确定记录之间的相异度函数时，如果选择不合适，则得到的离群挖掘结果很可能不尽人意，所以本方法在实际问题中应用得比较少。

基于偏移的异常点检测不采用统计检验或者基于距离的度量值来确定异常对象，它是模仿人类的思维方式，通过观察一个连续序列后，迅速地发现其中某些数据与其它数据明显的不同来确定异常点对象，即使不清楚数据的规则。基于偏移的异常点检测常用两种技术：序列异常技术和 OLAP 数据立方体技术。我们简单介绍序列异常的异常点检测技术。序列异常技术模仿了人类从一系列推测类似的对象中识别异常对象的方式。它利用隐含的数据冗余。给定 n 个对象的集合 S ，它建立一个子集合的序列， {S ₁ ， S ₂ ， … ， Sm} ，这里 2<= m <=n ，由此，求出子集间的偏离程度，即“相异度”。该算法从集合中选择一个子集合的序列来分析。对于每个子集合，它确定其与序列中前一个子集合的相异度差异。光滑因子最大的子集就是异常数据集。这里对几个相关概念进行解释：

1 ．异常集：它是偏离或异常点的集合，被定义为某类对象的最小子集，这些对象的去除会产生剩余集合的相异度的最大减少。

2 ．相异度函数：已知一个数据集，如果两个对象相似，相异函数返回值较小，反之，相异函数返回值较大；一个数据子集的计算依赖于前个子集的计算。

3 ．基数函数：数据集、数据子集中数据对象的个数。

4 ．光滑因子：从原始数据集中去除子集，相异度减小的两度，光滑因子最大的子集就是异常点数据集。

基于偏差的异常点数据的检测方法的时间复杂度通常为 O(n ) ， n 为对象个数。基于偏差的异常点检测方法计算性能优异，但由于事先并不知道数据的特性，异常存在的假设太过理想化，因而相异函数的定义较为复杂，对现实复杂数据的效果不太理想。

1.1.6 高维数据的异常点检测算法

以上几种异常检测算法一般都是在低维数据上进行的，对于高维数据的效果并不是很好。与低维空间不同，高维空间中的数据分布得比较稀疏，这使得高维空间中数据之间的距离尺度及区域密度不再具有直观的意义 ^{[48 ]}。基于这个原因， Aggarwal 和 Yu 提出一个高维数据异常检测的方法。它把高维数据集映射到低维子空间，根据子空间映射数据的稀疏程度来确定异常数据是否存在。

（4‑ 1 ）

高维数据的异常点检测的主要思想是：首先它将数据空间的每一维分成小个等深度区间。所谓等深度区间是指将数据映射到此一维空间上后，每一区间包含相等的 f = 1/ 的数据点。然后在数据集的 k 维子空间中的每一维上各取一个等深度区间，组成一个 k 维立方体，则立方体中的数据映射点数为一个随机数毛。设 n(D) 为 k 维立方体 D 所包含点数， N 为总的点数。定义稀疏系数 s(D) 如（ 4‑1 所示：

s(D) 为负数时，说明立方体 D 中数据点低于期望值， s(D) 越小，说明该立方体中数据越稀疏。

数据空间的任一模式可以用 ml m2 … mi … 表示。 mi 指此数据在第 i 维子空间映射区间，可以取值 1 到，或者 *( 牢表示可以为任意映射值 ) 。异常检测问题可以转化成为寻找映射在 k(k 作为参数输入 ) 维子空间上的异常模式以及符合这些异常模式的数据。如 4 维空间中一个映射在 2 维子空间上的模式 ( = 10 ) *3*90 高维数据中寻找异常模式是非常困难的。一个简单办法是对所有数据维进行组合，来搜索可能异常模式，但是效率极其低下。

1.2 出口产品质量异常检测的思路和算法分析

检疫检疫局监管出口企业生产批质量数据的过程是：首先检验检疫局下发给企业产品出口标准和参数，企业的质量控制人员可以参考此标准和参数组织生产活动，同时将出口产品的某一批次定位生产批，在产品的生产过程，将生产批的质量监控数据上报到检疫检疫局。此生产批将与后期在检验检验局出口报检产品建立对应关系，这样如果出口产品出现问题，检疫检疫执法机构可以通过此种模式的回溯机制定位到此产品生产过程的质量参数。目前企业上报的生产批数据主要是企业自身的质量控制人员手工录入的，数据录入过程中人为因素很大。出口电子监管系统中建立了一套复杂的基于规则标准的监管体系，检疫检疫局认可通过出口电子监管系统综合评定的企业上报的生产批数据，但是对于一些有意钻漏洞的企业，如果其一旦掌握了电子监管系统的评定规则，将对出口产品的质量安全带来新的危险。出口产品质量的异常检测就是在此问题的背景下，借助文中阐述的 OLAM 模型，通过时间序列的相似度查询，找到异常序列。

企业在生产过程中是存在某些时间序列的，其时间序列可能存在一些规律性的变换，例如季节变化产生的植物类食品的周期性变换，企业的生产工艺加工方法造成的周期性变化等等。有些异常点检测的研究主要集中于数据集内单数据点，这一方法在进行欺诈检测、金融监管、可疑交易监控等实际应用过程中出现了误报率高、真正的异常行为模式被掩盖的问题，产生问题的原因是现实生活中各种波动周期的存在 ^{[19 ]}。例如，一个账户连续 11 个月每月存入 5 千元，到第 12 月突然存入 5 万元，基于单数据点比较的离群判别模式将认为该月数据显著异常而报告为离群点，而这 5 万元实际可能是一笔正常的年终奖金。基于时间序列相似度分析的方法则将多个数据点通过时间轴连接成曲线，由点扩展到线，对线与线之间的相似度或差异度进行分析，由此可将孤立事件串联而成有规律的行为模式理解，更能够反映出人们在现实生活中的活动规律。由此可见，电子监管中的出口企业也同样存在这个规律，尤其食品的出口跟时间有着密切的联系。论文中的通过研究不同的异常点检测算法，找到了一种基于时间序列相似度的离群点检测模式。

1.2.1 时间序列相关背景

时间序列由两个基本因素构成：一个是被研究现象所属时间，另一个是反映该现象一定时间条件下数量特征的指标值。

从统计意义上来讲，所谓时间序列就是将某一指标在不同时间上的不同数值，按照时间的先后顺序排序而成的数列。这种数列由于受到各种偶然因素的影响，往往表现出某种随机性，彼此之间存在这统计上的依赖关系。虽然每一个时刻上的取之或数据点的位置具有一定的随机性，不可能完全准确地用历史值来预测将来，但是前后时刻的数值或数据点的相关性往往呈现某种趋势性或周期性变化，这是时间序列挖掘的可行性之所在。时间序列挖掘通过对过去历史行为的客观记录分析，揭示其内在的规律（如波动的周期、振幅、趋势的种类等），进而完成预测未来行为等决策性工作 ^{[30 ]}。

在统计分析中，对时间序列还采取一种简化、直接的分析方法，它没有具体描述被研究现象与其影响因素之间的关系，而是把各影响因素分别看作一种作用力，被研究对象的时间序列则看成合力；然后按作用特点和影响效果将影响因素规为 4 类，即趋势变动（ T ）、季节变动（ S ）、循环变动（ C ）和随机变动（ I ）。这四种类项的变动叠加在一起，形成了实际观测到的时间序列，因而可以通过对这四种变动形式的考察来研究时间系列的变动

[31 ^] 。

在时间序列序列挖掘的研究中，目前比较集中的问题之一是时间序列的快速查询以及相应的存取结构设计。早期的工作着重与精确查找。但是，大多数新型的数据库应用，特别是数据挖掘应用需要数据库具备相似（ Similarity ）查找能力。对于在几兆，甚至几十兆的时间序列数据库中发现两个模式相似的序列，手工处理很难胜任这样的工作，传统的数据库查找方法也难以完成此类任务，因此时间序列相似性查找成为目前数据挖掘领域的一个新的研究课题。目前国际和国内对时间序列相似度的研究提出了许多种解决方法，这些方法主要包括基于直接距离、傅立叶变换、 ARMA 模型参数法、规范变换、时间弯曲模型、界标模型、神经网络、小波变换、规则推导等。

从理论上来看，基于统计特性描述（如一阶统计量和高阶统计量）或参数建模（如 AR 建模和 ARMA 建模）的传统时间序列分析方法有可能用来解决相似性问题，但实际上并不能得到很好的结果，其主要困难在于相似性度量的定义和算法的时间复杂度，而这两者都依赖于时间序列的近似表示方法。因此，寻求某种鲁棒性强且计算复杂度低的时间序列近似表示方法，一直是解决相似性搜索问题的关键。迄今为止，时间序列相似性搜索问题已经提出了 10 年左右的时间，在这段时间内，先后出现了许多面向相似性搜索的时间序列近似表示方法，如 Agrawal 采用的离散傅立叶变换（ DFT ， Discrete Fourier Transform) 、 Chan 等人采用的 Haar 小波变换方法、 Last 等人提出的关键特征（如斜率和信噪比）法、 Guralnik 等人提出的字符表方法、 Korn 等人提出的奇异值分解（ SVD ， Singular Value Decomposition ）法、 Keogh 等人先后提出的分段累积近似法（ PAA ， Piecewise Aggregate Approximation ）、分段线性表示（ PLR ， Piecewise Linear Representation ）和适应性分段常数近似法（ APCA ， Adaptive Piecewise Constant ）等分段方法，以及 Perng 等人提出的界标模型（ Landmark Model ）等。这些表示方法各有所长，为时间序列相似性研究提供了诸多可以借鉴与参考的方向 ^{[32 ]}。本论文通过 OLAM 模型，实现了在 Weka 中基于离散傅里叶变换的时间序列相似性查找方法，通过此异常检查策略的实际应用来展示 OLAM 模型的实用性。

1.2.2 基于离散傅立叶变换的时间序列相似性查找

傅立叶变换是一种重要的积分变换，早已被广泛应用。在时间序列分析方面，离散傅立叶变换具有独特的优点。例如，给定一个时间序列，可以用离散傅立叶变换把其从时域空间变换到频域空间。根据 Parseval 的理论，时域能量函数与频域能量谱函数是等价的。这样就可以把比较时域空间的序列相似性问题转化为比较频域空间的频谱相似性问题。另外，因为频域空间的大部分能量集中前几个系数上，因此可以不考虑离散傅立叶变换得到的其他系数。把这些被保留系数看作从时间序列上提取的特征，这样就可以从每个序列中获得若干（记为 k ）特征，进而可以进一步把它们映射到 k 维空间上。这样就可以用一些目前被广泛采用多维索引方法（如 R* 数、 k-D- 树、线性四叉树（ Linear Quad tree ）、网格文件（ Grid － File ）），来存储和检索这些多维空间的点 ^{[33 ][34 ]}。

下面描述一下如何进行基于离散傅立叶变换的完全匹配。所谓完全匹配必须保证被查找的序列与给出的序列有相同的长度。因此，与子序列匹配相比，工作就相对简单一些。

1.1.1 完全匹配查找算法

给定一个时间序列 X = {xt|t = 0 ， 1 ， ... ， n-1} ，对 X 进行离散傅立叶变换，得到（ 4‑2)

这里， X 与 xt 代表时域信息，而与 Xf 代表频域信息，＝ {Xf| f ＝ 0 ， 1 ，， n － 1} ， Xf 为傅立叶系数。

根据 Parserval 的理论，时域能量谱函数与频域能量谱函数相同，得到 4‑ 3 ）

衡量两个序列是否相似的一般方法是用欧氏距离。如果两个序列的欧氏距离小于的话，则认为这两个序列相似，即满足如下公式：

按照 Parserval 的理论，如下式子也应该成立：

对大多数序列来说，能量集中在傅立叶变换后的前几个系数，也就是说一个信号的高频部分相对来说并不重要。因此我们只取前面 fc 个系数，即

因此

首次筛选所做的工作就是，从提出特征后的频域空间中找出满足上面式子的序列。这样就滤掉一大批与给定序列的距离大于的序列。

在首次筛选后，已经滤掉了一大批与给定序列的距离大于的序列。但是，由于只考虑了前面几个傅立叶系数，所以并不能保证剩余的序列相似。因此，还需要进行最终验证工作，即计算每个首次被选中的序列与给定序列在时域空间的欧氏距离，如果两个序列的欧氏距离小于或等于，则接受该序列。

实践证明，上述完全匹配查找方法非常有效，而且只取 1 ～ 3 个系数就可以达到很好的效果，随着序列数目的增加和序列长度的增加执行效果更好。

1.3 小结

做为论文的一个重要章节，其主要内容是综述和分析异常点检测算法，目的是找到适合检验检验出口产品质量分析的方法和策略。论文综述了目前异常点检测在各个方法领域的发展和其针对的问题域，其中包括了统计的异常点检测、距离的异常点检测、密度的异常点检测、深度的异常点检测、偏离的异常点检测、高维数据的异常点检测。由此可以看出，对于异常点的研究有多种手段和方法，本论文选择电子监管数据中的时间序列做为研究对象。时间序列是一种重要的高维数据类型，它是按照时间顺序观察所得到的一串数据。时间序列的应用日益广泛，其涉及天文、地理、生物、物理、化学等自然科学领域，图像识别、语音处理、声纳技术、遥感技术、机械工程等工程技术领域，以及市场经济、金融分析、人口统计、地震检测等社会经济领域，当前对于时间序列挖掘的研究正得到越来越多的重视。本论文提出对时间序列进行离散傅立叶变换 DFT(Discrete Fourier Transform) ，用 DFT 的前 k 个系数作为原时间序列的表示，其底层的理论依据是数字信号处理领域的 Parseval 定理，该定理保证了时间序列数据的 DFT 变换前几个系数中保存了序列中大部分能量。在实际应用中， DFT 变换对于自然产生的时间序列信号较为适合，但是对于其他来源的时间序列数据则效果不佳。

你可能感兴趣的:(数据仓库及数据挖掘)

学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动李蕾1229
为促进我校教师专业发展，发挥骨干教师的引领带头作用，11月6日下午，我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动。图片发自App会议由教师发展处李蕾主任主持，首先，由范校长宣读新老教师结对名单及双方承担职责。随后，两位新调入教师陈玉萍、莫正杰分别和他们的师傅鲍元美、刘召彬老师签订了师徒结对协议书。图片发自App图片发自App师徒拥抱、握手。有了师傅就有了目标有了方向，相信两位新教师在师
向内而求陈陈_19b4
10月27日，阴。阅读书目:《次第花开》。作者:希阿荣博堪布，是当今藏传佛家宁玛派最伟大的上师法王，如意宝晋美彭措仁波切颇具影响力的弟子之一。多年以来，赴海内外各地弘扬佛法，以正式授课、现场开示、发表文章等多种方法指导佛学弟子修行佛法。代表作《寂静之道》、《生命这出戏》、《透过佛法看世界》自出版以来一直是佛教类书籍中的畅销书。图片发自App金句:1.佛陀说，一切痛苦的根源在于我们长期以来对自身及外
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
春季养肝正当时 dxn悟
重温快乐2023年2月4日立春。春天来了，春暖花开，小鸟欢唱，那在这样的季节我们如何养肝呢？自然界的春季对应中医五行的木，人体五脏肝属木，“木曰曲直”，是以树干曲曲直直地向上、向外伸长舒展的生发姿态，来形容具有生长、升发、条达、舒畅等特征的食物及现象。根据中医天人相应的理念，肝五行属木，喜条达，主疏泄，与春天相应，所以春天最适合养肝。养肝首先要少生气，因为肝喜条达恶抑郁。人体五志肝为怒，生气发怒最
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
CX8836：小体积大功率升降压方案推荐（附Demo设计指南）诚芯微科技社交电子
CX8836是一颗同步四开关单向升降压控制器，在4.5V-40V宽输入电压范围内稳定工作，持续负载电流10A，能够在输入高于或低于输出电压时稳定调节输出电压，可适用于USBPD快充、车载充电器、HUB、汽车启停系统、工业PC电源等多种升降压应用场合，为大功率TYPE-CPD车载充电器提供最优解决方案。提供CX8836Demo测试、CX8836样品申请及CX8836方案开发技术支持。CX8836同升
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
Rust基础知识 GRKF15 rust 开发语言后端
1.Rust语言简介1.1基础语法变量声明：let关键字用于声明变量，可以指定或不指定类型，如leta=10;和letmutc=30i32;。函数定义：使用fn关键字定义函数，并指定参数类型及返回类型，如fnadd(i:i32,j:i32)->i32{i+j}。控制流：包括if、else等，控制语句后需要使用;来结束语句。1.2数据类型整数类型：i8、i16、i32、i64、i128，以及无符号的
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
舜公郑金锋书辛丑自剪扇面书法作品（四O六）舜公郑金锋
辛丑小阳春，新自剪扇面400品，大多为各色撒金、撒银、描金、描银、水印、彩绘、荧光等亚粉、色宣纸，以及域外包装填充纸等；王一品长锋羊毫秃笔；一得阁云头艳墨、宿墨、水等。书体有甲骨文，金文(商周金文、春秋战国金文、中山王厝器金文、汉金文……)，楚简帛书，侯马盟书，温县盟书，小篆，果蝙书等，隶书(秦简、汉简帛书、汉碑……)，草书(章草、小草、大草……)，行书(行楷、行草)，楷书(魏碑及北朝墓志、隋朝墓
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
mac 备份android 手机通讯录导入iphone,iphone如何导出通讯录（轻松教你iPhone备份通讯录的方法）... weixin_39762838 mac 备份android 手机通讯录导入iphone
在日新月异的手机更替中，换手机已经成为一个非常稀松平常的事情，但将旧手机上面的通讯录导入到新手机还是让不少小伙伴为难，本篇将给大家详细讲解这方面的知识：“苹果手机通讯录怎么导入到新手机”及“安卓手机通讯录导入到新手机”的方法。一、苹果手机通讯录导入到新手机常用方法(SIM卡导入)在苹果手机主频幕上找到“设置”，单击进入设置菜单，下拉菜单列表，点击“邮件、通讯录、日历”，然后找到“导入SIM卡通讯录
一分钟学会刷牙，受用终生！好易康
讲真，刷了十几二十年牙，没刷对过一次......来来来，划重点，更重要的是执行：①每天刷牙2次，②每次刷牙2~3分钟，③每3个月更换牙刷。最后，请使用正确的刷牙方法：巴氏（BASS）刷牙法undefined_腾讯视频视频来源ADA美国牙医协会巴氏刷牙法又称龈沟清扫法或水平颤动法。是由美国牙科协会推荐的一种有效去除龈缘附近及龈沟内菌斑的方法。刷牙不仅是刷牙齿，同时也要刷牙龈。因为口腔与细菌的战场就在
Python入门之Lesson2:Python基础语法小熊同学哦 Python入门课程 python 开发语言算法数据结构青少年编程
目录前言一.介绍1.变量和数据类型2.常见运算符3.输入输出4.条件语句5.循环结构二.练习三.总结前言欢迎来到《Python入门》系列博客的第二课。在上一课中，我们了解了Python的安装及运行环境的配置。在这一课中，我们将深入学习Python的基础语法，这是编写Python代码的根基。通过本节内容的学习，你将掌握变量、数据类型、运算符、输入输出、条件语句等Python编程的基础知识。一.介绍1
光盘文件系统 (iso9660) 格式解析穷人小水滴光盘文件系统 iso9660 deno GNU/Linux javascript
越简单的系统,越可靠,越不容易出问题.光盘文件系统(iso9660)十分简单,只需不到200行代码,即可实现定位读取其中的文件.参考资料:https://wiki.osdev.org/ISO_9660相关文章:《光盘防水嘛?DVD+R刻录光盘泡水实验》https://blog.csdn.net/secext2022/article/details/140583910《光驱的内部结构及日常使用》ht
逻辑思维的过程与力量解晓萱
之前我对逻辑思维的了解停留在，讲话时有逻辑，辩论时条理清晰。今天看了《开讲了》里面关于大学生质疑易中天老师的视频，听到易中天老师的回答，忽然对逻辑思维有了稍微深刻的理解。图片发自App逻辑学对我们太重要了，不仅仅是学习备考，更重要的是生活和事业及交流的选择及过程。偏激的起点和性格有关，更和逻辑思维水平有关。视频里，易中天老师评价北大学生逻辑时讲到：“他的逻辑环节是没问题的，但是逻辑起点错了，所以他
阅读《认知觉醒》读书笔记就看看书
本周阅读了周岭的《认知觉醒开启自我改变的原动力》，启发较多，故做读书笔记一则，留待学习。全书共八章，讲述了大脑、潜意识、元认知、专注力、学习力、行动力、情绪力及成本最低的成长之道。具体描述了大脑、焦虑、耐心、模糊、感性、元认知、自控力、专注力、情绪专注、学习专注、匹配、深度、关联、体系、打卡、反馈、休息、清晰、傻瓜、行动、心智宽带、单一视角、游戏心态、早起、冥想、阅读、写作、运动等相关知识点。大脑
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
【2022 CCF 非专业级别软件能力认证第一轮（CSP-J1）入门级 C++语言试题及解析】汉子萌萌哒 CCF noi 算法数据结构 c++
一、单项选择题(共15题，每题2分，共计30分；每题有且仅有一个正确选项)1.以下哪种功能没有涉及C++语言的面向对象特性支持：()。A.C++中调用printf函数B.C++中调用用户定义的类成员函数C.C++中构造一个class或structD.C++中构造来源于同一基类的多个派生类题目解析【解析】正确答案:AC++基础知识，面向对象和类有关，类又涉及父类、子类、继承、派生等关系，printf
计算机网络八股总结 Petrichorzncu 八股总结计算机网络笔记
这里写目录标题网络模型划分（五层和七层）及每一层的功能五层网络模型七层网络模型（OSI模型）==三次握手和四次挥手具体过程及原因==三次握手四次挥手TCP/IP协议组成==UDP协议与TCP/IP协议的区别==Http协议相关知识网络地址，子网掩码等相关计算网络模型划分（五层和七层）及每一层的功能五层网络模型应用层：负责处理网络应用程序，如电子邮件、文件传输和网页浏览。主要协议包括HTTP、FTP
2022-1-12晨间日记云卷云舒_a1b9
起床：6：20就寝：23：00天气：阴心情：还好纪念日：法考主观体出分的日子叫我起床的不是闹钟是梦想年度目标及关键点：备考初级会计师；坚持运动，减重，阅读，学习本月重要成果：报名今日三只青蛙/番茄钟学习听课；瑜伽课；记账盘点成功日志-记录三五件有收获的事务1.收到鲜花2.早起做早餐3.引导孩子做计划财务检视支出严重超预算，检视一月的预算是否合理人际的投入同学联系；开卷有益-学习/读书/听书听初级课
天猫返利网哪个最好?天猫返利网站有哪些? 优惠券高省
关于哪个返利网站好用，今天汐儿给大家介绍以下十大网站，可以作为参考：1、高省网【高省APP】（邀请码：668666）全网佣金最高。手机应用商店搜索“高省”即可免费下载安装，填写高省邀请码：668666，直升2皇冠，享更高佣金及分红奖励。高省APP全网佣金最高，手机应用商店搜索“高省”即可下载，高省邀请码：668666，此码注册，直升2皇冠，佣金更高！送万元推广大礼包，教你如何1年做到百万团队。其实
进销存小程序源码 PHP网络版ERP进销存管理系统全开源可二开摸鱼小号 php
可直接源码搭建部署发布后使用：一、功能模块介绍该系统模板主要有进，销，存三个主要模板功能组成，下面将介绍各模块所对应的功能；进：需要将产品采购入库，自动生成采购明细台账同时关联财务生成付款账单；销：是指对客户的销售订单记录，汇总生成产品销售明细及回款计划；存：库存的日常盘点与统计，库存下限预警、出入库台账、库存位置等。1.进购管理采购订单：采购下单审批→由上级审批通过采购入库；采购入库：货品到货>
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name