weixin_30877493

聚类算法及其评估指标

聚类(Clustering)-----物以类聚，人以群分。

1.Finding groups of objects

Objects similar to each other are in the same group

Objects are different from those in other groups

2.Unsupervised Learning

No labels

Data driven

3.Requirements:arbitrary shape,noise and outliers

4.K-means、K-mediods、DBSCAN、EM(Expectation Maximization)

聚类是观察式学习，而不是示例式的学习。

聚类能够作为一个独立的工具获得数据的分布状况，观察每一簇数据的特征，集中对特定的聚簇集合作进一步地分析。

聚类分析还可以作为其他数据挖掘任务（如分类、关联规则）的预处理步骤。

聚类分析的方法

划分方法：

Construct various partitions and then evaluate them by some criterion,e.g.,minimizing the sum of square errors

Typical methods:k-means,k-medoids,CLARANS

层次方法：

Create a hierarchical decomposition of the set of data (or objects) using some criterion

Typical methods:Diana,Agnes,BIRCH,CAMELEON

基于密度的方法：

Based on connectivity and density functions

Typical methods:DBSCAN,OPTICS,DenClue

基于网格的方法：

Based on multiple-level granularity structure

Typical methods:STING,WaveCluster,CLIQUE

基于模型的方法：

A model is hypothesized for each of the clusters and tries to find the best fit of that model to each other

Typical methods:EM,SOM,COBWEB

基于频繁模式的方法：

Based on the analysis of frequent patterns

Typical methods:p-Cluster

基于约束的方法：

Clustering by considering user-specified or application-specific constraints

Typical methods:COD(obstacles),constrained clustering

基于链接的方法：

Objects are often linked together in various ways

Massive links can be used to cluster objects:SimRank,LinkClus

距离需要满足的性质：

非负性：d(i, j) > 0 if i ≠ j, and d(i, i) = 0
对称性：d(i, j) = d(j, i)
三角不等式：d(i, j)<= d(i, k) + d(k, j)

闵可夫斯基距离(Minkowski Distance): 计算距离的通用的公式：

i = (xi1, xi2, …, xip) 和 j = (xj1, xj2, …, xjp) 是p维数据对象

曼哈顿距离(或城市块距离Manhattan distance):h=1

欧几里德距离(用的最多的):h=2

K-Means:

k-均值聚类算法的核心思想是通过迭代把数据对象划分到不同的簇中，以求目标函数最小化，从而使生成的簇尽可能地紧凑和独立。
首先，随机选取k个对象作为初始的k个簇的质心；
然后，将其余对象根据其与各个簇质心的距离分配到最近的簇；再求新形成的簇的质心。
这个迭代重定位过程不断重复，直到目标函数最小化为止。

输入:期望得到的簇的数目k，n个对象的数据库。
输出:使得平方误差准则函数最小化的k个簇。
方法:
选择k个对象作为初始的簇的质心；
repeat
计算对象与各个簇的质心的距离，将对象划分到距离其最近的簇；
重新计算每个新簇的均值；
until 簇的质心不再变化。

优点
相对高效: O(tkn), 当 n 是对象数, k 是簇数, 并且 t 是叠代数 . 通常地, k, t << n.
通常终止在局部最优，但可用全局最优技术改进。(模拟退火和遗传算法)
不足
只有当中心可计算时才适用, 无法处理分类/标称数据
需要事先指定簇的个数K
无法处理噪声的数据
不能发现非凸形状簇

K-Mediods:

k-均值算法采用簇的质心来代表一个簇，质心是簇中其他对象的参照点。因此，k-均值算法对孤立点是敏感的，如果具有极大值，就可能大幅度地扭曲数据的分布。

k-中心点算法是为消除这种敏感性提出的，它选择簇中位置最接近簇中心的对象（称为中心点）作为簇的代表点，目标函数仍然可以采用平方误差准则。

处理过程：首先，随机选择k个对象作为初始的k个簇的代表点，将其余对象根据其与代表点对象的距离分配到最近的簇；然后，反复用非代表点来代替代表点，以改进聚类质量，聚类质量用一个代价函数来估计，该函数度量对象与代表点对象之间的平均相异度。

输入:n个对象的数据库，期望得到的簇的数目k

输出:使得所有对象与其最近中心点的偏差总和最小化的k个簇

方法

选择k个对象作为初始的簇中心

repeat

对每个对象，计算离其最近的簇中心点，并将对象分配到该中心点代表的簇

随机选取非中心点Orandom

计算用Orandom 代替Oj 形成新集合的总代价S

如果S<0，用Orandom代替Oj，形成新的k个中心点的集合

until 不再发生变化

采用k-中心点算法有两个好处：

对属性类型没有局限性；

通过簇内主要点的位置来确定选择中心点，对孤立点的敏感性小

不足：
处理时间要比k-mean更长；
用户事先指定所需聚类簇个数k。

DBCSAN：

DBSCAN(Density Based Spatial Clustering of Applications with Noise，具有噪声应用的基于密度的空间聚类)

一种基于密度的聚类算法，它将足够高密度的区域划分为簇，能够在含有“噪声”的空间数据库中发现任意形状的簇

两个全局参数：Eps:领域半径，MinPts:在领域中点的最少个数

核心点：领域半径对象个数大于密度阈值MinPts

边界点：领域半径对象个数小于密度阈值MinPts

点p的Eps-邻域记为N_Eps(p),N_Eps(p)={qєD|dist(p,q)≤Eps}

直接密度可达:点p从点q是直接密度可达的，则Eps，MinPts要满足：p是属于N_Eps(q);|N_Eps(q)|>=MinPts(核心条件)

密度可达:如果存在一个点的序列p₁, p₂,…, p_n，p₁ = q， p_n =p，其中p_i+1 是从p_i直接密度可达的，则称点p是从点q关于Eps和MinPts密度可达的。

密度相连:如果存在一个点o，p和q都是从点o关于Eps和MinPts密度可达的，则称点p是从点q关于Eps和MinPts密度相连的。

输入D:一个包含n个对象的数据集

Ɛ:半径参数

MinPts:邻域密度阈值

输出:基于密度的簇的集合

方法：

标记所有对象为unvisited;

随机选择一个unvisited对象p

标记p为visited

if p的Ɛ-邻域至少有MinPts个对象

创建一个新簇C，并把p添加到C

令N为p的Ɛ-邻域中的对象的集合

for N中的每个点p’

if p'是unvisited

标记p’为visited

if p’的Ɛ-邻域至少有MinPts个点，把这些点添加到N

if p’还不是任何簇的成员，把p’添加到C

endfor

输出C

else 标记p为噪声

Until 没有标记为unvisited的对象

时间复杂度O(n²) ，若使用空间索引，则时间复杂度为O(nlogn) ，即便对于高维数据，DBSCAN的空间也是O(n)

优点：可以在带有噪声的空间数据库中发现任意形状的簇

不足：参数需要由用户确定，算法对参数敏感，在具体实施时困难很大，当簇的密度变化太大以及高维数据，DBSCAN会有麻烦。

EM

EM算法是一种框架，它逼近统计模型参数的最大似然或最大后验估计。在模糊或基于概率模型的聚类的情况下，EM算法从初始参数集出发，并且迭代直到不能改善聚类，即直到聚类收敛或改变充分小(小于一个预先设定的阈值)。每次迭代由两步组成：

期望步(E-步):根据当前的模糊聚类或概率簇的参数，把对象指派到簇中。

最大化步(M-步):发现新的聚类或参数，最小化模糊聚类的SSE或基于概率模型的聚类的期望似然。

形象说法：比如说食堂的大师傅炒了一份菜，要等分成两份给两个人吃，显然没有必要拿来天平一点一点的精确的去称分量，最简单的办法是先随意的把菜分到两个碗中，然后观察是否一样多，把比较多的那一份取出一点放到另一个碗中，这个过程一直迭代地执行下去，直到大家看不出两个碗所容纳的菜有什么分量上的不同为止。

最大似然估计（https://blog.csdn.net/zengxiantao1994/article/details/72787849）

Jensen(琴生)不等式：函数的期望大于等于期望的函数，即 E(f(x))≥f(E(x))

算法推导：http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006936.html

聚类评估

聚类评估估计在数据集上进行聚类的可行性和被聚类方法产生的结果的质量。聚类评估主要包括：估计聚类趋势、确定数据集中的簇数、测定聚类质量。

估计聚类趋势：对于给定的数据集，评估该数据集是否存在非随机结构。盲目地在数据集上使用聚类方法将返回一些簇，所挖掘的簇可能是误导。数据集上的聚类分析是有意义的，仅当数据中存在非随机结构。

聚类趋势评估确定给定的数据集是否具有可以导致有意义的聚类的非随机结构。一个没有任何非随机结构的数据集，如数据空间中均匀分布的点，尽管聚类算法可以为该数据集返回簇，但这些簇是随机的，没有任何意义。聚类要求数据的非均匀分布。

霍普金斯统计量(Hopkins Statistic)是一种空间统计量，检验空间分布的变量的空间随机性。

计算步骤：

(1) 均匀地从D的空间中抽取n个点p₁,p₂,...p_n,对每个点p_i(1≤i≤n),找出p_i在D中的最近邻，并令x_i为p_i与它在D中的最近邻之间的距离，即

(2) 均匀地从D的空间中抽取n个点q₁,q₂,...q_n,对每个点q_i(1≤i≤n),找出q_i在D-{q_i}中的最近邻，并令y_i为q_i与它在D-{q_i}中的最近邻之间的距离,即

(3) 计算霍普金斯统计量H

如果D是均匀分布的，则将会很接近，H大约为0.5.而如果D是高度倾斜的，则，因而H将会接近与0.

确定数据集中的簇数：K-均值这样的算法需要数据集的簇数作为参数，簇数也可以看作是数据集的有趣并且重要的概括统计量。因此，在使用聚类算法导出详细的簇之前，估计簇数是可取的。

经验方法：

肘方法(elbow method)：给定k>0,使用像K-均值这样的算法对数据集聚类，并计算簇内方差和var(k)。然后，绘制var关于k的曲线。曲线的第一个（或最显著的）拐点暗示“正确的”簇数。

交叉验证法：将数据分为m部分；用m-1部分获得聚类模型，余下部分评估聚类质量（测试样本与类中心的距离和）；对k>0重复m次，比较总体质量，选择能获得最好聚类质量的k

测定聚类质量：在数据集上使用聚类方法之后，需要评估结果簇的质量。

两类方法：外在方法和内在方法

外在方法：有监督的方法，需要基准数据。用一定的度量评判聚类结果与基准数据的符合程度。（基准是一种理想的聚类，通常由专家构建）

Jaccard系数（Jaccard Coefficient, JC）

FM指数（Fowlkes and Mallows Index, FMI）

Rand指数（Rand Index, RI）

( a+b+c+d=m(m-1)/2 )

上述性能度量的结果值均在[0,1]区间，值越大越好。

用Q(C,C_g)表示聚类C在给定基准数据C_g条件下的质量度量

Q的好坏取决于四个条件：

簇的同质性：簇内越纯越好

簇的完整性：能够将基准数据中属于相同类的样本聚类为相同的类

碎布袋：把一个异种数据加入纯类应该比放入碎布袋受到更大的“处罚”

小簇的保持性：把小簇划分成更小簇比把大簇划分为小簇的危害更大

BCubed精度和召回率：一个对象的精度指示同一个簇中有多少个其他对象与该对象同属一个类别。一个对象的召回率反映有多少同一类别的对象被分配在相同的簇中。

设D={o₁,o₂,...o_n}是对象的集合，C是D中的一个聚类。设L(o_i)(1≤i≤n)是基准确定的o_i的类别，C(o_i)是C中o_i的cluster_ID,对于两个对象o_i和o_j(1≤i,j≤n,i≠j),它们之间在聚类C中的关系的正确性由给出。

BCubed精度定义为

BCubed召回率定义为

内在方法：无监督的方法，无需基准数据。类内聚集程度和类间离散程度。

考虑聚类结果的簇划分C={C₁,C₂,...,C_k},定义簇C内样本间的平均距离

簇C内样本间的最远距离：

簇C_i与簇C_j最近样本间的距离：

簇C_i与簇C_j中心点间的距离：

DB指数（Davies-Bouldin Index,DBI）

Dunn指数（Dunn Index,DI）

DBI值越小越好，而DI则相反，值越大越好。

轮廓系数（silhouette coefficient）：

对于D中的每个对象o,计算o与o所属的簇内其他对象之间的平均距离a(o):

b(o)是o到不包含o的所有簇的最小平均距离：

轮廓系数定义为：

轮廓系数的值在-1和1之间。

a(o)的值反映o所属的簇的紧凑性。该值越小，簇越紧凑。

b(o)的值捕获o与其他簇的分离程度。b(o)的值越大，o与其他簇越分离。

当o的轮廓系数值接近1时，包含o的簇是紧凑的，并且o远离其他簇，这是一种可取的情况。

当轮廓系数的值为负时，这意味在期望情况下，o距离其他簇的对象比距离与自己同在簇的对象更近，许多情况下，这很糟糕，应当避免。

转载于:https://www.cnblogs.com/czhwust/p/mlclusterpre.html

AI驱动的代码重构与优化技术 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
AI驱动的代码重构与优化技术概述什么是AI驱动的代码重构与优化？AI驱动的代码重构与优化技术，是指利用人工智能，特别是机器学习和深度学习的算法，对软件代码进行自动分析和改进的技术。这种技术能够通过学习大量的代码样本，识别出代码中的模式、问题和改进点，从而自动完成代码的重构和优化。重构的定义重构（Refactoring）是改进代码内部结构而不改变外部行为的过程。其目的通常是为了提高代码的可读性、可维
基于oracle linux的 DBI/DBD 标准化安装文档(六) oracle
一、安装DBIDBI(DatabaseInterface)是perl连接数据库的接口。其是perl连接数据库的最优方法，他支持包括Orcale,Sybase,mysql,db2等绝大多数的数据库，下面将简要介绍其安装方法。1.1解压tar-zxvfDBI-1.616_901.tar.gz1.2安装依赖yuminstallperl-ExtUtils-CBuilderperl-ExtUtils-Mak
Agent | 告别Token焦虑！LLaVA-Mini用一个视觉Token革新多模态大模型 SGG_CV paper agent python 人工智能
欢迎关注，获取最新人工智能动态和技术，有时会发布相关技术教程。也可留言想要跟踪哪些技术动态。往期Agent文章参考：Owl小白教程一键启动Manus开源|Owl最新版小白教程，一键启动，五大更新Owl技术解析：Manus开源复刻框架OWL，测评和使用教程来了！Manus核心技术：Manus|核心技术被曝光？你知道它使用了哪些工具吗？针对deepseek的api:Manus开源|owl针对使用dee
34个适合机械工程及自动化专业【论文选题】大数据蟒行探索者自动化运维
论文选题具有极其重要的意义，它直接关系到论文的质量、价值以及研究的可行性和顺利程度。选题明确了研究的具体领域和核心问题，就像给研究旅程设定了方向和目的地。例如，选择“人工智能在医疗影像诊断中的应用”这一选题，就确定了研究将聚焦于人工智能技术在医疗影像领域的应用问题，研究目标可能是提高影像诊断的准确性、效率等。清晰的方向和目标能让研究者在收集资料、设计研究方法等方面更具针对性，避免研究过程中的盲目性
人工智能技术篇*卷(三) code_stream #人工智能人工智能
接下来，我们在神经网络方面继续展开神经网络多层感知机（MLP）解决问题：多层感知机是一种基本的前馈神经网络，可用于解决分类和回归问题。它通过多个神经元层的非线性变换，能够学习复杂的非线性关系，对数据进行分类或预测连续值。例如，在手写数字识别中，它可以从数字图像的像素数据中学习到特征模式，从而判断该数字是0-9中的哪一个；在房价预测中，根据房屋的面积、房间数量等特征预测房价。案例：以手写数字识别为例
Oracle SQL*Loader 与 SQLULDR2 学习指南瑞琪姐 oracle sql 数据库
1.SQL*Loader(sqlldr)1.1概述作用：Oracle官方工具，用于将外部数据文件（如CSV、文本文件）高效加载到数据库表中。特点：支持多种数据格式（定长、变长、CSV）。支持直接路径加载（DirectPathLoad），绕过SQL引擎，提升性能。提供错误记录和丢弃无效数据的功能。1.2核心组件控制文件(ControlFile)：定义数据加载规则，包括数据文件路径、目标表、字段映射等
莫名锁表？ --- mysql的事务隔离级别程序员小软 mysql 数据库 java
前言系统响应超时系统访问数据库特别慢莫名提示锁等待超时数据库锁表事务长时间等锁，直到超时以上问题都可能是事务锁表导致的问题今天测试反馈系统批量处理莫名提示锁等待超时，再次操作查看数据库事务确实存在等锁情况，甚至死锁。刚开始是偶尔出现，后来一直就是死锁，导致其他操作也操作不了。刚开始发现数据库中操作插入的时候会进入锁等待怀疑是这张表中主键自增导致的锁表，于是将表改为指定主键，问题依然存在。后来想起来
MySQL数据库架构设计：分片与分区策略实战墨瑾轩一起学学数据库【一】mysql 数据库架构 adb
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣在数据库的魔法森林中，MySQL就像是一位智慧的老树精，而分片（Sharding）与分区（Partitioning）则是它手中的两把神秘钥匙，能够打开数据高效存储与快速检索的大门。今天，我们就一起踏上一场奇幻之旅，探索如何运用这两把钥匙，打造一个既强大又灵活的
数据库语句 lrydnh 数据库
//双击数据库useworld;//显示数据库里有多少张表showtables;一个大的项目就是数据库。SQL语句createschemaDataDefinitionLanguage:数据定义语言(DDL)查看创建和删除数据库：showdatabases;createdatabaseWorker;dropdatabaseWorker;增删改表tableshowtables;createtablet
STM32智能小车的设计与实现 a1666137 stm32 嵌入式硬件单片机
一、引言随着科技的飞速发展，智能小车作为一种集机械、电子、计算机、传感器、人工智能等技术于一体的新型交通工具，已经广泛应用于科研、教育、娱乐等多个领域。STM32作为一款高性能、低功耗的微控制器，凭借其强大的功能和灵活的编程方式，成为智能小车设计的首选平台。本文将对基于STM32的智能小车的设计与实现进行详细介绍。二、智能小车系统概述基于STM32的智能小车系统主要由STM32微控制器、电机驱动模
数据结构与算法：单调栈 WBluuue c++算法数据结构 leetcode
前言单调栈是一种维护数组当前位置左右两侧比它小或大的最近的数的一种数据结构。一、经典用法单调栈的经典用法就是找数组当前位置的数左右两侧比它小或大的最近的数。1.模板——单调栈结构(进阶)#includeusingnamespacestd;voidfindSmall(vector&arr){stackindex;vector>ans(1000001,vector(2,0));//存下标intcur;
超详细：数据库的基本架构 m0_74824661 面试学习路线阿里巴巴数据库架构
MySQL基础架构下面这个图是我给出的一个MySQL基础架构图，可以清楚的了解到SQL语句在MySQL的各个模块进行执行过程。然后MySQL可以分为两个部分，一个是server层，另一个是存储引擎。server层Server层涵盖了MySQL的大多数核心服务功能，以及所有的内置函数（如日期、时间、数学和加密函数等）。所有跨存储引擎的功能都在这一层实现，比如存储过程、触发器、视图等。Server层主
数据结构与算法：洪水填充 WBluuue c++算法 leetcode 数据结构深度优先剪枝图论
前言洪水填充是一种用在图上的搜索算法，其过程就像洪水或病毒一样逐渐蔓延整个区域，继而达到遍历和统计相同属性的连通区域的功能，中间也可以通过每走过一个节点就设置路径信息的方法来达到剪枝的效果。一、岛屿数量——洪水填充方法classSolution{public:intnumIslands(vector>&grid){returnsolve2(grid);}//洪水填充方法intsolve2(vect
MYSQL8.0数据库误删除记录恢复 MYSQL8.0数据库崩溃恢复 MYSQL8.0数据库删除表恢复 caihuayuan5 面试题汇总与解析大数据 spring boot java 后端课程设计
数据类型MYSQL8.0数据大小242MB故障检测主机断电导致数据库崩溃,无法启动.修复结果收到文件后,修正不一致的地方，成功启动MYSQL8.0完成恢复客户验收数据成功。完成恢复。最新数据得以恢复.客户非常满意。友情提醒：重要数据一定要勤备份，遇到数据丢失数据损坏等问题，要第一时间联系专业人士。对于各类主流数据库，我们可以做最底层的数据恢复及数据修复，对于数据库的某些特定故障我们保证数据库100
从Manus爆红到OpenAI反击：AI Agent技术架构与实战解析大F的智能小课大模型理论和实战 DeepSeek技术解析和实战人工智能架构
大家好，我是大F，深耕AI算法十余年，互联网大厂技术岗。知行合一，不写水文，喜欢可关注，分享AI算法干货、技术心得。欢迎关注《大模型理论和实战》、《DeepSeek技术解析和实战》，一起探索技术的无限可能！1.引：一夜爆红的Manus与OpenAI的反击2025年3月6日凌晨，中国团队Monica推出的通用人工智能代理产品Manus横空出世。这款被称作"Agent界的DeepSeek时刻"的产品，
量子神经网络（Quantum Neural Network）：结合量子计算的 AI 新探索盼达思文体科创人工智能和深度学习量子计算人工智能神经网络
一、引言在当今科技飞速发展的时代，人工智能（AI）和量子计算成为了两个备受关注的领域。量子神经网络（QuantumNeuralNetwork，QNN）作为这两个领域的交叉点，正吸引着越来越多的研究兴趣。QNN试图将量子计算的强大能力与传统神经网络的学习能力相结合，为解决复杂的人工智能问题提供新的思路和方法。二、量子计算基础（一）量子比特（Qubit）量子比特是量子计算的基本信息单位，与传统的比特不
AI 革命再提速：从 Manus 封停到 OpenAI 开源，技术竞赛与伦理博弈下的产业变局 zhz5214 AI 人工智能开源智能体 ai AI编程 AI写作
2025年3月，人工智能领域迎来戏剧性转折。继DeepSeek以开源策略搅动市场后，新兴AI公司Manus的官方X账号因涉嫌关联加密货币诈骗被平台封禁，引发轩然大波。而在封禁事件发酵不到一周，OpenAI连夜发布AgentSDK与ResponsesAPI，以开源姿态强势回应。这场技术竞赛与伦理博弈交织的产业变局，正将AI革命推向新的临界点。一、技术突围与平台博弈：Manus事件的双重隐喻Manus
基于oracle linux的 DBI/DBD 标准化安装文档(二) 文档
一、安装DBIDBI(DatabaseInterface)是perl连接数据库的接口。其是perl连接数据库的最优方法，他支持包括Orcale,Sybase,mysql,db2等绝大多数的数据库，下面将简要介绍其安装方法。1.1解压tar-zxvfDBI-1.616_901.tar.gz1.2安装依赖yuminstallperl-ExtUtils-CBuilderperl-ExtUtils-Mak
数据库：SQLite/MySQL/PostgreSQL 的破圈之战程序员
数据库类型对比维度SQLiteMySQLPostgreSQL类型嵌入式数据库关系型数据库管理系统(RDBMS)对象-关系型数据库(ORDBMS)架构无服务端，单文件存储客户端-服务器架构客户端-服务器架构事务支持ACID兼容（默认启用）ACID兼容（需使用InnoDB引擎）完整ACID兼容并发处理写操作全局锁行级锁+MVCC(InnoDB)多版本并发控制(MVCC)扩展性单机，适合轻量级应用支持主
【Mysql数据库第6章】MySQL的多表操作—多表联合查询、子查询、内外连接 KJ.JK 数据库 mysql 内连接外连接 mysql的子查询
文章目录往期精彩知识1、多表联合查询介绍2、交叉连接查询3、内连接查询4、外连接查询（1）外连接介绍（2）左外连接（3）右外连接（4）满外连接综合代码演示5、子查询（1）子查询的介绍和特点（2）子查询的关键字all关键字any和some关键字in关键字exists关键字6、自关联查询作者：KJ.JK往期精彩知识Spring中的创建对象的三种方式、第三方资源配置管理详细描述及使用（XML版完结篇）S
SQL注入-01-什么是SQL注入？ AnQ_xiao SQL注入-【入门】SQL注入数据库安全黑客攻击数据泄露参数验证
什么是SQL注入?1、正常的web端口访问正常访问是web传入程序设计者所希望的参数值，由程序查询数据库完成处理后，呈现结果页面给用户。2、SQL注入是如何访问？（1）SQL注入也是正常的web端口访问（2）只是传入的参数值并非是程序设计者所希望的，而是传入了嵌套SQL代码的参数值（3）参数值利用程序处理注入者的逻辑，按注入者的期望执行数据库查询SQL注入：是通过应用程序把带有SQL代码的参数传递
GBase 8c慢日志启用和查询 GBASE数据库数据库 GBASE南大通用 sql GBase
原文链接：https://www.gbase.cn/community/post/3985更多精彩内容尽在南大通用GBase技术社区，南大通用致力于成为用户最信赖的数据库产品供应商。GBase8c可以通过慢日志定位问题、归因诊断分析。慢日志配置和使用方法如下：1、慢日志配置（1）相关GUC参数GBase8c慢日志主要相关配置参数为：enable_stmt_trackon：默认值，启用Full/Sl
深度学习中的注意力机制：解锁智能模型的新视角冰蓝蓝深度学习深度学习人工智能
在人工智能的快速发展中，深度学习模型已经成为了处理复杂数据和任务的主力军。然而，随着数据量的激增和任务的复杂化，传统的深度学习模型面临着效率和性能的双重挑战。在这样的背景下，注意力机制（AttentionMechanism）应运而生，它不仅提升了模型的处理能力，还为深度学习领域带来了新的研究视角。什么是注意力机制？注意力机制是一种受人类视觉注意力启发的技术，它允许模型在处理大量信息时，能够动态地聚
GBase8c aes_encrypt和aes_decrypt函数 keep__go GBase8c 数据库 gbase
在数据库中，aes_encrypt和aes_decrypt函数进行加解密时使用的块加密模式。GBase8c与MySQL的aes_encrypt和aes_decrypt函数区别：1、GBase8c中的初始化向量init_vector不能为空2、MySQL的加密模块block_encryption_mode为aes-128-ecb，GBase8c不支持aes-128-ecb，默认加密模块为aes-12
MYSQL数据备份与恢复（mysqldump）一诚学编程 mysql mysql 数据库 linux adb
MySQL备份之mysqldump表级别备份还原格式：mysqldump[OPTIONS]database[tables]实例：把db_user数据库中的tb_student数据表进行备份备份：#mysqldumpdb_usertb_student>/tmp/sqlbak/tb_student.sql-p还原：#mysql数据库名称/tmp/sqlbak/db_itheima.sql-p还原：#m
Vue+EasyExcel来操作文件上传下载 ☆夜幕星河℡ SpringBoot Excel EasyExcel java vue spring boot
Excel导入导出在管理一个系统时，总会有许多的数据，为了方便浏览查看数据，系统总会提供「导出Excel」的功能；有导出就有导入，在要向数据库中插入大量的数据时，我们向程序提供准备好的Excel，然后程序读取表格内容，并将数据添加到数据库中。实现这个「导入/导出Excel」的功能也不复杂，我们使用第三方的类库即可实现。比如：Apachepoi、JavaExcel（JXL）和阿里巴巴开源的Easye
【技术解密】本地部署 DeepSeek-V3：完整指南海棠AI实验室 “智元启示录“-AI发展的深度思考与未来展望人工智能深度学习 DeepSeek
目录引言运行环境需求下载与安装推理部署总结参考资源引言随着人工智能的快速发展，开源大模型正逐步改变着技术生态。DeepSeek-V3作为最新的开源大模型之一，不仅提供了强大的推理能力，同时也支持本地部署，使开发者可以灵活地进行自定义优化。本文将详细介绍如何在本地部署DeepSeek-V3，涵盖系统要求、安装步骤、模型转换及不同推理框架的应用。1.运行环境需求1.1硬件要求✅NVIDIAGPU（支持
人工智能伦理与可持续发展 CarlowZJ 人工智能
前言人工智能（AI）技术正在深刻地改变我们的生活和工作方式。从自动驾驶汽车到智能医疗系统，从个性化推荐到自动化决策，AI的应用无处不在。然而，随着技术的快速发展，其伦理和社会影响也引发了广泛的关注。人工智能伦理不仅涉及技术本身的公平性、透明性和安全性，还涉及到更广泛的社会、经济和环境影响。本文将探讨人工智能伦理的核心问题，并从可持续发展的角度提出应对策略。一、人工智能伦理的核心问题1.1数据隐私与
MySQL---DDL（3.17）秋凉づᐇ mysql oracle 数据库
1、DDL-数据库操作查询：查询所有数据库：SHOWDATABASES;查询当前数据库：SELECTDATABASE();创建:CREATEDATABASE[IFNOTEXISTS]数据库名[DEFAULTCHARSET字符集][COLLATE排序规则]；删除：DROPDATABASE[IFEXISTS]数据库名；使用：USE数据库名；2、DDL--表操作-查询查询当前数据库所有表：SHOWTAB
大模型RAG实战｜混合检索：BM25检索+向量检索的LlamaIndex实现 AIGC大模型吱屋猪 django python 后端 AI-native 人工智能 llama 百度
ThinkRAG大模型RAG实战系列文章，带你深入探索使用LlamaIndex框架，构建本地大模型知识库问答系统。本系列涵盖知识库管理、检索优化、模型本地部署等主题，通过代码与实例，讲解如何打造生产级系统，实现本地知识库的快速检索与智能问答。本文我将介绍一种效果更好的混合检索方法，在实际问答场景中，优于向量数据库自带的混合检索功能。1什么是混合检索目前，大模型RAG系统中普遍采用混合检索来提升检索
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修