李滚滚

非局部均值滤波和用于高光谱分类的新颖度量方式的NLM

文章目录

1 均值和非局部均值滤波
2 论文【使用新的相似性度量方法做非局部均值滤波】

2.1 类相似性度量
2.2 参数估计算法
2.3 根据非局部上下文信息分类

paper： Hyperspectral Image Classification Based on Nonlocal Means With a Novel Class-Relativity Measurement
均值与非局部均值滤波的思想与普通网络和attention网络的思想我认为是一致的，非常像，对我来说认为两者思想一样是一个聚合总结的过程，也许等我了解的更多，我会经历一个发散找到两者不同的过程。

1 均值和非局部均值滤波

均值滤波器利用滑窗的方式以滑窗的均值代替中心像素的值，进行滤波。缺点：

当方框的半径越大，得到的图像中那些变化较大的地方（边缘）计算后变化就越小，即边缘不明显，即模糊；
而且像素之间的相似性并不局限于一个很小的块，像是长边缘，或者结构纹理就可能再很远的地方仍然存在相似性。

非局部均值滤波器是图像去噪一种很好的方法，基本原理与均值滤波类似，都是要取平均值，但是非局部均值滤波在计算中加入了每一个点的权重值，所以能够保证在相邻且相差很大的点在方框中求平均值时相互之间的影响减小，也就对图像边缘细节部分保留很多，这样图像看起来会更清晰。

首先在一个点A周围取一个大的框（搜索框），设边长为s，A在方框的中心，然后再在方框中取小的方框，即相似框，设边长为d
如图所示，红色的点为中心点A，整个 $5\times 5$ 的矩形为中心点A的搜索框,即 $s = 5$ ，方框中取小的相似框边长为3，即 $d = 3$ ,这时中心点A对应的相似框为蓝色部分 $3\times 3$ 的区域Q，以绿色点为中心的相似框为红斜线部分P，计算P与Q的差值，并加入高斯核计算得到的加权值
在搜索框内找到所有边长为d 的小方框，即红色斜线框P在搜索框内移动，记录中心点的坐标，记录所有相似框与Q相减，并且加入高斯核计算得到的加权值，这样可以得到一个二维数组，里面存放着各个点的差值乘以权重后的值，加入高斯核主要是因为距离中心点距离不同对中心点的影响大小也不同，离中心点越近，权重值越大一些而且高斯核的权重和是1，所以就不用再归一化了。
加入高斯核后，由下图可以看到距离中心点越近权重越大。
然后将这个二维数组求和，得到的值就是这个相似框的中心点B对于A的权重值。计算出A周围所有点的权重值，其实这个时候这个值和权重是成反比的，以A本身为例（以A为中心点的相似框），计算出来A对于A的所谓权重值是零。然后根据计算出来的值用一个指数减函数就得到了成正比的权重关系，具体的函数见下面的代码，w=exp(-d/h)，就是这个，其中d就是计算出来的值啦，代入后w就是成正比的权重关系啦，h是一个滤波百分比值，可以先固定为一个常数，而且这个计算出来w就是一个自动归一化的(0,1)的值。
然后就是根据得到的权重值【需要将所有的权重值规范化，使其和为1】以及各个点本身的灰度值计算出非局部均值滤波后A点的灰度值。
以此类推，可以计算出图中所有点经过非局部均值滤波后的值

优点：
可以既去除噪声，又保留图像边缘细节；当然去噪声指的一般是高斯白噪声，因为高斯白噪声的均值是0，所以求和取平均会比较有效果
缺点：
效率比较低

2 论文【使用新的相似性度量方法做非局部均值滤波】

我们看到前面的非局部均值滤波求解相似块的相似性的时候使用高斯核进行计算，这篇文章利用KL散度设计了一种新颖的相似性度量方法。
$X=\left\{x_{1}, \ldots, x_{n}\right\} \in R^{B \times n}$ 表示 $n$ 个像素B维特征的高光谱图像
$\Omega \equiv\{1, \ldots, K\}$ K个标签的集合
$Y=\left\{y_{1}, \ldots, y_{n}\right\} \in \Omega^{n}$ HIC（高光谱图像分类）的最终目的是将标签划分到标签集合 $\Omega$
本文，首先将高光谱图像投影到主成分分析的空间，获得一幅多维图像P。选择该图像的前 $d$ 维 $P_f = P_{1}, P_{2}, \ldots, P_{d}$ ， $P= P_f+P_r$ ， $P_r$ 表示剩余由噪声控制的图像，因为它们是综合的、压缩的、降噪的表示，并且与原始图像X中的每个像素相关联。该图像的剩余维度主要是噪声。
多项逻辑回归数学和统计基础稳固，能够很好的解决由光谱特性给HIS带来的不适定分类问题，利用 $P_f$ 在像素点 $i$ 的PCA特征向量，得到像素点 $i$ 的类别后验为 $p\left(y_{i} | P_{f}^{i}\right)$ ： $p\left(y_{i}=k | P_{f}^{i}, \boldsymbol{\omega}\right) \equiv \frac{\exp \left(\boldsymbol{\omega}^{(k)} \mathbf{h}\left(\mathbf{x}_{i}\right)\right)}{\sum_{k=1}^{K} \exp \left(\boldsymbol{\omega}^{(k)} \mathbf{h}\left(\mathbf{x}_{i}\right)\right)}$ 其中 $\mathbf{h}(\mathbf{x}) \equiv\left[h_{1}(x), \ldots, h_{m}(x)\right]^{T}$ 指输入的 $m$ 个固定函数，通常指特征， $\omega(\mathbf{x}) \equiv\left[\omega_{1}(1)^{T}, \ldots, \omega_{1}(K)^{T}\right]^{T}$ 表示逻辑回归器。RBF核用于提高转换空间的可分性， $K(\mathbf{x}, \mathbf{z})=\exp \left(-\|\mathbf{x}-\mathbf{z}\|^{2} /\left(2 \rho^{2}\right)\right)$ ，因此特征可以表示为 $\mathbf{h}\left(\mathbf{x}_{i}\right) \equiv\left[1, K\left(P_{f}^{i}, P_{f}^{1}\right) \ldots, K\left(P_{f}^{i}, P_{f}^{L}\right)\right]^{T}$ 【L表示训练样本的个数】。同时，逻辑回归器 $\hat{\omega}$ 参数通过变量分裂和增广拉格朗日(LORSAL)算法学习得到【参数学习用一些优化方法学习得到。】。

2.1 类相似性度量

欧式距离是测量两个样本相似性最重要最广泛的方法，实践中，为了减小噪声影响并扩充样本容量，使用以 $x_i$ 和 $x_j$ 为中心的正方形框 $N_{i}$ 和 $N_{j}$ 的相似性代替两个样本的相似性，即第一部分介绍的非局部滤波。相似性度量公式变为： $R_{i,j}=\exp \left(-\frac{\left\|I_{N_{i}}-I_{N_{j}}\right\|^{2}}{\sigma^{2}}\right)$ 其中 $I_{N_{i}}$ 和 $I_{N_{j}}$ 表示以以 $x_i$ 和 $x_j$ 为中心的图像块， $R_{i}$ 表示两个像素的相似性。
在传统的非局部均匀滤波算法中，权重是基于欧式距离计算的，实际上，测度应该是根据任务决定的，因此本文用于高光谱图像分类的一个直观改变时使用任务依赖距离代替计算权值时的欧式距离。文章假设非局部相似块有相似的类别结构，根据KL散度提出一种类相似性测量方法。
为了简便，令 $p\left(y_{i} | \hat{\boldsymbol{\omega}}\right) \equiv p\left(y_{i} | P_{f}^{i}, \hat{\omega}\right) \equiv \left[p\left(y_{i}=1 | \hat{\boldsymbol{\omega}}\right), \ldots, p\left(y_{i}=K | \hat{\omega}\right)\right]^{T}$ ， $p\left(y_{i} | \hat{\boldsymbol{\omega}}\right)$ 和 $p\left(y_{j} | \hat{\boldsymbol{\omega}}\right)$ 表示两个样本 $i$ 和 $j$ 的后验概率向量， $\in \Omega$ ， $x_i$ 到 $x_j$ 的距离表示为： $d_{i, j}=\sum_{k=1}^{K} p\left(y_{i}=k | \widehat{\boldsymbol{\omega}}\right) \log \left(\frac{p\left(y_{i}=k | \widehat{\boldsymbol{\omega}}\right)}{p\left(y_{j}=k | \widehat{\boldsymbol{\omega}}\right)}\right)$ $\sum_{k=1}^{K} p\left(y_{i}=k | \widehat{\boldsymbol{\omega}}\right)=1$

$d_{i, j}$ 是非负的，也就是 $d_{i, j} \geq 0$ ，当且仅当 $p\left(y_{i} | \hat{\boldsymbol{\omega}}\right) \equiv p\left(y_{i} | \hat{\boldsymbol{\omega}}\right)$ 时等号成立。这个测量是非对称的， $d_{i, j} \neq d_{j, i}$ ，对称版本可以写为： $\begin{aligned} d_{i, j}^{\prime} &=D\left(p\left(y_{i} | \widehat{\boldsymbol{\omega}}\right), p\left(y_{j} | \widehat{\boldsymbol{\omega}}\right)\right) \\ &=D\left(p\left(y_{j} | \widehat{\boldsymbol{\omega}}\right), p\left(y_{i} | \widehat{\boldsymbol{\omega}}\right)\right)=d_{i, j}+d_{j, i} \end{aligned}$
与两个分布的KL散度一样，这种测量能够看作 $x_i$ 和 $x_j$ 之间的判别信息，距离越小，两个样本属于同一类的可能性越大。因此，两个 $\times l$ 的图像块 $N_{i}$ 和 $N_{j}$ 之间的距离测度为： $\begin{array}{l}{d_{N_{i}, N_{j}}} \\ {=\sum_{m=1}^{M} d_{N_{i}(m), N_{j}(m)}^{\prime}} \\ {=\sum_{m=1}^{M} \sum_{k=1}^{K}\left\{p\left(y_{N_{i}(m)}=k | \widehat{\boldsymbol{\omega}}\right) \log \left(\frac{p\left(y_{N_{i}(m)}=k | \overline{\omega}\right)}{p\left(y_{N_{j}(m)}=k | \overline{\omega}\right)}\right)+p\left(y_{N_{j}(m)}=k | \widehat{\omega}\right) \log \left(\frac{p\left(y_{N_{j}(m)}=k | \widehat{\omega}\right)}{p\left(y_{N_{i}(m)}=k | \widehat{\omega}\right)}\right) \}\right.} \end{array}$
其中M是图像块中元素的个数 $M=l^{2}$ ，也就是两个相似块的相似性等于相似块内所有像素新的相似性测度的和。
因此，此时的相似性度量公式变为： $R_{i,j}=\exp \left(-\frac{d_{N_i,N_j}}{\sigma^{2}}\right)$ 其中需要估计的参数有核宽度参数 $\sigma$ ，PCA降维保留的维度数 $d$ .

2.2 参数估计算法

首先要确定PCA分析选择图像的前 $d$ 维 $P_f = P_{1}, P_{2}, \ldots, P_{d}$ 中参数 $d$ 和RBF核中核参数 $\sigma$ 。PCA能够通过只保留最大的 $d$ 个特征向量并去除噪声部分，有效地缩减特征维度。大家普遍认为核宽度参数 $\sigma$ 是噪声标准差 $\sigma_n$ 的一个函数。噪声标准差需要噪声图像，根据PCA原理可知，获得噪声图像 $I_n$ 一种直观方法是取PCA处理剩余由噪声控制图像 $P_r$ 的的平均值。所以 $d$ 根据论文8中方法估计， $\sigma_n^2$ 由噪声图像的方差 $Var(I_n)$ 估计。这种噪声方差的估计策略完全依赖于图像，而不依赖额外的信息，从该意义上来说，这种估计方法是完全数据驱动的。
假设 $\sigma$ 的值是 $\sigma_n$ 的线性函数，由所选子空间 $d$ 和邻域大小 $\times l$ 共同表示的线性关系被认为是一种低精度估计。本文中使用论文13的方法来估计 $\sigma$ 的值， $\sigma$ 与噪声标准差 $\sigma_n$ 的关系可以写为： $\begin{aligned} \sigma &=h \times \sigma_{n} \\ h &=\sqrt{\frac{2 l^{2}}{\ln (1 / \gamma)}} \end{aligned}$
常量 $h$ 基于具有 $\sigma_n^2$ 噪声特征的 $I_n$ 的相同块之间的期望距离进行估计的，因此，对于 $l\times l$ 邻域大小，期望欧式距离的平方是 $2l^2\sigma_n^2$ .假设这样邻域之间的权重至少为 $\gamma$ ，然后可以使用第二个公式估计参数 $h$ 。参数 $\gamma(0\le \gamma \le 1)$ 是量化在一定噪声水平下两个相同邻域相似性的自由参数，其合理取值范围为0.6-0.9。

2.3 根据非局部上下文信息分类

空间上下文信息是准确分类的有效方法。本文中，利用NLM方法包含距离中心比较远的上下文信息。因此，对于给定的 $\hat{\omega}$ ,标签Y的最大后验概率为 $\hat{Y}=\arg \max _{Y \in \Omega^{n}} \sum_{i=1}^{n} \sum_{j \in S_{i}} w_{i, j}^{\prime} p\left(y_{j} | \widehat{\boldsymbol{\omega}}\right)$ 其中 $w_{i, j}^{\prime}=\frac{\exp \left(-d_{N_{i}, N_{j}} / \sigma^{2}\right)}{\sum_{j \in S_{i}} \exp \left(-d_{N_{i}, N_{j}} / \sigma^{2}\right)}$ $\hat{Y}$ 表示最大后验估计得到的标签/分类。核宽度参数 $\sigma$ 使用 $\gamma = 0.9$ 估计， $w_{i,j}$ 描述像素 $j$ 对于像素 $i$ 新的值的贡献，这里表示非局部特征向量 $p\left(y_{i} | \hat{\omega}\right)$ 和 $p\left(y_{j} | \hat{\omega}\right)$ 相似性的一个函数，更具体地权重 $w_{i,j}$ 在本文中是KL散度距离的函数，且随距离增大而减小。因此，与像素 $i$ 相似的非局部特征对像素 $i$ 的真实未知特征的估计会产生很大的影响，反之亦然。核宽度参数 $\sigma$ 的作用像是控制滤波平滑度。全局平均是指图像的每个特征都对像素 $i$ 的特征更新做了共享。但是为了缓解计算负担，搜索框 $S_i$ 一般限制在以像素 $i$ 为中心的一个比较小的窗口。因此，算法复杂度限制在 $O\left(n s^{2}\right)$ 而不是 $O\left(n ^{2}\right)$ ， $n$ 表示像素总数， $s^2$ 表示小的搜索框S中像素的数量 $s\times s$ 。
attention不就是这嘛……

【前端】如何依靠纯前端实现拍照获取/选择文件等文字识别OCR技术爱上大树的小猪前端 ocr 前端框架 react.js
本文仅介绍第三方依赖包Tesseract.js，Tesseract.js是一个基于网页的OCR（光学字符识别）引擎，可以识别图像中的文本并将其转换为可供计算机处理的文本数据。支持多框架编译，如Vue、React等，这里展示步骤为React开发。下面直接进入主题：附Tesseract.js官方（https://github.com/naptha/tesseract.js）下载安装依赖包npminst
AI大模型从入门到精通，2025终极指南！好卷啊，又不能躺平，只能悄悄卷你们了！大模型教程人工智能大模型训练 LLM 知识库大模型大模型入门大模型学习
什么是AI大模型？AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力，可以应用于各种领域，如自然语言处理、图像识别、语音识别等。为什么要学AI大模型？2024人工智能大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于
基于GPT架构的视频生成工具（VideoGPT） deepdata_cn 视频生成音视频视频生成
VideoGPT是基于GPT架构的视频生成工具，支持从文本生成视频。最初，研究人员尝试将自然语言处理中的GPT架构思想引入视频处理领域，开始探索如何利用其强大的语言理解和生成能力来处理视频的时空信息。模型改进与创新：如VideoGPT+模型结合了先进的图像编码器和视频编码器，克服了传统方法在处理视频时的局限，在捕捉丰富空间细节和理解复杂时间动态上展现出卓越性能。iVideoGPT采用新颖的压缩to
Google Gemini 大模型技术架构剖析 musicml 人工智能
▼最近直播超级多，预约保你有收获近期直播：《从原理到实践教你做出一个Gemini/ChatGPT》—1—Gemini技术架构剖析Google新的多模态模型家族Gemini，它在文本、图像、音频、视频等方面具有卓越的能力。Gemini系列包括Ultra、Pro和Nano三种尺寸，适用于从复杂的推理任务到设备内存受限的应用场景。GeminiUltra是最强大的模型，可在各种高度复杂的任务（包括推理和多
数据读取错误：RuntimeError: The size of tensor a (3) must match the size of tensor b (4) at non-singleton hitsz_syl 单例模式计算机视觉 opencv
去除4通道图像：importcv2importosimportshutilfolder_path=R'F:\bounding_box_test\bounding_box_train'#更改为存储图片文件夹的路径image_files=os.listdir(folder_path)count=0forfile_nameinimage_files:iffile_name.endswith('.jpg'
python 使用microsoft-Florence-2-base进行图片描述生成哦里哦里哦里给 AI 大语言模型实战 python microsoft 开发语言
目录一、Florence-2简介二、代码实践三、多语言模型一、Florence-2简介Florence-2是一个先进的视觉基础模型，采用基于提示（prompt）的方式，处理广泛的视觉和视觉-语言任务。Florence-2能够解析简单的文本提示，执行如图像描述、物体检测和分割等任务。该模型利用FLD-5B数据集，该数据集包含54亿个注释，涵盖1.26亿张图像，用于掌握多任务学习。模型的序列到序列架构
Python第二十三课：自监督学习 | 无标注数据的觉醒程之编 Python全栈通关秘籍 python 开发语言人工智能机器学习
本节目标理解自监督学习的核心范式与优势掌握对比学习（ContrastiveLearning）框架实现图像掩码自编码器（MaskedAutoencoder）开发实战项目：亿级参数模型轻量化探索数据增强的创造性艺术一、自监督学习基础（AI的拼图游戏）1.核心思想解析学习范式数据需求生活比喻监督学习海量标注数据老师逐题批改作业无监督学习纯无标签数据自学杂乱笔记自监督学习自动生成伪标签玩拼图游戏（根据碎片
MobileNet家族：从v1到v4的架构演进与发展历程彩旗工作室人工智能架构人工智能机器学习 cnn 卷积神经网络
MobileNet是一个专为移动设备和嵌入式系统设计的轻量化卷积神经网络（CNN）家族，旨在在资源受限的环境中实现高效的图像分类、对象检测和语义分割等任务。自2017年首次推出以来，MobileNet经历了从v1到v4的多次迭代，每一代都在计算效率、模型大小和准确性上取得了显著进步。本文将详细探讨MobileNetv1、v2、v3和v4的原理、架构设计及其发展历程，并分析其关键创新和性能表现。Mo
Vision Transformer (ViT) 详细描述及 PyTorch 代码全解析 AIGC_ZY CV transformer pytorch 深度学习
VisionTransformer(ViT)是一种将Transformer架构应用于图像分类任务的模型。它摒弃了传统卷积神经网络(CNN)的卷积操作，而是将图像分割成patches，并将这些patches视为序列输入到Transformer编码器中。ViT的处理流程输入图像被分割成多个固定大小的patch，每个patch经过线性投影变成嵌入向量，然后加上位置编码。接着，这些嵌入向量会和类别标签（c
【图像分割】Labelme JSON标注转换为TXT代码详解唐king json python
书接上文：https://blog.csdn.net/qq_49092686/article/details/145114987?spm=1001.2014.3001.5502这里给出更细致的json2txt代码，同时考虑了circle、rectangle这两种情况各位朋友，在使用前，你一定要注意你的json格式是不是跟我的一致，不一致的话是用不了的（是不是也用的labelme制作的数据集）imp
工业相机视频播放(RTSP) CHHC1880 工业相机 rtsp ffmpeg 推流
需求：工业相机图像能在rtsp流上播放。实现手段：C#利用工业相机的SDK拿到图后，通过ffmpeg管道推给流媒体程序，再转流播放。模拟测试：两张图在rtsp上进行轮播
分辨率、帧率和码率三者之间的关系 0 error ~ 0 warning 计算机杂说学习
1、前言在很多视频项目中，我们经常会说的，视频质量好或者视频质量不好。那么这个视频质量到底怎么算是好，怎么算是不好呢？这里我们就要了解一下有关视频的几个重要参数：分辨率，帧率，码率。这三个参数是评估视频质量的关键参数。2、分辨率指图像占用屏幕上像素的多少。图像中的像素密度越高，图像的分辨率越高。目前视频方面使用最多的分辨率是1080P。1080P的像素总数为1920x1080=2,073,
CIFAR-10 数据集的简介一头大学牲 python 深度学习机器学习数据分析
文章目录CIFAR-10数据集的简介文件结构图像数据结构访问数据Python代码CIFAR-10数据集的数据格式CIFAR-10数据集的简介CIFAR-10数据集是一个广泛使用的图像数据集，具体可见CIFAR-10和CIFAR-100数据集，它包含60,000张32x32像素的彩色（3channels）图像，分为10个类别，每个类别有6,000张图像。每个类别的图像数量分布如下：飞机(airpla
PyTorch 实现 Conditional DCGAN（条件深度卷积生成对抗网络）进行图像到图像转换的示例代码 max500600 算法 python YOLO 深度学习人工智能
以下是一个使用PyTorch实现ConditionalDCGAN（条件深度卷积生成对抗网络）进行图像到图像转换的示例代码。该代码包含训练和可视化部分，假设输入为图片和4个工艺参数，根据这些输入生成相应的图片。1.导入必要的库importtorchimporttorch.nnasnnimporttorch.optimasoptimimporttorchvisionimporttorchvision.
一周热点：微软攻克语音输入、文本输出难题-Phi-4-multimodal 数据分析能量站机器学习人工智能
微软Phi-4-multimodal模型是人工智能领域的一个重要进展，它标志着微软在多模态人工智能技术上的突破。以下是对该模型的详细解释：模型概述微软Phi-4-multimodal是一个能够同时处理文本、图像和语音的多模态大型语言模型。它通过创新的架构和训练方法，实现了在不同模态之间的无缝交互，为用户提供更自然、更智能的交互体验。模型架构该模型采用多模态Transformer架构，通过LoRA（
Adobe Photoshop CC 2025配置要求小魚資源大雜燴 windows
操作系统Windows：Windows10（版本22H2）或Windows11（版本21H2、22H2、23H2）。macOS：macOSMonterey（12.0）或更高版本。处理器：支持AVX2和SSE4.2的多核Intel、AMD或WinARM处理器。推荐使用最新一代的IntelCore或AMDRyzen处理器。内存最低要求：8GBRAM。推荐配置：16GB或更高，特别是对于处理高分辨率图像
Adobe Firefly 技术浅析（三）：GANs 的改进爱研究的小牛 AIGC——图像 AIGC—生成对抗网络 AIGC 机器学习深度学习
生成式对抗网络（GANs）在图像生成领域取得了显著的进展，但原始的GANs在训练稳定性、生成质量以及多样性方面存在一些挑战。AdobeFirefly在其图像生成技术中采用了多种改进的GANs方法，以提高生成图像的质量和多样性。1.条件生成式对抗网络（cGANs）1.1基本原理条件生成式对抗网络（cGANs）通过引入额外的条件信息（如类别标签、文本描述等），使得生成器能够根据这些条件生成特定类型的图
# Manim学习记录（2）鼠鼠emo了捏 python numpy vscode 数学建模
第一个案例GraphingMovement这个开始再坐标轴上画函数图像以及移动frommanimimport*classGraphingMovement(Scene):defconstruct(self):axes=Axes(x_range=[0,5,1],#x轴范围：从0到5，刻度间隔为1y_range=[0,3,1],#y轴范围：从0到3，刻度间隔为1x_length=5,#x轴长度为5（单位
Python精进系列： K-Means 聚类算法调用库函数和手动实现对比分析进一步有进一步的欢喜 Python 精进系列算法 python kmeans
一、引言在机器学习领域，聚类分析是一种重要的无监督学习方法，用于将数据集中的样本划分为不同的组或簇，使得同一簇内的样本具有较高的相似性，而不同簇之间的样本具有较大的差异性。K-Means聚类算法是最常用的聚类算法之一，它以其简单性和高效性在数据挖掘、图像分割、模式识别等领域得到了广泛应用。本文将详细介绍K-Means聚类算法，并分别给出调用现成函数和不调用任何现成函数实现K-Means聚类的代码示
热门AI创作助手推荐【第一期】量子星澜文心一言 AI写作 chatgpt
星游AI创作助手人工智能在现代科技中的应用非常广泛，涵盖了诸多领域，包括但不限于以下几个方面：1.语音识别和自然语言处理：人工智能技术被广泛应用于语音识别和自然语言处理领域，例如智能助手、翻译系统、语音交互系统等。2.机器学习和数据分析：人工智能的机器学习算法被用于数据分析、预测建模、用户个性化推荐等领域，帮助企业做出更准确的商业决策。3.计算机视觉：人工智能在计算机视觉领域的应用包括图像识别、视
YOLO11改进-模块-引入多尺度差异融合模块MDFM 一勺汤 YOLOv11模型改进系列深度学习人工智能 YOLO YOLOv11 目标检测模块改进
遥感变化检测（RSCD）专注于识别在不同时间获取的两幅遥感图像之间发生变化的区域。近年来，卷积神经网络（CNN）在具有挑战性的RSCD任务中展现出了良好的效果。然而，这些方法未能有效地融合双时相特征，也未提取出对后续RSCD任务有益的有用信息。此外，它们在特征聚合中没有考虑多层次特征交互，并且忽略了差异特征与双时相特征之间的关系，从而影响了RSCD的结果。为解决上述问题，本文通过孪生卷积网络提取不
YOLO11改进-模块-引入CMUNeXt Block 增强全局信息一勺汤 YOLOv11模型改进系列网络 YOLO 目标检测模块魔改 YOLOv11 YOLOV11模型改进
在医学图像分割领域面临诸多问题，如U形架构卷积网络难以提取全局信息，混合架构因计算资源受限在实际医疗场景应用受阻，轻量化网络在保证性能与提取全局信息上存在矛盾。因此，设计了CMUNeXtBlock，CMUNeXtBlock采用大核深度可分离卷积替代普通卷积来提取全局信息，凭借深度可分离卷积减少参数和计算成本以维持轻量化，同时综合利用卷积归纳偏置和全局信息提取能力，有效解决了这些问题。代码：http
Stable Diffusion 模型具体如何设置参数？壁纸样机神器 stable diffusion 人工智能计算机视觉
基础参数设置随机种子（seed）：设置一个固定的随机种子值，可以确保在相同文本提示下生成相同的图像。如果设置为-1，则每次生成的图像都是随机的。num_inference_steps：控制模型推理的步数。步数越多，生成的图像质量通常越高，但生成时间也会相应增加。通常使用默认值50步，如果需要更快的结果可以减少步数，而更高质量的图像则可以适当增加步数。guidance_scale：用于调整生成图像对
计算机视觉入门 109702008 人工智能 #深度学习计算机视觉人工智能
计算机视觉（ComputerVision）是一门涉及使机器能够从图像或者多维数据中提取信息，解释、理解并对物体或场景进行处理的学科。以下是一个基本的计算机视觉入门学习路线，旨在为刚刚接触这一领域的学习者提供指导。1.基础知识储备数学基础：线性代数、概率论和数理统计、微积分、优化理论。编程语言：掌握至少一门编程语言，Python是目前在计算机视觉领域最流行的语言，其次是C++。2.计算机视觉基础数字
计算机视觉（Computer Vision, CV）的入门到实践的详细学习路线云梦优选计算机数据库大数据计算机视觉学习人工智能
一、基础准备1.数学基础线性代数深入矩阵运算，理解矩阵乘法、转置、逆等基本概念。掌握特征值与特征向量的几何意义，理解其在图像压缩、特征提取中的应用。学习奇异值分解（SVD）及其在降维和数据压缩中的具体应用。概率与统计熟悉贝叶斯定理及其在分类任务中的应用，如朴素贝叶斯分类器。理解常见概率分布（如正态分布、二项分布）及其性质。学习统计推断方法，如假设检验、置信区间估计，以评估模型性能。微积分掌握梯度、
Next.js项目MindAI教程 - 第一章：环境准备与项目初始化琑95 Next.js实战项目 node.js typescript git mysql 人工智能阿里云 c5全栈
1.开发环境准备1.1Node.js安装#检查是否已安装Node.jsnode-vnpm-v#如果未安装，访问https://nodejs.org下载安装包#建议安装LTS版本（当前为18.x或20.x）1.2配置npm镜像（国内用户推荐）#设置淘宝镜像npmconfigsetregistryhttps://registry.npmmirror.com#或安装cnpmnpminstall-gcnp
【解锁机器学习：探寻数学基石】游戏乐趣机器学习人工智能
机器学习中的数学基础探秘在当今数字化时代，机器学习无疑是最具影响力和发展潜力的技术领域之一。从图像识别到自然语言处理，从智能推荐系统到自动驾驶，机器学习的应用无处不在，深刻地改变着我们的生活和工作方式。然而，在这看似神奇的机器学习背后，数学作为其坚实的理论基础，起着不可或缺的关键作用。毫不夸张地说，数学是打开机器学习大门的钥匙，是理解和掌握机器学习算法与模型的核心所在。想象一下，机器学习就像是一座
利用 OpenCV 库进行实时目标物体检测欣然～ opencv 人工智能计算机视觉
一、代码概述此代码利用OpenCV库实现了基于特征匹配的实时物体检测系统。通过摄像头捕获实时视频帧，将其与预先加载的参考图像进行特征匹配，从而识别出视频帧中是否存在与参考图像匹配的物体。二、环境依赖OpenCV：用于图像处理、特征提取和匹配等操作。NumPy：用于数值计算，OpenCV依赖于NumPy进行数组操作。可以使用以下命令安装所需库：bashpipinstallopencv-pythonn
自用力扣刷题记录（Python，数组、字符串） qq_40283123
文章目录一.数组69744844241274453最小操作次数使数组元素相等665非递减数列283移动的零118杨辉三角形119杨辉三角形2661图片平滑器598范围求和II419夹板上的战舰189旋转数组396旋转函数54螺旋矩阵59螺旋矩阵II498对角线遍历566重塑矩阵48旋转图像73矩阵置零289生命游戏303区域和检索-数组不可变304二维区域和检索-矩阵不可变238除自身以外数组的乘
移动端Canvas实现手写签名不知名靓仔 canvas
引言在移动应用开发中，手写签名功能的集成已经成为许多业务场景的标配，比如电子合同签署、医疗记录确认或是物流配送签收等。本文将详细阐述如何在移动端实现手写签名，包括技术选型、具体实现步骤以及优化建议，帮助开发者快速上手并构建高质量的手写签名体验。技术选型1.使用CanvasAPIHTML5的CanvasAPI提供了在网页上绘制图形的能力，包括路径、文本、图像等，非常适合用来捕捉和展示手写签名。在移动
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri