道之动

数字图像处理完整实践1--基础知识

文章目录

1.数字图像与Matlab(IPT)基础知识

1.1数字图像的表示
1.2读取图像（imread）
1.3显示图像（imshow）
1.4保存图像（imwrite）
1.5数据类（Data class）
1.6图像类型（Image type）
1.7数据类与图像类型间的转换

1.7.1数据类间的转换
1.7.2图像类和类型的转换

1.8 数组索引

1.8.1向量索引
1.8.2矩阵索引
1.8.3选择矩阵维数

1.9常用的数组生成函数

写在前面

关于参考材料：本系列博客参考学习经典教材《Digital Image Processing Using MATLAB》所总结的笔记，如有侵权，还请麻烦联系作者删除。

关于使用建议：本系列博客与教材相似，自成体系。同时加入了作者学习所遇到的困惑与心得。可以作为图像处理、计算机视觉爱好者的辅助指南。也竭力让其更易懂，从而帮助广大读者更好地掌握传统的图像处理技术。

关于实验平台：本系列博客基于Matlab2013（Window7）以上的版本做实验。

关于提问与反馈：在本系列博客阅读中，读者若产生相关疑问，可在评论中提问，本人非常荣幸能与大家共同探讨。我也将实时更新博客，如有错误，欢迎大家批评指正。

1.数字图像与Matlab(IPT)基础知识

Matlab语言简洁表示+IPT（理想的软件原型环境）：大量图像处理操作可按简洁明了的编码方式进行。
本博客为后续内容的基础，重要内容有

Matlab表示法的基本知识

IPT（扩展Matlab数值计算能力的函数集/图像处理工具箱）基本属性和函数

增强IPT的程序设计概念

1.1数字图像的表示

图像定义：二维函数 $f (x, y)$ 。其中 $x$ 和 $y$ 是空间（平面）坐标， $f$ 在任何坐标点 $(x, y)$ 处的振幅，也就是图像在该点的亮度（或是黑白图像中的灰度）。【连续的二维函数】
其中，彩色图像的组成元素是单个二维图像 $f (x, y)$ 。如RGB彩色图像由三幅独立的分量二维图像（红、绿、蓝）组成。
数字图像定义：当图像 $f$ 的坐标 $x$ 和 $y$ 分量和振幅都是有限且离散的量。【二维数组（实数矩阵）----也及后续表示为二维数组的都为数字图像】
因为图像关于 $x$ 和 $y$ 坐标以及振幅连续，所以需要通过取样（坐标值数字化），量化（振幅数字化），将图像装换成数字图像。

1）坐标约定
数据图像表示为一个实数矩阵如下图2.1所示（主要两种不同的坐标约定）。
其中每个坐标点 $(x, y)$ （或 $(r, c)$ ）不是图像在取样时的实际物理坐标值，只表示第几行的第几个取样。
还有一种较少用的IPT坐标约定，与 $(x, y)$ 正好相反，表示为 $(y, x)$ ，其中 $y$ 表示行， $x$ 表示列。

2）图像的矩阵表示
数字图像的数据化图像函数表示如下：

其中等式右边是由定义给出的一幅数字图像。该数组的每一个元素都称为像元、图元或像素。（为了便捷，默认称数字图像及其元素为图像和像素）
同样，数字图像在Matlab中可表示为矩阵如下所示：

1.2读取图像（imread）

将图像读入Matlab环境：f = imread( ‘filename’ );
在命令行窗口，且无需赋值给其他变量时，可直接使用imread filename;。其中若去掉封号，会将运行结果直接输出在命令行窗口。
获取图像的行数M和列数N：[M, N] = size(f);
获取图像的附加信息：whos f
此命令本身就是要将信息输出到命令行窗口，故加不加封号都无影响。且不同的Matlab版本输出的附加信息并不相同。图像格式等相关信息如表2.1所示：

例子：将任意图片bk.png拷贝到Matlab当前工作路径，便可按以下方式输入命令进行实验。

>> f=imread('bk.png');
>> size(f)
ans =
   279   253     3
>> whos f
  Name        Size                Bytes  Class    Attributes
  f         279x253x3            211761  uint8

1.3显示图像（imshow）

显示在Matlab桌面上的图像：imshow
常用的选项如下所示：

imshow(f)：显示图像数组f，默认灰度级数为256（像素取值范围[0, 255]）。
imshow(f, [low high])：显示图像数组f，其中将各灰度取值小于等于low的显示为黑色，大于等于high的显示为白色。介于low和high之间的值以默认的技术显示为中等亮度值。其中，imshow(f, [ ]) 表示图像数组f按原有的灰度级数显示（特别是针对动态范围较小或既有正值又有负值的图像）。
可通过在命令行窗口输入help imshow或查询相关帮助文档，获取更多imshow使用方法。

例子：加载一个灰度图tree.png，并按照如下命令执行。

>> tree = imread('tree.png');
>> whos tree
Name        Size              Bytes  Class    Attributes
  tree      467x533            248911  uint8              
>> imshow(tree),figure,imshow(tree, [98 100]),figure,imshow(tree,[])

最后一行命令所显示的结果如下所示（配合使用逗号和命令figure可同时不覆盖地显示多幅图片）：

1.4保存图像（imwrite）

-将Matlab桌面上的图像写到磁盘上：imwrite
不同的文件格式有不同的参数，常用的选项如下所示：

通用语法imwrite(f, filename)：其中，filename为路径+文件名+扩展名（表2.1支持的）的字符串组合，将图像f写入filename指定的磁盘位置。

只适用于JPEG格式的语法imwrite(f, filename, ‘quality’, q)：q为取值范围为[0, 100]的整数（q越小，图像退化越严重）。
例子：压缩jpg图像及imfinfo的使用。

>> imwrite(tree, './tree50.jpg', 'quality', 50)
>> imwrite(tree, './tree25.jpg', 'quality', 25)
>> imwrite(tree, './tree15.jpg', 'quality', 15)
>> imwrite(tree, './tree5.jpg', 'quality', 5)
>> imwrite(tree, './tree0.jpg', 'quality', 0)
>> imwrite(tree, './tree.jpg')
>> imfinfo tree.jpg %了解所实现的压缩并获得图像文件的其它详细信息
ans = 
       Filename: 'D:\demo\tree.…'
        FileModDate: '02-Jul-2020 11:07:09'
           FileSize: 34873
             Format: 'jpg'
      FormatVersion: ''
              Width: 533
             Height: 467
           BitDepth: 8
          ColorType: 'grayscale'
    FormatSignature: ''
    NumberOfSamples: 1
       CodingMethod: 'Huffman'
      CodingProcess: 'Sequential'
            Comment: {}
>>%使用imfinfo计算图像压缩比
>> K = imfinfo('tree.jpg') ;
>> image_bytes = K.Width*K.Height*K.BitDepth/8;
>> compressed_bytes = K.FileSize;
>> compression_ratio = image_bytes/compressed_bytes
compression_ratio =
 				7.1376

按照不同的q值输出的结果如下所示（q=15或q=0时，图像退化严重）：

只适用于tif格式的语法imwrite(f, filename, ‘compression’, ‘parameter’, ‘resolution’, [colres rowres])：其中parameter的取值主要有3种，'none’表示无压缩，'packbits’表示比特包压缩， 'ccitt’表示ccitt压缩。[colres rowres]分别以每单位（如每英寸）中的点数给出图像的列分辨率和行分辨率（默认为[72, 72]）。
例子：利用无压缩，将图像tree.jpg从分辨率96dpix96dpi，像素大小为467x533(可得出图像大小为4.86x5.55英寸)减小为像素不变，大小为1x1.5英寸的tree.tif图像。
```
	>> tree= imread('tree.jpg');
	>> colres = round(467/1);
	>> rowres = round(533/1.5);
	>> imwrite(tree, 'tree.tif', 'compression', 'none', 'resolution', [colres, rowres])
```
原图与写出后的图像如下所示：
只适用于tif格式的语法imwrite(f, filename, ‘compression’, ‘parameter’, ‘resolution’, [colres rowres])：

1.5数据类（Data class）

数字图像的像素值用Matlab、IPT程序表示可用的数据类（数据类型）。
其中，像素的坐标都是整数的。

其中double类最常用；
unit8也常用（特别是从存储设备读取数据时）；
logical和使用较少的unit16构成本书集中讨论的基础数据类。

1.6图像类型（Image type）

工具箱支持的图像类型有：
1）亮度图像（Intensity images）
表示为一个数据矩阵，规定双精度型归一化的像素取值范围是[0, 1]。

2）二值图像（Binary images）
表示为一个取值只有0和1的逻辑数组。在Matlab中具有特殊意义，仅仅包含0和1的其他类型数组不认为是二值图像的表示。
将其他类型数组转化为逻辑数组，可使用 logical() 函数（非零数值变为逻辑1)。通过 islogical() 来判断数组是否为逻辑数组。

#注意#大多数单色图像的处理运算通过以上两种图像类型来进行。以下两类图像见后续博客。

3）索引图像（Indexed images）
4）RGB图像（RGB images）

#注意#一幅数字图像由图像类型和数据类表征。如“unit 8 亮度图像”，“double 亮度图像”。

1.7数据类与图像类型间的转换

1.7.1数据类间的转换

数据类的转换遵循编程语言类型转换的一贯做法，通过数据类名，直接转换为想要的类型。
例如：常见将unit8类数组A转换为双精度数组B，可通过简单命令B=double（A）。
#注意# 记住2.5中数据类表2.2的取值范围。若将取值范围大的数据类转换为小的，一般先进行缩放。

1.7.2图像类和类型的转换

释义：一个图像采用一种图像类型表示时，可以输入为一种或多种数据类的数组。可以使用本节提供的函数，进行数组的数据类转换。这个操作有时不会改变图像类型，有时会。

表2.3列举了IPT中进行单色图像类和类型间的转换函数（彩色图像见后续博客）

im2uint8(f)：检测出输入的图像数据类，并进行所有必要的缩放，将输入转换为uint8类。
im2uint16(f)：类比于im2uint8(f)。
mat2gray(f, [fmin, fmax])：把一个double类的任意图像数组分f转换成取值范围为[0，1]（0为黑色，1为白色）的归一化double数组。参数fmin和fmax是为了在转换时，将f中小于fmin的值转换为0，将f中大于fmax的值转换为1。如果不填写fmin和fmax，则默认f中最小值为fmin，最大值为fmax。
im2double(f)：将输入转换为范围[0, 1]间的double类。若输入的已经是double类的，则返回相同的数组（不改变取值范围，此时建议用mat2gray方法）。

im2bw(f, T)：将一幅亮度图像f进行所有必要的缩放（如输入为uint8，默认将所有元素值除255），转换为一幅二值图像。T为阈值（必须取值在0与1之间，不人为指定T时，默认为0.5），f中小于T的转换为0，其它转换为1。输入类型为logical的则输出相同的数组。将二值图像转为亮度图像则可使用以上四个函数。

例子：

>> f = [1, 2 ; 3, 4] %默认为double类型
f =
     1     2
     3     4
>> g = mat2gray(f) %将f的取值范围变为[0, 1]
g =
         0    0.3333
    0.6667    1.0000
>> gb = im2bw(g, 0.6)%去阈值为0.6，达到将f中1,2转为0的二值图像gb
gb =
     0     0
     1     1
>> gb = f > 2 %直接使用关系运算符生成二值数组
gb =
     0     0
     1     1
>> gbv = islogical(gb) %使用islogical判断gb是否为二值数组
gbv =
     1
>> gbd = im2double(gb) %将gb转换为值为0和1的double类数组
gbd =
     0     0
     1     1

1.8 数组索引

主要关注一维和二维数组（向量和矩阵）的基本索引操作。

1.8.1向量索引

行向量rV，列向量cV，则常用向量索引操作有。
基础索引rV(i)/cV(i)：提取行向量rV（或列向量cV）第i个元素。i取值从1开始。
向量转置(.’): rV.’ = cV
向量切片rV(start:step:end)：在rV中，从索引start到索引end处，每隔step步，提取一个。
linspace(x1, x2, n): 以坐标（1，x1）与（n，x2）建立一条直线函数 $f (x)$ ，并分别提取 $f (x), x = [1, 2, . . ., n]$ 的值。当输入n=1，返回x2；输入n=2，返回x1，x2。
向量以向量为索引rV([i, j, k]):提取行向量rV第i，第j，第k个元素。

>> rV = [1 2 3 4 5] 
rV =
     1     2     3     4     5
>> rV(3)  %基础索引rV(i)/cV(i)
ans =
     3
>> cV = rV.' %向量转置(.')
cV =
     1
     2
     3
     4
     5     
>> rV(2:4) %向量切片
ans =
     2     3     4
>> rV(2:end) %end为内置变量，表示最后一个元素索引
ans =
     2     3     4     5
>> rV(:)  %不论rV(:)、cV(:)，全部返回所有元素组成的列向量
ans =
     1
     2
     3
     4
     5
>> rV(1:end)  %行向量返回行向量，列向量返回列向量
ans =
     1     2     3     4     5     
>> rV(1:2:end) %正序隔步提取元素
ans =
     1     3     5
>> rV(end:-2:1) %逆序隔步提取元素
ans =
     5     3     1     
>> x = linspace(1, 10, 3)  %线性返回值
x =
    1.0000    5.5000   10.0000
>> rV([1, 3, 4]) %向量以向量为索引，不论传入的是行向量，还是列向量，都会转置后在索引
ans =
     1     3     4

1.8.2矩阵索引

矩阵索引操作就要是对向量索引操作的扩展，分别对矩阵A(row, col)分别作行向量索引和列向量索引操作。两种区别于向量索引的矩阵操作形式为：
以逻辑矩阵D作为矩阵A的索引矩阵A(D):提取逻辑矩阵D中非0元素对应位置的矩阵A中的元素。逻辑矩阵D的大小要和矩阵A相等。
A矩阵的冒号(:)运算：A(: )、A(8)等都是先将矩阵以每列拼接成一个列向量，而后，进行列向量切片操作。A(2:3)、A(1:end)等都是先将矩阵以每列拼接成一个行向量，而后，进行行向量切片操作。
主要操作如代码所示：

>> A = [1 2 3; 4 5 6; 7 8 9] %矩阵的声明，封号（；）表示本行的截止 
A =
     1     2     3
     4     5     6
     7     8     9
>> A(2, 1) %提取第2行第1列的元素
ans =
     4
>> cV2 = A(:, 2) %获取矩阵A的第2列元素，获取行类似rV2 = A(2, :)
cV2 =
     2
     5
     8
>> A(end, end) %内置end的使用
ans =
     9
>> A([1 3], [2 3]) %以向量作为索引
ans =
     2     3
     8     9     
>> D = logical([1 0 0; 0 0 1; 0 0 0]) %以逻辑矩阵作为索引，找出非零元素对应元素的位置
D =
     1     0     0
     0     0     1
     0     0     0
>> A(D)
ans =
     1
     6
 >> A(:) %矩阵的冒号(:)运算
ans =
     1
     4
     7
     2
     5
     8
     3
     6
     9
>> A(2:5) 
ans =
     4     7     2     5
>>

1.8.3选择矩阵维数

任意的Matlab任何变量A（标量、向量、矩阵、多维数组等）都表示为数组。
ndims(A)：返回数组A的维数（值必大于等于2，标量也是1x1的数组）。
size(A, dim)：返回数组A第dim个维度的大小。当dim大于实际维数时，返回1。

>> A = [1 2 3; 4 5 6; 7 8 9] %矩阵的声明，
A =
     1     2     3
     4     5     6
     7     8     9
>> ndims(A) %获取矩阵A的维
ans =
     2
>> size(A, 1) %获取矩阵A的第一维大小（行数）
ans =
     3

1.9常用的数组生成函数

以下列出7种常用数组生成函数（更便于模拟数字图像，验证数字图像处理算法等）。
zeros(M, N)：生成一个大小为M x N的double类矩阵，元素均为0。

注意：zeros(M) 等效于zeros(M, M)，生成一个大小为M x M的方阵。如下函数类似。

ones(M, N)：生成一个大小为M x N的double类矩阵，元素均为1。
true(M, N)：生成一个大小为M x N的logical类矩阵，元素均为1。
false(M, N)：生成一个大小为M x N的logical类矩阵，元素均为0。
magic(M)：生成一个大小为M x M的“魔术方阵”，其中每行、每列和主对角线中的元素之和均相等，且元素均为整数。
rand(M, N)：生成一个大小为M x N的矩阵，每个元素都是在区间[0,1]中均匀分布的随机数。
randn(M, N)：生成一个大小为M x N的矩阵，其元素是正态分布的随机数，均值为0，方差为1。

>> 5*ones(3) %等效于5*ones(3, 3)
ans =
     5     5     5
     5     5     5
     5     5     5
>> rand(2, 3)
ans =
    0.7922    0.6557    0.8491
    0.9595    0.0357    0.9340
>> randn(2)
ans =
    0.4889    0.7269
    1.0347   -0.3034

格灵深瞳视觉算法面试30问全景精解机＿长算法面试职场和发展
格灵深瞳视觉算法面试30问全景精解——AI感知×智能安防×场景创新：格灵深瞳视觉算法面试核心考点全览前言格灵深瞳（GREATVISION）作为国内领先的人工智能与计算机视觉企业，专注于智慧安防、智能交通、智慧零售等领域，推动视觉算法在大规模城市级场景的落地。格灵深瞳视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在复杂场景下的创新能力与工程实践。本文精选30个高质量面试问题，涵盖基
商汤科技视觉算法面试30问全景精解
商汤科技视觉算法面试30问全景精解——AI赋能×智能视觉×产业创新：商汤科技视觉算法面试核心考点全览前言商汤科技（SenseTime）作为全球领先的人工智能平台公司，专注于计算机视觉、深度学习和智慧城市、智能汽车、智能医疗等领域，推动人脸识别、目标检测、视频分析、自动驾驶等前沿技术的产业化落地。商汤视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、自动驾驶、智慧医疗等复
旷视科技视觉算法面试30问全景精解机＿长科技算法面试深度学习 YOLO
旷视科技视觉算法面试30问全景精解——AI赋能×智能安防×视觉创新：旷视科技视觉算法面试核心考点全览前言旷视科技（Megvii）作为全球领先的人工智能公司，专注于计算机视觉、深度学习和智能安防等领域，推动人脸识别、目标检测、视频分析、工业视觉等前沿技术的产业化落地。旷视视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、工业检测、智慧城市等复杂场景下的创新与工程能力。本文
网络爬虫再深入——对抗指纹检测、分布式架构与智能解析实战 rooney2024 爬虫
目录一、深入反爬：浏览器指纹检测与对抗（配图1）1.高级指纹检测原理2.对抗方案与实战二、分布式爬虫架构深度设计（配图2）1.容错与弹性设计2.智能限流算法三、智能解析：LLM与计算机视觉的融合（配图3）1.LLM解析非结构化文本2.视觉辅助定位元素四、法律与伦理：爬虫工程师的自我修养1.关键法律边界2.道德实践框架五、未来战场：Web3.0时代的爬虫技术演进1.去中心化网络挑战2.AI驱动的自适
【教程4＞第9章＞第8节】通过FPGA实现RGB图像转换为CMYK图像——verilog实现与MATLAB辅助验证 fpga和matlab #fpga开发 CMYK RGB 教程4 verilog
本课程学习成果预览(FPGA测试结果通过MATLAB显示)目录1.软件版本2.通过FPGA实现RGB图像转CMYK3.RGB图像转CMYK的测试3.1步骤一：生成测试样本3.2步骤二：通过testbench调用X2.bmp3.3步骤三：vivado仿真3.4步骤四：MATLAB辅助验证4.视频操作步骤演示欢迎订阅FPGA/MATLAB/Simulink系列教程《★教程1:matlab入门100例》
计算机视觉：人工智能的“眼睛” 人工智能教程人工智能计算机视觉机器学习算法 pytorch python 数据结构
前言在人工智能的众多领域中，计算机视觉（ComputerVision）无疑是其中最为引人注目的方向之一。它赋予了机器“看”的能力，使计算机能够像人类一样理解和解释视觉信息。从自动驾驶汽车到医疗影像诊断，从安防监控到虚拟现实，计算机视觉的应用场景无处不在，深刻地改变着我们的生活和工作方式。本文将深入探讨计算机视觉的核心技术、应用场景以及未来的发展趋势，帮助您全面了解这一充满活力的领域。一、计算机视觉
计算机视觉：打开机器之眼看世界 LeafyJee_ 人工智能人工智能深度学习计算机视觉
计算机视觉是人工智能领域中备受关注的一部分，它的目标是赋予计算机类似于人类眼睛的功能，让机器能够感知和理解周围的世界。通过图像和视频数据，计算机视觉技术将信息转化为可理解和可操作的数据，为各种应用领域提供了强大的支持。一、计算机视觉的起源和发展计算机视觉起源于20世纪50年代，当时科学家们开始研究如何让计算机能够识别和理解图像。随着技术的不断进步，计算机视觉逐渐发展成为一门独立的学科，并广泛应用于
如何使用 OpenCV 打开指定摄像头
在计算机视觉应用中，经常需要从特定的摄像头设备获取视频流。例如，在多摄像头环境中，当使用OpenCV的cv::VideoCapture类打开摄像头时，如果不指定摄像头的ID，可能会随机打开系统中的某个摄像头，或者按照设备连接的顺序打开第一个可用的摄像头。比如： //打开两个摄像头 cv::VideoCapture cap0(0); if (!cap0.isOpened()){ c
MFC数字图像处理24位图转8位图等四种图像色彩转换方式 CurtainSystem 数字图像处理数字图像处理图像色彩转换 24位图转8位图
一、实验主要思路和基本操作本实验主要探究8位图和24位图的颜色转换。8位图具有调色板，调色板中有对应的256种不同的颜色，每种颜色所含的RGB值都不一样。24位图没有调色板，RGB三个颜色分量分别都有0-255可选择，属于真彩色图像。其中，两种不同位数的图形都有彩色图像和灰度图像两种，灰度图像中每个像素的颜色分量，R、G、值都一样。所以本实验核心分为两点：了解颜色的RGB组合和学会调色板的使用调色
深度学习在环境感知中的应用：案例与代码实现
让机器学会“看”世界：深度学习如何赋能环境感知？关键词深度学习|环境感知|计算机视觉|传感器融合|语义分割|目标检测|自动驾驶摘要环境感知是机器与外界互动的“眼睛和耳朵”——从自动驾驶汽车识别行人，到智能机器人避开障碍物，再到城市监控系统检测异常，所有智能系统都需要先“理解”环境，才能做出决策。传统环境感知方法依赖手工特征提取，难以应对复杂场景；而深度学习通过数据驱动的方式，让机器从大量数据中自动
基于YOLOv8的Web端交互式目标检测系统设计与实现 YOLO实战营 YOLO 前端目标检测人工智能 ui 目标跟踪计算机视觉
1.引言目标检测是计算机视觉领域的一项重要任务，它在安防监控、自动驾驶、医疗影像分析等领域有着广泛的应用。近年来，随着深度学习技术的快速发展，YOLO(YouOnlyLookOnce)系列算法因其出色的速度和精度平衡而备受关注。本文将详细介绍如何基于最新的YOLOv8模型构建一个Web端交互式目标检测系统，包含完整的UI界面设计和数据集处理流程。本系统将实现以下功能：基于YOLOv8的高效目标检测
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现神经网络15044 算法 python 分类矩阵人工智能数据挖掘深度学习
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言1.1研究背景实例分割是计算机视觉领域的重要任务，它要求模型不仅要检测图像中的对象，还要精确地分割出每个对象的像素级掩码。近年来，基于Transformer的模型在实例分割任务上取得
OpenCV引擎：驱动实时应用开发的科技狂飙芯作者 DD：计算机科学领域 opencv 计算机视觉
在人工智能与计算机视觉技术迅猛发展的今天，实时图像处理已成为工业自动化、自动驾驶、医疗诊断、增强现实等领域的核心技术需求。而**OpenCV（OpenSourceComputerVisionLibrary）**作为全球最活跃的开源计算机视觉库，正以其强大的算法生态、跨平台兼容性以及持续进化的架构设计，成为驱动实时应用开发的“数字引擎”。本文将深入剖析OpenCV如何通过技术创新突破实时处理的性能极
数字图像处理与Python语言实现-Box模糊CUDA实现视觉与物联智能数字图像处理与Python实现 python 深度学习计算机视觉图像处理 CUDA
Box模糊CUDA实现文章目录Box模糊CUDA实现1、Box模糊的基本原理2、算法优化：滑动窗口技术3、参数对模糊效果的影响4、Box模糊的优缺点5、与高斯模糊的对比6、实际应用场景7、算法实现7.1PyCUDA实现7.2CuPy实现7.3C++与CUDA实现8、总结在图像处理领域，**Box模糊（方框模糊或均值模糊）**是一种基础且高效的模糊算法，其核心思想是通过对像素邻域内的颜色值取平均值来
旋转目标检测：Deep Spatial Feature Transformation for Oriented Aerial Object Detection【方法解析】沉浸式AI 《AI与SLAM论文解析》人工智能计算机视觉旋转目标检测
DeepSpatialFeatureTransformationforOrientedAerialObjectDetection目录DeepSpatialFeatureTransformationforOrientedAerialObjectDetection摘要关键词引言相关工作旋转对齐模块特征对齐方法旋转对齐模块特征选择模块摘要航空图像中的目标检测在计算机视觉领域引起了广泛关注。不同于自然图像
解读一个大学专业——信号与图像处理
专业定义与核心内容维度内容定义研究如何采集、处理、分析和理解一维信号（语音、雷达、脑电）和二维/三维图像（医学、遥感、工业视觉）。关键词数字信号处理（DSP）、图像处理、计算机视觉、模式识别、压缩感知、深度学习、GPU加速、嵌入式系统。技术栈MATLAB/Python+OpenCV/PyTorch+DSP/FPGA+GPU（CUDA）第五届先进算法与信号、图像处理国际学术会议（AASIP2025）
MATLAB中绘制系统零极点图（Pole-Zero Map）的几种方法爱代码的小黄人 matlab 开发语言
以下是MATLAB中绘制系统零极点图（Pole-ZeroMap）的常见方法及各自适用场景总结，适用于你当前在分析符号表达式/系统传函后的使用需求：✅方法一：pzmap(tf(num,den))（最常用，推荐）用法：num_coeffs=sym2poly(num);den_coeffs=sym2poly(den);sys=tf(num_coeffs,den_coeffs);pzmap(sys);✅优
将地面距离（米）转换为经纬度变化量（度），基于WGS84椭球模型。MATLAB SageFlower 遥感
将地面距离（米）转换为经纬度变化量（度）1函数解释2主程序以下是针对该MATLAB代码的逐行解析和功能说明：1函数解释函数定义与用途function[lat_deg,lon_deg]=metersToDegrees(lat,meters)•功能：将地面距离（米）转换为经纬度变化量（度），基于WGS84椭球模型。•输入：•lat：纬度（-90°到90°）•meters：地面距离（默认16米）•输出：
MATLAB在工业缺陷检测中的应用
本文还有配套的精品资源，点击获取简介：缺陷检测、伤痕检测、瑕疵检测和划痕检测是工业自动化和质量控制中至关重要的环节，MATLAB作为一种高级编程环境，在图像处理和计算机视觉任务中扮演了重要角色。本文详细介绍了如何使用MATLAB实现这些检测过程，包括图像采集、预处理、特征提取和决策制定等步骤。通过介绍内置图像处理工具箱中的应用，色彩转换技术、边缘检测算法以及形态学操作等方法，我们阐述了如何识别和处
MATLAB电力系统暂态稳定分析 rit8432499 matlab 开发语言
MATLAB电力系统暂态稳定分析程序MATLAB电力系统暂态稳定分析程序，包含潮流计算和机电暂态仿真功能。实现电力系统暂态稳定分析流程，包括牛顿-拉夫逊法潮流计算、同步发电机模型、励磁系统模型和数值积分求解。%===================================================%电力系统暂态稳定分析程序%功能：%1.牛顿-拉夫逊法潮流计算%2.机电暂态仿真%3.同
【缺陷检测】基于计算机视觉实现电路板智能检测系统附Matlab代码 matlab科研助手计算机视觉 matlab 人工智能
✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。往期回顾关注个人主页：Matlab科研工作室个人信条：格物致知,完整Matlab代码及仿真咨询内容私信。内容介绍随着信息技术的飞速发展和电子产品的日益普及，印刷电路板（PCB）作为电子产品的核心组件，其质量直接关系到整个系统的性能和可靠性。传统的电路板检测主要依赖人工目检，存在效率低下
Matlab自学笔记六十四：求解自变量带有约束条件的方程
1.说明有一些方程由于实际问题的需要，需要设置一些限制约束条件，例如x>0等，若使用Matlab编程求解，首先尝试使用符号运算求解（符号运算可参考文章54：Matlab自学笔记五十四：符号数学工具箱和符号运算、符号求解、绘图），简单的约束条件可以在声明sym变量的时候直接写出，复杂的约束条件可能需要使用assume设置假设条件（符号变量假设条件的用法请参考文章56：Matlab快速上手五十六：详解
【代码】Matlab鸟瞰图函数
用matlab把图像转化为鸟瞰图代码clcclearcloseallI=imread('road.png');figure(1)imshow(I)bevSensor=load('birdsEyeConfig');birdsEyeImage=transformImage(bevSensor.birdsEyeConfig,I);figure(2)imshow(birdsEyeImage)效果
【人工智能99问】卷积神经网络（CNN）的结构和原理是什么？(10/99)
文章目录卷积神经网络（CNN）的结构及原理一、CNN的核心结构1.输入层（InputLayer）2.卷积层（ConvolutionalLayer）2.卷积层的核心机制：局部感受野与权值共享3.池化层（PoolingLayer）4.全连接层（FullyConnectedLayer）5.输出层（OutputLayer）6.辅助层二、CNN的工作原理三、CNN的使用场景1.计算机视觉（最核心场景）2.其
Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring 论文阅读钟屿论文阅读计算机视觉人工智能
用于动态场景去模糊的深度多尺度卷积神经网络摘要针对一般动态场景的非均匀盲去模糊是一个具有挑战性的计算机视觉问题，因为模糊不仅来源于多个物体运动，还来源于相机抖动和场景深度变化。为了去除这些复杂的运动模糊，传统的基于能量优化的方法依赖于简单的假设，例如模糊核是部分均匀或局部线性的。此外，最近的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统的去模糊方法在模糊核难以近似或参数化的
基于Paillier同态加密算法的金融数据安全共享机制研究【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
吴恩达机器学习cs229-学习笔记-更新中是娜个二叉树！机器学习学习笔记
吴恩达机器学习cs22901基础概念语言：Matlab/python监督学习定义：获取一组数据集拟合数据从X到Y的映射回归问题：预测的Y是连续的，Y是实数分类问题：分类指的是Y取离散值，输出是离散的两组，正示例和负示例，把所有样本推到这条直线上，用0，1，标识逻辑回归算法，拟合直线区分正，负示例处理相对大量特征的回归算法或者分类算法支持向量机算法：它使用的不是1,2,3,10个输入特征，而是使用无
YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测
在深度学习领域，手写数字识别是一个经典问题，也是入门计算机视觉的重要案例。本文将介绍一个基于YOLOv8和MNIST数据集的手写数字识别系统，该系统不仅能识别静态图像中的数字，还能通过摄像头实时检测手写数字。个人博客：YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测-iDing's博客项目概述这个项目结合了传统的MNIST数据集和现代的目标检测算法YOLOv8，实现了以下功能：将MN
基于深度学习的手写数字和符号识别系统：YOLOv5/v6/v7/v8/v10模型实现与UI界面集成 YOLO实战营深度学习 YOLO ui 人工智能目标检测计算机视觉
1.引言随着人工智能和深度学习技术的发展，手写数字和符号识别已经成为计算机视觉领域的重要研究方向。手写识别在很多实际应用中扮演着关键角色，例如邮政编码识别、表单自动处理和智能教育系统等。传统的手写识别方法通常依赖于复杂的特征工程，而深度学习则能够自动从数据中学习到特征，极大地提高了识别精度和速度。本文将介绍如何构建一个基于YOLO系列模型（YOLOv5、YOLOv6、YOLOv7、YOLOv8、Y
matlab dft变换_傅里叶变换篇（一）——从时域到频域腿毛拆床垫 matlab dft变换
这次直接进入正题哈！啥是傅里叶变换？傅里叶变换可以将时域信号转变成频域，通过分析频谱了解信号的组成。网上有大量介绍傅里叶变换的好文章，感兴趣的小伙伴可以自行查阅！什么是时域和频域呢？简单的理解是：时域的横轴为时间，反映信号随时间的变化，频域的横轴为频率，反映信号组成的不同频率分量。现实生活中因为时间和采样的原因，得到的信号大多是有限长度序列的离散时间序列的傅里叶变换(DFT)。傅里叶变换的计算机实
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache