Matlab领域

【答题卡识别】Hough变换答题卡识别【含Matlab源码 250期】

⛄一、获取代码方式

获取代码方式Q：
完整代码已上传我的资源：【答题卡识别】基于matlab Hough变换答题卡识别【含Matlab源码 250期】

获取代码方式2：
付费专栏图像处理（Matlab）

备注：
点击上面蓝色字体付费专栏图像处理（Matlab），扫描上面二维码，付费299.9元订阅海神之光博客付费专栏，凭支付凭证，私信博主，可免费获得5份本博客上传CSDN资源代码（有效期为订阅日起，三天内有效）；
点击CSDN资源下载链接：5份本博客上传CSDN资源代码

⛄二、答题卡识别简介

研究答题卡识别软件的设计与开发，集成了图像分割、模式识别等领域的功能模块，涉及计算机图像处理的一系列知识。通过图像处理技术，系统能够识别答题卡图像的答案选项，再通过输入正确答案的答题卡并与之对照，进而对学生答题卡进行判别并计算出分数。本案例侧重于图像识别方面的实现，应用了图像校正、模式识别等方面的算法。

1 理论基础
答题卡自动阅卷系统通过获取答题卡图像作为系统输入，并通过计算机处理、自动识别填涂标记，存入数据库完成阅卷。在图像数字化的过程中，受设备、环境等因素的影响，答题卡图像的质量在一定程度上下降，影响自动阅卷的准确率，甚至导致无法正常阅卷。因此，要对所获取的图像进行一系列的预处理，滤去干扰、噪声，做几何校正、彩色校正等操作，并进行二值化处理，以确保后续步骤能顺利进行。

1.1 图像二值化
彩色图像经过灰度化处理后得到灰度图，每个像素都仅有一个灰度值，该灰度值的大小决定了像素的亮暗程度。在答题卡自动识别实验中，根据答题卡图像答案目标的色彩特点，为了方便地进行目标答案的检测和识别，我们需要对灰度图像进行二值化处理，也就是说各像素的灰度值只有0和1两个取值，用来表示黑白两种颜色，这样可以大大减少计算的数据量。

在对答题卡图像进行二值化的过程中，阈值的选取是关键，直接影响到目标答案是否能被正确识别。根据二值化过程中的阈值选取的来源不同，阈值选取方法可以分为全局和局部两种。鉴于答题卡图像的应用场景，不同考生填涂答题卡的深浅度往往不同。如果采用由用户指定阈值的方法，则可能会产生对每张答题卡都需要进行阈值调整的要求，而且在光照不均匀等因素的影响下往往会出现目标区域二值化异常的现象。因此，在本案例中采用局部平均阈值法来自动确定阈值，当像素点的灰度值小于阈值时，则将该点的数值置为0，否则将数值置为1。该算法在不同的图像区域所选择的阈值会自动调整，也消除了光照不均匀等因素的干扰，同时在光照明暗变化时能自动调整阈值的大小。等待系统载入答题卡图像，进行灰度化化等预处理后再进行二值化，将有效突出答案目标的显示效果。

1.2 倾斜校正
在答题卡图像采集的过程中，由于种种原因，可能会导致所采集得到的答题卡图像有某种程度的倾斜，为了得到准确的阅卷结果，需要进行必要的倾斜纠正处理。答题卡图像的倾斜校正一般分为两步：第一步，查找倾斜角度；第二步，进行坐标变换，得到校正后的图像。其中，常用的倾斜角度查找方法有两种：一种是利用Hough变换来找出倾斜角度；另一种是利用角点检测来找出倾斜角度。根据答题卡图像样式固定的特点，本案例采用Hough变换来进行倾斜角度的计算。
Hough变换作为一种参数空间变换算法，自从1962年被Hough提出之后，便成为直线和其他参数化形状检测的重要工具。Hough变换具有较强的稳定性和鲁棒性，可以在一定程度上避免噪声的影响，而且易于并行运算2。因此， Hough变换被不断地研究并取得大量进展， Duda和Halt将极坐标引入Hough变换，使这种方法可以更加有效地用于直线检测和其他任意几何形状的检测。Ballard提出了非解析任意形状的R表法，将Hough变换推广到对任意方向和范围的非解析任意形状的识别，这种方法被称为广义Hough变换。
直线y=mx+b可用极坐标表示为：

也可表示为：

其中，1式中的(r，6)定义了一个从原点到该直线最近点的向量，显然，该向量与该直线垂直，如图所示。

假设以参数r和0构成一个二维空间，则x、y平面上的任意一条直线对应了r、0平面上的一个点。因此， x、y平面上的任意一条直线的Hough变换就是寻找r、0平面上的一个对应点的过程。
假设x、y平面上有一个特定的点(xo，yo)，经过该点的直线可以有很多条，每一条都对应了r、0平面中的一个点，这些点必须是满足以xo、yo作为常量时的1式。因此，根据1式的定义可以发现，在参数空间与x、y空间中所有这些直线对应点的轨迹是一条正弦型曲线，即x、y平面上的任意一点对应了r、0平面上的一条正弦曲线。如果有一组位于由参数ro和0决定的直线上的边缘点，则每个边缘点对应了r、0空间的一条正弦型曲线。由于这些曲线均对应了同一条直线参数，因此所有这些曲线必交于点
(ro，0o)。
在实际计算的过程中，为了找出这些点所构成的直线段，我们可以将r、0空间进行网格化，进而将其量化成许多小格，并初始化各小格的计数累加器。根据每一个(x0，yo)点的极坐标公式，可以根据其代入0的量化值，算出各个r的值，如果经量化后的值落在某个小格内，则使该小格的计数累加器加1；当全部(x，y)点变换后，对小格计数器进行统计，包含较大计数值的小格对应于共线点，并且(r，0)可作为直线拟合参数；包含较小计数值的小格一般对应于非共线点，丢弃不用。通过以上过程可以看出，如果r、0网格量化度量过大，则其参数空间的聚合效果较差，进而很难查找直线的准确的r、0参数；同理，如果r、0网格量化度量过小，则计算量会随之增大，影响查找效率。因此，在计算过程中需要综
合考虑这两方面，选择合适的网格量化度量值2。
由于Hough变换需要进行网格扫描处理，运行速度往往较慢，因此在进行直线检测和倾斜角度计算时，需要考虑的一个重要因素就是计算量的问题。其中，计算量与搜索角度步长0，和搜索角度范围0，密切相关。因此，采用多级Hough变换，通过设置角度搜索步长由大到小来进行直线检测和倾斜角度计算，可以有效降低算法的计算量。多级Hough变换首先用较大的0，和0，以求出倾斜角度的大致范围，这类似于人眼主观估计的过程。然后用较小的0，和0，对倾斜角度进行细化处理，对于某些应用场景甚至可以求出约0.02°的倾斜，这类似于人眼仔细估计的过程。因此，采用多级Hough变换比直接应用Hough变换在运算速度上有了较大提高。
在计算答题卡图像的倾斜角度时，为了消除涂抹区域部均匀的影响，对已获取的满足上述特征的极大值对应的倾斜角度，可采用算术平均的方式进行优化处理。假设每行答题区对应的倾斜角度为0；(i=1，2，…，N，N通常为答题区的总行数)，则图像的倾斜角度0m
由3式给出：

获取答题卡图像的倾斜角度后，可以对图像进行旋转处理。假设点(x.，)o)绕点(a，b)旋转0度后坐标为(x，y)，旋转后中心坐标为(c，d)，则：

图像旋转可能会引起图像的高度和宽度范围的改变，结合答题卡图像周边区域的特点，我们对旋转图像超出范围的周边区域进行了删除处理。同时，为了尽可能保持图像的完整性，在进行旋转时以图像的中心位置作为旋转中心进行计算，对答题卡图像进行倾斜校正的效果。

1.3 图像分割
图像分割是图像处理中常用的关键步骤之一，本案例涉及对答题卡图像有效区域的检测和分割。一般情况下，对灰度图像的分割通常可基于像素灰度值的两个性质：不连续性和相似性。图像固定区域内部的像素一般都具有灰度相似性，而在不同区域之间的边界上一般具有灰度不连续性，也就是我们常说的区域边缘属性。因此，灰度图像分割方法一般可以分为基于区域的方法和基于边界的方法。前者利用区域内的灰度相似性进行分割，后者利用区域间的灰度不连续性进行分割。根据分割过程中选择的运算策略不同，分割算法又可分为并行算法和串行算法。在并行算法过程中，所有检测和分割都可独立和同时地进行，利于提高运算效率曰。在串行算法过程中，后续的处理流程要用到之前的步骤得到的结果，要求程序运行具有连续性。
基于区域的分割方法
基于区域的分割方法以区域内像素的相似性特征为依据，将图像划分成一系列有意义的独立区域，实现分割的目标。图像进行区域分割一般有以下特征。
(1)一致性。图像分割后的区域应在某些特征方面表现出一致性，如灰度、颜色或纹理。
(2)单一性。区域内部目标分布单一，不能包含太多孔洞。
(3)差异性。区域内部的同一特征在相邻区域间应有明显的差异性。
(4)准确性。区域间的分割边界应该有光滑性，且边界的空间位置准确。
基于区域的分割方法常用的有灰度阈值法和区域增长法等，其特点是充分利用了区域内像素特征的相似性。

2 程序实现
本案例提出了一种能够有效识别答题卡的方法，利用基于Hough变换的直线检测技术检测图像的倾斜度，对存在倾斜的图像进行旋转校正，最终实现答题卡答案的定位和检测。其中，在识别过程中使用像素灰度积分统计的方法，具有较低的误识别率，能够准确定位答题卡的涂卡痕迹。下面介绍程序实现过程中的关键步骤。

2.1 图像灰度化
根据答题卡图像的自身特点，本实验要求输入的图片为灰度格式，并将采集到的答题卡图片经灰度化处理后存储到硬盘的指定文件夹，用于检测识别。采用灰度图像进行存储能显著减少文件所占用的硬盘空间，而且能提高图像处理识别的速度。一般而言，可采用加权平均值法对原始RGB图像进行灰度化处理，该方法的主要思想是从原图像中取R、G、B各层像素值并经过加权求和得到灰度图的亮度值。现实生活中，人眼对绿色(G)敏感度最高，对红色®敏感度次之，对蓝色(B)敏感度最低，因此为了选择合适的权值对象使之能够输出合理的灰度图像，权值系数应该满足G>R>B.实验和理论证明，当R、G、B的权值系数分别为0.299、0.587和0.114时，能够得到最适合人眼观察的灰度图像。

2.2 灰度图像二值化
图像二值化是图像处理的基本技术之一，而阈值的选取则是图像二值化的关键步骤。一般而言，对于灰度图像来说，可适当选择一个或若干个灰度值T(0≤T≤255)来进行二值化，将目标和背景分开，这个灰度值T就称为阈值。因此，对于答题卡图像来说，根据考生填涂答题卡的答案目标区域特点，可选择适当的阈值T进行二值化。当像素点的灰度值小于T时，则将该点的颜色值置为“0”，否则将其颜色值置为“1”。这样就得到了只包含黑白两种颜色的二值图像。

2.3 图像平滑滤波
图像平滑滤波是一种实用的数字图像处理技术，主要是为了减少图像的噪声，常用的有中值滤波、均值滤波等方法。中值滤波指将像素邻域的灰度值进行排序后取中位数值作为中心像素的新灰度值。答题卡图像在采集过程中经常会遇到随机噪声的干扰，该噪声一般是邻域中亮度值发生随机突变的像素，并且经排序后往往出现在序列的队首或队尾，故经中值滤波后答题卡图像的随机噪声能得到有效消除。

2.4 图像校正
对答题卡图像进行校正处理主要是进行图像旋转操作，便于后续的检测和识别。图像旋转的算法很多，本实验采用的算法思路为：将需调整的答题卡图像读取到内存中，计算图像的倾斜角度，依据所得的倾斜角度旋转图像，得到校正图像。根据答题卡图像的特点，答题卡的有效信息往往位于整幅图像的特定部位，一般包括考生准考证号区域、答案区域和考试科目区域三大部分，因此对这些区域进行精确的定位即可提取图像的特征信息。答题卡图像一般由明确的矩形框和直线组成，在进行区域定位时选择Hough变换来进行直线检测，进而获取定位信息，计算倾斜角度，之后进行图像旋转来得到校正结果。

2.5 填写检查
考生在涂卡时，由于种种原因可能会出现重选、漏选等错误，可根据对识别结果的影响分两种情况进行处理：一种情况是如果考生的基本信息如专业、科目、班级、学号、试卷类型等客观信息出现重选、漏选错误，则在系统识别后会立即给出错误提示，要求确认修改图像或重新采集图像；另一种情况是如果考生填涂答案时出现重选、漏选错误，则可按答案选择错误对待，并将识别结果记入存储结构。最后，系统根据事先录入的标准答案与识别存储结构进行自动评分，从而获得每名考生的考试成绩信息。
备注：此简介仅作为理论参考，与本案例实际略有出入

三、部分源代码

clc; clear all; close all;
warning off all;
I = imread('images\\1.jpg');
I1 = Image_Normalize(I, 0);
hsize = [3 3];
sigma = 0.5;
I2 = Image_Smooth(I1, hsize, sigma, 0);
I3 = Gray_Convert(I2, 0);
bw2 = Image_Binary(I3, 0);
[~, ~, xy_long] = Hough_Process(bw2, I1, 0);
angle = Compute_Angle(xy_long);
[I4, bw3] = Image_Rotate(I1, bw2, angle*1.8, 0);
[bw4, Loc1] = Morph_Process(bw3, 0);
if nargin < 3
    flag = 1;
end
[H, T, R] = hough(bw);
P = houghpeaks(H, 4, 'threshold', ceil(0.3*max(H(:))));
lines = houghlines(bw, T, R, P, 'FillGap', 50, 'MinLength', 7);
max_len = 0;
for k = 1 : length(lines)
    xy = [lines(k).point1; lines(k).point2]; 
    len = norm(lines(k).point1-lines(k).point2); 
    Len(k) = len;
    if len > max_len
        max_len = len;
        xy_long = xy;
    end
    if nargin < 5
    flag = 1;
end
Line1 = Line{1};
Line2 = Line{2};
Line3 = Line{3};
Line4 = Line{4};
yn1 = round(Line1(1, 2) + 0.18*(Line2(1, 2)-Line1(1, 2)));
yn2 = round(Line1(1, 2) + 0.34*(Line2(1, 2)-Line1(1, 2)));
yn3 = round(Line1(1, 2) + 0.50*(Line2(1, 2)-Line1(1, 2)));
Linen1_1 = [Line1(1, 1) yn1; Line1(2, 1) yn1];
Linen2_1 = [Line1(1, 1) yn2; Line1(2, 1) yn2];
Linen3_1 = [Line1(1, 1) yn3; Line1(2, 1) yn3];
% 定位竖直网格分割线
xn1 = round(Line3(1, 1) + 0.22*(Line4(1, 1)-Line3(1, 1)));
xn2 = round(Line3(1, 1) + 0.26*(Line4(1, 1)-Line3(1, 1)));
xn3 = round(Line3(1, 1) + 0.48*(Line4(1, 1)-Line3(1, 1)));
xn4 = round(Line3(1, 1) + 0.52*(Line4(1, 1)-Line3(1, 1)));
xn5 = round(Line3(1, 1) + 0.73*(Line4(1, 1)-Line3(1, 1)));
xn6 = round(Line3(1, 1) + 0.77*(Line4(1, 1)-Line3(1, 1)));
xn7 = round(Line3(1, 1) + 0.98*(Line4(1, 1)-Line3(1, 1)));

Linen1_2 = [xn1 Line3(1, 2); xn1 Line3(2, 2)];
Linen2_2 = [xn2 Line3(1, 2); xn2 Line3(2, 2)];
Linen3_2 = [xn3 Line3(1, 2); xn3 Line3(2, 2)];
Linen4_2 = [xn4 Line3(1, 2); xn4 Line3(2, 2)];
Linen5_2 = [xn5 Line3(1, 2); xn5 Line3(2, 2)];
Linen6_2 = [xn6 Line3(1, 2); xn6 Line3(2, 2)];
Linen7_2 = [xn7 Line3(1, 2); xn7 Line3(2, 2)];
ym1_1 = round(Line1(1, 2) + 0.32*(Linen1_1(1, 2)-Line1(1, 2)));
ym2_1 = round(Line1(1, 2) + 0.5*(Linen1_1(1, 2)-Line1(1, 2)));
ym3_1 = round(Line1(1, 2) + 0.65*(Linen1_1(1, 2)-Line1(1, 2)));
ym4_1 = round(Line1(1, 2) + 0.80*(Linen1_1(1, 2)-Line1(1, 2)));
ym5_1 = round(Line1(1, 2) + 0.95*(Linen1_1(1, 2)-Line1(1, 2)));
Linem1_1 = [Line1(1, 1) ym1_1; Line1(2, 1) ym1_1];
Linem2_1 = [Line1(1, 1) ym2_1; Line1(2, 1) ym2_1];
Linem3_1 = [Line1(1, 1) ym3_1; Line1(2, 1) ym3_1];
Linem4_1 = [Line1(1, 1) ym4_1; Line1(2, 1) ym4_1];
Linem5_1 = [Line1(1, 1) ym5_1; Line1(2, 1) ym5_1];

ym1_2 = round(Linen1_1(1, 2) + 0.25*(Linen2_1(1, 2)-Linen1_1(1, 2)));
ym2_2 = round(Linen1_1(1, 2) + 0.40*(Linen2_1(1, 2)-Linen1_1(1, 2)));
ym3_2 = round(Linen1_1(1, 2) + 0.60*(Linen2_1(1, 2)-Linen1_1(1, 2)));
ym4_2 = round(Linen1_1(1, 2) + 0.75*(Linen2_1(1, 2)-Linen1_1(1, 2)));
ym5_2 = round(Linen1_1(1, 2) + 0.90*(Linen2_1(1, 2)-Linen1_1(1, 2)));
Linem1_2 = [Line1(1, 1) ym1_2; Line1(2, 1) ym1_2];
Linem2_2 = [Line1(1, 1) ym2_2; Line1(2, 1) ym2_2];
Linem3_2 = [Line1(1, 1) ym3_2; Line1(2, 1) ym3_2];
Linem4_2 = [Line1(1, 1) ym4_2; Line1(2, 1) ym4_2];
Linem5_2 = [Line1(1, 1) ym5_2; Line1(2, 1) ym5_2];
end
 

## ⛄四、运行结果
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210208085757339.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1RJUUNtYXRsYWI=,size_16,color_FFFFFF,t_70#pic_center)


## ⛄五、matlab版本及参考文献
**1 matlab版本**
2014a

**2 参考文献**
[1] 蔡利梅.MATLAB图像处理——理论、算法与实例分析[M].清华大学出版社，2020.
[2]杨丹,赵海滨,龙哲.MATLAB图像处理实例详解[M].清华大学出版社，2013.
[3]周品.MATLAB图像处理与图形用户界面设计[M].清华大学出版社，2013.
[4]刘成龙.精通MATLAB图像处理[M].清华大学出版社，2015.

2025年三个月自学手册网络安全（黑客技术）网安kk web安全安全网络网络安全人工智能
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习导航
入门网络安全工程师要学习哪些内容【2025年寒假最新学习计划】白帽黑客2659 学习 web安全安全网络安全密码学
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包大家都知道网络安全行业很火，这个行业因为国家政策趋势正在大力发展，大有可为!但很多人对网络安全工程师还是不了解，不知道网络安全工程师需要学什么?知了堂小编总结出以下要点。网络安全工程师是一个概称，学习的东西很多，具体学什么看自己以后的职业定位。如果你以后想成为安全产品工程师，学的内容侧重点就和渗透测试工程师不一样，如果你想成为安全开发
深入解析 Flutter Riverpod：从原理到实战陈皮话梅糖@ flutter Riverpod
深入解析FlutterRiverpod：从原理到实战Riverpod是Flutter社区中一个强大且灵活的状态管理工具，被称为Provider的升级版。它解决了Provider的一些局限性，比如类型安全、全局状态管理的灵活性、不依赖BuildContext等。Riverpod的设计理念是简洁、灵活和高性能，适合从小型到大型项目的状态管理需求。本篇博客将详细分析Riverpod的核心原理、常见用法，
【2025年】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！网安詹姆斯 web安全 CTF 网络安全大赛 python linux
【2025年】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、S
java进阶篇--生产环境如何排查bug和优化 JVM？爱分享的淘金达人 Java源码剖析(30讲)jvm优化 jvm调优优化jvm 生产环境优化jvm 生产环境jvm优化
通过前面几个课时的学习，相信你对JVM的理论及实践等相关知识有了一个大体的印象。而本课时将重点讲解JVM的排查与优化，这样就会对JVM的知识点有一个完整的认识，从而可以更好地应用于实际工作或者面试了。我们本课时的面试题是，生产环境如何排查问题？回答：如果是在生产环境中直接排查JVM的话，最简单的做法就是使用JDK自带的6个非常实用的命令行工具来排查。它们分别是：jps、jstat、jinfo、jm
Coze扣子专业版计费规则调整一览落笔画忧愁e 扣子商店 Coze插件
就在今晚(2025-01-24)，扣子更新了专业版的计费规则更新时间：2025年2月中旬主要更新内容：新增扣子资源包，原智能体资源包、大模型资源包下架。专业版用户每日赠送500资源点（仅限当日有效），可抵扣智能体调用费用和模型调用费用语音识别API、语音合成API、实时音视频SDK全面开放，无需申请即可使用更新详解：智能体资源包、大模型资源包下架处理，剩余资源用量使用完毕后，不支持续费。新增扣子资
MXTU MAX 苹果cmsv10模板仿毒舌自适应主题/短视X体验版完全开源希希分享软希网58soho_cn 源码资源仿毒舌自适应主题/
基于MxonePro二开的主题，全开源未加密。MXTUMAX仿毒舌苹果CMS影视自适应主题主题说明：1、将mxtheme目录放置根目录|将mxpro目录放置template文件夹中2、苹果cms后台-系统-网站参数配置-网站模板-选择mxpro模板目录填写html3、网站模板选择好之后一定要先访问前台，然后再进入后台设置4、主题后台地址：MXTUMAX图图主题,/admin.php/admin/m
如何用 python 获取实时的股票数据？_python efinance(2) 元点三 2024年程序员学习 python java linux
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新Python全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课
如何用 python 获取实时的股票数据？_python efinance，2024年最新pdf面试简历元点三 2024年程序员学习 python pdf 面试
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新Python全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课
使用BLIP模型生成图像描述的可查询索引 dgay_hua python 计算机视觉开发语言
在本篇文章中，我们将介绍如何使用预训练的SalesforceBLIP图像描述模型，生成一个可查询的图像描述索引。我们将使用ImageCaptionLoader来加载图像，并通过一系列步骤生成查询索引。使用示例代码进行演示，帮助读者理解和实践。技术背景介绍随着计算机视觉技术的发展，图像描述生成成为了重要的研究领域。通过对图像内容自动生成文字描述，可以大大提高对图像信息的检索和管理效率。Salesfo
Java面试题中高级进阶（JVM篇Java内存）李老头探索 java jvm 开发语言
前言本来想着给自己放松一下，刷刷博客，突然被几道面试题难倒！说说Java内存结构？说说对象分配规则？描述一下JVM加载class文件的原理机制？似乎有点模糊了，那就大概看一下面试题吧。好记性不如烂键盘***12万字的java面试题整理***Java内存结构方法区和堆是所有线程共享的内存区域；而java栈、本地方法栈和程序员计数器是运行是线程私有的内存区域。Java堆（Heap）,是Java虚拟机所
DeepSeek 爆火：初级程序员的饭碗要丢？别慌，这是进阶的号角！清水白石008 人工智能职业生涯提升学习人工智能深度学习自然语言处理
DeepSeek爆火：初级程序员的饭碗要丢？别慌，这是进阶的号角！前言最近，一款名为DeepSeek的AI编程工具火遍了程序员圈。其强大的代码生成能力、智能的代码理解，让不少初级程序员感到一丝焦虑：AI都这么厉害了，我们这些写基础代码的，饭碗还能保得住吗？作为一名在程序软件领域摸爬滚打多年的老兵，我深知技术变革带来的冲击，也理解初级程序员们心中的担忧。但我想说的是，DeepSeek的爆火，非但不是
8-项目实战-信用卡数字识别 #北极星star Opencv图像处理框架实战 opencv 计算机视觉人工智能
目录(1)总体流程与方法(2)代码实现(3)识别结果(1)总体流程与方法①读取模板图像：加载包含数字模板的图像，并提取每个数字的轮廓，将它们作为模板存储。②读取输入图像：加载待识别的信用卡图像，并进行预处理。③提取数字区域：通过一系列图像处理操作（如礼帽操作、梯度计算、闭操作等）提取可能包含数字的区域。④轮廓排序与筛选：找到提取区域的轮廓，并根据轮廓的宽高比和尺寸筛选出符合条件的数字区域。⑤数字识
百度极速版APP 自动脚本 javascript代码 zaxjb123 dubbo
使用JavaScript编写针对百度极速版APP的自动化脚本通常涉及到使用WebView测试框架，比如Puppeteer或Selenium，这些工具允许你控制一个浏览器或WebView环境，从而与网页或APP中的Web内容进行交互。然而，对于原生APP（如百度极速版）的自动化测试，通常需要使用专门的移动应用自动化框架，如Appium。Appium支持多种编程语言，包括JavaScript。要使用J
Anaconda 配置镜像源猿代码_xiao python pytorch python 深度学习
Anaconda镜像使用帮助Anaconda是一个用于科学计算的Python发行版，支持Linux,Mac,Windows,包含了众多流行的科学计算、数据分析的Python包。Anaconda安装包可以到https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/下载。TUNA还提供了Anaconda仓库与第三方源（conda-forge、msys2
剑指Offer（第二版）面试题10：斐波那契数列温柔狠角色面试题笔试题剑指Offer 剑指Offer 斐波那契数列跳台阶
（尊重劳动成果，转载请注明出处：http://blog.csdn.net/qq_25827845/article/details/71933891冷血之心的博客）
AScript自动化脚本游戏辅助系列教程 jinglong.zha 自动化脚本自动化运维 ascript 懒人精灵 easyclick python 游戏辅助开发
Python自动化脚本开发，AScript零基础从入门到精通，游戏脚本，自动化脚本，python核心与进阶实战教程AScript基础-python核心与进阶课程简介_哔哩哔哩_bilibiliAScript基础-python核心与进阶课程简介是Python自动化脚本开发，AScript零基础从入门到精通，游戏脚本，自动化脚本，python核心与进阶实战教程的第1集视频，该合集共计35集，视频收藏或
关于wordpress建站遇到的问题 bug菌¹ 全栈Bug调优(实战版)#CSDN问答解惑(全栈版)android
本文收录于《全栈Bug调优(实战版)》专栏，主要记录项目实战过程中所遇到的Bug或因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！问题描述使用Wordpress搭建网站遇到的问题我目前使用了AWS的云服务器在这个云服务器的基础上搭建了AApanel(国内叫宝塔面板),与此同时我也购买了域名和做了DN
Git入门与进阶：详细使用指南向着开发进攻 git git
Git入门与进阶：详细使用指南Git是一款强大的分布式版本控制工具，广泛用于软件开发中的源代码管理。无论你是一个刚刚开始学习编程的新手，还是一个已经有经验的开发者，Git都是你日常工作中的必备工具。在这篇文章中，我将详细介绍Git的使用方法，帮助你从基础到进阶掌握Git。什么是Git？Git是一种分布式版本控制系统（VCS），它让多个开发者能够高效地协同开发，跟踪代码的历史版本，并且管理项目的不同
AI外呼机器人：营销新利器还是骚扰电话的升级版？ yoloGina 客户管理外呼系统电话外呼人工智能机器人
"您好，这里是XX房产，最近有购房需求吗？""您好，您最近有种牙需求吗？"相信很多人都接到过类似的营销电话，而电话那头，很可能已经不是真人，而是AI外呼机器人。近年来，AI外呼系统凭借其高效率、低成本的优势，迅速在电销行业普及，成为企业营销的"新宠"。据统计，2022年中国AI外呼市场规模已达50亿元，预计2025年将突破100亿元。AI外呼系统的核心技术是语音识别和自然语言处理。通过深度学习海量
《剑指 Offer》专项突破版 - 面试题 56 : 二叉搜索树中两节点的值之和（详解 C++ 实现的两种方法） melonyzzZ 数据结构算法 c++开发语言数据结构面试
目录前言一、利用哈希表二、应用双指针前言题目链接：LCR056.两数之和IV-输入二叉搜索树-力扣（LeetCode）题目：给定一棵二叉搜索树和一个值k，请判断该二叉搜索树中是否存在值之和等于k的两个节点。假设二叉搜索树中节点的值均唯一。例如，在下图所示的二叉搜索树中，存在值之和等于12的两个节点（节点5和节点7），但不存在值之和为22的两个节点。分析：解决这个问题自然需要遍历二叉树中的所有节点，
深入浅出：CUDA是什么，如何利用它进行高效并行计算码上飞扬 CUDA
在当今这个数据驱动的时代，计算能力的需求日益增加，特别是在深度学习、科学计算和图像处理等领域。为了满足这些需求，NVIDIA推出了CUDA（ComputeUnifiedDeviceArchitecture），这是一种并行计算平台和编程模型。本文将带你全面了解CUDA的基本概念、工作原理及其应用场景。一、什么是CUDA？CUDA（ComputeUnifiedDeviceArchitecture）是由
python panda下载_pandas python下载|Pandas for python v0.25.0官方版 v0.25.0官方版 - 哩咯下载站... weixin_39647458 python panda下载
Pandas是python的数据分析包，最初被作为金融数据分析工具而开发出来，提供pandas.whl包下载，有需要的赶快下载吧！软件介绍Pandas是python的一个数据分析包，最初由AQRCapitalManagement于2008年4月开发，并于2009年底开源出来，目前由专注于Python数据包开发的PyData开发team继续开发和维护，属于PyData项目的一部分。Pandas最初被
(01)ES6 教程——let与const、解构赋值、Symbol 欲游山河十万里 web框架学习 es6 前端 javascript
前言ES6，全称ECMAScript6.0，是JavaScript的下一个版本标准，2015.06发版。ES6主要是为了解决ES5的先天不足，比如JavaScript里并没有类的概念，但是目前浏览器的JavaScript是ES5版本，大多数高版本的浏览器也支持ES6，不过只实现了ES6的部分特性和功能。ECMAScript的背景JavaScript是大家所了解的语言名称，但是这个语言名称是商标（O
深度学习模型中的知识蒸馏是如何工作的? c++服务器开发深度学习人工智能
深度学习模型在多个领域，特别是计算机视觉和自然语言处理中，已经取得了革命性的进展。然而，随着模型复杂性和资源需求的不断攀升，如何将这些庞大模型的知识浓缩为更紧凑、更高效的形式，成为了当前研究的热点。知识蒸馏，作为一种将知识从复杂模型转移到更简单模型的策略，已经成为实现这一目标的有效工具。在本文中，我们将深入探究深度学习模型中知识蒸馏的概念、原理及其在各领域的应用，以期为读者提供一个全面而严谨的视角
UVA10608 Friends 题解 W9095 算法 c++
0x01STEP1读题审题UVA10608Friends题面翻译读完题就知道，这题用并查集。本人太弱，就用带权并查集做。0x02STEP2主要步骤实际上，带权并查集的几种操作并不复杂，是基础并查集的扩展版。初始化：for(inti=1;iusingnamespacestd;intn,m,t,f[300000],num[300000];intgetf(intx){if(f[x]==x)returnx
百度百舸 DeepSeek 一体机发布，支持昆仑芯 P800 单机 8 卡满血版开箱即用百度智能云技术站 deepseek 百度百舸专有云
在私有云环境中成功部署DeepSeek满血版并实现性能调优，并不是一件容易的事情。选择合适的GPU配置、安装相应的环境、成功部署上线业务、加速推理任务加速、支撑多用户并发……完成业务测试，成功融入生产业务中。为了帮助企业快速实现DeepSeek服务的落地，百度智能云推出「百度百舸DeepSeek一体机」。百度百舸DeepSeek一体机基于百度百舸平台打造，提供纯国产的算力组合，支持昆仑芯P800单
Python从0到100（四）：Python中的运算符介绍(补充) 是Dream呀 python java 数据库
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Python从0到100（三十五）：beautifulsoup的学习是Dream呀 Dream的茶话会 python beautifulsoup 学习
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
《深入浅出AI》前言知识：深度学习基础总结 GoAI 深入浅出AI 人工智能深度学习机器学习 cnn rnn 生成对抗网络神经网络
个人主页:GoAI|公众号:GoAI的学习小屋|交流群:704932595|个人简介：掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计算机视觉方向导师等，专注大数据与人工智能知识分享。AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本

【答题卡识别】Hough变换答题卡识别【含Matlab源码 250期】

⛄一、获取代码方式

⛄二、答题卡识别简介

三、部分源代码

你可能感兴趣的:(Matlab图像处理（进阶版）,matlab,图像处理,计算机视觉)