Mr_tianyanxiaobai

验证码识别论文总结---外文篇

文章目录

《A Survey on Breaking Technique of Text-Based CAPTCHA》
《Selective Learning Confusion Class for Text-Based CAPTCHA Recognition》
《A Low-Cost Approach to Crack Python CAPTCHAs Using AI-Based Chosen-Plaintext Attack》
《Captcha Automatic Segmentation and Recognition Based on Improved Vertical Projection》
《A Multi-label Neural Network Approach to Solving Connected CAPTCHAs》
《 Verification CAPTCHA Based on Deep Learning》
《A CAPTCHA recognition technology based on deep learning》
《Recognition of CAPTCHA Characters by Supervised Machine Learning Algorithms》
《Using Synthetic Data to Train Neural Networks is Model-Based Reasoning》
《Chinese Character CAPTCHA Recognition and Performance Estimation via Deep Neural Network》
《A machine learning attack against variable-length Chinese character CAPTCHAs》
《A generative vision model that trains with high data efficiency and breaks text-based CAPTCHAs》

为了了解国际形势，先来篇近几年的综述报告：

《A Survey on Breaking Technique of Text-Based CAPTCHA》

基于文本验证码的破解技术综述
2017
基于文本验证码的主要特点

足够大的数据集，使其足以抵抗暴力求解
具有变形，粘贴，重叠等字符。达到不容易分割的目的
同一字符的大小，宽高，位置，字体不同
具有大量噪声

各大网站种类以及特点汇总

主要内容

验证码的识别，主要针对于验证码是否切割而分为两种派系
早期文本验证码的破解技术主要是“预处理+分割+识别”。而随着验证码字符的粘连，现在出现了更多的处理框架比如：预处理+识别+后处理、预处理+分割+组合+识别，预处理+分割+组合+识别+后处理
本文主要是分别对预处理，分割，组合，识别，后处理等各大模块的研究进展进行了一个描述
每个模块的研究情况如下：

当前形势存在的一些问题以及发展方向

目前市面上还有一个标准的数据库，进而没法对领域内的各种方法进行一个统一的评估
目前只有在训练集和测试集属于同一类型下，才能够有效的识别
拒绝的概念还未被熟知

《Selective Learning Confusion Class for Text-Based CAPTCHA Recognition》

2019
基于选择性学习的文本验证码识别

拟解决的问题
由于深度神经网络对混淆类的较低的识别准确率，而提出的一种选择性学习混淆类的新方法
大多数DCNN有统一处理训练样本，且在训练过程中不断迭代，并且随着误差率越来越小，趋于稳定后停止训练（其实这里放弃了学习混淆样本的能力，因为混淆类别对降低错误率没有影响）

内容概要
总的来说的话，就是建立了一种新的架构SLCC（Selective Learning Confusion Class）,将混淆样本和普通样本分开，训练出两个模型，然后再结合。

针对混淆类的问题，开始的时候，文中提到了一种方法Dropsample：
简单的来说就是通过样本不同类别的置信度，动态改变训练集中每个样本取出用以学习的概率分布。（具体参看论文：W. Yang, L. Jin,D. Tao, Z. Xie, and Z. Feng, ``Dropsample: A newtraining method to enhance deep convolutional neural networks for large-scale unconstrained handwritten chinese character recognition’’ PatternRecognit., vol. 58, pp. 190-203, Oct.2016.），但是这种方法吧普通训练集和混淆样本结合放在一起训练，这样会很大程度上影响收敛速度，以及模型准确性。

提出了一个具有两级DCNN的架构：全级DCNN和混淆级DCNN。
用全级DCNN的输出构造混淆关系矩阵以显示类之间的混淆关系
提出了一种分区算法（根据混淆矩阵，将一些有混淆关系的类别合在一起，形成新的样本集合），每个样本集对应一个新的混淆级DCNN。
为提高混淆级DCNN中混淆字符的识别准确性，提出了训练和验证交互式学习算法。
将两个阶段的输出结合起来作为最终识别结果。

结果：
作者用了两种定义的混淆集合方法，第一种是把所有混淆集合放在一起（SLCC-A），第二种是把这个大的混淆集合分开，就是上述的说的每个混淆子集合中的所有元素都存在混淆（SLCC-M）。得到集合如下：

错误率与迭代次数的变化如下：

一些细节问题

basic DCNN采用的网络结构：leNet-5
数据集的来源：QQ and BotDetect CAPTCHA，这两种数据集分别得到了1000张（人工打码），然后再根据文中提到的针对非均匀数据集的处理方法，得到比较均匀的数据集。
其实生成的混淆集合不会很多，因为10num+26charac中字符容易混淆的就那么几种，所以最后一步将全级DCNN和混淆级DCNN结合和有必要。

学到的东西

对自动随机生成的数据集，可能出现数据集分布不均匀的处理方式：采用找差随机变换填补法保证每个标签类里的样本数均匀
训练和验证交互式学习算法：每次从训练集和验证集中随机选择少量样本训练，验证并且根据验证结果，将错误识别的样本更新入训练集中。然后重复上述操作，直至收敛。（这样做能够整个网络能够得到及时的反馈）

《A Low-Cost Approach to Crack Python CAPTCHAs Using AI-Based Chosen-Plaintext Attack》

基于AI的低成本破解python captcha的方法

2019

解决的问题

利用TensorFlow对象检测以及文中提到的峰值分给算法与卷积神经网络相结合，对两个开源的验证码库（claptcha和captcha）https://pypi.org/project/claptcha/进行识别（有与训练集可自己生成大大减少了计算机资源的使用，以及寻找训练集所需要的成本）

论文特点

利用以后的验证码生成库，可以无限的训练模型，使模型达到良好的标记效
利用目标检测算法能够很好地对字符进行定位
利用峰值分割算法很好地弥补了目标检测的一些不足

工作流程

利用上述的开源库代码，完成一个验证码生成器
利用TensorFlow 下的Google 目标检测对图像中的文字进行定位，找到每个文字的位置
利用峰值分割算法对目标检测算法进行扩展,使每个字符得到较好的分割（x为横向坐标，y为在该x下整列的值的和）
建立相应的神经网络，训练模型

需要改进的地方

对粘连的验证码很不友好

《Captcha Automatic Segmentation and Recognition Based on Improved Vertical Projection》

拟解决的问题：
解决很多粘连的验证码的分割问题，针对验证码的不同粘连程度提出来分割方式
大致思路：

对图片进行预处理：图片背景色处理，二值化，去燥（Hough转换，中值滤波）等操作
根据图片的粘连程度不同，以不同的切割算法对图片进行切割
通过图片与模块的匹配程度来对新的图片进行预测

值得说的一些细节

该项目的数据集来源于：The captcha dataset used in this paper came from ‘the Second National Big Data Technology Competition—Captcha Recognition Competition’ undertaken by DataCastle.
Hough转换：简单的获救在指教坐标系中的一条直线，转换到极坐标中是一个点。（用以去除干扰线）
定义图片的粘连程度以及分割算法（通过对图片的垂直投影进行观察）：
1. 如果两个字符之间有0投影的，则称该图片为无粘连图片，切割点：0投影位置坐标
2. 若两个字符之间没有0投影，且出现最高峰，最高峰的位置距离两个投影的中心的距离不超过5个像素，则称为图片为：共用线粘连。切割点：最高峰所在坐标点
3. 若两个字符之间没有0投影，且出现了最低谷，且最低谷距离两个投影的中心的距离不超过5个像素，则称该图片为：共用角粘连。切割点：谷底所在坐标
4. 若无上述特征的粘连图片，称为高度粘连。切割点：两个字符中间点的中心点

结果

改进方向
1. 可以考虑一种算法，通过对投影中连续几个相邻坐标点的分类，来斜向对图片进行切割。
2. 利用深度学习代替最后的通过对比样本与模块的匹配度来进行识别的操作

《A Multi-label Neural Network Approach to Solving Connected CAPTCHAs》

一种基于多标签神经网络的解决连通问题的验证码识别算法
论文目的
设计一种多标签卷积神经网络以不分割的方式来解决captchas（卷积被修改成不仅学习字符的特征还要学习每个字符所在位置）
数据集

Captcha 0.2.1：一个开源的验证码生成器。结果：测试集94%的正确率
百度验证码（1200个图像，手工标记）。结果：由于训练集过少，测试集只有43%的正确率

网络结构

Separate Convolutional Layers： 放入的图片首先通过Separate Convolutional Layers来提取不同位置的特征的信息。因为不同位置的信息应当不同，所以采用了4个没有参数共享的卷积块来进行特征提取。卷积块的详细结构如下：

Contact层： 每个验证字符的是否识别难度其实是和他的邻居的两个字符有关的，如下图，左边的W比右边的W难识别，是因为他和一个D挨着。因此有了这个contact层，也就是在考虑字符所在位置的特征同时也考虑其周围邻居的特征。

其他的全连接层就不赘述了。
论文特色

与传统方法相比，达到了端对端的效果，无需切割
考虑到了字符在不同位置之间的辨识程度，通过不同的卷积层抽象每个位置的的各个字符的特征
和一般的seq2seq相比，放弃了其统一提取特征的思路，不同位置的字符并没有共享参数。

《 Verification CAPTCHA Based on Deep Learning》

Tao Zhang, Honglei Zheng，Lele Zhang
总结

这篇论文主要是对于可切割的图片进行切割，然后利用卷积进行学习。
网络结构效仿VGGNet模型，如下：
本论文在分割的基础上，提出来端对端的识别。并且提出来LSTM等结构的引入

《A CAPTCHA recognition technology based on deep learning》

Yu Hu, Li Chen , Jun Cheng
拟解决的问题
避免定位与分割，对具有噪声背景和字符粘连，畸形的图片进行识别
数据集：利用python脚本生成

具体思路
1 对图片进行局部对比度归一化（在深度学习中对比度通常指的是图像或图像区域中像素的标准差）这里用以避免由于过多的绝对输入值引起的神经元输出饱和
2. 引入多任务学习的概念，识别每个字符相当于一个任务，而一张图片有5个字符。因此神经网络的输出应该是5*62个神经元
3. 网络结构：采用VGG-let的结构

4. 设置自学习率公式：
lr(i) = lr(0) * (1/(1+decay)*i)
lr(0)=0.001,decay =0.0001

论文优点

引入自学习率来加速模型的收敛速度
将多任务学习的概念引入，这里采用硬共享的方式建立模型，减少参数大小
利用VGG-Net网络的好处有：
- 3 * 3 是最小的能够捕获左、右、上、下和中心特征的尺寸；
- 两个 3 * 3 卷积连接可以视为 5* 5 的卷积，三个 3 * 3 的卷积连在一起可以视为 7*7 的卷积，多个小卷积层比一个大卷积层有更多的非线性，且具有更少的参数。

《Recognition of CAPTCHA Characters by Supervised Machine Learning Algorithms》

用监督机器学习算法识别CAPTCHA字符
2018
解决的问题
本论文主要比较了几个监督学习的算法针对于验证码识别的优劣，其中主要比较了：KNN，SVM，神将网络，决策树等对一种新型的验证码–气泡验证码进行识别。

关于气泡验证码的相关叙述请查看：BUBBLE CAPTCHA - A START OF THE NEW DIRECTION OF TEXT CAPTCHA SCHEME DEVELOPMENT
事列如下（这种数据集可以用PHP的相应库生成）：

特色：

通过设置固定的垂直投影以及二维颜色等两种标准来对图片进行切割
将预处理后的图片拉成一个1位向量作为机器学习的输入
对多种机器学习算法进行了评估（成本以及精确性）

缺陷
只是用常规的解决验证码识别的方法却解决了一种不常见的验证码

《Using Synthetic Data to Train Neural Networks is Model-Based Reasoning》

使用合成数据训练神经网络
解决的问题
为了解决数据问题：提出来一种基于概率合成数据的数据生成模型，能在训练时无限生成标记数据。并提出了一种用以识别图片风格以及字母的网络结构
论文思路

定义风格，不同网站的验证码风格图不同，如下：
做自定义了一个图片生成器，该生成器（每种风格的每种参数，都是在一个范围内的，可以均匀分布产生）可以通过输入固定格式的x，来进行图片的很成。这个x代表的就是图片的风格+内容。具体定义如下：

L 表示字母的个数
ε 1:K 表示一个1K维结构化参数集，用于控制Captcha渲染参数，如字距调整和各种特定于样式的变形
i1:L 表示1L维，表示具体的字母
将x作为图片生成器的输入，将图片生成器的输出作为神经网络的输入。损失函数为：softmax输出的对数的负和
该神经网络的结构如下：
对每次生成的数据有一个回溯的过程，也就是说开始的时候产生数据属于均匀分布，后面作者建立了一个概率模型，用以根据结果过改变数据的生成概率。

缺陷
该模型其实必须要了解所需要破解的验证码的风格，那么还是需要人为的进行测试定义，那么这样合成的过程是否和原网站所贴的验证码的过程相似，存在很大问题。
优点
该模型后面根据贝叶斯概率所建立的模型，可以很好地用以确定每条样本的重要程度

《Chinese Character CAPTCHA Recognition and Performance Estimation via Deep Neural Network》

拟解决的问题
提出一种网络结构用于识别汉字的笔画，词根以及其他特征，且准确率高于中文OCR软件Hanvon
数据集来源：使用Kptcha自动生成，生成了三种类型：#3D阴影，水波纹，语言
网络结构（在·letNet5的基础上加了一层卷积用以适应汉字的特殊性）

使用三个卷积层和二次采样层来学习汉字的结构。对于每个汉字，它通常由三个部分组成：笔画，字根和字符。因此，我们使用第一个卷积层和子采样层来学习图像中的笔画结构，然后第二个卷积层和子采样层用于学习字根，同理…
例如 “什”字，择优两个词根（一个“单人旁”，一个“十”）
论文特点
1.该论文很逻辑性的论述了网络结构这样设计的特点：
2.其传统机器学习算法以及letNet5的准确率进行了比较
3.利用控制变量法，讨论了卷积个数，feature map的数量等于精度，收敛速度的关系
4.很详细的利用控制变量讨论了准确率，训练迭代次数，样本数量，target的类别数的变化情况。得到结论：在足够的训练样本条件下，识别的准确性与训练样本数和迭代次数的乘积呈指数关系。

《A machine learning attack against variable-length Chinese character CAPTCHAs》

可变长度汉字验证码破解
2018
拟解决的问题
如题，在普通的汉字验证码识别的基础上提出来可变长度的验证码识别。并且提出了两种方法。

基于多尺度Gabor和基于逻辑回归的识别（MGLCR）
基于卷积神经网络的识别（CCR）

数据集主要来自于“中国国家企业信用信息网”，并且为了证明该算法的优劣，本文还找了其他各种类型的验证码进行测试

解决思路

图像预处理

利用高斯光滑，形态灰度化重建（膨胀和腐蚀）和Ostu方法（一种二值化的高效算法）对图像进行不同程度上的去噪。

2.图像的分割

图像的维度分类，根据图像的颜色分布，将图像分为：灰度图，均匀色彩图，不均匀色彩图
如下图所示，不同类的图像的维度是不同的）：
使用均值偏移聚类算法（爬山聚类），根据图像类别，确定其数据的维度，然后进行聚类，这里的类别数又算法自动确定。并且在聚类后，还需要进行一个聚类矫正的操作。（其实就是定义一个阈值把那些类中像素少的给剔除）

3.MGLCR：利用Gabor滤波器来提取图像特征，再利用PCA进行维度上的归一与降维,最后利用逻辑回归进行分类
4. CCR：卷积神经网络的结构如下：

论文优点
5. 将均值偏移聚类应用于图像分割，用以应对可变数据长度的验证码
6. 提出来一种比较新颖的识别算法：MGLCR
7. 采用多种算法对图片进行二值化处理，用以应付图片的各种噪点。

《A generative vision model that trains with high data efficiency and breaks text-based CAPTCHAs》

这篇论文是一篇science，论文主要提出了Recursive Cortical Network（RCN），看前言应该说的是一种通过概率图生成模型。。。不过感觉需要很多前驱只是，因此，还没有怎么读懂，先换一下，另开一章博客。

冒充顺华文庭内部群胜天半子毛顺华就是骗子，中粮仓智慧农业虚拟盘及早远离切勿被套！昌龙律法
人到老年，就怕手头没钱。一些不法分子利用老年人信息闭塞、认知较弱等特点瞄准了老年人的“钱袋子”花样百出实施诈骗老年人损失财产的同时还饱受精神打击不能忍！这些套路，应该让爸妈知道智慧农业，低碳环保双探交易市场，数字体育，人工智能十选五就是骗局我们曾曝光了无数种金融骗局，不知道能有多少人看到，能帮一个是一个，再次曝光一种炒股诱导做慈善参加数字经济的骗局，相信作为股民，大家都会经常接到一下分析个股，或者
人工智能真的能编程吗？研究勾勒出自主软件工程的障碍 WSSWWWSSW 人工智能软件工程
想象一下这样一个未来：人工智能悄然承担起软件开发的繁重工作：重构杂乱无章的代码、迁移遗留系统以及排查竞态条件，这样人类工程师就可以专注于架构、设计以及那些机器仍然无法解决的真正新颖的问题。最近的进展似乎让这个未来近在咫尺，但麻省理工学院计算机科学与人工智能实验室（CSAIL）以及其他几家合作机构的研究人员发表的一篇新论文指出，要实现这个潜在的未来，需要认真审视当前面临的挑战。这篇题为《面向软件工程
GPU 之后，IMU 登场：AI 发展的下一次飞跃
你早晨醒来，手机上的大模型帮你写完邮件、翻译合同，却依旧不能帮你把厨房里洒掉的牛奶擦干。你戴上的AR眼镜知道“那里有杯子”，却抓不到它——AI会说不会做。是不是哪里少了一截？人工智能（AI）的发展历程中，我们见证了从简单的数据处理到复杂的语言生成能力的飞跃。然而，尽管AI在虚拟世界中表现出色，它在物理世界中的表现却相对滞后。为了填补这一空白，AI正在进入一个新的发展阶段：行动驱动时代。在本文中，我
python学习路线（从菜鸟到起飞）突突突然不会编了 python 学习开发语言
以下是基于2025年最新技术趋势的Python学习路线，综合多个权威资源整理而成，涵盖从零基础到进阶应用的全流程，适合不同学习目标（如Web开发、数据分析、人工智能等）的学习者。路线分为基础、进阶、实战、高级、方向拓展五个阶段，并附学习资源推荐：一、基础阶段（1-2个月）目标：掌握Python核心语法与编程思维，熟悉开发环境。环境搭建安装Python3.10+，配置PyCharm或VSCode开发
京东零售重磅开源 | OxyGent：像搭乐高一样组装AI团队，实现群体智能京东零售技术零售开源人工智能
京东零售Oxygen团队正式开源发布多智能体协作框架——OxyGent。这一创新框架致力于帮助开发者高效组装多智能体协作系统，实现智能体间的无缝协作、弹性扩展与全链路可追溯。推动人工智能从“单点突破”迈向“群体智能”时代。OxyGent已在开源社区正式上线。开源地址：https://github.com/jd-opensource/OxyGent官网地址：https://oxygent.jd.co
具身智能的视觉-语言导航综述
24年2月来自曲阜师范、华东师大和哈工大的论文“Vision-LanguageNavigationwithEmbodiedIntelligence:ASurvey”。作为人工智能领域的长期愿景，具身智能的核心目标是提升智体与环境的感知、理解和交互能力。视觉-语言导航（VLN）作为实现具身智能的重要研究路径，致力于探索智体如何利用自然语言与人进行有效沟通，接收并理解指令，并最终依靠视觉信息实现精准导
具身智能：从理论到实践的跨越
具身智能（EmbodiedAI）的概念起源与发展是一个跨越半个多世纪的学术探索历程，其核心思想在不同学科的交叉碰撞中逐渐成型。以下从理论源头、技术奠基、术语演进三个维度展开解析，揭示这一概念的学术脉络与产业价值：一、理论源头：从图灵的哲学构想到认知科学的具身化转向1.图灵的"感官机器"设想（1950年）在人工智能奠基性论文《计算机器与智能》中，图灵提出了两种智能发展路径：抽象计算路径：如国际象棋等
生命3.0时代，面对人工智能时代的到来，我们可以做些什么笃定的沙丁鱼
生命的定义生命的定义有很多，最为人所熟知的是在生物学上的定义，即生命是蛋白质存在的一种形式。但是，这种定义可能不太适用于未来的智能机器和外星文明，我们不能将我们对未来生命的思考局限在过去遇到过的物种，所以需要将生命定义得更广阔一些：生命是一个能保持自身复杂性并能进行复制的过程。复制的对象并不是由原子组成的物质，而是能阐明原子是如何排列的信息，这种信息由比特组成。换句话说：我们可以将生命看作一种自我
不正规不靠谱：假摩根士丹利内部群推荐绿色低碳减排平台骗局揭露!送一万体验资金做慈善全是假的! 易星辰分享普法
关于曝光网上摩根士丹利何晓斌宝丰能源节能减排在炒股群推荐智慧农业中粮仓平台骗局的文章，其内容主要揭示了近期频发的一种投资诈骗手段。以下是该骗局的主要特点和步骤：为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”
假冒朱民！通达OA社科院朱民ST-balance项目就是假的，被骗亏损真相揭秘，亲身亏损经历正义青天
通达OA社科院朱民ST-balance项目不正规——杀猪盘不能提现投票骗局曝光！随着互联网的普及，数字经济蓬勃发展，各种线上平台如雨后春笋般涌现。然而，在这些看似繁荣的平台中，不乏一些黑平台，它们以欺诈手段骗取用户的财产，给人们的财产安全带来严重威胁！因此，我们有必要提高警惕，防范黑平台诈骗。针对网上素未谋面的牛散大咖，经济学家等推荐网上投资理财、数字经济，数字体育市场，人工智能项目，数字低碳，慈
基于深度学习的语音识别：从音频信号到文本转录 Blossom.118 机器学习与人工智能深度学习语音识别音视频人工智能机器学习线性代数计算机视觉
前言语音识别（AutomaticSpeechRecognition,ASR）是人工智能领域中一个极具挑战性和应用前景的研究方向。它通过将语音信号转换为文本，为人们提供了更加自然和便捷的人机交互方式。近年来，深度学习技术在语音识别领域取得了显著进展，极大地提高了语音识别的准确率和鲁棒性。本文将详细介绍如何使用深度学习技术构建一个语音识别系统，从音频信号的预处理到模型的训练与部署。一、语音识别的基本概
普通人想利用AI变现，这5个赛道不能错过！浮沉导师
随着人工智能技术的迅猛发展，越来越多的普通人开始关注如何利用AI实现变现。AI不仅改变了我们的工作方式，也创造了众多赚钱的机会。本文将介绍五个值得关注的AI赛道，帮助你抓住这些机会，实现收入增长。【高省】APP网购优惠券免费领，分享还能赚钱。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台。佣金更高，模式更好，终端用户不流失。0投资，稳定可靠，百度有几百万篇报道，期待你的加入。应用市场下载【高省
AI人工智能 Agent：金融投资中智能体的应用 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能Agent：金融投资中智能体的应用1.背景介绍在金融投资领域，人工智能（AI）技术的应用已经成为一种趋势。随着数据量的爆炸性增长和计算能力的提升，AI技术在金融市场中的应用变得越来越广泛和深入。智能体（Agent）作为AI技术的重要组成部分，能够在金融投资中发挥重要作用。智能体可以通过学习和适应市场环境，自动执行交易策略，优化投资组合，甚至预测市场趋势。2.核心概念与联系2.1智能体（
对话谷歌前 CEO Eric Schmidt：数字超智能将在十年内到来，AI 将创造更多更高薪的工作 AI科技大本营人工智能
责编|王启隆出品|CSDN（ID：CSDNnews）投稿或寻求报道|[email protected]科技巨擘、谷歌前CEOEricSchmidt最近做客PeterDiamandis的Moonshots播客，与主持人PeterDiamandis及DaveLondon展开了一场关于人工智能未来的深度对话。全世界都在为AI的飞速发展感到兴奋又焦虑时，这位曾经执掌谷歌帝国长达十年、亲眼见证并推动了这场技术
格灵深瞳视觉算法面试30问全景精解机＿长算法面试职场和发展
格灵深瞳视觉算法面试30问全景精解——AI感知×智能安防×场景创新：格灵深瞳视觉算法面试核心考点全览前言格灵深瞳（GREATVISION）作为国内领先的人工智能与计算机视觉企业，专注于智慧安防、智能交通、智慧零售等领域，推动视觉算法在大规模城市级场景的落地。格灵深瞳视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在复杂场景下的创新能力与工程实践。本文精选30个高质量面试问题，涵盖基
商汤科技视觉算法面试30问全景精解
商汤科技视觉算法面试30问全景精解——AI赋能×智能视觉×产业创新：商汤科技视觉算法面试核心考点全览前言商汤科技（SenseTime）作为全球领先的人工智能平台公司，专注于计算机视觉、深度学习和智慧城市、智能汽车、智能医疗等领域，推动人脸识别、目标检测、视频分析、自动驾驶等前沿技术的产业化落地。商汤视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、自动驾驶、智慧医疗等复
旷视科技视觉算法面试30问全景精解机＿长科技算法面试深度学习 YOLO
旷视科技视觉算法面试30问全景精解——AI赋能×智能安防×视觉创新：旷视科技视觉算法面试核心考点全览前言旷视科技（Megvii）作为全球领先的人工智能公司，专注于计算机视觉、深度学习和智能安防等领域，推动人脸识别、目标检测、视频分析、工业视觉等前沿技术的产业化落地。旷视视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、工业检测、智慧城市等复杂场景下的创新与工程能力。本文
今日播报！庆衍书院郭庆旺被骗黑幕曝光，KSD2.0光伏市场不能出金不要再次踏入！法律咨询维权
社交平台有这样一种群，群里都是“理财专家”“炒股大神”“操盘高手”，不仅每天免费授课、推荐牛股，还有助理“一对一”指导具体操作。针对网上素未谋面的牛散大咖，经济学家等推荐网上投资理财、数字经济，数字体育市场，人工智能项目，数字低碳，慈善投票网站买数字的等等都是骗局，广大市民对此要提高警惕，遇到此类情况一概不要相信。咨询顾问：182--71402640（电微同号）数字经济数字体育数字农业慈善投票大赛
大模型软件的多租户架构设计 AI天才研究院 AI人工智能与大数据 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
大模型软件的多租户架构设计关键词：大模型软件、多租户架构、设计、性能优化、安全性摘要：随着大数据和人工智能技术的迅猛发展，大模型软件在各个领域得到了广泛应用。然而，如何在大模型软件中实现高效的多租户架构设计，成为当前技术领域的一个关键挑战。本文将深入探讨大模型软件的多租户架构设计，包括其背景、核心概念、算法原理、系统架构、项目实战以及最佳实践等，旨在为开发者提供一套系统化、全面化的设计指南。设计过
AI人才实在太抢手！顶级科学家年薪超7000万：中高级也能过千万程序员超超人工智能 transformer 深度学习 java spring boot ai 大模型
快科技7月2日消息，据媒体报道，激烈的人工智能人才争夺战，导致一些顶尖资深研究科学家的年薪超过1000万美元（约7167万元人民币）。而典型的薪资方案则处于300万至700万美元区间，相较于2022年，这一数字实现了约50%的增长。薪酬追踪网站Levels的统计数据显示，Meta给予AI工程师的薪酬范围为18.6万至320万美元，OpenAI则在21.2万至250万美元之间；若以薪酬中位数来衡量，
边缘计算与量子模型优化驱动医疗诊断新突破
内容概要在医疗人工智能领域，边缘计算与量子模型优化的协同演进正重构诊断系统的技术范式。通过将计算节点前置至医疗设备端，边缘架构有效解决了传统云端模型面临的实时性瓶颈，配合量子优化算法对复杂特征空间的快速寻优能力，使得CT、MRI等高维影像数据的解析效率提升显著。值得关注的是，框架选型直接影响着模型部署的可行性——TensorFlow在移动端推理优化方面的工具链完备性，与PyTorch动态图机制对迭
量子生成对抗网络：量子计算与生成模型的融合革命牧之112 量子计算生成对抗网络人工智能
引言：当生成对抗网络遇上量子计算在人工智能与量子计算双重浪潮的交汇处，量子生成对抗网络（QuantumGenerativeAdversarialNetworks,QGAN）正成为突破经典算力瓶颈的关键技术。传统生成对抗网络（GAN）在图像生成、数据增强等领域已取得辉煌成就，但其参数规模与计算复杂度随着数据维度呈指数级增长。量子计算的叠加性、纠缠性和并行性，为解决这一矛盾提供了全新思路。2025年，
OpenAI模型可解释性工具：理解AI的黑箱 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能百度 ai
OpenAI模型可解释性工具：理解AI的黑箱关键词：OpenAI模型、可解释性工具、AI黑箱、模型理解、人工智能摘要：本文旨在深入探讨OpenAI模型可解释性工具，帮助大家理解AI这个“黑箱”。首先介绍了研究的背景、目的和预期读者，接着解释了核心概念，包括OpenAI模型、可解释性工具等，阐述了它们之间的关系。通过核心算法原理、数学模型和公式的讲解，让大家明白其内在机制。还给出了项目实战案例，包括
骗局套路：卧虎藏隆应天书府隆国强被骗无法提现！讲述背后事实！正义青天
为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”是真的吗？为什么不能提现呢？其实都是骗子给你的一串数字而已！近期作者接触到了很多投资者被所谓的“隆国强”（骗子假冒）在卧虎藏隆应天书府带单的案例。这些新平台打着
7篇1章7节：机器学习算法解读，与数值预测回归模型构建 MD分析用R探索医药数据科学机器学习算法回归 r语言数据挖掘
机器学习是当今数据分析和人工智能的核心工具之一，其算法广泛应用于分类、回归、排序和推荐等领域。本篇将详细讲解机器学习的四大经典算法类型，并以回归问题为例深入探讨数值预测的关键步骤，包括数据准备、线性回归模型构建、模型预测及误差评估，帮助读者更系统地理解和掌握机器学习的基础知识及实际应用。一、机器学习的算法在数据科学和人工智能的浪潮中，机器学习算法成为了解决各种数据问题的关键工具。机器学习主要处理四
假冒振我中华第六届内部操盘群毛振华不正规!未来低碳项目不能提现难友真实经历告诉你! 法律咨询维权
随着互联网的普及和金融科技的发展，越来越多的人开始使用线上平台进行投资、交易等活动。然而，一些不法分子也利用这些平台实施诈骗行为，给投资者带来了巨大的损失。本文将介绍一种常见的骗局——黑平台无法出金，以帮助大家提高警惕性，避免上当受骗。推荐网上投资理财、数字经济、数字体育、人工智能，数字农业慈善投票网站买数字的等等都是，广大市民对此要提高警惕，遇到此类情况一概不要相信。（注明：该文章出现名字为网上
ai绘画生成软件哪个好？几款好用的AI绘画软件分享! 呼酱小宝箱
随着人工智能技术的不断发展，越来越多的AI绘画生成软件被开发出来。这些软件利用深度学习技术，可以将普通照片或图像转化成具备艺术效果的画作。那么，ai绘画生成软件哪个好？首先，让我们来看一下几个常见的AI绘画生成软件，它们分别是：1、DeepDreamDeepDream是由Google开发的一款AI绘画生成软件。它通过卷积神经网络对输入的图片进行处理，从而生成出具有艺术风格的画作。DeepDream
生成式 AI：从 “理解” 到 “创造” 的突破田园Coder 人工智能科普人工智能科普
1.生成式AI的定义：让AI从“识别”走向“创造”1.1什么是生成式AI生成式AI是一类能自主生成新内容（文本、图像、音频、视频等）的人工智能技术。与传统“判别式AI”（如人脸识别、垃圾邮件过滤，专注于分类和判断）不同，生成式AI的核心是“创造”——它能基于学习的规律，生成与训练数据相似但全新的内容。例如，判别式AI能判断“这是一幅梵高的画”，而生成式AI能模仿梵高的风格创作一幅全新的油画；判别式
青少年人工智能Python编程水平测试四级模拟试卷9 试题解析编程小伙伴测评网 YCL 试题详解 python 开发语言少儿编程青少年编程算法数据结构排序算法
1、以下选项中，说法正确的是？（）A、条件1and条件2，表示条件满足其中1个即可B、条件1or条件2，表示2个条件需要同时满足C、and和or不能在一个条件表达式中同时使用D、andor一般和if语句搭配使用正确答案：D试题解析：and是逻辑与，同时满足结果才满足；or是逻辑或，满足一个结果就是满足；
青少年人工智能Python编程水平测试四级模拟试卷5 试题解析编程小伙伴测评网 YCL 试题详解 python 开发语言少儿编程青少年编程算法推荐算法
【单选题】（每题2分）1、运行下列代码后，输入4，输出的结果是？（）num_1=input()num_2="3"print(num_1+num_2)A、7B
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后