一点一滴的Beer

[验证码识别技术]字符验证码杀手--CNN

字符验证码杀手--CNN

1 abstract

目前随着深度学习，越来越蓬勃的发展，在图像识别和语音识别中也表现出了强大的生产力。对于普通的深度学习爱好者来说，一上来就去跑那边公开的大型数据库，比如ImageNet或者CoCo，可以会觉得这个屠龙之技离生活好遥远。那么本文就是希望将此技术运用到一些普通用户日常就能感知的场景上，让普通用户切实能够体会到深度学习工具的非凡能力。

关键字:深度学习,验证码,破解,识别,CNN

2 验证码概述

很多普通程序员在入门爬虫的时候，基本上都会遇到的环节---“验证码”。就是这个东西使得很多程序的自动化工作止步，让人懊恼不已。关于验证码的功能，以前提到过（todo)，本文不再赘述，只用一句话来概括下：验证是一种防止程序自动化的一个措施，其最常见的表现形式就是看图识别字符。

验证码技术就是一种反自动化技术。本文所解决的问题则是，使用深度学习技术来实现“全自动化的识别验证码”（这听起来有那么点人工智能的味道了）。

因为现在新的形式的验证产品很多，光从外界的展现形式上就有：

完整滑动解锁式
随机滑动拼图式
随机点选汉字式
图片分类选择式
其它

但是本文是以学习为目标，并不指向任何一种验证形式，而是指向传统的字符型验证码。由浅入深来对验证码进行一些科普。下图就是网络上的各色各样的字符型验证码，敬请大家赏析：

3 验证码场景

首先说明本文的观点：随着深度学习技术在图像处理技术上越来越强大的表现，这些传统的纯依靠简单图片的码式验证已经没有任何的安全性可言。

但是这些不安全的验证码却即使是在今天写这篇文章的时候，还存在于互联网的各个角落，存在于大互联网公司，基于像银行，证券和保险等等这些金融领域。

这些主要的应用场景包括：注册，登录，找回密码，抢购下单，评论，投票等等。如果这个地方不安全的话，也就是说能够通过程序做自动化，那么网络上的资源就会全部被自动化程序抢夺过去，或者说直接落入少数会做自动化的人的手中。为什么呢？因为普通计算机程序的计算能力是人的几万甚至几百万倍。

如果还不能理解，我说一个简单的例子吧，如果你自己去注册你的帐号密码需要3分钟完成，但是通过程序可以一秒钟注册300个账号。讲到这个地方，如果你还不理解，那么你想象在去年的时候互联网金融行业非常火爆时，每注册一个账号就有20块钱可以拿。也就是说比较厉害的人可以通过这个程序，一秒钟赚6000块钱。

如果你还不能理解这个东西的话，再举一些和大家日常生活中非常相关度高的一个场景：

网上春节购买火车票。春节的时候大家会买火车票吧？你是不是发现你守在电脑面前不管怎么用心，不管怎么努力，结果发现放出火车票的时候，那些票一扫而光？然后发现身边好多人都没买到票，但是网上黄牛那儿却票源充足，但是不好意思，得加价。
网上手机新品发布秒杀。国内大厂手机新品发布时，网上瞬间秒光，自己买不到，但是黄牛那儿也有，得加钱。
网上开盘选房子。你要买房子，网上开盘选房，虽然你已经做好了不看户型，有房就抢的准备，但是开盘瞬间，你就发现网络被挤爆，然后等线上网页缓过来时，房子已经完了。但是身边加钱找专业人员代抢的人却抢到了房子，为什么？
网上拍汽车牌照。在国内某些大城市里面对于汽车牌照的发放量的把控是是非常严格的。每次在网上拍牌照的那天，很多人都会请假一天，然后在一个网络环境非常好的网吧里面等待来处理这个事情，但是发现还是抢不过别人付费请的专业团队的那些人。当然抢不过有一方面是自己业务不熟悉的原因，还有一方面就是：可能你在拿一个小铲子的辛苦的小打小闹的，别人直接操纵在一个大型挖掘机上战场了。生产力是完全不一样的。

类似的事情特别特别多。这个产业就叫做“薅羊毛”，顾名思义就是积少成多，有很小的成本把一点点的小的利益聚集起来就会变成一个比较可观的利益。

4 应用举例

4.1 互联网大厂

4.1.1 美橙互联

https://www.cndns.com/members/signin.aspx

4.1.2 中国互联网络信息中心

http://www.cnnic.net.cn/

4.1.3 百度

https://wappass.baidu.com/

4.1.4 阿里支付宝

https://omeo.alipay.com/service/checkcode?sessionID=a2a5fc056b8e3ef8b32758835333d673&t=0.3144848125469759

4.1.5 网易邮箱

http://reg.email.163.com/unireg/call.do?cmd=register.entrance&from=163navi®Page=163

4.1.6 58同城

https://passport.58.com/validcode/get?vcodekey=d5S2Tk7dofqN30VwIN6WTwvOHP6AkyvC&time=1466065243496

4.2 互联网金融

4.2.1 平安保险

https://www.pingan.com.cn/pinganone/pa/index.screen?sid_source=toagw

4.2.2 宜信

https://www.creditease.cn/a/user/loadRegisterUserPage

4.2.3 大地保险

http://www.95590.cn/ebiz/loginSkin.jsp?loginBackUrl=http://www.95590.cn/

5 图像识别

下面是字符验证码两种比较极端的表现形式：

简单类型的特点：

背景和前景可以很容易完全分离
字符的取值范围仅为[0,9]这样的最小有限域
生成图片的字符为单一字体
多位字符串可以通过简单算法进行完美切割

复杂类型的特点：

背景有随机干扰点或者干扰线条
字符范围为所有数字，字母，甚至汉字集
生成的图片的字体多样化
多位字符在图片上的位置出现重合，无法完美切割

在上一部分内容中举的现在线上应用的例子，基本上属于比较复杂的类型，但是由于它的设计理念仍然停留在图像学上，所以对于现在的CNN来说，是完全没有技术上的问题，毕竟很多深度学习框架的入门教程就是对手写数字数据库MNIST进行识别。它们有的区别只是前期准备工作的工作量的不同，这里所说的前期准备工作就是指：带标记的数据的准备工作。所谓的“带标记的数据”是指，需要人预先告诉计算机什么样的图片对应着是什么样的字符串，因为本问题中所用的CNN方法是属于有监督学习的范围，需要有个场外的“老师”进行指导。

关于上面两种极端的字符验证码的识别的技术方法，请移步文章末尾链接。

里面有两个例子，并附上了完整的源码：

使用传统机器学习SVM对简单验证码识别
使用CNN对多位字符验证端到端的识别

当然后面的那种CNN的方法是对于解决此类问题是属于核武器级别的，CNN模式的优点缺点都很明显：

- 优点：通用性强，换一个模式后，可以不用修改代码就可以直接训练出新的模型。

- 缺点：需要大量的带标注的数据，特别是端到端的复杂一点的，可能需要几万带标记的先验数据集。

在CNN的文章中给出的demo，因为只是做效果演示，里面的数据集的生成是直接用的第三方标准库无限生成的。如果是在具体的场景去使用，则需要准备大量的带标记数据，像本文提到的困难的字符验证，如果要达到90%以上的正确识别率，估计需要5万带标记数据。下图是生成的部分先验数据集：

对于不同的多字符验证码，根据其难易程度分类，可以有一些不同的处理方式，有“蛮力型”的通用识别方法，也有“特事特办”的特别识别方法。

5.1 通用识别方法

所谓的通用识别方法就是：流程化作业，基本不太需要在编程上思考太多。

通用步骤如下：

下载一定数量的目标验证码图片。根据验证图片的复杂程度而定，有的需要几百张，有的需要几万张。
已经事先准备好一套标准的CNN图像分类的项目模板，需要事先做好的功课。
对项目模板进行简单的参数调整，以适配当前问题的图片尺寸。
将图像输入CNN，将输出的结果和先验标记的类型做误差对比
不断迭代生成模型

这其实是一个深度学习对分类问题处理的标准化流程。有不明白的地方，请补充一点相关的知识：

https://www.tensorflow.org/get_started/mnist/beginners

https://www.tensorflow.org/get_started/mnist/pros

由Google公司主推的深度学习框架tensorflow的入门文档里面就介绍了分别用矩阵回归和CNN神经网络对手写数字识别的方法。

当然，关于如何获取带标记的数据，目前也有比较便宜的获取渠道，直接在网上搜索“打码平台”，提供这“人工智能”领域的“人工”服务的厂家也不少，而且是明码标价：

对于字符型验证码，基本上是几分钱一张标记图吧。

5.2 特别识别方法

虽然上面的通用型方法可以百试不爽，但是每次来一个新的问题，你都要准备大量的带标记数据，这个未免也太繁琐了，而且像一些简单的字符验证码的问题，其实倒没有必要去大动干戈。那么这个时候就需要一些小的技巧了。

这里所说的特别识别方法，仍然是基于深度学习这种通用方法来做的，只是我们可以将一些复杂问题进行适当的简化，这个思想有点类似于“降维”处理的意思。

因为深度学习具有这样的神奇效果：理论上对绝大多数的线性或者非线性问题都能实现非常好的拟合。

但是对于越复杂的问题，对数据的需求量越大。这个现状是无法避免的，但是我们却能够做一些人为的自动化工作，以达成此目标。

比如像这些验证：

不管它们色彩有多么的变化，不管背后加些啥乱七八糟的干扰点或者线，但是有一个事实他们无法回避，就是：他们的字符之间都是非常好分割的。也就是说，像这些类型的验证码，可以很容易将一个本来要判定N位字符串的问题简化为“判定1位字符，然后将N个这样的图片再组合起来”。这样网络的复杂度可以大大的简化，训练所需要的样数量，还有训练的时长都会大量减少。

如果验证码图片可以从N维“降维”到1维了，这个字符的字体如果是单一的，比如下面这些验证：

那么问题就更简单了：只需要为每个字符分类准备一张图片即可。也不是说如果你的验证码范围是[0,9]，则只需要从下载的图片集中对0～9这几个数字每个标记一张即可，然后就是使用一些普通的数据增强技术：贴图，绽放，上下自由截取，随机噪点等等，可以生成无限多的数据集了，当然这些全部是由程序自动化完成。

好的图像预处理也很重要，所谓好的图像预处理，就是指能够将图像里面的主体特征变得更加明显，例如：

好的图像预处理会使识别问题难度直线下降，比如上面左图如果用CNN估计可能要1万样本，而右边的那个经过预处理后，估计只需要1千样本就OK了。

关于如何做数据增强，在后续的文章中会进行具体介绍。

6 文末小结

如果对本话题有兴趣请持续关注本系列文章。

如果还想进一步讨论相应的技术，请加入QQ群：592109504

手机QQ扫描二维码：https://mp.weixin.qq.com/s/7RCtZH0ljuF5Ti6jgQxyww

验证识别合辑技术文章：https://zhuanlan.zhihu.com/p/30871712

后续会有更多干货文章，敬请期待。。。

我的博客即将搬运同步至腾讯云+社区，邀请大家一同入驻：https://cloud.tencent.com/developer/support-plan

你可能感兴趣的:([验证码识别技术]字符验证码杀手--CNN)

程序化广告行业（27/89）：供应商筛选、比稿流程与广告透明化要点 lilye66 程序化广告 sqlserver 数据库 cloudera 大数据
程序化广告行业（27/89）：供应商筛选、比稿流程与广告透明化要点在数字化营销浪潮中，程序化广告已成为企业精准触达目标受众的重要手段。一直以来，我都期望和大家一同深入钻研技术领域知识，实现共同进步。今天，咱们继续剖析程序化广告行业，聚焦在供应商筛选、比稿流程以及广告透明化这些关键环节，帮助大家更好地理解这一行业的运作机制。供应商筛选与比稿流程详解供应商入库评估要点在程序化广告投放中，供应商的选择至
图像处理之白平衡（附源码） FPGA工程狮-阿水 Python图像处理图像处理人工智能 python isp
图像处理之白平衡（附源码）概要白平衡（WhiteBalance）是图像处理和摄影中的一种技术，旨在消除由于光源色温差异导致的颜色偏差，使得图像中的白色和其他颜色呈现出自然、真实的效果。基本概念白平衡是调整图像中各个颜色通道（红色、绿色和蓝色）的亮度和色彩平衡，以消除由不同光源（如日光、白炽灯、荧光灯等）产生的色偏。其目的是让图像看起来像是在中性白光下拍摄的，从而确保图像中的白色看起来确实是白色，其
【Jmeter】前置处理器实战：「BeanShell 预处理程序」参数化手机号码、身份证号顾三殇 JMeter 从入门到软件测试实战 jmeter
一、实战场景业务场景：常见业务管理系统测试中，个人信息档案的自动化批量生成，需要贴近实际进行入参，在姓名、手机号码、身份证号、生日、性别中，这五者有着各自的行业规范格式，而生日、性别有时是由身份证号默认带出数据的信息，数据输入规范：·姓名：“姓”在百家姓中任意取一，“名”任意，均为对字符串的随机取值，字数为2~18字·手机号码：11位整数，“手机号码”规范格式，比如188、135等开头的号码为有效
【加密】常用加密算法 llzcxdb java 开发语言
非对称加密非对称加密是一种加密技术，也称为公钥加密。它使用一对密钥：公钥和私钥。公钥可以向任何人公开，用于加密信息，而私钥则是保密的，用于解密信息。这种加密方法确保了数据的安全传输，因为只有拥有对应私钥的人才能解密通过公钥加密的信息。非对称加密的一个主要特点是，即使公钥被他人获取，他们也无法解密密文，因为缺乏与之配对的私钥。常见的非对称加密算法包括RSA、椭圆曲线加密（ECC）和数字签名算法（DS
处理文本的原则 the only KIrsTEN 语音和文本处理(Python)
没有字符编码方案本身就是目的：它是一种启用计算机上有用的文本处理。•计算机预期支持的基本低级文本处理包括：使字符可见（包括连字、上下文形式等）渲染时断线（包括断字）修改外观，例如点大小、字距、下划线、倾斜和重量（轻，半，粗体等）确定“单词”和“句子”等单位在选择和突出显示文本等过程中与用户交互通过插入和删除接受键盘输入和编辑存储的文本比较操作中的文本，例如排序或确定排序顺序两串分析文本内容，例如拼
LeetCode——1864. 构成交替字符串需要的最小交换次数(Minimum Number of Swaps to Make the Binary...)[中等]——分析及代码（Java）江南土豆数据结构与算法 LeetCode Java 题解
LeetCode——1864.构成交替字符串需要的最小交换次数[MinimumNumberofSwapstoMaketheBinaryStringAlternating][中等]——分析及代码[Java]一、题目二、分析及代码1.模拟（1）思路（2）代码（3）结果三、其他一、题目给你一个二进制字符串s，现需要将其转化为一个交替字符串。请你计算并返回转化所需的最小字符交换次数，如果无法完成转化，返回
(LeetCode每日一题) 1963. 使字符串平衡的最小交换次数(贪心、双指针) 岁忧 java版刷题 LeetCode leetcode 算法职场和发展 java c++
题目：1963.使字符串平衡的最小交换次数方法一：对于符合要求的字符串，需要任何[0,i]部分，“[”都不比“]”少。[视为+1，]视为-1，那么任何前缀和sum都不能出现sum0){sum--;}else{while(s[j]!='['){j--;}s[j]=']';sum++;ans++;}}}returnans;}};JAVA版本：classSolution{publicintminSwap
【数据结构-合法括号字符串】力扣1963. 使字符串平衡的最小交换次数 hlc@ 数据结构数据结构 leetcode 算法
给你一个字符串s，下标从0开始，且长度为偶数n。字符串恰好由n/2个开括号‘[’和n/2个闭括号‘]’组成。只有能满足下述所有条件的字符串才能称为平衡字符串：字符串是一个空字符串，或者字符串可以记作AB，其中A和B都是平衡字符串，或者字符串可以写成[C]，其中C是一个平衡字符串。你可以交换任意两个下标所对应的括号任意次数。返回使s变成平衡字符串所需要的最小交换次数。示例1：输入：s=“][][”输
LeetCode1963. 使字符串平衡的最小交换次数超好的小白各种算法题算法
给你一个字符串s，下标从0开始，且长度为偶数n。字符串恰好由n/2个开括号‘[’和n/2个闭括号‘]’组成。只有能满足下述所有条件的字符串才能称为平衡字符串：字符串是一个空字符串，或者字符串可以记作AB，其中A和B都是平衡字符串，或者字符串可以写成[C]，其中C是一个平衡字符串。你可以交换任意两个下标所对应的括号任意次数。返回使s变成平衡字符串所需要的最小交换次数。示例1：输入：s=“][][”输
lxml模块的学习 bad kid's cute lxml模块 lxml模块 python 爬虫
1.lxml的认识在前面学习了xpath的语法，那么在代码中我们如何使用xpath呢，对应的我们需要lxm博文链接：xpath和lxml类库安装方式：pipinstalllxml2.lxml的使用1.导入lxml的etree库(导入没有提示不代表不能用)fromlxmlimportetree2.利用etree.HTML，将字符串转化为Element对象,Element对象具有xpath的方法,返回
大模型黑书阅读笔记--第一章 53年7月11天大模型黑书笔记人工智能自然语言处理语言模型
cnn,rnn达到了极限，憋了三十年（这段时间已经有注意力了，并且注意力也加到了cnn，rnn中，但没啥进展）憋来了工业化最先进的transformertransformer的核心概念可以理解为混合词元（token），rnn通过循环函数顺序分析次元，而transformer模型不是顺序分析，而是将每个词元与序列中其他词元关联起来。为突破cnn的极限，注意力的概念出来了：cnn做序列处理时只关注最后
AI学习第二天--监督学习半监督学习无监督学习 iisugar 机器学习支持向量机人工智能
目录1.监督学习（SupervisedLearning）比喻：技术细节：形象例子：2.无监督学习（UnsupervisedLearning）比喻：技术细节：形象例子：3.半监督学习（Semi-SupervisedLearning）比喻：技术细节：形象例子：4.三者的对比与选择表格总结：5.实际案例对比案例：电商平台用户分群6.关键逻辑总结1.监督学习（SupervisedLearning）比喻：老
【华为OD-E卷 -123 判断一组不等式是否满足约束并输出最大差 100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享华为od python java javascript c++
【华为OD-E卷-判断一组不等式是否满足约束并输出最大差100分（python、java、c++、js、c）】题目给定一组不等式，判断是否成立并输出不等式的最大差(输出浮点数的整数部分)要求:不等式系数为double类型，是一个二维数组不等式的变量为int类型，是一维数组;不等式的目标值为double类型，是一维数组不等式约束为字符串数组，只能是:“>”,“>=”,“<”,“<=”,“=”，例如，
【华为OD-E卷 -122 字符统计及重排 100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享 python 华为od java c++javascript
【华为OD-E卷-字符统计及重排100分（python、java、c++、js、c）】题目给出一个仅包含字母的字符串，不包含空格，统计字符串中各个字母（区分大小写）出现的次数，并按照字母出现次数从大到小的顺序。输出各个字母及其出现次数。如果次数相同，按照自然顺序进行排序，且小写字母在大写字母之前输入描述输入一行，为一个仅包含字母的字符串输出描述按照字母出现次数从大到小的顺序输出各个字母和字母次数，
【华为OD-E卷-02 最多提取子串数目100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享华为od python java c++javascript
【华为OD-E卷-最多提取子串数目100分（python、java、c++、js、c）】题目给定[a-z]，26个英文字母小写字符串组成的字符串A和B，其中A可能存在重复字母，B不会存在重复字母，现从字符串A中按规则挑选一些字母，可以组成字符串B。挑选规则如下：同一个位置的字母只能挑选一次被挑选字母的相对先后顺序不能被改变求最多可以同时从A中挑选多少组能组成B的字符串。输入描述输入为2行，第1行输
JS逆向案例-致远OA的前端密码加密逆向分析布啦啦李我的渗透笔记 python JS逆向 javascript逆向致远OA 密码爆破防范措施 js逆向
免责声明本文仅为技术研究与渗透测试思路分享，旨在帮助安全从业人员更好地理解相关技术原理和防御措施。任何个人或组织不得利用本文内容从事非法活动或攻击他人系统。如果任何人因违反法律法规或不当使用本文内容而导致任何法律后果，本文作者概不负责。请务必遵守法律法规，合理使用技术知识。一、致远OA的登录过程1.1实验版本致远A6+协同管理软件V8.0SP2用户名不变，密码加密，无验证码。1.2登录过程步骤操作
JavaScript基础-DOM 简介難釋懷 javascript 开发语言
在现代Web开发中，JavaScript与HTML和CSS一起构成了网页的核心技术。而在这三者之中，DOM（DocumentObjectModel，文档对象模型）作为浏览器处理网页内容的一种接口，扮演着至关重要的角色。通过DOM，JavaScript能够动态地访问和操作网页的内容、结构以及样式。本文将介绍DOM的基本概念、核心组成部分以及如何使用JavaScript来操作DOM。一、什么是DOM？
JAVA中List数组与泛型 Yeauty java 泛型
去除ArrayList中重复字符串元素方式A:案例演示需求：ArrayList去除集合中字符串的重复值(字符串的内容相同)思路：创建新集合方式/***A:案例演示*需求：ArrayList去除集合中字符串的重复值(字符串的内容相同)*思路：创建新集合方式*/publicstaticvoidmain(String[]args){ArrayListlist=newArrayList();list.ad
《基于机器学习的负荷曲线聚类算法对比与改进：K-L-isodata的创新性研究》 TWHiwhjig 机器学习算法聚类
基于机器学习的负荷曲线聚类包括kmeansisodata和改进的L-isodata以及在其基础上再次进行改进的K-L-isodata(有创新性)，四者通过评价指标进行了对比精品代码可修改性极高有参考文献ID:93150688324967700自律的电气人基于机器学习的负荷曲线聚类是一种基于数据分析和模式识别的技术，它可以帮助我们对系统的负荷变化进行分类和理解。在负荷曲线聚类的研究中，K-means
【C++经典例题】反转字符串中单词的字符顺序：两种实现方法详解倔强的石头_ C++经典例题 c++java 算法
博客主页：倔强的石头的CSDN主页Gitee主页：倔强的石头的gitee主页⏩文章专栏：C++经典例题期待您的关注目录问题描述基于快慢指针的解法基于索引的解法两种方法的比较问题描述在处理字符串相关的问题时，反转字符串中每个单词的字符顺序是一个常见的任务，同时要保证空格和单词的初始顺序不变。给定一个字符串s，你需要反转字符串中每个单词的字符顺序，同时仍保留空格和单词的初始顺序。s包含可打印的ASCI
一条查询sql的执行流程和底层原理 weixin_30608503 大数据数据库
1、一条查询SQL执行流程图2、查询SQL执行流程之发送SQL请求（1）客户端按照Mysql通信协议将SQL发送到服务端，SQL到达服务端后，服务端会单起一个线程执行SQL。（2）执行时Mysql首先判断SQL的前6个字符是否为select。并且语句中是否带有SQL_NO_CACHE关键字，如果没有则进入查询缓存。3、查询SQL执行流程之查询缓存查询缓存说白了就是一个哈希表，将执行过的语句及其结果
2025 年江苏省职业院校技能大赛“应用软件系统开发“赛项规程 qq_2924167571 java 应用软件系统开发 GZ031 应用软件系统开发赛项职业院校技能大赛最新比赛资料
2025年江苏省职业院校技能大赛"应用软件系统开发"赛项规程一、赛项名称赛项编号：JSG2025031赛项名称：应用软件系统开发赛项组别：高职学生组、高职教师组赛项归属赛道：电子与信息赛道二需要最新竞赛资料“应用软件系统开发”文章底部名片联系我二、竞赛目的党的二十大报告明确指出“要推动战略性新兴产业融合集群发展，构建新一代信息技术等一批新的增长引擎”，新一代信息技术产业对经济社会高质量发展的赋能作
Browser Use开启AI辅助网页操作新时代 CodeJourney. python 人工智能算法数据库
在当今数字化时代，人们的工作和生活与互联网紧密相连。每天，我们都要花费大量时间在各类网站之间穿梭，进行诸如填写表单、查询信息、比价等重复性操作。这些工作不仅耗费精力，还容易因疲劳而出错，严重影响了工作效率。而现有的自动化工具，要么需要掌握专业的编程知识才能使用，要么在功能上存在局限性，让普通技术用户望而却步。不过，随着人工智能技术的飞速发展，一款名为BrowserUse的开源项目应运而生，为我们带
光学工程师中年危机光学设计培训激光雷达光学设计 zemax 光学光学工程
一、技术能力突围：向高价值领域迁移‌‌瞄准增量市场‌‌激光雷达与自动驾驶‌：将光学设计经验迁移至激光雷达光路优化（如VCSEL阵列准直算法）、热稳定性补偿算法（解决车载环境温度漂移问题）‌15。‌AR/VR光学模组‌：参与超表面透镜（Metasurface）设计，结合波导与全息技术提升显示效率，掌握LightTools或LucidShape光场仿真‌37。‌强化算法能力‌‌光学-算法交叉技能‌：从
Hive函数大全：从核心内置函数到自定义UDF实战指南（附详细案例与总结）一个天蝎座白勺程序猿大数据开发从入门到实战合集 hive hadoop 数据仓库
目录背景‌一、Hive函数分类与核心函数表‌1.内置函数分类‌2.用户自定义函数（UDF）分类二、常用函数详解与实战案例‌1.数学函数‌2.字符串函数‌3.窗口函数‌4.自定义UDF实战‌三、总结与优化建议‌1.核心总结2.性能优化建议‌3.常问问题背景‌Hive作为Hadoop生态中最常用的数据仓库工具，其强大的函数库是高效处理和分析海量数据的核心能力之一。Hive函数分为‌内置函数‌和‌用户自
String类墨香染城城 java 开发语言
1.String类的重要性在C语言中已经涉及到字符串了，但是在C语言中要表示字符串只能使用字符数组或者字符指针，可以使用标准库提供的字符串系列函数完成大部分操作，但是这种将数据和操作数据方法分离开的方式不符合面相对象的思想，而字符串应用又非常广泛，因此Java语言专门提供了String类。2.常用方法2.1字符串构造String类提供的构造方式非常多，常用的就以下三种：publicstaticvo
P11451 [USACO24DEC] It‘s Mooin‘ Time B（枚举算法）爱干饭的boy 算法竞赛题目超详细解析算法 c语言 c++青少年编程贪心算法推荐算法
题目描述FarmerJohn正在试图向Elsie描述他最喜欢的USACO竞赛，但她很难理解为什么他这么喜欢它。他说「竞赛中我最喜欢的部分是Bessie说『现在是哞哞时间』并在整个竞赛中一直哞哞叫」。Elsie仍然不理解，所以FarmerJohn将竞赛以文本文件形式下载，并试图解释他的意思。竞赛被定义为一个长度为$N$（$3≤N≤20000$）的小写字母字符串。一种哞叫一般地定义为子串$c_ic_j
goldengate sqlserver mysql_使用 Oracle GoldenGate 在 Microsoft SQL Server 和 Oracle Database 之间复制事务... weixin_39907713 goldengate sqlserver mysql
大多数关注数据复制的Oracle技术专家都熟悉OracleStreams。在2009年之前，Streams一直是推荐使用的最流行的Oracle数据分发技术。2009年7月，Oracle收购了GoldenGate这一数据库复制软件供应商。Oracle现在鼓励客户使用OracleGoldenGate(Oracle融合中间件系列的组成部分)来满足新应用中的数据复制需求。Oracle关于OracleStr
java web 安全，如何认证客户端？时间戳和noce如何抵御重放攻击？ ughome java 安全
技术问答整理1.JavaHMAC签名验签示例问题如何用Java实现HMAC签名和验签？答案importjavax.crypto.Mac;importjavax.crypto.spec.SecretKeySpec;importjava.nio.charset.StandardCharsets;importjava.util.HexFormat;publicclassHmacExample{//生成H
【C#高级编程】—表达式树详解 _Csharp C#基础-高阶-实战知识点 c#开发语言表达式表达式树
表达式树详解什么是表达式树？C#表达式树（ExpressionTrees）是一种将代码表示为数据结构的技术，允许在运行时分析、转换和执行代码逻辑。表达式树是一种树形数据结构，它将代码（例如Lambda表达式）表示为对象。每个节点代表一个操作（例如加法、减法、调用方法等），而子节点代表操作的操作数。基本概念数据结构表示：表达式树以树形结构表示代码（如lambda表达式），每个节点代表一个操作（如方法
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他