xcy13638760

话说验证码识别

最近在研究验证码识别。大体总结了一下分为以下几种思路：

1、绕过验证码。跳过验证码直接访问需要的页面内容。（大天朝很多网站验证码就是个摆设。）

2、请求头中自带验证码。有些网站的验证码会在前台js校验。服务器生成的验证码会在请求头中。可以获取请求头，并把验证码解析出来。

3、session不刷新。国内很多网站存在一个通病：验证码验证成功后，直接获取请求资源。（忘记了刷新cookie对应的验证码）可以预先设定一个cookie和验证码。利用这个漏洞访问网站。对于多线程无法控制以及有些网站验证码定期不访问失效问题。可以添加一个定时访问程序来解决

4、利用第三方插件。对于有些网站验证码比较简单。只含阿拉伯数字和英文字母。可以用第三方的插件来识别。例如：tess4j、tesseract

5、有些网站的验证码是从库中随机取出一个来的。对于这类静态的验证码。可以自己建立一个验证码静态库。自己建立好图片和验证码答案的链接。采用map的映射方法就可以进行识别参见：http://www.cnblogs.com/neutra/archive/2012/02/26/2368358.html

6、自己定制写验证码的程序

下面说一下自己定制写验证码程序的基本思路。先普及一下验证码的知识。方便后面理解

常见验证码的弱点与验证码识别

0x00 简介

验证码作为一种辅助安全手段在Web安全中有着特殊的地位，验证码安全和web应用中的众多漏洞相比似乎微不足道，但是千里之堤毁于蚁穴，有些时候如果能绕过验证码，则可以把手动变为自动，对于Web安全检测有很大的帮助。

全自动区分计算机和人类的图灵测试（英语：Completely Automated Public Turing test to tell Computers and Humans Apart，简称CAPTCHA），俗称验证码，是一种区分用户是计算机和人的公共全自动程序。在CAPTCHA测试中，作为服务器的计算机会自动生成一个问题由用户来解答。这个问题可以由计算机生成并评判，但是必须只有人类才能解答。由于计算机无法解答CAPTCHA的问题，所以回答出问题的用户就可以被认为是人类。(from wikipedia)

大部分验证码的设计者都不知道为什么要用到验证码，或者对于如何检验验证码的强度没有任何概念。大多数验证码在实现的时候只是把文字印到背景稍微复杂点的图片上就完事了，程序员没有从根本上了解验证码的设计理念。

验证码的形式多种多样，先介绍最简单的纯文本验证码。

纯文本验证码

纯文本，输出具有固定格式，数量有限，例如：

•1+1=?

•本论坛的域名是?

•今天是星期几?

•复杂点的数学运算

这种验证码并不符合验证码的定义，因为只有自动生成的问题才能用做验证码，这种文字验证码都是从题库里选择出来的，数量有限。破解方式也很简单，多刷新几次，建立题库和对应的答案，用正则从网页里抓取问题，寻找匹配的答案后破解。也有些用随机生成的数学公式，比如随机数 [+-*/]随机运算符随机数=?，小学生水平的程序员也可以搞定……

这种验证码也不是一无是处，对于很多见到表单就来一发的spam bot来说，实在没必要单独为了一个网站下那么大功夫。对于铁了心要在你的网站大量灌水的人，这种验证码和没有一样。

下面讲的是验证码中的重点，图形验证码。

图形验证码

先来说一下基础：

识别图形验证码可以说是计算机科学里的一项重要课题，涉及到计算机图形学，机器学习，机器视觉，人工智能等等高深领域……

简单地说，计算机图形学的主要研究内容就是研究如何在计算机中表示图形、以及利用计算机进行图形的计算、处理和显示的相关原理与算法。图形通常由点、线、面、体等几何元素和灰度、色彩、线型、线宽等非几何属性组成。计算机涉及到的几何图形处理一般有 2维到n维图形处理，边界区分，面积计算，体积计算，扭曲变形校正。对于颜色则有色彩空间的计算与转换，图形上色，阴影，色差处理等等。

在破解验证码中需要用到的知识一般是像素，线，面等基本2维图形元素的处理和色差分析。常见工具为：

•支持向量机(SVM)

•OpenCV

•图像处理软件(Photoshop,Gimp…)

•Python Image Library

支持向量机SVM是一个机器学习领域里常用到的分类器，可以对图形进行边界区分，不过需要的背景知识太高深。

OpenCV是一个很常用的计算机图像处理和机器视觉库，一般用于人脸识别，跟踪移动物体等等，对这方面有兴趣的可以研究一下

PS,GIMP就不说了，说多了都是泪啊……

Python Image Library是pyhon里面带的一个图形处理库，功能比较强大，是我们的首选。

SVM图像边界区分

SVM原理，把数据映射到高维空间，然后寻找能够分割的超平面

识别验证码需要充分利用图片中的信息，才能把验证码的文字和背景部分分离，一张典型的jpeg图片，每个像素都可以放在一个5维的空间里，这5个维度分别是，X,Y,R,G,B，也就是像素的坐标和颜色，在计算机图形学中，有很多种色彩空间，最常用的比如RGB，印刷用的CYMK，还有比较少见的HSL或者HSV，每种色彩空间的维度都不一样，但是可以通过公式互相转换。

RGB色彩空间构成的立方体，每个维度代表一种颜色

HSL（色相饱和度）色彩空间构成的锥体，可以参考：

https://zh.wikipedia.org/wiki/HSL%E5%92%8CHSV%E8%89%B2%E5%BD%A9%E7%A9%BA%E9%97%B4

了解到色彩空间的原理，就可以用在该空间适用的公式来进行像素的色差判断，比如RGB空间里判断两个点的色差可以用3维空间中两坐标求距离的公式：

distance=sqrt[(r1-r2)^2+(g1-g2)^2+(b1-b2)^2]

更加直观的图片，大家感受一下：

随便把一张图片的每个像素都映射到RGB色彩空间里就能获得一个这样的立方体。

通过对像素颜色进行统计和区分，可以获得图片的颜色分布，在验证码中，一般来说使用近似颜色最多的像素都是背景，最少的一般为干扰点，干扰线和需要识别文字本身。

对于在RGB空间中不好区分颜色，可以把色彩空间转换为HSV或HSL：

0x01 验证码识别的原理和过程

第一步：二值化

所谓二值化就是把不需要的信息通通去除，比如背景，干扰线，干扰像素等等，只剩下需要识别的文字，让图片变成2进制点阵。

第二步：文字分割

为了能识别出字符，需要对要识别的文字图图片进行分割，把每个字符作为单独的一个图片看待。

第三步：标准化

对于部分特殊的验证码，需要对分割后的图片进行标准化处理，也就是说尽量把每个相同的字符都变成一样的格式，减少随机的程度

最简单的比如旋转还原，复杂点的比如扭曲还原等等

第四步：识别

这一步可以用很多种方法，最简单的就是模板对比，对每个出现过的字符进行处理后把点阵变成字符串，标明是什么字符后，通过字符串对比来判断相似度。

在文章的后半部分会详细解释每步的各种算法

二值化算法

对于大部分彩色验证码，通过判断色差和像素分布都能准确的把文字和背景分离出来，通过PS等工具把图片打开，用RGB探针对文字和背景图的颜色分别测试，在测试多张图片后，很容易可以发现文字和背景图的RGB差距总是大于一个固定的阈值，即使每次图片的文字和背景颜色都会变化，比如：

新浪和discuz的验证码

通过对文字部分和干扰部分取样可以发现，文字部分的R、G值一般在100左右，B值接近255，但是背景干扰的R、G值则大大高于文字部分，接近200，比较接近文字轮廓部分的像素的RG值也在150以上。通过程序遍历一遍像素就可以完全去掉背景。

Discuz的验证码同理

对于一些和文字颜色相同但是较为分散和单一的干扰像素点，我们可以用判断相邻像素的方法，对于每个点判断该点和相邻8个点的色差，若色差大于某个值，则+1，如果周围有超过6个点的色差都比较大，说明这个点是噪点。对于图像边界的一圈像素，周围没有8个像素，则统统清除，反正文字都在图片的中间位置。

如下图：假如当前像素的坐标是x,y 图形坐标系的原点是图像的左上角

干扰线对于识别验证码增加了一些难度，不过干扰线只有很小的几率会以大角度曲线的方式出现，大部分时间还是小角度直线，去除算法可以参考http://wenku.baidu.com/view/63bac64f2b160b4e767fcfed.html

对于1个像素粗细的干扰线，在字符为2个像素以上的时候，可以用去噪点算法作为滤镜，多执行几次，就可以完美的把细干扰线去掉。

对于像素数比干扰点稍大的干扰色块，可以采用的算法有：

油漆桶算法（又叫种子填充算法，Floodfill）

种子填充算法可以方便的计算出任意色块的面积，对于没有粘连字符或者粘连但是字符每个颜色不一样的验证码来说，去除干扰色块的效果很好，你只需要大概计算一下最小的和最大的字符平均占多少像素，然后把这段区间之外像素数的色块排除掉即可。

上下左右4个方向填充还有8个方向填充的不同

判断颜色分布：

对于大多数彩色验证码来说，文字基本在图片中心的位置，每个字符本身的颜色是一样的，也就是说对于文字来说，同一种颜色基本都集中在一个固定的区域范围内，通过统计图片中的像素，按近似颜色分组，同时分析每个颜色组在图片中的分布范围，假如说有一种颜色大部分像素都在图片边缘，那么这个颜色肯定不属于要识别的字符，可以去掉。

对于干扰线，并没有一种十分有效的方式能完全去除并且不影响到文字，不过如果能够成功分割字符的话，少量干扰线对于识别率影响不大。

字符分割算法

破解验证码的重点和难点就在于能否成功分割字符，这一点也是机器视觉里的一道难题，对物件的识别能力。对于颜色相同又完全粘连的字符，比如google的验证码，目前是没法做到5%以上的识别率的。不过google的验证码基本上人类也只有30%的识别率

对于字符之间完全没有粘连的验证码，比如这个->_->

分割起来是非常的容易，用最基本的扫描线法就可以分割，比如从最左侧开始从上到下（y=0---||||y=n）扫描，如果没有遇到任何文字的像素，就则往右一个像素然后再扫描，如果遇到有文字像素存在，就记录当前横坐标,继续向右扫，突然没有文字像素的时候，就说明到了两个字符直接的空白部分，重复这个步骤再横向扫描就能找到每个字符最边缘4个像素的位置，然后可以用PIL内建的crop功能把单独的字符抠出来。

对于有少许粘连但是只是在字符边角的地方重叠几个像素的验证码，可以用垂直像素直方图的统计方法分割。如下图：

图上半部分是垂直像素直方图的一种直观展示，假如图片宽度为100像素，则把图片切割为100个1像素的竖线，下面的红色部分为当前x坐标上所有黑色像素的总和。这么一来可以很容易的通过直方图的波峰波谷把4个字母分割开。图片的下半部分是扫描线分隔法，因为干扰线和字符旋转的存在，只有M和5直接才出现了连续的空白部分。

除了垂直像素直方图，还可以从不同的角度进行斜线方向的像素数投影，这种方式对于每次全体字符都随机向一个角度旋转的验证码效果很好。对于每次字符大小和数量都一样的验证码还可以用平均分割法，也就是直接先把中间的文字部分整体切出来，然后按宽度平均分成几份，这种方式对字符粘连比较多用其他方式不好分割的验证码很有用，之前的megaupload的3位字母验证码就是通过这种方式成功分割的。

另外对于彩色的验证码，还可以用颜色分割，比如12306的：

12306的验证码，每个字符颜色都不一样，真是省事啊。

作为验证码识别里的难点，分割字符还有很多种算法，包括笔画分析曲线角度分析等等，不过即便如此，对粘连的比较厉害的字符还是很难成功的。

标准化

标准化的意思是指对于同一个字符，尽可能让每次识别前的样本都一致，以提高识别率。而验证码设计者则会用随机旋转，随机扭曲还有随机字体大小的方式防止字符被简单方法识别。

还原随机旋转的字符一般采用的是旋转卡壳算法：

此算法非常简单，对一张图片左右各旋转30度的范围，每次1度，旋转后用扫描线法判断字符的宽度，对于标准的长方形字体，在完全垂直的时候肯定是宽度最窄的。嗯？纳尼？上面的图是中间的最窄？好像的确是这样，不过只要每次旋转后的结果都一样，对于识别率不会有影响。

扭曲还原的算法比较蛋疼，效果也不怎么样（其实我不会），不过如果识别算法好的话，对扭曲的字符只要人能认出来，识别率也可以达到接近人类的水准。

还有一些常用到的算法，对于提高识别率和减少样本数量有一定帮助：

骨架细化：腐蚀算法

腐蚀算法的原理有点像剥洋葱，从最外层沿着最外面的一层像素一圈一圈的去掉，直到里面只剩下一层像素为止。腐蚀算法里面需要用到另一个算法，叫做凸包算法，用来找一堆像素点里面最外围的一层。

最后就是把字符变成统一大小，一般而言是把全部字符都缩到和验证码里出现过的最小的字符一个大小。

详情请自行google……

分割算法差不多就到这里了，都是一些比较基础的内容。下面是最终的识别。

0x02 识别

其实到了这一步，单独的字符已经分离出来了，可以训练tesseract ocr来识别了，样本数量多的话，识别率也是很高的。不过在这里还是要讲一下，如何自己来实现识别过程。

第一步，样本现在应该已经是一个矩阵的形式了，有像素的地方是1，背景是0，先肉眼识别一下，然后把这个矩阵转换为字符串，建立一个键值对，标明这串字符串是什么字符。之后就只需要多搜集几个同样字符的不同字符串变形，这就是制作模板的过程，。

搜集了足够多的模板后，就可以开始识别了，最简单的方法：汉明距离，但是如果字符有少许扭曲的话，识别率会低的离谱。对比近似字符串用的最多一般是编辑距离算法(Levenshtein Distance)，具体请自己google。

两种算法的差别在于，对同样两个字符串对比10010101和10101010，汉明距离是6，但是编辑距离是2。

最后一种最NB的识别算法，就是神经网络，神经网络是一种模拟动物神经元工作模式的算法，神经网络有多种不同的结构，但是基本架构分为输入层，隐含层和输出层，输入和输出均为二进制。

对于验证码识别来说，输入和输出节点不宜过多，因为多了很慢……所以如果样本矩阵为20x20 400个像素的话，需要对应的也要有400个输入节点，因此我们需要对整个矩阵提取特征值，比如先横向每两个数字XOR一下，然后再竖向每两个数字XOR。

Python有很多封装好的神经网络库，你所需要的只是把特征值输入神经网络，再告诉他你给他的是什么（字符），这样多喂几次之后，也就是训练的过程，随着训练的进行，神经网络的内部结构会改变，逐渐向正确的答案靠拢。神经网络的优势是，对于扭曲的字符识别成功率非常高。另外神经网络在信息安全中还可以起到很多其他作用，比如识别恶意代码等等。

动画验证码

有些不甘寂寞的程序员又玩出了些新花样，比如各种GIF甚至flv格式的动画验证码，下面我来分析一下腾讯安全中心的GIF验证码。

晃来晃去的看似很难，放慢100倍一帧一帧再看看？

基本上每帧都有一个字符和其他的分开，用最简单的扫描法就能分割出来。

剩下的就很轻松了，旋转还原之后，先填充内部空白，缩小细化之后做成模板对比，识别率怎么也得有90%了。

原本一张图就能搞定的事情，偏偏给了我们8张图，而且每张图还有一点区别，平白无故增大了很多信息量。

另外就是一些所谓的高用户体验的验证码，比如freebuf的：

拖动解锁按钮会触发执行一段js，生成一串随机字符串，ajax给后端程序判断。

破解方式就当留给大家的思考题了，假如我想刷评论的话，怎么办。

还有就是声音验证码的识别，现在很多验证码为了提高用户体验和照顾视觉障碍的用户，都有声音验证码，一般来说是机器生成一段读数字的语音。但是在这方面上很多程序员都偷懒了，预先找了10个数字的声音录音，然后生成的时候把他们随机拼到一起，结果就是这样：

前3秒为语音提示，后面的是数字，有没有发现什么？

声音也是可以做成模板的哦

最后就是应该怎么样去设计验证码

•整体效果


•字符数量一定范围内随机


•字体大小一定范围内随机


•波浪扭曲(角度方向一定范围内随机)


•防识别


•不要过度依赖防识别技术


•不要使用过多字符集-用户体验差


•防分割 


•重叠粘连比干扰线效果好


•备用计划


•同样强度完全不同的一套验证码

1分钟彻底搞懂“高内聚，低耦合” jmlinux C语言方法算法 stm32 嵌入式硬件单片机
目录1.高内聚低耦合:2.生活类比理解耦合与内聚2.1高内聚情况2.2高耦合情况2.3低耦合情况3.程序开发中耦合的影响3.1高内聚示例3.2低耦合示例1.高内聚低耦合:一句话说明,每个模块只管自己的事，并且尽量不依赖其他模块。两句话说明,具体一点：高内聚：一个模块集中做好一件事，所有相关的代码都在一起。低耦合：不同模块之间的联系尽量少，修改一个模块不会影响其他模块。2.生活类比理解耦合与内聚我们
Python 爬虫验证码识别 acheding python python 爬虫 ocr
在我们进行爬虫的过程中，经常会碰到有些网站会时不时弹出来验证码识别。我们该如何解决呢？这里分享2种我尝试过的方法。0.验证码示例1.OpenCV+pytesseract使用Python中的OpenCV库进行图像预处理（边缘保留滤波、灰度化、二值化、形态学操作和逻辑运算），然后结合pytesseract进行文字识别。pytesseract需要配合安装在本地的tesseract-ocr.exe文件一起
linux 内核回调,Linux 内核通知链随笔【下】 iwbunny linux 内核回调
书接上回，闲话不表。话说，女神无论是在土豪或者屌丝那里都找不到归属感，冥冥之中天上掉下来一个王子(PS:又名高富帅)，既可以满足女神的物质需求还可以满足女神的精神需求：点击(此处)折叠或打开/*GFS.c*/#include#include#include#include#include#include#include#includeMODULE_LICENSE("GPL");/**注册通知链*/
牛客网面试必刷TOP101-010贪心算法BM96 主持人调度（二） bingw0114 贪心算法算法
描述有n个活动即将举办，每个活动都有开始时间与活动的结束时间，第i个活动的开始时间是starti,第i个活动的结束时间是endi,举办某个活动就需要为该活动准备一个活动主持人。一位活动主持人在同一时间只能参与一个活动。并且活动主持人需要全程参与活动，换句话说，一个主持人参与了第i个活动，那么该主持人在(starti,endi)这个时间段不能参与其他任何活动。求为了成功举办这n个活动，最少需要多少名
AI时代职业突围：DeepSeek 设计你的专属“人生芯片” iMr_Stone 人工智能
新年伊始，咱们今儿先不聊技术~俗话说：凡事预则立、不预则废。作为一个半路转入芯片行业的大头兵，咱们也请DeepSeek给咱做一个长期的职业规划：接下来，请参考DeepSeek给咱们的建议：一、行业特点与趋势（规划基础）行业特性技术密集：需持续学习工艺制程、EDA工具、架构设计（如RISC-V/ARM）等。长周期：芯片设计到量产需2-5年，需耐心积累经验。全球化竞争：关注地缘政治（如中美技术博弈）和
Python 实现 2025 专属烟花效果粒子 Clevermea python 开发语言 pygame 算法逻辑回归推荐算法
引言“爆竹声中一岁除”，听到这句话，想必大家都不陌生吧。在城市中看到那拖着彩星的烟花飞向天空，在空中绽放出来，那一刻是多么美好。那么，话说回来，你是否想过用代码的力量，在虚拟世界中重现这绚烂的烟花场景呢？借助Python强大的绘图和动画库，我们完全可以实现这一有趣的创意，为2025年增添一份独特的科技感与浪漫氛围。准备工作在开始编码之前，我们需要安装一些必要的Python库。这里我们会用到pyga
Java设计模式之桥接模式愿时光不负. #结构型模式 java 设计模式桥接模式
桥接模式（BridgePattern）1.概述桥接模式是一种结构型设计模式，它通过将抽象部分与实现部分分离，使它们可以独立变化。桥接模式的核心思想是将抽象与实现解耦，使得它们可以独立变化，而不受彼此的影响。换句话说，桥接模式旨在处理“类的维度扩展问题”。2.适用场景希望将抽象与实现解耦：当一个类存在多个维度的变化时，桥接模式可以有效地将这些维度分离，避免类的层次结构过于复杂。不希望在抽象和实现之间
解决远程桌面连接后没有声音的问题 huanghong6956
1.首先确定被远程主机已安装声卡和驱动，换句话说就是被远程主机可以出声2.在被远程主机上，开始－运行－gpedit.msc，打开组策略计算机配置－管理模板－终端服务－客户端/服务器数据重定向－启用“允许音频重定向3.重启4.欧了
Junit4使用详解（一） weixin_34194702 测试 java
我们写单元测试，一般都会用到一个或多个单元测试框架，在这里，我们介绍一下JUnit4这个测试框架。这是Java界用的最广泛，也是最基础的一个框架，其他的很多框架，包括我们后面会看到的Robolectric，都是基于或兼容JUnit4的。然而首先要解决的问题是。。。为什么要使用单元测试框架呢或者换句话说，单元测试框架能够为我们做什么呢？从最基本的开始说起，假如我们有这样一个类：publicclass
【收藏不迷路】380种群智能优化算法-Matlab代码免费获取（截至2025.2.14） 88号技师智能优化算法算法 matlab 优化算法人工智能
群智能优化算法可以作为很好的工具来解决许多实际问题，如特征选择、图像分割、医学诊断，经济排放调度问题，植物病害识别，工程设计，PID优化控制，设备故障诊断，机器学习模型参数整定等等。在这个领域，有一个理论：没有免费午餐(NoFreeLunch，NFL)理论。它从逻辑上证明了不存在最适合解决所有优化问题的元启发式算法。换句话说，特定的元启发式可能在一组问题上显示出非常有希望的结果，但相同的算法可能在
【鸿蒙开发实战教程】在MacOS上如何使用 Flutter 构建鸿蒙APP 「已注销」 harmonyos macos flutter 鸿蒙
前言根据研究机构CounterpointResearch发布的最新数据，2024年第一季度，鸿蒙OS份额由去年一季度的8%上涨至17%，iOS份额则从20%下降至16%。这意味着，华为鸿蒙OS在中国市场的份额超越苹果iOS，已成中国第二大操作系统。随着鸿蒙市场份额的不断提升，相应的岗位也会迎来一个爆发式的增长。这对于想要换赛道的程序员来说是一个非常好的消息，话说大家最近有想法转型鸿蒙开发吗？目前各
自然语言处理（NLP）入门：基础概念与应用场景 Ash Butterfield nlp 自然语言处理人工智能
什么是自然语言处理（NLP）？自然语言处理（NaturalLanguageProcessing,NLP）是人工智能（AI）的一个重要分支，研究如何让计算机理解、生成、分析和与人类语言进行交互。换句话说，NLP是让机器像人一样“读、写、听、说”的技术，它结合了语言学、机器学习、计算机科学等多学科知识。NLP的核心目标是将非结构化的自然语言（如文本和语音）转化为结构化数据，使机器能够高效处理、分析和生
IT运维很头疼云络科技说不如包给他们 weixin_33755649 运维前端 devops ViewUI
相声,相信很多人都喜欢，台上一个捧一个逗造就了一台戏。俗话说“三分逗，七分捧”，看似被抢尽风头的捧哏者反而扮演着更重要的角色。在IT界也有着这样一对关系——开发和运维。所谓“三分建设，七分运维”，一直以来默默躲在背后的IT运维部门，尽管无数次被企业轻视，还要遭受业务部埋怨，而一旦企业系统遭到考验，运维人员就得重装上任，赶忙“救火”。近几年，随着云计算等技术的落地，提升了效率的同时也增加了IT复杂程
NLOS场景代表什么　☆cwlulu 信息与通信 5G
NLOS（Non-Line-Of-Sight）场景指的是在通信、雷达、成像以及其他传感应用中，信号传输路径被障碍物阻挡，导致信号无法直接从发送点直线到达接收点的情况。换句话说，在NLOS条件下，信号必须通过反射、折射或散射等方式绕过障碍物才能到达目的地。在不同的技术和应用场景中，NLOS具有不同的意义：1.**无线通信**：在无线通信系统中，NLOS条件可能会导致信号强度减弱、延迟扩展（信号到达时
普通人也能轻松掌握的20个DeepSeek高频提示词（2025版）工业甲酰苯胺前端 deepseek
一、基础原则1️⃣说人话最重要"不用专业术语，就像和朋友聊天一样描述需求"。❌️错误示范："请用SWOT分析法输出新能源汽车行业报告"。✅正确示范："我要给老板汇报比亚迪谈判进展，完全不懂电池技术，请用买菜大妈都能听懂的话说明：他们的核心技术强在哪？报价大概多少？谈判时怎么装专业？"。2️⃣场景化公式"我要做___(具体事项)，给___(使用对象)看，重点突出___(核心需求)，担心___(潜在问
【MySQL例题】我在广州学Mysql 系列——有关数据备份与还原的示例练小杰数据库相关 MYSQL 数据库练习题 mysql 数据库经验分享学习 android sql
ℹ️大家好，我是练小杰，今天周二，明天就是元宵节了呀！！俗话说“众里寻他千百度。蓦然回首，那人却在，灯火阑珊处。”本文主要对数据库备份与还原的知识点例题学习~~前情回顾：【MySQL数据备份与还原详解】数据库专栏：【数据库专栏】【Mysql练习题】了解更多，点击主页：【练小杰的CSDN】文章目录俗话说“众里寻他千百度。蓦然回首，那人却在，灯火阑珊处。”前言实验准备创建数据库及定义表命令执行完毕后，
深入解析 Kafka 消费者偏移量管理 t0_54program kafka 分布式个人开发
在使用Kafka进行消息消费时，偏移量管理是一个非常重要的概念。它直接关系到消息的重复消费、丢失以及系统的可靠性。本文将详细介绍Kafka中的偏移量管理机制，包括当前偏移量与提交偏移量的区别、自动提交与手动提交的使用场景及代码示例。一、当前偏移量与提交偏移量在Kafka中，当前偏移量（CurrentOffset）是指消费者下次将要从分区中拉取的记录的偏移量。换句话说，它是消费者“即将”消费的消息的
坚果有话说 harmonyos
大家好，我是坚果，我接触鸿蒙原生开发。是因为我以前是做Flutter开发的，我经常在社区写博客，有一天，看到有博客在介绍鸿蒙，于是我点击详细了解了一下，于是被鸿蒙的魅力所感染。于是自己加入到了鸿蒙的分享和布道中，我觉得有必要让大家了解鸿蒙。于是我在探索HarmonyOS的初期，不仅投身于项目开发，还细心记录下每一次尝试的感悟，在各大平台上广泛分享我的开发经验，耐心解答同行们的疑惑。随着探索的深入，
【项目实战】计算点击率，如何将两个时间组成的List映射成一个Map返回给前端本本本添哥 Z -Inbox1 java list 前端
一、第一次遇到1.1说明在Java中，经常有两个需要关联的独立列表。换句话说，我们有两个列表，一个包含键，另一个包含值。browserList=[{"browser":40,"day":1696694400000},{
《电商出海，数字化工具如何提升市场竞争力？》
电商出海：如何用数字化工具打开全球市场？在全球化的浪潮下，电商出海已经成了很多企业眼中的“香饽饽”。毕竟，谁不想把自家的产品卖到世界各地，赚个盆满钵满呢？但话说回来，电商出海可不是件容易的事儿。文化差异、品牌建设、市场竞争，还有数据安全，这些难题就像一座座大山，横在企业面前。不过别急，数字化工具这时候就能派上大用场啦！从市场调研、店铺搭建，到营销推广、客户管理，这些工具就像是电商出海的“利器”，能
【数据迁移】- 单实例 to RAC的ADG 圆️️ #ADG 数据库数据迁移 adg
一、概述ADG是数据迁移最常用工具之一，也是我个人认为最简单，最省事的迁移方式。因为ADG属于物理（块）迁移，换句话说就是主库是什么样子，迁移后的数据库就是什么样子。不像其他逻辑迁移（数据泵、OGG等）需要大量时间验证数据完整性以及业务适配等问题。使用ADG迁移时，这些问题一般都不用担心。下面我们开始从单实例——RAC的ADG迁移。二、部署ADG环境2.1主库前提要求开启归档模式SQL>archi
Go语言接口规范 MarVeLu 语言规范 golang 代码规范接口
俗话说,一流企业做标准,二流企业做品牌,三流企业做产品.制定标准至关重要,标准规范的制定离不开接口，制定标准的目的就是为了让定义和实现分离，而接口作为完全的抽象，是标准制定的不二之选.项目开发过程中前后端工程师有一个统一的文档进行沟通交流开发一套良好的接口规范可以提升工作效率,减少沟通障碍.项目维护中或者项目人员更迭，方便后期人员查看、维护目录一.整体要求1.简洁2.易读3.小写4.单数二.域名规
leetcode[279]完全平方数 Python3实现（动态规划） zhang35 LeetCode python 动态规划算法 leetcode
#给定正整数n，找到若干个完全平方数（比如1,4,9,16,...）使得它们的和等于n。你需要让组成和的完全平方数的个数最少。##给你一个整数n，返回和为n的完全平方数的最少数量。##完全平方数是一个整数，其值等于另一个整数的平方；换句话说，其值等于一个整数自乘的积。例如，1、4、9和16都是完全平方数，而3和11不是。#####示例1：###输入：n=12#输出：3#解释：12=4+4+4#
力扣 279.完全平方数 Takina541 leetcode 算法数据结构
题目：给你一个整数n，返回和为n的完全平方数的最少数量。完全平方数是一个整数，其值等于另一个整数的平方；换句话说，其值等于一个整数自乘的积。例如，1、4、9和16都是完全平方数，而3和11不是。示例1：输入：n=12输出：3解释：12=4+4+4示例2：输入：n=13输出：2解释：13=4+9提示：1vec(n+1,0);//先将平方数存储起来for(inti=1;idp(n+1,n+1);dp[
关于桌面软件的开发语言和开发框架的思考 csid_502
作者：朱金灿来源：http://blog.csdn.net/clever101什么是好的开发语言和好的开发框架？这个问题可能一千个人有一千种答案，我的答案是在满足用户效率需要的前提下能降低开发者对计算机知识的依赖而把尽可能多的精力用在满足业务开发需要的开发语言和开发框架就是好的开发语言和开发框架。这话说得有点拗口，其实它包含下面几层意思：首先是开发语言或开发框架必须满足用户的效率需要，比如一个软件
【CSS】什么是响应式设计？响应式设计的基本原理，怎么做托尼比卡丘 #每天搞懂一道css题 css 前端
在当今多设备、多屏幕尺寸的时代，网页设计面临着前所未有的挑战。传统的固定布局已无法满足用户在不同设备上浏览网页的需求，响应式设计（ResponsiveWebDesign）应运而生，成为网页设计的趋势和标准。本文将深入探讨响应式设计的概念、基本原理以及实现方法。一、什么是响应式设计？响应式网站设计是一种灵活且适应性强的网页设计方法，其核心理念是：“内容如水，适配容器”换句话说，网页内容会根据用户行为
专科生的嵌入式开发之路 lzs_blog 嵌入式开发之路嵌入式开发嵌入式开发经历专科生嵌入式开发
俗话说的好，高中不努力，大学指定没戏，哈哈，谁说的，当然是我说的。高考结束了，我成功以320分的优异成绩成为了一个地道的专科生，高中玩嗨了，这回选志愿就傻眼了，这点分可选的学校并不多，要不再复习一年？？敖，还是算了吧。报志愿的时间到了，通过一番的筛选，第一志愿秦皇岛职业技术学院，为啥选这主要是看学校环境好啊，海边走路就到了，第二志愿邯郸学院，原因是这是个本科专科一体的学校，而且邯郸据说美女多，能和
深入理解 Python 拷贝机制：浅拷贝与深拷贝的最佳实践！！小南AI学院 python windows 开发语言
1.Python浅拷贝1.1.什么是浅拷贝浅拷贝（ShallowCopy）是指创建一个新的对象，但新的对象中的元素仍然引用原始对象中的元素，而不是将其复制到新的内存位置。换句话说，浅拷贝只会复制对象本身，而不递归地复制对象中包含的其他对象或嵌套对象。举个例子，假设我们有一个包含列表的列表：original=[[1,2,3],[4,5,6]]shallow_copy=original.copy()在
vue 函数路由跳转_基于Vue/VueRouter/Vuex/Axios登录路由和接口级拦截原理与实现许吴倩 vue 函数路由跳转
作者：胡哥有话说转发链接：https://www.jianshu.com/p/bb4c76f1f6b3前言前后端分离开发、独立部署，为前端的开发人员提供了极大的便利，同时也带来了新的挑战。前后端分离带来的问题基于前端分离带来的问题在路由级，模块之间的切换、跳转需要前端进行独立的维护在接口级，前后端数据交互由接口进行连接(异步)这是重点：前端需要根据用户的登录态或角色身份进行权限控制拦截，以展示对应
java中的mapper是什么_java中entity层、dao层、service层、mapper层、util层、controller层具体含义以及表现... 南城游子 java中的mapper是什么
entity层A：entity就是属性类，通常定义在model层里面，相当于MVC的M层，属于数据模型层B：一般得实体类对应一个数据表，其中的属性定义数据表中的字段，实体类的字段数量>=数据库表中需要操作的字段数量dao层A：dao层叫做数据访问层，全称为dataaccessobject，属于一种比较底层基础得操作，具体到对某个表得增删改查，换句话说，某个dao一定是和数据库中的某一张表一一对应的
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的