夜谷子

tesseract-OCR的在验证码识别中的重训练与使用

安装

图片验证码识别包安装

pip install pytesseract
pip install PILLOW

tesseract-OCR编译安装

（1）leptonica编译安装
下载地址：http://www.leptonica.com/download.html
编译安装：

tar zxvf leptonica-1.75.3.tar.gz
cd leptonica-1.75.3
./configure 
make&&make install

（2）tesseract编译安装

wget https://github.com/tesseract-ocr/tesseract/archive/tesseract-3.05.01.tar.gz
tar zxvf tesseract-3.05.01.tar.gz
cd tesseract-3.05.01
./autogen.sh
make
make install
ldconfig

报错问题及解决方案：参考https://it.baiked.com/system/ops/2291.html
测试是否成功：
tesseract

验证码识别

获取验证码图像

def get_picture(driver):
    global cache
    if cache == []:
        captchaElem = driver.find_element_by_xpath('//*[@id="captcha_img"]')
        captchaX = int(captchaElem.location['x'])
        captchaY = int(captchaElem.location['y'])
        captchaWidth = captchaElem.size['width']
        captchaHeight = captchaElem.size['height']
        captchaRight = captchaX + captchaWidth
        captchaBottom = captchaY + captchaHeight
        cache = [captchaX,captchaY,captchaRight,captchaBottom]
    else:
        captchaX,captchaY,captchaRight,captchaBottom = cache

    driver.get_screenshot_as_file("screenshot.png")
    imgObject = Image.open("screenshot.png")

    im = imgObject.crop((captchaX, captchaY, captchaRight, captchaBottom))
    
    return im

图像预处理

def im_process(im):
    # 将RGB彩图转为灰度图
    gray = im.convert('L')
    # 将灰度图按照设定阈值转化为二值图
    gray = gray.point(lambda x: 0 if x < 100 else 1, '1')
    
    return gray

图像去噪

转化为二值图片后，就需要清除噪点。本项目图片比较简单，大部分噪点也是最简单的那种孤立点，所以可以通过检测这些孤立点就能移除大量的噪点。
关于如何去除更复杂的噪点甚至干扰线和色块，有比较成熟的算法: 洪水填充法 Flood Fill ，本文为了问题简单化，选用较为简单的九宫格去噪法：

对某个黑点周边的九宫格里面的黑色点计数;
如果黑色点少于2个则证明此点为孤立点，然后得到所有的孤立点;
对所有孤立点一次批量移除。

具体实现算法如下：

## 降噪
def sum_9_region_new(img, x, y):
    '''确定噪点 '''
    cur_pixel = img.getpixel((x, y))  # 当前像素点的值
    width = img.width
    height = img.height
 
    if cur_pixel == 1:  # 如果当前点为白色区域,则不统计邻域值
        return 0
 
    # 因当前图片的四周都有黑点，所以周围的黑点可以去除
    if y < 2:  # 本例中，前两行的黑点都可以去除
        return 1
    elif y == height - 1:  # 最下面一行
        if x < 1 or x == width - 1:
            return 1
        else:
            sum = img.getpixel((x - 1, y - 1)) \
                      + img.getpixel((x - 1, y)) \
                      + img.getpixel((x, y - 1)) \
                      + cur_pixel \
                      + img.getpixel((x + 1, y - 1)) \
                      + img.getpixel((x + 1, y)) 
            return 6 - sum 
    else:  # y不在边界
        if x < 2:  # 前两列
            return 1
        elif x == width - 1:  # 右边非顶点
            sum = img.getpixel((x - 1, y - 1)) \
                  + img.getpixel((x - 1, y)) \
                  + img.getpixel((x - 1, y + 1)) \
                  + img.getpixel((x, y - 1)) \
                  + cur_pixel \
                  + img.getpixel((x, y + 1)) 
            return 6 - sum
        else:  # 具备9领域条件的
            sum = img.getpixel((x - 1, y - 1)) \
                  + img.getpixel((x - 1, y)) \
                  + img.getpixel((x - 1, y + 1)) \
                  + img.getpixel((x, y - 1)) \
                  + cur_pixel \
                  + img.getpixel((x, y + 1)) \
                  + img.getpixel((x + 1, y - 1)) \
                  + img.getpixel((x + 1, y)) \
                  + img.getpixel((x + 1, y + 1))
            return 9 - sum

 
def collect_noise_point(img):
    '''收集所有的噪点'''
    noise_point_list = []
    for x in range(img.width):
        for y in range(img.height):
            res_9 = sum_9_region_new(img, x, y)
            if (0 < res_9 < 3) and img.getpixel((x, y)) == 0:  # 找到孤立点
                pos = (x, y)
                noise_point_list.append(pos)
    return noise_point_list
 
def remove_noise_pixel(img, noise_point_list):
    '''根据噪点的位置信息，消除二值图片的黑点噪声'''
    for item in noise_point_list:
        img.putpixel((item[0], item[1]), 1)

验证码识别

# 解析验证图像字符
def parse_ycode(im):
    # 预处理
    im = im_process(im)
    # 去噪
    noise_point_list = collect_noise_point(im)
    remove_noise_pixel(im, noise_point_list)
    #  pytesseract识别验证码
    yanzhengma = pytesseract.image_to_string(im,lang='eng')
    yanzhengma = list(filter(str.isalnum, str(yanzhengma)))

    if len(yanzhengma) == 5:
        return yanzhengma       
    else:
        im.save(SAVE_FILE+'0-'+''.join(yanzhengma)+'.jpg')
        return None

Tesseract-OCR训练

安装依赖包

yum install cairo-devel pango-devel libicu-devel

编译安装训练工具

tesseract根目录下，执行以下命令：

./configure
make training
make training-install

安装jTessBoxEditor

jTessBoxEditor需要jre7（Java Runtime Environment）以上的版本支持。
安装完jre后，下载jTessBoxEditor，解压，运行train.bat文件即可运行。
具体操作可参考：https://www.jianshu.com/p/5c8c6b170f6f

合成图片

返回到win系统上，运行jTessBoxEditor工具，把所有图片合成一张.tif格式的图片（命名为[lang].[fontname].exp[num].tif）。

生成box文件

在tif文件所在的目录下打开一个命令行，产生相应的Box文件（*.box）来生成一个box文件，该文件记录了tesseract识别出来的每一个字和其位置坐标。
tesseract [lang].[fontname].exp[num].tif [lang].[fontname].exp[num] batch.nochop makebox

修正文字内容

把[lang].[fontname].exp[num].box下载下来，放到win系统下，放到之前[lang].[fontname].exp[num].tif目录下。
使用jTessBoxEditor开始修正文字。
具体修正操作可参考：https://www.jianshu.com/p/5c8c6b170f6f

开始训练

将修正后的box文件替换掉原始box文件。执行下面操作：
tesseract [lang].[fontname].exp[num].tif [lang].[fontname].exp[num] box.train.stderr
这一步会生成两个文本文件：[lang].[fontname].exp[num].tr 和 [lang].[fontname].exp[num].txt，后者只有一些换行符，前者对应于box文件中各字符在tif图片文件中的形状信息，记录的方式实际上是将一个字符看成是一个多边形，而tr文件记录的就是多边形每条边的位置、方向、长度等信息。

生成字符集信息

unicharset_extractor [lang].[fontname].exp[num].box
这一步会生成一个名为unicharset的文本文件，正如其名字表明的，这个文件记录的是一个字符集，它存有box文件里面不重复的字符信息，每个单独字符占一行。

创建字体信息文件

我们可以训练tesseract识别同一种语言的不同字体（这里只训练一种字体），我们需要提供字体相关的特性，这是通过一个叫做font_properties的文本文件标明的。这个文件的每一行以如下格式记录了一个字体的信息：

本文的训练中使用了名为Boldface的字体，因此font_properties里面需要有一行以Boldface开头的字体信息。
除了手动创建这个文件外，tesseract-ocr源码中也提供了一个这样的font_properties文件（training/langdata/font_properties），并且里面已经有了很多字体的信息，因此这里就不许要手动创建了，后面的步骤要用的这个文件的时候，直接指定使用这个文件就行了。例如：
Boldface 0 1 0 0 0

聚合

首先使用shapeclustering
shapeclustering -F font_properties -U unicharset [lang].[fontname].exp[num].tr
这一步会输出一个名为shapetable的文件，下一步的mftraining会自动在当前目录加载这个文件。

接下来执行mftraining
mftraining -F font_properties -U unicharset -O [lang].unicharset [lang].[fontname].exp[num].tr
输出结果有警告，但不影响，执行完成后会生成三个文件：[lang].unicharset, inttemp, pffmtable

最后执行cntraining
cntraining [lang].[fontname].exp[num].tr
这一步生成一个名为normproto的文件

合并生成traineddata文件

现在你只需要合并所有的文件(shapetable, normproto, inttemp, pffmtable)，用相同的前缀重命名它们，如lang.。
combine_tessdata lang.
注意：不要忘记最后一个点！
将生成的[lang].traineddata放在tessdata目录下。然后你就可以用你训练的语言去测试了：

tesseract --list-langs
tesseract image.tif output -l lang

你可能感兴趣的:(算法与应用,图像处理)

用 Python Turtle 绘制一只可爱的小狗：用代码捕捉狗狗的萌态栗子风暴 Python的Turtle绘画 python 开发语言
用PythonTurtle绘制一只可爱的小狗：用代码捕捉狗狗的萌态前言往期绘画>>点击进所有绘画效果图代码前言小狗，作为人类最忠实的朋友之一，总是以它们可爱的模样和活泼的性格，赢得了无数人的喜爱。从呆萌的小狗眼神到摇晃的尾巴，每一处细节都充满了温暖和快乐。今天，我们将用PythonTurtle模块，绘制一只可爱的小狗，捕捉它那份纯真与活力。往期绘画>>点击进所有绘画序号链接01用Python与Tu
Linux开启命令审计功能记录用户的每一步操作自由鬼安全运维技术 IT应用探讨 linux 运维服务器
默认情况下，Linux不记录用户的每一步操作到系统级别的日志文件中。但是，Linux确实记录了一些与用户操作相关的信息，并且提供了多种方法来开启更详细的用户操作记录，以满足安全审计或故障排除的需求。一、Linux默认记录的信息：用户登录和退出信息：Linux会记录用户的登录(login)和退出(logout)事件。这些信息通常被记录在/var/log/wtmp和/var/log/btmp文件中。你
深入探究LLamaFactory推理DeepSeek蒸馏模型时无法展示＜think＞思考过程的问题羊城迷鹿 DeepSeek LLama-Factory 思维链
文章目录问题背景初始测试与问题发现LLaMAFactory测试结果对照实验：Ollama测试系统性排查与解决方案探索1.尝试更换模板2.深入研究官方文档3.自定义模板实现优化界面展示：实现思考过程的可视化实现方法参数调整影响分析实验一实验二进入大模型应用与实战专栏|查看更多专栏内容问题背景最近在本地环境中部署了DeepSeek-R1-Distill-Qwen-1.5B，即由Qwen2.5-Math
申威、龙芯、海光等六大国产芯片前景分析，谁有扛鼎之力？艾瑞网科技人工智能
申威、龙芯、海光等六大国产芯片前景分析，谁有扛鼎之力？芯片是底层硬件基础设施的核心，也是智能设备的心脏，人们愈发意识到芯片对于各行各业发展的重要意义，也对国内的芯片厂商投入了更多关注度。经过多年发展，目前我国已有超过14万家芯片相关企业，其中申威、龙芯、海光、兆芯、鲲鹏、飞腾六大厂商作为中坚代表，共同引领着国内芯片产业的进步。这六大厂商谁的商业应用前景更广，谁拥有更可持续发展的未来？其实从现在我们
代码随想录算法训练营第七天|Leetcode 344.反转字符串 541. 反转字符串II 卡码网：54.替换数字昂子的博客算法 leetcode java 数据结构
344.反转字符串建议：本题是字符串基础题目，就是考察reverse函数的实现，同时也明确一下平时刷题什么时候用库函数，什么时候不用库函数题目链接/文章讲解/视频讲解：代码随想录思路非常简单，两个指针一个指向头一个指向尾巴，对于字符串，我们定义两个指针（也可以说是索引下标），一个从字符串前面，一个从字符串后面，两个指针同时向中间移动，并交换元素。classSolution{publicvoidre
C++ 泛型编程四代目水门 C++学习笔记 c++开发语言
C++泛型编程一、泛型编程基础1.核心概念实现算法与数据结构的分离基于模板技术（函数模板/类模板）本质：类型参数化，减少重复代码典型应用：STL容器、迭代器、算法2.类型本质内存布局的抽象不同类型对应不同的内存分配策略二、函数模板1.基本语法cpptemplate//或template返回类型函数名(参数列表){//函数体}2.关键特性支持隐式推导和显式指定类型可重载（包括与普通函数重载）可声明为
【学习笔记5】Linux下cuda、cudnn、pytorch版本对应关系 longii11 linux pytorch 运维
一、cuda和cudnnNVIDIACUDAToolkit（CUDA）为创建高性能GPU加速应用程序提供了一个开发环境。借助CUDA工具包，您可以在GPU加速的嵌入式系统、桌面工作站、企业数据中心、基于云的平台和HPC超级计算机上开发、优化和部署您的应用程序。该工具包包括GPU加速库、调试和优化工具、C/C++编译器以及用于部署应用程序的运行时库。全球的深度学习研究人员和框架开发人员都依赖cuDN
字节跳动2024校招后端开发面试题大全（含解题思路） AI天才研究院 ChatGPT AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
字节跳动2024校招后端开发面试题大全（含解题思路）关键词：字节跳动、校招、后端开发、面试题、解题思路摘要：本文将围绕字节跳动2024校招后端开发面试题进行深入分析，包括数据结构与算法、编程语言基础、后端技术栈、微服务架构、系统设计与优化等方面的面试题。通过详细解析这些面试题，帮助读者理解解题思路，提升后端开发面试技能。字节跳动2024校招后端开发面试背景字节跳动（ByteDance）是中国领先的
JAVA排序荔枝吃吃 java 排序算法算法
1.冒泡排序/***使用冒泡排序算法对整数数组进行排序*冒泡排序是一种简单的排序算法，它重复地遍历要排序的数列，*一次比较两个元素，如果它们的顺序错误就把它们交换过来*遍历数列的工作是重复地进行直到没有再需要交换，也就是说该数列已经排序完成*这个算法的名字由来是因为越小（或越大）的元素会经过交换慢慢“浮”到数列的顶端**@paramarr待排序的整数数组*/publicstaticvoidbubb
【AI辅助工具】Trae和Cursor 对比分析 Hello kele 人工智能 AI编程
Trae和Cursor都是旨在提升编程效率的AI辅助工具，但在功能、定位和用户体验上有所差异。Trae：Trae是字节跳动推出的AI集成开发环境（IDE），专为中文开发者设计，提供全中文界面，符合国人使用习惯。主要特点：智能问答与代码自动补全：支持通过自然语言描述需求，自动生成相应的代码，减少手动编写代码的时间。Builder模式：类似于Cursor的Composer功能，帮助用户从零开始构建完整
DeepSeek：AI赋能的无限可能——从日常生活到职业进阶的全场景探索 Hello kele 人工智能人工智能
引言在人工智能技术飞速发展的今天，DeepSeek作为一款国产AI工具，凭借其强大的推理能力、自然语言处理效率和场景化应用潜力，正在重塑人类解决问题的方式。从撰写演讲稿到制定投资策略，从家庭教育到企业管理，DeepSeek通过“自然语言对话”的交互模式，将复杂任务简化为几步提示词的输入，真正实现了“所想即所得”。本文将从七大核心场景出发，系统解析DeepSeek如何成为个人与组织的智能助手，推动效
IMT-2020(5G)推进组发布《5G-Advanced 场景需求与关键技术白皮书》优橙教育 5G 面试职场和发展 5g 网络
11月16日，由工业和信息化部、深圳市人民政府主办的2022年中国5G发展大会在深圳举行。本届大会以“5G领航新基建，构筑发展新底座”为主题。会上，IMT-2020(5G)推进组发布《5G-Advanced场景需求与关键技术白皮书》。中国工程院院士邬贺铨表示，5G商用三年来在国际上取得了网络部署与用户数领先的成绩。2022年9月中国建成5G基站数占基站总数的20.6%，占全球5G基站数60%。20
数据结构与算法--实现链表的复制(链表中节点比较特殊,含有一个rand指针,指向任意一个节点) 请叫我大虾数据结构链表数据结构
已在leetcode上执行通过//https://leetcode.com/problems/copy-list-with-random-pointer/leetcode地址publicclassCopyListWithRandom{publicstaticclassNode{intval;Nodenext;Noderandom;publicNode(intval){this.val=val;th
【贪心算法1】 m0_46150269 贪心算法算法
力扣455.分发饼干链接:link思路尽可能让更多人吃到饼干并且尽可能少的造成浪费，大尺寸饼干能满足大胃口的人就应该优先分给大胃口的人。所以先将饼干和胃口大小排序，然后从后往前遍历。但是这时候又有一个问题，饼干和胃口哪个作为for循环哪个作为if呢？答案是只能胃口作为for，饼干作为if，因为for循环的i是固定每次移动，而饼干index只有满足条件才会移动。这里可以举一个反例，如果最大胃口大于最
MySQL锁机制深度解析：从乐观锁到悲观锁的哲学思辨与技术实践
一、并发控制的本质与挑战在数据库系统的核心地带，并发控制始终是保障数据一致性的核心命题。当每秒百万级的交易请求在金融系统中穿梭，当电商平台的库存数字在促销瞬间剧烈波动，当社交媒体的点赞计数以指数级增长时，数据库工程师们必须直面并发控制的终极挑战：如何在保证数据一致性的前提下，实现最大程度的并发性能。这个问题的解决之道，本质上是对"时间"这个维度的不同处理策略。悲观锁（PessimisticLock
贪心算法-移除K个数字我是你的春哥！贪心算法算法 java
1、题目描述给定一个以字符串表示的非负整数num，移除这个数中的k位数字，使得剩下的数字最小。注意：num的长度小于10002且≥k。num不会包含任何前导零。2、题目分析：题目简介明了，就是把给定的数字删除指定个数的数字使删除之后的数字是同等位数数字中最小的那个。但是需要注意的是，题目中给的数字是字符串的形式并且输出结果也是字符串的形式，这就涉及到字符串和数字之间的相互转化问题。题目中要求删除的
RAG 检索增强生成：技术详解与应用展望君君学姐 RAG检索增强生成
RAG检索增强生成：技术详解与应用展望一、引言随着人工智能技术的飞速发展，自然语言处理（NLP）领域迎来了前所未有的变革。其中，检索增强生成（Retrieval-AugmentedGeneration，简称RAG）作为一种新兴的技术框架，正逐渐成为大模型应用中的热门选择。RAG通过结合信息检索（IR）和自然语言生成（NLG）的能力，旨在提升模型在回答问题、生成文本等任务中的准确性和可靠性。本文将深
CES Asia 2025:5G与物联网成焦点，论坛峰会引企业关注赛逸展张胜 5G 物联网
在科技飞速发展的当下，5G与物联网技术正深刻改变着人们的生活和产业格局。作为亚洲消费电子领域的年度盛会，CESAsia2025第七届亚洲消费电子技术贸易展（赛逸展）将在首都北京盛大开幕。此次展会以“科技新视界，创新赢未来”为主题，将全方位展示5G技术及其在物联网中的创新应用，展会期间的相关论坛峰会更是吸引了众多企业的目光，成为行业内交流合作的重要契机。在5G技术展示方面，CESAsia2025将汇
企业信息查询系统的技术实现路径探析——以某大数据平台为例探熵科技大数据
引言在数字化转型加速的背景下，企业信息服务领域正经历着从传统工商查询向智能决策支持的演进。本文将以某企业信息查询系统为研究样本，解析其技术架构与实现路径，探讨大数据技术在企业服务场景中的落地应用。一、行业技术现状分析当前企业信息服务面临三大技术挑战：多源异构数据整合：需聚合工商数据（结构化）、招投标公告（半结构化）、企业新闻（非结构化）等差异化数据源数据实时性要求：企业经营状态变更、联系方式更新等
使用OpenCV和Python将图像读取为RGB UixnContext opencv python 人工智能 OpenCV
在计算机视觉和图像处理中，OpenCV是一个广泛使用的开源库，提供了许多功能强大的图像处理工具。其中一个常见的任务是将图像读取为RGB格式，以便进一步处理和分析。在本文中，我将向您展示如何使用OpenCV和Python来实现这个任务。首先，确保您已经安装了OpenCV库。您可以使用以下命令在Python中安装OpenCV：pipinstallopencv-python一旦安装完成，我们可以开始写代
贪心算法-字符串数组能拼接出的最小字典序(java) SP_1024 算法贪心算法算法 java
最小字典序的贪心算法题目描述贪心算法的解题思路贪心算法自定义比较器贪心算法暴力递归解法题目描述给定一个由字符串组成的数组strs，必须把所有的字符串拼接起来，返回所有可能的拼接结果中字典序最小的结果贪心算法的解题思路首先我们很自然的能想到,遍历数组,比较数组中每一个元素,字典序越小的,就放前面.但这里右一个陷阱,比如ba和b两个字符串,b的字典序小于ba,如果拼成bba就错了,显然bab字典序更小
# React源码解析之Reconciler运行循环与scheduler调度 Bug程序员枯港后端
React源码之看完吊打面试官系列经历一个月的学习整理，站在前人的肩膀上，对React有了一些浅薄的理解，希望记录自己的学习过程的同时也可以给大家带来一点小帮助。如果此系列文章对您有些帮助，还望在座各位义夫义母不吝点赞关注支持，也希望各位大佬拍砖探讨本系列行文思路如下,本篇属于React中的React的管理员(reconciler与scheduler)[X]React启动过程[X]React的两大
在VSCode中遇到Vetur插件与其他插件冲突时，安琪CiCi 网络协议
1.检查冲突插件-常见冲突场景：-Vetur与VueLanguageFeatures(Volar)：两者功能重叠，建议禁用Vetur，改用官方推荐的Volar。-格式化工具冲突（如Prettier、ESLint）：多个格式化插件可能导致代码保存时行为异常。-操作步骤：1.打开VSCode扩展面板（Ctrl+Shift+X）。2.搜索已安装的插件，尝试禁用可疑插件（如Volar或其他Vue相关插件）
基于python cv 库实现读取图片像素值我是电脑高手 python小工具 python 开发语言图像处理
--------在日常生活中，我们经常用简单的形容词来描述颜色，比如“红色”、“蓝色”、“绿色”等。然而，这种描述方法对于精确确定颜色是有限的，尤其是在设计、图像处理、Web开发等领域。为了更准确和科学地定义颜色，我们通常采用RGB值来表示颜色。什么是RGB值？RGB是指红色（Red）、绿色（Green）和蓝色（Blue）的组合方式，用来表示颜色。RGB是一种加色模型，也就是说，通过将红、绿、蓝三
【无标题】四色拓扑模型与宇宙历史重构的猜想框架 2301_81062744 拓扑学
###四色拓扑模型与宇宙历史重构的猜想框架---####**一、理论基础：四色拓扑与时空全息原理的融合**1.**宇宙背景信息的拓扑编码**-**大尺度结构网络**：将星系团映射为四色顶点，纤维状暗物质结构作为边，构建宇宙尺度平面图\(\mathcal{G}_{\text{cosmo}}=(V_{\text{galaxy}},E_{\text{filament}})\)。-**CMB极化图谱**：
【无标题】四色定理拓扑证明的数学强化与物理深化框架 2301_81062744 拓扑学
###**四色定理拓扑证明的数学强化与物理深化框架**---####**一、拓扑收缩的数学严谨性补全**#####**1.1零点插入的平面性保持证明**-**Kuratowski定理应用**：验证插入零点后的图\(G'\)不含\(K_5\)或\(K_{3,3}\)子图。-**引理**：每次插入零点仅增加2度顶点，不改变图的平面类。-**证明**：设原图\(G\)为平面图，插入零点\(p\)将边\(
——四色定理的解析与证明（完整版） 2301_81062744 拓扑学
——四色定理的解析与证明（完整版）###**引言**四色定理自1852年诞生以来，始终是图论与拓扑学领域的核心难题。其简洁的表述——“任何平面地图仅需四种颜色即可实现邻接区域异色”——与证明过程的复杂性形成鲜明对比。1976年，Appel与Haken通过计算机穷举约1500种不可约构形，首次给出确定性证明，却因依赖机器验证引发了数学哲学层面的长期争议。此后，数学家们不断寻求更直观、更具构造性的证明
拓展：核心对象成员访问操作符神里流~霜灭 c++c语言数据结构链表顺序表操作符
前言针对于核心对象成员访问操作符，这篇文章只简单介绍一下两者的区别以及优缺点，什么情况下使用操作符（->）、什么情况下使用操作符（.）。在C++中，操作符->（箭头操作符）和.（点操作符）是用于访问对象成员的核心操作符，但它们的使用场景和底层逻辑有明显区别。以下是详细分析：一、基本定义与区别操作符适用对象语法等价底层逻辑.对象实例（非指针）obj.member直接访问对象的成员->指向对象的指针p
【五.LangChain技术与应用】【31.LangChain ReAct Agent：反应式智能代理的实现】再见孙悟空_ AI 进阶之旅》langchain LangChain技术 LangChain输出解析器人工智能 langchain官方工具 Agent案例2
一、ReActAgent是啥？为什么说它比「普通AI」聪明？想象一下，你让ChatGPT查快递物流，它可能直接编个假单号糊弄你。但换成ReActAgent，它会先推理（Reasoning）需要调用哪个接口，再行动（Action）查询真实数据——这就是ReAct的核心：让AI学会「动脑子」再动手。举个真实案例（参考官方代码改的）：fromlangchain.agentsimportTool,init
大白话react第十五章React 应用性能优化深度实践 IT木昜大白话react react.js 前端前端框架
大白话react第十五章React应用性能优化深度实践1.React服务端渲染（SSR）的深入运用白话解释：之前咱们做的网页大多是在浏览器里把页面一点点搭建起来，这得花点时间。服务端渲染呢，就是让服务器提前把网页组装好，直接发给浏览器，这样页面打开的速度就快多啦，用户体验也更好。代码示例：用Next.js这个框架来做服务端渲染。Next.js是基于React的，能很方便地实现服务端渲染。//pag
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他