weixin_34235457

CRNN中英文字符识别

代码地址如下：
http://www.demodashi.com/demo/13870.html

参考GitHub源码：https://github.com/YoungMiao/crnn

应demo大师文章要求，我再补充下，推荐下，这个平台挺好

1.环境搭建

1.1 基础环境

Ubuntu14.04 + CUDA
opencv2.4 + pytorch + lmdb +wrap_ctc

安装lmdb apt-get install lmdb

1.2 安装pytorch

pip,linux,cuda8.0,python2.7:pip install http://download.pytorch.org/whl/cu80/torch-0.1.12.post2-cp27-none-linux_x86_64.whl
参考：http://pytorch.org/

1.3 安装wrap_ctc

git clone https://github.com/baidu-research/warp-ctc.git`
cd warp-ctc
mkdir build; cd build
cmake ..
make

GPU版在环境变量中添加
export CUDA_HOME="/usr/local/cuda"

cd pytorch_binding
python setup.py install

参考：https://github.com/SeanNaren/warp-ctc/tree/pytorch_bindings/pytorch_binding

1.4 注意问题

缺少cffi库文件使用pip install cffi安装
安装pytorch_binding前,确认设置CUDA_HOME,虽然编译安装不会报错,但是在调用gpu时，会出现wrap_ctc没有gpu属性的错误

2. crnn预测(以21类中英文为例)

模型地址：链接：https://eyun.baidu.com/s/3dEUJJg9 密码：vKeD

运行/contrib/crnn/demo.py

原始图片为:

识别结果为：

# 加载模型
model_path = './samples/netCRNN_9_112580.pth'
# 需识别的图片
img_path = './data/demo.png'
# 识别的类别
alphabet = 'ACIMRey万下依口哺摄次状璐癌草血运重'
# 设置模型参数 图片高度imgH=32, nc, 分类数目nclass=len(alphabet)+1 一个预留位, LSTM设置隐藏层数nh=128, 使用GPU个数ngpu=1
model = crnn.CRNN(32, 1, 22, 128, 1).cuda()

替换模型时，注意模型分类的类别数目

3、程序实现（crnn 训练(以21类中英文为例)）

注意：--------------------------------------

请补充完整个实现过程，以下实现，没有说到具体的实现过程，应该把具体的代码说清楚，思路说清楚。数据怎样清洗的，怎样建模的等等

1. 数据预处理

运行/contrib/crnn/tool/tolmdb.py

# 生成的lmdb输出路径
outputPath = "./train_lmdb"
# 图片及对应的label
imgdata = open("./train.txt")

2. 训练模型

运行/contrib/crnn/crnn_main.py

python crnn_main.py [--param val]
--trainroot        训练集路径
--valroot          验证集路径
--workers          CPU工作核数, default=2
--batchSize        设置batchSize大小, default=64
--imgH             图片高度, default=32
--nh               LSTM隐藏层数, default=256
--niter            训练回合数, default=25
--lr               学习率, default=0.01
--beta1             
--cuda             使用GPU, action='store_true'
--ngpu             使用GPU的个数, default=1
--crnn             选择预训练模型
--alphabet         设置分类
--Diters            
--experiment        模型保存目录
--displayInterval   设置多少次迭代显示一次, default=500
--n_test_disp        每次验证显示的个数, default=10
--valInterval        设置多少次迭代验证一次, default=500
--saveInterval       设置多少次迭代保存一次模型, default=500
--adam               使用adma优化器, action='store_true'
--adadelta           使用adadelta优化器, action='store_true'
--keep_ratio         设置图片保持横纵比缩放, action='store_true'
--random_sample      是否使用随机采样器对数据集进行采样, action='store_true'

示例:python /contrib/crnn/crnn_main.py --tainroot [训练集路径] --valroot [验证集路径] --nh 128 --cuda --crnn [预训练模型路径]

修改/contrib/crnn/keys.py中alphabet = 'ACIMRey万下依口哺摄次状璐癌草血运重'增加或者减少类别

注意事项

训练和预测采用的类别数和LSTM隐藏层数需保持一致

4、项目结构

从上往下大概说明下

1.crnn.py是crnn网络结构模块
#双向的LSTM
class BidirectionalLSTM(nn.Module)
#CRNN网络
class CRNN(nn.Module)
crnn网络设计：
CRNN由CNN+BiLSTM+CTC构成：

网络结构：

input：输入文字块，归一化到32*w 即height缩放到32，宽度按高度的比率缩放，也可以缩放到自己想要的宽度，训练时为批次训练，缩放到[32,Wmax]），示例为（32,128）
经过两个conv层和两个poling层，conv3层时数据大小为256*8*32，两个pooling层步长为2
pooling2层步长为（2，1），（个人看法：作者使用的英文训练，英文字符的特征是高大于宽的特征，倘若使用中文训练，建议使用（2,2），我的代码中默认为（2,2），示例以（2，1）为例,所以此时输出为256*4*33
bn层不改变输出的大小（就是做个归一化，加速训练收敛），p3层时,w+1,所以pooling3层时，输出为512*2*34
conv7层时，kernel 为22，stride(1,1) padding(0,0)
Wnew = (2 + 2 padW - kernel ) / strideW + 1 = 1
Hnew = 33
所以conv7层输出为512133
后面跟两个双向Lstm,隐藏节点都是256
Blstm1输出33*1256
Blstm2输出 33*1*5530 5530 = 字符个数 + 非字符 = 5529 + 1
最终的输出结果直观上可以想象成将128分为33份，每一份对应5530个类别的概率

2.tolmdb.py生成训练lmdb数据模块

输入图片list的文档，大概格式如下

3.crnn_main.py主程序模块

增加了对类别增删的增量训练，line104~line117
4.dataset.py数据加载模块
class alignCollate:按照比例缩放w
class randomSequentialSampler：随机采样batch
5.utils.py编解码模块

5、数据部分
数据获取方法有两种：

生成自然场景文本
GitHub：https://github.com/ankush-me/SynthText
生成常规文本：
GitHub：https://github.com/YoungMiao/synthdata-zh
有时间在记录两种方法

CRNN中英文字符识别

代码地址如下：
http://www.demodashi.com/demo/13870.html

注：本文著作权归作者，由demo大师代发，拒绝转载，转载需要作者授权

你可能感兴趣的:(CRNN中英文字符识别)

车牌识别技术揭秘：如何用 C# 实现自动车牌识别系统威哥说编程 c#开发语言
车牌识别（LicensePlateRecognition，LPR）是一项计算机视觉技术，用于自动识别车辆的车牌号码。在实际应用中，车牌识别技术被广泛用于停车场管理、交通监控和安防系统等领域。实现车牌识别系统的关键步骤包括图像预处理、车牌检测、字符分割、字符识别等。C#中可以通过结合OpenCV、EmguCV、TesseractOCR等工具来实现车牌识别系统。一、所需工具和库EmguCV：这是一个封
python反爬虫处理--处理验证码（Tesseract 库）的安装与使用范哥来了 python 爬虫开发语言
处理验证码是反爬虫策略中常见的挑战之一。在Python中，可以采用多种方法来解决这一问题，具体取决于验证码的类型（如文本、图像或滑块验证等）。以下是一些常用的解决方案：对于简单的文字或数字验证码：如果网站使用的是相对简单的验证码形式，您可以尝试使用OCR(OpticalCharacterRecognition,光学字符识别)技术来自动识别这些验证码。Python中有一个叫做Tesseract的库，
Matlab绘图(一)——设置坐标轴标签指定中英文字体和字体大小加点油。。。。 Matlab绘图 matlab matplotlib
❤️代码1%设置x轴和y轴标签，分别指定中文和英文的字体xlabel(['\fontname{宋体}数据1\fontname{TimesNewRoman}(Data1)'],...'FontSize',10.5,'Interpreter','tex');ylabel(['\fontname{宋体}数据2\fontname{TimesNewRoman}(%)'],...'FontSize',10.5
SQL注入常见问题之在sql注入中英文符号和中文符号的影响是小七呀呀 SQL专栏 sql 数据库 oracle mysql 网络安全 web安全
文章目录前言一、语法解析差异二、绕过过滤机制三、编码问题四、注入效果差异总结前言作为初学者的我在学习SQL注入中总是遇到了很多问题，很多时候都非常困惑，现在我把我的问题汇总出来，以帮助有需要的同学。一、语法解析差异英文符号：SQL语法严格要求使用英文符号（如'、"、;、--等）。若使用中文符号（如全角‘’、；、——等），可能导致数据库解析失败，攻击语句无法执行。示例:--正确（英文引号）SELEC
【前端】如何依靠纯前端实现拍照获取/选择文件等文字识别OCR技术爱上大树的小猪前端 ocr 前端框架 react.js
本文仅介绍第三方依赖包Tesseract.js，Tesseract.js是一个基于网页的OCR（光学字符识别）引擎，可以识别图像中的文本并将其转换为可供计算机处理的文本数据。支持多框架编译，如Vue、React等，这里展示步骤为React开发。下面直接进入主题：附Tesseract.js官方（https://github.com/naptha/tesseract.js）下载安装依赖包npminst
2025-03-15 学习记录--C/C++-PTA 练习3-4 统计字符小呀小萝卜儿学习-C/C++学习 c语言
合抱之木，生于毫末；九层之台，起于累土；千里之行，始于足下。一、题目描述⭐️练习3-4统计字符本题要求编写程序，输入10个字符，统计其中英文字母、空格或回车、数字字符和其他字符的个数。输入格式:输入为10个字符。最后一个回车表示输入结束，不算在内。输出格式:在一行内按照letter=英文字母个数,blank=空格或回车个数,digit=数字字符个数,other=其他字符个数的格式输出。输入样例:a
验证码识别：使用OCR技术识别图形验证码详解数据知道 2025年爬虫和逆向教程 ocr python 爬虫 OCR识别验证码识别图片验证码
文章目录一、基本原理二、所需工具2.1Python环境2.2图像处理库2.3OCR引擎2.4Python接口三、实现步骤3.1获取验证码图像3.2图像预处理3.3使用OCR进行字符识别3.4基本OCR识别样例四、提高识别准确率的方法4.1字符分割4.2使用深度学习模型4.3数据增强4.4集成多个OCR引擎五、实际应用中的注意事项六、总结验证码（CAPTCHA）是一种用于区分人类用户和自动化程序的安
基于YOLOv5的车牌识别系统：从数据集到UI界面的实现深度学习&目标检测实战项目 YOLOv5实战项目 YOLO ui 分类数据挖掘目标跟踪
1.引言随着智能交通系统的发展，车牌识别技术已成为交通管理、停车场自动化、路面监控等应用中的关键技术之一。车牌识别系统（LicensePlateRecognition,LPR）主要用于识别车辆的车牌号码，并将其转化为可以进一步处理的数据。车牌识别系统通常由图像处理、字符识别、目标检测等多种技术组成。近年来，随着深度学习技术的飞速发展，基于卷积神经网络（CNN）的目标检测算法，如YOLO（YouOn
论文摘要生成器：用TextRank算法实现文献关键信息提取 Atlas Shepherd python 算法自然语言处理 python 信息可视化
我们基于python代码，使用PyQt5创建图形用户界面（GUI），同时支持中英文两种语言的文本论文文献关键信息提取。PyQt5：用于创建GUI应用程序。jieba：中文分词库，用于中文文本的处理。re：正则表达式模块，用于文本清理和句子分割。numpy：提供数值计算能力，如数组操作、矩阵运算等，主要用于TextRank算法的实现。importsysimportreimportjiebaimpor
文档处理的数字化和革新 - ComIDP
在当今快节奏的环境中，企业不断寻求创新解决方案以精简操作并自动化手动任务。ComIDP是由ComPDFKit提供的先进的智能文档处理（IDP）解决方案，它作为一个强大工具，旨在改变组织管理文档的方式。什么是智能文档处理？智能文档处理是一种结合了人工智能（AI）、机器学习（ML）和光学字符识别（OCR）的技术，用于自动提取各种文档格式中的有价值信息。与传统的数据捕获方法需要大量手动干预不同，IDP利
【AI赋能】蓝耘赋能通义万相2.1：AI创作新时代的强力引擎星落无尘人工智能 AIGC
通义万相2.1的强大功能与特性通义万相2.1拥有多项突破性能力，使其在众多AI生成模型中脱颖而出。它支持文生视频、图生视频、视频编辑、文生图和视频生音频等多项任务，是真正意义上的多模态生成模型。在视频生成方面，通义万相2.1推出极速版和专业版两个版本，在权威的VBenchLeaderboard评测榜单上以84.7%的总分登顶。其首创的中文文字生成功能，为视频添加具有电影级效果的中英文文字特效变得轻
图像标注与OCR工具分析 winfredzhang ocr 框选裁剪标示位置遍历
图像标注和OCR（光学字符识别）工具的代码进行详细分析。该工具允许用户在图像上进行矩形标注，使用OCR对标注区域进行文本识别，并将结果保存为Excel文件。同时，用户可以保存和加载标注，清除标注，以及裁剪图像等。C:\pythoncode\new\scipgetpersoninfofromphoto.py项目简介这个图像标注和OCR工具的功能主要包括：加载图像并显示在界面上。允许用户在图像上绘制矩
Mistral 发布 Mistral OCR，号称「世界上最好的 OCR 模型」自不量力的A同学 ocr
Mistral发布的MistralOCR号称“世界上最好的OCR模型”，以下是对它的详细介绍：产品概述MistralOCR是一种光学字符识别API，以图像和PDF作为输入，可从有序交错的文本和图像中提取内容，能理解文档的每个元素，包括媒体、文本、表格、公式等，可与RAG系统结合，处理多模式文档。核心优势顶尖的复杂文档理解能力：可精准识别科学论文、技术文献中的图表、公式（含LaTeX）、表格及混合排
快速掌握EasyOCR应用实战指南梦想画家 #python 人工智能 python pytorch EasyOCR
EasyOCR是一个开源的、支持多语言（28+种）和多文档格式（PDF/PNG/JPG/TIFF等）的OCR（光学字符识别）工具库，由HuggingFace团队维护。其目标是简化OCR的开发流程，提供易用、高性能的文本识别能力，适用于工业、教育、医疗等多个领域。EasyOCR核心组件解析1.特征提取（FeatureExtraction）技术模型：ResNet（残差网络）、VGG功能：将输入图像转换
Python OCR库：自动化测试验证码识别神器！测试大大怪 python ocr selenium appium 功能测试测试用例测试工具
在接口自动化工作中，经常需要处理文字识别的任务，而OCR（OpticalCharacterRecognition，光学字符识别）库能够帮助我们将图像中的文字提取出来。Python中有几个常用的OCR库，包括pyocr、pytesseract和python-tesseract、EasyOCR。本文将对它们进行比较，并提供一些示例代码来演示它们在实际接口自动化工作中的应用。1、pyocrPyOCR是一
使用easyocr、PyPDF2对图像及PDF文档进行识别欣然～ dubbo
一、概述本Python脚本的主要功能是对当前目录及其子目录下的图片和PDF文件进行光学字符识别（OCR）处理。它使用easyocr库处理图片中的文字，使用PyPDF2库提取PDF文件中的文本，并将处理结果保存为文本文件。同时，脚本会记录详细的处理日志，方便用户跟踪处理过程和排查问题。二、环境要求Python版本：建议使用Python3.6及以上版本。依赖库：easyocr：用于图片的OCR识别。P
深入解析 Umi-OCR：高效的免费开源 OCR 文字识别工具萧鼎 python基础到进阶教程 ocr python Umi-OCR
1.Umi-OCR简介1.1什么是Umi-OCR？Umi-OCR是一款开源、免费、支持离线使用的光学字符识别（OCR）工具，基于PaddleOCR和Tesseract-OCR，能够高效识别图片中的文字，尤其适用于批量截图文字提取、PDF文字识别、手写体识别等应用场景。它具备轻量级、易用、支持多种格式等特点，在文字识别任务中表现优异。1.2Umi-OCR的核心特点完全免费开源：Umi-OCR在Git
如何结合NLP（自然语言处理）技术提升OCR系统的语义理解和上下文感知能力？金智维科技官方自然语言处理 ocr 人工智能
光学字符识别（OCR）技术能够快速从文档、图像中提取文本信息，目前已经广泛应用于金融、教育、医疗、物流等领域。然而，传统OCR技术的功能主要集中在字符提取和简单的结构化输出上，难以处理复杂场景中涉及的语义理解与上下文感知问题。而通过将自然语言处理（NLP）技术与OCR相结合，可以极大提升系统对文本的语义理解能力，为多场景应用赋予更高的智能化水平。虽然OCR在文本识别的准确性和速度上不断提升，但面对
【pyOCR】星星向前看 python
pyOCR是什么pyOCR，全称PythonOpticalCharacterRecognition，是一个Python库，用于文本识别。它集成了多个OCR（光学字符识别）引擎，包括Tesseract、OCRopus等，让开发者能够方便地进行文本识别操作。pyOCR支持多种格式的文档，如PDF、JPEG、PNG等，并能够识别多种语言的文本。使用pyOCR，开发者可以轻松地将图片中的文字转换为机器可处
2.4K star的GOT-OCR2.0：端到端OCR 模型 AI 研习所人工智能大模型 AI AIGC 人工智能
GOT-OCR2.0是一款新一代的光学字符识别（OCR）技术，标志着人工智能在文本识别领域的重大进步。作为一款开源模型，GOT-OCR2.0不仅支持传统的文本和文档识别，还能够处理乐谱、图表以及复杂的数学公式，为用户提供了更加全面和高效的解决方案。产品功能及特点多语言支持：GOT-OCR2.0主要支持中文和英文字符识别，并能够通过进一步的微调扩展到更多语言。这种灵活性使其适用于国际化应用，满足不同
利用条形码和 OCR 彻底改变 VIN 和 TIN 识别方式 sdk大全 Dynamsoft Barcode Reader 人工智能
利用条形码和OCR彻底改变VIN和TIN识别方式在汽车行业中，车辆识别号(VIN)和轮胎识别号(TIN)不可或缺。这些字母数字代码在确保车辆跟踪和安全方面起着至关重要的作用。VIN提供有关车辆来源、规格和唯一身份的详细信息，而TIN对于监控轮胎生产、召回和安全标准至关重要。然而，识别这些代码和数字的传统方法已被证明效率低下，常常导致错误、延误和操作瓶颈。条形码和光学字符识别(OCR)等技术的引入彻
使用 Helsinki-NLP 中英文翻译本地部署 - python 实现 Xian-HHappy 技术知识点自然语言处理 python 人工智能中英文翻译模型本地部署
通过Helsinki-NLP本地部署中英文翻译功能。该开源模型性价比相对高，资源占用少，对于翻译要求不高的应用场景可以使用，比如单词，简单句式的中英文翻译。该示例使用的模型下载地址：【免费】Helsinki-NLP中英文翻译本地部署-python实现模型资源-CSDN文库模型也可以在huggingface下载。1、英文翻译为中文示例：#-*-coding:utf-8-*-#date:2024#Au
android手机的分区,安卓系统分区介绍孙佳纯 android手机的分区
本帖最后由刘向臻LXZ于2014-7-1114:32编辑安卓系统分区介绍：英文原文：AndroidPartitionsExplained:boot,system,recovery,data,cache&misc地址：安卓手机和平板一般包括以下标准内部分区：/boot/system/recovery/data/cache/misc另外还与SD卡分区：/sdcard/sd-ext现中英文对照如下：注意
有哪些好用的AI工具？(你想要的AI工具都在这) c++
1.常见应用场景1.1.国内通用大模型模型名称简介官网地址DeepSeek深度求索公司研发的高性能开源模型，以低成本、高推理能力著称，支持数学、代码等复杂任务。https://chat.deepseek.com/豆包字节跳动开发的智能语言模型，基于深度学习技术，支持多种自然语言处理任务。https://www.doubao.com/Kimi月之暗面科技推出的长文本处理AI助手，擅长中英文对话、文件
有哪些好用的AI工具？(你想要的AI工具都在这) c++
1.常见应用场景1.1.国内通用大模型模型名称简介官网地址DeepSeek深度求索公司研发的高性能开源模型，以低成本、高推理能力著称，支持数学、代码等复杂任务。https://chat.deepseek.com/豆包字节跳动开发的智能语言模型，基于深度学习技术，支持多种自然语言处理任务。https://www.doubao.com/Kimi月之暗面科技推出的长文本处理AI助手，擅长中英文对话、文件
学术必备的21个论文网站，建议收藏！初尘屿风人工智能深度学习全文检索学习方法百度
1、综合型论文网站（国内）（1）知网介绍：国内知名度最高的网站，拥有上亿篇各种论文期刊，包含中国学术文献、外文文献、学位论文、报纸、会议、年鉴、工具书等各类资源统一检索、统一导航、在线阅读和下载服务。网址：https://www.cnki.net/（2）掌桥科研介绍：掌桥科研文献资源库涵盖中英文期刊，会议，学位论文、科技报告等多种资源，拥有1.2多亿文献资源，值得一提的是，它整合了目前国际上主流的
初识Vulkan渲染管线超级无敌小小顺利 Vulkan Vulkan 渲染管线 GPU Pipeline
目前参考《Vulkan规范》和《Vulkan开发实战详解》对渲染管线有了一个初步的认识。现结合中英文的渲染管线图进行笔记整理。中英文的渲染管线图分别如下所示：绘制命令送入设备队列执行后，Vulkan将原始的物体顶点坐标数据、顶点颜色数据最终转化为屏幕中画面。上面中文管线结构图中有两个应用程序入口，左侧为简单示例入口，右侧为使用GPU进行高性能通用计算时的计算管线。1.绘制：命令进入Vulkan图形
ocr智能票据识别系统|自动化票据识别集成方案 OCR_API 接口 ocr 自动化运维
在企业日常运营中，对大量票据实现数字化管理是一项耗时且容易出错的任务。随着技术的进步，OCR（光学字符识别）智能票据识别系统的出现为企业提供了一个高效、准确的解决方案，不仅简化了财务流程，还大幅提升了工作效率。一、什么是OCR智能票据识别系统？OCR智能票据识别系统是一种基于先进图像处理和深度学习算法的技术，能够自动从各类票据中提取关键信息，并将其转换为结构化数据。翔云发票识别系统可以应用于增值税
【PYTORCH】官方的turoria实现中英文翻译 liwulin0506 pytorch python pytorch 人工智能 python
参考https://pytorch.org/tutorials/intermediate/seq2seq_translation_tutorial.html背景pytorch官方的是seq2seq是法语到英文，做了一个中文到英文的。数据集下载后解压，使用的data\testsets\devset\UNv1.0.devset.zh和UNv1.0.devset.en，因为电脑配置不行，所以只选取了10
＜Attention Is All You Need＞：全网首次提出Transformer模型论文中英文对照学习 kingking44 transformer 学习人工智能
论文摘要英文Thedominantsequencetransductionmodelsarebasedoncomplexrecurrentorconvolutionalneuralnetworksthatincludeanencoderandadecoder.Thebestperformingmodelsalsoconnecttheencoderanddecoderthroughanattenti
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他