kerlubasola

tesseract-ocr识别中文扫描图片实例讲解 .

本文参考http://blog.csdn.net/zhoushuyan/archive/2010/10/18/5948289.aspx#1567946实现，在这里感谢该文章的作者。

当我浏览http://code.google.com/p/tesseract-ocr并下载了几个文件下来之后顿时感到一头雾水，不知该如何下手。网上看到有人在linux操作系统下的实现，

如：

利用开源程序（ImageMagick+tesseract-ocr）实现图像验证码识别

但却很少看到在windows下的相关文章介绍。

接下来我将一步步讲述如何采用tesseract-ocr识别含有中文的图片。

1、下载tesseract-ocr（注意3.0版本之后才支持中文的识别）

tesseract-ocr-setup-3.00.exe

chi_sim.traineddata.gz

2、安装tesseract-ocr

解压缩，双击 tesseract-ocr-setup-3.00.exe即可根据提示一步步安装，本人安装的目录是：D:/Program Files/Tesseract-OCR

在该目录下可看到tesseract.exe文件，这就是我们后面程序中会调用到的运行进程。

3、自定义安装语言包

D:/Program Files/Tesseract-OCR目录下找到/tessdata目录，其是用来存放语言包，可把 chi_sim.traineddata.gz解压缩之后的chi_sim.traineddata文件复制到该目录下即可。

4、编写测试代码

在编写代码之前下载两个jar包：jai_imageio-1.1-alpha.jar、swingx-1.0.jar，可在www.findjar.com 网站上去下载。

view plain copy to clipboard print ?

importjava.awt.image.BufferedImage;
importjava.io.File;
importjava.io.IOException;
importjava.util.Iterator;
importjava.util.Locale;
importjavax.imageio.IIOImage;
importjavax.imageio.ImageIO;
importjavax.imageio.ImageReader;
importjavax.imageio.ImageWriteParam;
importjavax.imageio.ImageWriter;
importjavax.imageio.metadata.IIOMetadata;
importjavax.imageio.stream.ImageInputStream;
importjavax.imageio.stream.ImageOutputStream;
importcom.sun.media.imageio.plugins.tiff.TIFFImageWriteParam;
publicclassImageIOHelper{
/**
*图片文件转换为tif格式
*@paramimageFile文件路径
*@paramimageFormat文件扩展名
*@return
*/
publicstaticFilecreateImage(FileimageFile,StringimageFormat){
FiletempFile=null;
try{
Iterator<ImageReader>readers=ImageIO.getImageReadersByFormatName(imageFormat);
ImageReaderreader=readers.next();
ImageInputStreamiis=ImageIO.createImageInputStream(imageFile);
reader.setInput(iis);
//Readthestreammetadata
IIOMetadatastreamMetadata=reader.getStreamMetadata();
//SetupthewriteParam
TIFFImageWriteParamtiffWriteParam=newTIFFImageWriteParam(Locale.CHINESE);
tiffWriteParam.setCompressionMode(ImageWriteParam.MODE_DISABLED);
//Gettifwriterandsetoutputtofile
Iterator<ImageWriter>writers=ImageIO.getImageWritersByFormatName("tiff");
ImageWriterwriter=writers.next();
BufferedImagebi=reader.read(0);
IIOImageimage=newIIOImage(bi,null,reader.getImageMetadata(0));
tempFile=tempImageFile(imageFile);
ImageOutputStreamios=ImageIO.createImageOutputStream(tempFile);
writer.setOutput(ios);
writer.write(streamMetadata,image,tiffWriteParam);
ios.close();
writer.dispose();
reader.dispose();
}catch(IOExceptione){
e.printStackTrace();
}
returntempFile;
}
privatestaticFiletempImageFile(FileimageFile){
Stringpath=imageFile.getPath();
StringBufferstrB=newStringBuffer(path);
strB.insert(path.lastIndexOf('.'),0);
returnnewFile(strB.toString().replaceFirst("(?<=//.)(//w+)$","tif"));
}
}

import java.awt.image.BufferedImage;import java.io.File;import java.io.IOException;import java.util.Iterator;import java.util.Locale;import javax.imageio.IIOImage;import javax.imageio.ImageIO;import javax.imageio.ImageReader;import javax.imageio.ImageWriteParam;import javax.imageio.ImageWriter;import javax.imageio.metadata.IIOMetadata;import javax.imageio.stream.ImageInputStream;import javax.imageio.stream.ImageOutputStream;import com.sun.media.imageio.plugins.tiff.TIFFImageWriteParam;public class ImageIOHelper {	/**	 * 图片文件转换为tif格式	 * @param imageFile 文件路径	 * @param imageFormat 文件扩展名	 * @return	 */	public static File createImage(File imageFile, String imageFormat) {		File tempFile = null;		try {			Iterator<ImageReader> readers = ImageIO.getImageReadersByFormatName(imageFormat);			ImageReader reader = readers.next();					ImageInputStream iis = ImageIO.createImageInputStream(imageFile);			reader.setInput(iis);			//Read the stream metadata			IIOMetadata streamMetadata = reader.getStreamMetadata();						//Set up the writeParam			TIFFImageWriteParam tiffWriteParam = new TIFFImageWriteParam(Locale.CHINESE);			tiffWriteParam.setCompressionMode(ImageWriteParam.MODE_DISABLED);						//Get tif writer and set output to file			Iterator<ImageWriter> writers = ImageIO.getImageWritersByFormatName("tiff");			ImageWriter writer = writers.next();						BufferedImage bi = reader.read(0);			IIOImage image = new IIOImage(bi,null,reader.getImageMetadata(0));			tempFile = tempImageFile(imageFile);			ImageOutputStream ios = ImageIO.createImageOutputStream(tempFile);			writer.setOutput(ios);			writer.write(streamMetadata, image, tiffWriteParam);			ios.close();						writer.dispose();			reader.dispose();					} catch (IOException e) {			e.printStackTrace();		}		return tempFile;	}	private static File tempImageFile(File imageFile) {		String path = imageFile.getPath();		StringBuffer strB = new StringBuffer(path);		strB.insert(path.lastIndexOf('.'),0);		return new File(strB.toString().replaceFirst("(?<=//.)(//w+)$", "tif"));	}}

view plain copy to clipboard print ?

importjava.io.BufferedReader;
importjava.io.File;
importjava.io.FileInputStream;
importjava.io.InputStreamReader;
importjava.util.ArrayList;
importjava.util.List;
importorg.jdesktop.swingx.util.OS;
publicclassOCR{
privatefinalStringLANG_OPTION="-l";//英文字母小写l，并非数字1
privatefinalStringEOL=System.getProperty("line.separator");
privateStringtessPath="D://ProgramFiles//Tesseract-OCR";
//privateStringtessPath=newFile("tesseract").getAbsolutePath();
publicStringrecognizeText(FileimageFile,StringimageFormat)throwsException{
FiletempImage=ImageIOHelper.createImage(imageFile,imageFormat);
FileoutputFile=newFile(imageFile.getParentFile(),"output");
StringBufferstrB=newStringBuffer();
List<String>cmd=newArrayList<String>();
if(OS.isWindowsXP()){
cmd.add(tessPath+"//tesseract");
}elseif(OS.isLinux()){
cmd.add("tesseract");
}else{
cmd.add(tessPath+"//tesseract");
}
cmd.add("");
cmd.add(outputFile.getName());
cmd.add(LANG_OPTION);
cmd.add("chi_sim");
//cmd.add("eng");
ProcessBuilderpb=newProcessBuilder();
pb.directory(imageFile.getParentFile());
cmd.set(1,tempImage.getName());
pb.command(cmd);
pb.redirectErrorStream(true);
Processprocess=pb.start();
//tesseract.exe1.jpg1-lchi_sim
intw=process.waitFor();
//删除临时正在工作文件
tempImage.delete();
if(w==0){
BufferedReaderin=newBufferedReader(newInputStreamReader(newFileInputStream(outputFile.getAbsolutePath()+".txt"),"UTF-8"));
Stringstr;
while((str=in.readLine())!=null){
strB.append(str).append(EOL);
}
in.close();
}else{
Stringmsg;
switch(w){
case1:
msg="Errorsaccessingfiles.Theremaybespacesinyourimage'sfilename.";
break;
case29:
msg="Cannotrecongnizetheimageoritsselectedregion.";
break;
case31:
msg="Unsupportedimageformat.";
break;
default:
msg="Errorsoccurred.";
}
tempImage.delete();
thrownewRuntimeException(msg);
}
newFile(outputFile.getAbsolutePath()+".txt").delete();
returnstrB.toString();
}
}

import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.InputStreamReader;import java.util.ArrayList;import java.util.List;import org.jdesktop.swingx.util.OS;public class OCR {	private final String LANG_OPTION = "-l";  //英文字母小写l，并非数字1	private final String EOL = System.getProperty("line.separator");	private String tessPath = "D://Program Files//Tesseract-OCR";	//private String tessPath = new File("tesseract").getAbsolutePath();		public String recognizeText(File imageFile,String imageFormat)throws Exception{		File tempImage = ImageIOHelper.createImage(imageFile,imageFormat);		File outputFile = new File(imageFile.getParentFile(),"output");		StringBuffer strB = new StringBuffer();		List<String> cmd = new ArrayList<String>();		if(OS.isWindowsXP()){			cmd.add(tessPath+"//tesseract");		}else if(OS.isLinux()){			cmd.add("tesseract");		}else{			cmd.add(tessPath+"//tesseract");		}		cmd.add("");		cmd.add(outputFile.getName());		cmd.add(LANG_OPTION);		cmd.add("chi_sim");		//cmd.add("eng");				ProcessBuilder pb = new ProcessBuilder();		pb.directory(imageFile.getParentFile());				cmd.set(1, tempImage.getName());		pb.command(cmd);		pb.redirectErrorStream(true);				Process process = pb.start();		//tesseract.exe 1.jpg 1 -l chi_sim		int w = process.waitFor();				//删除临时正在工作文件		tempImage.delete();				if(w==0){			BufferedReader in = new BufferedReader(new InputStreamReader(new FileInputStream(outputFile.getAbsolutePath()+".txt"),"UTF-8"));						String str;			while((str = in.readLine())!=null){				strB.append(str).append(EOL);			}			in.close();		}else{			String msg;			switch(w){				case 1:					msg = "Errors accessing files.There may be spaces in your image's filename.";					break;				case 29:					msg = "Cannot recongnize the image or its selected region.";					break;				case 31:					msg = "Unsupported image format.";					break;				default:					msg = "Errors occurred.";			}			tempImage.delete();			throw new RuntimeException(msg);		}		new File(outputFile.getAbsolutePath()+".txt").delete();		return strB.toString();	}}

view plain copy to clipboard print ?

importjava.io.File;
importjava.io.IOException;
publicclassTestOCR{
/**
*@paramargs
*/
publicstaticvoidmain(String[]args){
Stringpath="d://test//chi.jpg";
try{
StringvalCode=newOCR().recognizeText(newFile(path),"jpg");
System.out.println(valCode);
}catch(IOExceptione){
e.printStackTrace();
}catch(Exceptione){
e.printStackTrace();
}
}
}

通过本人的测试对于中文的识别虽然不是很完美，至少其可支持了，但最大的缺点就是速度慢。中文本来就很复杂，而且其语言包就达到50多M，和英文语言包比起来真是..............

测试图片，可右击“图片另存为”

解析输出结果：

一、引孟4
1. 1 从体验经济到体验设计驷
随着社会生产力发展水平的提高和人类需求层次的升级, 体验经济也就成
为了经济发展的必然趋势。体验经济日渐显现, 出现了服务于它的体验设计。、
设计是创新的重要组成部分。茌强调目主创新的六环i竞下, 申国的企业应
该兖分关注体验设计的新趋势‘。体验设计的理论正茌成为现代企业开发产品和
服务顶目的重要依据。现阶段, IT 领域很早就注意到了这一点, 百度、腾讯、
支付宝、阿里巴巴等着属设有专门的用户体验部, 为其产品和服务增加附加价值,
也更六程度她让用户满意, 最终荻得了最佳企业效益。、
同时7 随看现代产品设计思想的成熟, 产品设计也越来越聚焦于人本身一
7人的存茌, 人的需要7 持别是人的情感需要。设计与人, 人与设计, 设计是
否可以有长远意义, 是否可以印证人的真买存茌, 是否可以帮助人们理解目己,
认识世界。这个问题己偏同于哲学, 但却确买是设计这种文化形式的内茌诉求。
越来越多的产品遍过设计, 茌与人交互的过程申7 使人产生愉悦的体验, 并茌
这个体验的后期, 让人产生反思, 遍过反思得以认识自己7 发展自己。找想这
点是设计成为一种优势文化, 而所要肩负的必要责任。 ~

测试中发现的几个注意点：

1、若是一份英文文档其对英文字母o绝大部分会识别为数字0。所以若是英文和数字的文档，最好不要加入中文语言包，而是引入eng.traineddata语言包到D:/Program Files/Tesseract-OCR/tessdata目录下。

看到OCR类31-32行代码

cmd.add("chi_sim");
//cmd.add("eng");

去掉 //cmd.add("eng");前的注释，但记得在cmd.add("chi_sim");前加上注释哦，不然你就看不到效果了哦。

2、测试中还发现一个问题，有时候在目录下已经生成临时文件并且识别出的文字写入到output.txt,但是在int w = process.waitFor();则阻塞了停止运行再也没有反应了，以致控制台始终没有打印出文字。

解析（参考）：刚开始想到直接去掉这个语句算了，但是运行的时候会报运行错误。最后在http://www.cnblogs.com/xxpal/articles/824963.html看到下面一段文字说明：在Windows平台上，运行被调用程序的DOS窗口在程序执行完毕后往往并不会自动关闭，从而导致Java应用程序阻塞在waitfor()语句。导致该现象的一个可能的原因是，该可执行程序的标准输出比较多，而运行窗口的标准输出缓冲区不够大。解决的办法是，利用Java中Process类提供的方法让Java虚拟机截获被调用程序的DOS运行窗口的标准输出，在waitfor()命令之前读出窗口的标准输出缓冲区中的内容。

解决办法：在int w = process.waitFor();代码行前面加上

String s;
BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(process.getInputStream()));
while((s=bufferedReader.readLine()) != null);

int w = process.waitFor();

再次运行试试看吧。

回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
ARMv8 Debug __pop_ ARMv8 ARM64 架构 linux 运维
内容来自DEN0024A_v8_architecture_PG.pdf本质ARMv8Debug是什么历史在ARMv4开始被引入,并已发展成一系列广泛的调试(debug1)和跟踪(trace)功能ARMv6和ARMv7-a新增了自托管调试(debug2)和性能评测(trace-enhance)ARMv8处理器提供硬件功能侵入式:调试工具能够对核心活动提供显著级别的控制非侵入式:以非侵入性方式收集有关
TextFiled 中输入金额宁梓茞
要求:输入的金额不能超过六位,小数点后面只能输入两位小数如果textFIled中第一位输入的是0,后面必须输入小数点,否则禁止输入用到textfiled代理方法#pragmamark----textFiledDelegate-----(BOOL)textField:(UITextField*)textFieldshouldChangeCharactersInRange:(NSRange)range
ARMV8体系结构简介：概述简单同学 ARMV8体系结构 ARMV8
1.前言本文主要概括的介绍ARMV8体系结构定义了哪些内容，概括的说：ARM体系结构定义了PE的行为，不会定义具体的实现ARM体系结构也定义了debug体系结构和trace体系结构ARM体系结构采用RISC指令集（1）长度一致的寄存器；（2）load/store架构，数据处理操作只能对寄存器内容进行处理，不会直接对内存的内容进行处理；（3）简单寻址方式，load/store地址来源于寄存器或指令域
Python实现TIFF 文件转换为 PNG 和 JPG 格式 sand&wich python 开发语言
在日常的图像处理工作中，可能会遇到需要将TIFF格式的图像转换为其他格式的情况，例如PNG和JPG。下面，本文将介绍如何使用Python和GDAL库实现这一功能。准备工作在开始之前，请确保已经安装了必要的库：GDAL（GeospatialDataAbstractionLibrary）可以使用以下命令安装GDAL：pipinstallgdal代码实现以下是一个将TIFF文件转换为PNG文件的示例代码
处理标签包裹的字符串，并取出前250字符周bro 前端 javascript 开发语言
//假设这是你的HTML字符串varhtmlString=`这是一个段落。这是一个标题这是另一个段落，包含一些链接。`;//解析HTML字符串并提取文本functionextractTextFromHTML(html){varparser=newDOMParser();vardoc=parser.parseFromString(html,"text/html");vartextContent=do
spring security中几大组件的作用和执行顺序阿信在这里 java spring
springsecurity中几大组件的作用和执行顺序在SpringSecurity中，AuthenticationProvider、GroupPermissionEvaluator、PermissionEvaluator、AbstractAuthenticationProcessingFilter、DefaultMethodSecurityExpressionHandler和ManageSecu
Linux下使用U盘 WittXie Linux linux 运维服务器
第一步：插入U盘，如果能够识别出U盘，则会打印出一些信息；第二步：查看U盘系统分配给U盘的设备名；输入如下命令进行查看：fdisk-l/dev/sda如果打印出如下信息：Disk/dev/sda:4233MB,4233101312bytes165heads,34sectors/track,1473cylindersUnits=cylindersof5610*512=2872320bytesDevi
车载软件调试工具系列---Trace32简介（Lauterbach TRACE32）开头篇车载诊断技术车载电子电气架构车载软件架构——AUTOSAR 架构 AUTOSAR 汽车电子电器架构 Trace 32 劳特巴赫
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：屏蔽力是信息过载时代一个人的特殊竞争力，任何消耗你的人和事，多看一眼都是你的不对。非必要不费力证明自己，无利益不试图说服别人，是精神上的节能减排。无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事.而不是让内心的烦躁、焦虑、毁掉你本就不多的热情和定力。时间不知不觉中，快
Cut, Paste and Learn方法解读 wangxinwei2000 深度学习人工智能
Abstract问题背景：标注数据的缺乏：在实例检测任务中，部署物体检测模型的一个主要障碍是缺乏大量标注数据。例如，在一个特定的厨房环境中找到包含实例的大型标注数据集是不太可能的。每当面对新的环境和新的物体实例时，都需要进行昂贵的数据收集和标注工作。研究贡献：解决方法：本文提出了一种简单的方法，可以以最小的努力生成大量标注的实例数据集。关键洞察：研究者的关键洞察是，仅仅确保“局部真实感”（patc
MySQl篇（SQL - 基本介绍）（持续更新迭代） wclass-zhengge mysql sql 数据库
目录一、简介二、SQL方言（分页查询为例）1.简介2.SQL方言大比拼2.1.Oracle2.1.1.使用ROWNUM实现分页查询2.1.2.使用ROW_NUMBER()实现分页查询2.2.MySQL2.3.PostgreSQL三、语法规范四、注释五、MySQL脚本中的标点符号一、简介1、SQL是结构化查询语言（StructureQueryLanguage），专门用来操作/访问关系型数据库的通用语
梧桐数据库（WuTongDB）：数据库技术中都有哪些常见的优化器鲁鲁517 梧桐数据库梧桐数据库
以下是一些常见的数据库优化器：1.CBO（Cost-BasedOptimizer）应用场景：广泛应用于关系型数据库中，如Oracle、PostgreSQL、MySQL等。工作原理：通过计算不同执行计划的代价（如CPU、I/O等资源消耗），选择最低代价的执行计划。代表数据库：Oracle、PostgreSQL、MySQL。特点：CBO使用统计信息（如表大小、索引分布）来评估查询的代价。2.RBO（R
谈谈你对AQS的理解 Mutig_s juc java 开发语言面试后端
AQS概述AQS，全称为AbstractQueuedSynchronizer，是Java并发包（java.util.concurrent）中一个核心的框架，主要用于构建阻塞式锁和相关的同步器，也是构建锁或者其他同步组件的基础框架。AQS提供了一种基于FIFO（First-In-First-Out）的CLH(三个人名缩写)双向队列的机制，来实现各种同步器，如ReentrantLock、Semapho
【安装环境】配置MMTracking环境 xuanyu22 安装环境机器学习神经网络深度学习 python
版本v0.14.0安装torchnumpy的版本不能太高，否则后面安装时会发生冲突。先安装numpy，因为pytorch的安装会自动配置高版本numpy。condainstallnumpy=1.21.5mmtracking支持的torch版本有限，需要找到合适的condainstallpytorch==1.11.0torchvision==0.12.0cudatoolkit=10.2-cpytor
复盘赵建庄
行动后反思，AAR（AfterActionReview），是知识管理的一种工具，起源于美国陆军的作战方法，强调在每次行动后进行及时反思、总结和改进。《复盘》一书其实就是这种方法的具体应用，名字不同，然而实质相同。相比AAR这样的说法，复盘更简洁，容易被国人接受，而且，书中给出了非常详细的步骤，有较强的指导意义和实战性，AAR的六步法，说的比较简单，有人可以悟，结合实际业务演变出各种变化，大多数人可
three.js AnimationClip 和 AnimationMixer 灵魂清零 three web3 前端 javascript vue.js
AnimationClip动画剪辑（AnimationClip）是一个可重用的关键帧轨道集，它代表动画。构造器AnimationClip(name:String,duration:Number,tracks:Array)name-此剪辑的名称duration-持续时间(单位秒).如果传入负数,持续时间将会从传入的数组中计算得到。tracks-一个由关键帧轨道（KeyframeTracks）组成的数
git 恢复误删的远程分支 Hanfank
需求实际工作上，肯定会有不小心的时候，比如我吧，删除了本地dev分支，intellijidea提示是否将trackedbranch也删掉，结果一不小心将远程分支也删除了，接下来就是我的救赎之旅。查看reflog，找到最后一次commitidgitreflog--date=isoreflog是referencelog的意思，也就是引用log，记录HEAD在各个分支上的移动轨迹。选项--date=is
CISSP考点拾遗——软件保障SwA 我全家都是CISSP
说明：“考点拾遗”系列基于日常为学员和网友做的答疑整理，主要涉及教材中没有完全覆盖到的知识点。Softwareassuranceisthelevelofconfidencethatsoftwareisfreefromvulnerabilities,eitherintentionallydesignedintothesoftwareoraccidentallyinsertedatanytimedur
解决mysql漏洞 Oracle MySQL Server远程安全漏洞(CVE-2015-0411) dieweidong5625 数据库运维 java
有时候会检测到服务器有很多漏洞，而大部分漏洞都是由于服务的版本过低的原因，因为官网出现漏洞就会发布新版本来修复这个漏洞，所以一般情况下，我们只需要对相应的软件包进行升级到安全版本即可。通过查阅官网信息，OracleMySQLServer远程安全漏洞(CVE-2015-0411)，受影响系统：OracleMySQLServer/usr/databases.sql//先备份原有所有数据，防止数据丢失。
Spring Cloud: Hystrix请求队列线程不足 MeazZa
在SpringCloud中，Feign可以实现本地化的微服务API调用，Hystrix可以实现调用失败时的fallback处理。问题描述：在实际生产环境中使用时，我们遇到了这样一个错误："...,stacktrace:[com.netflix.hystrix.exception.HystrixRuntimeException:QueryNodeImpalaBdService#getQueryRes
MySQL内存结构 san.hang 数据库数据结构与算法
实际上MySQL内存的组成和Oracle类似，也可以分为SGA（系统全局区）和PGA（程序缓存区）。mysql>showvariableslike"%buffer%";一、SGA1.innodb_buffer_bool用来缓存Innodb表的数据、索引、插入缓冲、数据字典等信息。2.innodb_log_buffer事务在内存中的缓冲，即redlogbuffer的大小3.querycache高速查
蓝易云 - 诊断并修复SSH连接Github时遇到的“connection closed“错误。蓝易云 ssh github 运维 linux vscode redis
解决SSH连接GitHub时遇到的"connectionclosed"错误，需要依次排查网络连通性、认证信息、SSH配置和服务器响应等多个可能影响连接的因素。下面是解决步骤和方法：网络连通性检查：使用ping命令检查您的机器是否能够到达GitHub的服务器。pinggithub.com如果不能ping通，可能是网络问题，检查代理设置或网络连接。使用traceroute或tracert命令（取决于操
Oracle（125）如何执行不完全恢复？辞暮尔尔-烟火年年 Oracle oracle 数据库
不完全恢复（IncompleteRecovery）是指将Oracle数据库恢复到一个特定时间点、SCN（系统变更号）或取消点，而不是恢复到最近的备份后的最新状态。以下是详细的步骤和代码示例，展示如何执行不完全恢复。准备工作备份控制文件：确保你有控制文件的备份。备份数据文件：确保你有数据文件的备份。备份归档日志：确保你有最新的归档日志。不完全恢复的基本步骤关闭数据库：确保数据库处于关闭状态。启动数据
国际与国内GCP指南的历史演变和未来方向一线临研人
作为一名临床试验从业者，耳边萦绕最多的恐怕就是“遵守GCP”了。那么，GCP是什么？从哪里来？又到哪里去？本文将全面介绍GCP指南的现状及发展历程，从国际和国内两个角度，分享最新的关于GCP的资讯。GCP是什么？GCP是GoodClinicalPractice的缩写，即《药物临床试验质量管理规范》。GCP是规范药物临床试验全过程的标准规定，包括方案设计、组织实施、监查、稽查、记录、分析总结和报告,
通过与AI代理结对编程在集成课程中促进AI辅助学习循环的方法神一样的老师论文阅读分享人工智能结对编程学习
本篇论文提出了一种新的方法论，利用人工智能（AI）技术的最新进展，为学生制定一个AI辅助的代码学习循环。这种方法在现有的学习过程中创新性地融入了结对编程，以增强学生的互动式学习体验。以下是论文的主要内容概述：摘要(Abstract)：提出了一种新方法，利用AI技术来辅助学生学习编程。方法包括将示例代码转化为脚手架代码作为练习，通过教师与AI的配对来实现。脚手架代码作为学生在硬件平台上迭代完成和调试
Oracle EBS中AR模块的财务流程概览六月雨滴 EBS oracle
应收账款(AR)模块是OracleE-BusinessSuite(EBS)中另一个重要的财务管理模块，主要用于管理企业销售过程中的账款回收。下面是AR模块中的一些关键财务流程及其详细说明：1.销售订单管理创建销售订单：当客户下单时，销售人员在系统中创建销售订单。订单确认：确认销售订单的详细信息，包括商品、数量、价格等。订单履行：确保仓库有足够的库存来满足订单需求。2.发票生成发票创建：根据销售订单
oracle数据库安装和配置详细讲解程序员小羊！运维数据库 oracle
大家好，我是程序员小羊！前言：Oracle数据库是全球广泛使用的关系型数据库管理系统(RDBMS)，提供高性能、可靠性、安全性和可扩展性，广泛应用于企业关键任务系统。下面详细介绍如何在CentOS系统上安装和配置Oracle数据库。1.前提条件1.1硬件要求内存：最小1GB，推荐2GB以上。硬盘：至少10GB的可用空间，视具体应用需求而定。1.2软件要求操作系统：CentOS7或CentOS8（确
看《绝望主妇》学英语高雅_1f79
第四季第九集剧集连接https://www.imeiju.cc/Play/3543-1-8.html单词1.tendverbUS/tend/1）tendverb(BELIKELY)趋向；倾向于[I]tobelikelytohappenortohaveaparticularcharacteristicoreffect:Wetendtoeatathome.Childrentendtobelikethe
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_

tesseract-ocr识别中文扫描图片实例讲解 .

你可能感兴趣的:(RAC)