如何利用Python识别图片中的文字详解

一、Tesseract

文字识别是ORC的一部分内容，ORC的意思是光学字符识别，通俗讲就是文字识别。Tesseract是一个用于文字识别的工具，我们结合Python使用可以很快的实现文字识别。但是在此之前我们需要完成一个繁琐的工作。

（1）Tesseract的安装及配置

Tesseract的安装我们可以移步到该网址 https://digi.bib.uni-mannheim.de/tesseract/，我们可以看到如下界面：

有很多版本供大家选择，大家可以根据自己的需求选择。其中w32表示32位系统，w64表示64位系统，大家选择合适的版本即可，可能下载速度比较慢，安装时我们需要知道我们安装的位置，将安装目录配置到系统path变量当中，我们路径是D:\CodeField\Tesseract-OCR。

我们右击我的电脑/此电脑->属性->高级系统设置->环境变量->Path->编辑->新建然后将我们的路径复制进去即可。添加好系统变量后后我们还需要依次点确定，这样才算配置好了。

（2）下载语言包

Tesseract默认是不支持中文的，如果想要识别中文或者其它语言需要下载相应的语言包，下载地址如下：https://tesseract-ocr.github.io/tessdoc/Data-Files ，进入网站后我们往下翻：

其中有两个中文语言包，一个Chinese-Simplified和Chinese-Traditional，它们分别是简体中文和繁体中文，我们选择需要的下载即可。下载完成后我们需要放到Tesseract的路径下的tessdata目录下，我们路径是D:\CodeField\Tesseract-OCR\tessdata。

（3）其它模块下载

除了上面的步骤，我们还需要下载两个模块：

pip install pytesseract
pip install pillow

第一个是用于文字识别的，第二个是用于图片读取的。接下来我们就可以进行文字识别了。

二、文字识别

（1）单张图片识别

接下来的操作就要简单的多，下面是我们要识别的图片：

接下来就是我们文字识别的代码：

import pytesseract
from PIL import Image
# 读取图片
im = Image.open('sentence.jpg')
# 识别文字
string = pytesseract.image_to_string(im)
print(string)

识别结果如下：

Do not go gentle into that good night!

因为默认是支持英文的，所以我们可以直接识别，但是当我们要识别中文或其它语言时就需要做些修改：

import pytesseract
from PIL import Image
# 读取图片
im = Image.open('sentence.png')
# 识别文字，并指定语言
string = pytesseract.image_to_string(im, lang='chi_sim')
print(string)

在识别时，我们设置lang='chi_sim'，也就是把语言设置为简体中文，只有当你的tessdata目录下有简体中文包该设置才会生效。下面是我们用来识别的图片：

识别结果如下：

不要温顺的走进那个良夜

图片内容被准确识别出来了。有一点我们需要知道，在我们将语言设置为简体中文或其它语言后，Tesseract还是可以识别出英文字符。

（2）批量图片识别

既然我们把单张图片识别列出来了，就肯定还有批量图片识别这个功能，这就需要我们准备一个txt文件了，比如我有文件，text.txt内容如下：

sentence1.jpg
sentence2.jpg

我们将代码修改为如下：

import pytesseract
# 识别文字
string = pytesseract.image_to_string('text.txt', lang='chi_sim')
print(string)

但是这样自己写一个txt文件难免有些麻烦，因此我们又可以进行如下修改：

import os
import pytesseract
# 文字图片的路径
path = 'text_img/'
# 获取图片路径列表
imgs = [path + i for i in os.listdir(path)]
# 打开文件
f = open('text.txt', 'w+', encoding='utf-8')
# 将各个图片的路径写入text.txt文件当中
for img in imgs:
    f.write(img + '\n')
# 关闭文件
f.close()
# 文字识别
string = pytesseract.image_to_string('text.txt', lang='chi_sim')
print(string)

这样我们只需要传入一个文字图片的根目录就可以批量进行识别了。在测试过程中发现，Tesseract对手写体、行楷等飘逸的字体识别不准确，对一些复杂的字识别也有待提升。但是宋体、印刷体等笔画严谨的字体识别准确率很高。另外如果图片的倾斜大于一定的角度，识别结果也会有很大差别。

到此这篇关于如何利用Python识别图片中的文字详解的文章就介绍到这了,更多相关Python识别图片中的文字内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

你可能感兴趣的:(如何利用Python识别图片中的文字详解)

“显著性”（Saliency）是计算机视觉中的一个重要概念，主要指的是图像或视频中最吸引人注意力的区域或对象步步咏凉天计算机视觉人工智能
“显著性”（Saliency）是计算机视觉中的一个重要概念，主要指的是图像或视频中最吸引人注意力的区域或对象。它模拟的是人类视觉系统对视觉场景中“显著”区域的感知能力。显著性可以用于图像理解、目标检测、图像压缩、图像分割等多个任务。下面是对显著性在计算机视觉中的几个关键方面的解释：一、显著性检测（SaliencyDetection）显著性检测的目标是预测图像中最能吸引人注意的区域，通常输出一个与输
自然拼读之简笔画(纪念) 大U同学
啾宝图绘书今天要寄送给我的小侄女。当然，还未画完。图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App最开始也是以这个简笔画练手的。在此存档哈哈。
《给孩子最好的礼物》P18~19 七乡杏坛
“父亲是一个银行，发行知识，支付爱。”读到这一句话，我内心非常的感动，文中的父亲本是一所学校的教授。为了给生病的儿子治病，他在工作之余，买起了冰棍，后来他干脆提前离休，在校园里开了一家小卖部。他用自己的辛勤劳作，为身患绝症的儿子累积了一道用生命筑起的防护墙。父亲二字，是多么的朴实，又是多么的伟大。作为家长，要当孩子的成长路上的指南针，舍得付出自己的时间与心思，才会收获一个健康又上进的孩子。看看今晚
汉朝为何分为“西汉”和“东汉”？宋朝为何有“北宋”与“南宋”之分？我没忘记
汉朝是中国历史上极具有代表性的、具有承先启后的重要地位的大一统王朝，与后来的唐朝并称“强汉盛唐”。但是汉朝分为两个历史时期，即西汉（前202年－9年）与东汉（25年－220年），那么这两个时期的汉朝为何会被称之为“西汉”与“东汉”呢？还有宋朝也是被分为“南宋”与“北宋”，更不用说更早时期的“西周”与“东周”、“西晋”与“东晋”等等，这是如何一回事呢？汉光武帝其实无论是西汉、东汉还是北宋、南宋，它们
国产开源！TinyPiXOS国产自主轻量级移动嵌入式设备桌面操作系统！运用纯C/C++从底层重构出超轻量级的整体图形技术栈，打造一款独立可控、轻量且高度定制化的嵌入式桌面操作系统方案。 TinyPiXOS开发者联盟 TinyPiXOS 开源 c语言 c++系统架构 linux 嵌入式硬件 arm开发
目录TinyPiXOS——国产自主轻量级移动嵌入式设备桌面操作系统开源工程系统优势系统特点为什么要造“轮子”？我们做了什么？核心模块自主研发GUI桌面系统交互设计和开发适用场景关于自有内核的开发规划关于多窗口操作的说明如何参与项目如何学习TinyPiXOS关注我们TinyPiXOS——国产自主轻量级移动嵌入式设备桌面操作系统TinyPiXOS以开源Linux为基础，通过创新的内核级轻量化改造与精简
从代码到终端部署：Prompt如何颠覆传统DevOps流程 LCG元工具运维 prompt devops 运维
文章目录基于Prompt工程的DevOps架构重构实践一、架构演进与技术对比1.1架构演进路径1.2核心流程对比二、核心实现方案2.1Prompt解析引擎实现（Python）2.2Kubernetes集成部署（YAML模板）三、生产部署实践3.1安全增强方案3.2性能优化数据四、技术前瞻与演进4.1未来三年技术路线图五、完整技术图谱六、核心代码实现（TypeScript前端）七、部署验证测试基于P
解锁Prompt+DevOps新姿势：终端系统重塑的三大核心策略
文章目录引言：Prompt驱动的DevOps范式迁移核心策略一：智能决策流水线构建横向架构对比纵向实现流程Python实现示例核心策略二：自适应终端部署体系TypeScript客户端实现YAML部署配置模板核心策略三：智能运维闭环构建安全审计实现方案性能对比分析技术前瞻性分析附录：完整技术图谱技术架构部署验证引言：Prompt驱动的DevOps范式迁移在云原生与AI工程化交汇的今天，Prompt技
假勤奋 Joanbetty永恒
在工作和学习中，常见到有些人看似勤奋，却无法收获相应的回报，原因出在哪里呢？今天给大家列出一份“伪勤奋清单”，愿你有则改之，无则加勉。花大量的时间做最容易的事，有的人习惯花大量的时间去做最容易的事，还炫耀自己“没有功劳也有苦劳”。例如，上学时在图书馆待了一天，看上去很辛苦，但大部分时间都用在了机械的抄写上，真正的成果寥寥。每天做很多事情，不代表每天做成了很多事情，勤奋的结果如何，是比勤奋的过程更值
新手配音兼职入门指南【专业完整版】配音新手圈
入行配音业数年，自己思索了很久，跟朋友或同行也探讨无数次这个问题——如何利用自己的专业把有用的配音、有声书知识教给别人。而作为刚想入门的新手，面对眼前海量的信息，或许根本不知道从哪里开始，今天这篇文章用任何人都可以看懂的表达方法来全面的解析一下都有哪些配音平台，怎么选择配音平台。1、配音新手圈这是一个公众号配音新手圈里面每天更新配音任务，都是适合没有基础的人去做的，每天都有任务。适合新入门的小白练
前端------Filter 童小纯前端系列---从入门到深化 html vue
其实数组的很多函数需要的参数都是一样的arr.fun((item,index,arr)=>{item:数组的元素index:数组元素在的位置arr:整个数组})Filter是数组的一个用法,用来返回一个数组,满足特定条件的数组中的元素letarr=[1,2,3,4];letnewArr=arr.filter((item,index,arr)=>{console.log("数组元素${item}")
大学 b99b9fce07d4
graduate每个人都怀揣着一个大学梦，期盼过段无拘无束的大学生活，在适当的年华释放着属于青春的色彩，将"我的青春我做主"落实到行动中，但试问，真正做到不曾留下遗憾的又有多少人。回想曾经的自己，抱着同样的理想懵懵懂懂的进入了大学，迄今已三年有余，时间是个好东西，让原来的我们褪去了初中的幼嫩，长出"锋利"的羽毛，学会了飞翔。
《论语》：八佾第三（2）么么虎南行记
三家者，以《雍》彻。子曰：“‘相维辟公，天子穆穆，’奚取于三家之堂？”①三家：鲁国当政的三家大夫孟孙、叔孙、季孙。《雍》：《诗经．周颂》中的为周天子举行祭礼后撤去祭品、祭器时所唱的诗。彻．同“撤”，古代祭礼完毕后撤祭馔，乐人唱诗以娱神。②“相维辟公，天子穆穆"。出资《诗经》里《雍》这首诗中的二句：各路诸侯们都在助祭，天子恭敬地主祭。相(xiàng)：助祭的人。维：用于句中的助词，可以译为“是”。辟
高并发解决方案：SpringBoot+Redis分布式缓存实战 fanxbl957 Web 缓存 spring boot redis
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人高并发解决方案：SpringBoot
SpringBoot缓存技术全解析：Redis+Caffeine二级缓存架构 fanxbl957 Web 缓存 spring boot redis
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot缓存技术全解析：
“东方瑞士”新加坡：如何用短短几十年成就一个金融帝国外小至
新加坡是一个1965年才取得独立的，面积很小的岛国。然而它却在短短的几十年之间，发展成为一个繁荣的金融帝国。它是亚洲最大的新兴市场货币交易中心，全球第三大外汇交易中心，全世界发展最快的国内债券市场之一，同时也是亚洲地区金融衍生品交易的领军国，亚洲为数不多的国际金融中心。这让人在叹服的同时，也忍不住好奇他们是如何做到在几十年之内做到这样飞速地发展的。下面，我们就来学习下新加坡金融市场以及金融衍生品市
39岁程序员住进养老院早6晚9的作息！看到后我酸了猿天下
前言最近，有个程序员比较火，一方面他似乎重新定义了“养老”，刺痛很多大龄青年人的神经，一方面又让网友们非常羡慕，提前过上了大家梦想中的生活。事情是这样的，2个月前，重庆一家养老院入住了一位最年轻的住户，年仅39岁的古先生，之前的职业是网络技术员。古先生入住养老院也并非提前养老，而是他患有膝关节滑膜炎，需要长时间疗养，但由于父母早年患癌去世、自己单身，便进入养老院调养。入住养老院后，他早上6点起床，
后端开发：Spring Boot 的分布式缓存方案大厂资深架构师 Spring Boot 开发实战 spring boot 分布式缓存 ai
后端开发：SpringBoot的分布式缓存方案关键词：SpringBoot、分布式缓存、Redis、Caffeine、缓存策略、缓存失效摘要：本文深入探讨了在SpringBoot后端开发中分布式缓存方案的相关技术。首先介绍了分布式缓存在现代应用中的重要性及本文的研究范围，接着阐述了核心概念如分布式缓存的原理与架构，详细讲解了常用的核心算法原理及具体操作步骤，包括使用Python代码示例说明。通过数
commons-pool2对象池原理简析月落亦莫离
所谓对象池，即一个放对象的池子。目的是为了复用对象，以减少创建对象的开销，如连接池、线程池等。commons-pool2是apache下的一款对象池开源组件，在学习它的原理前，首先考虑下如果我们自实现对象池，会有哪些问题需要考虑？底层用什么数据结构来做对象池的容器？对象池要有什么属性，支持哪些方法？对象在对象池中的生命周期是什么样的？从对象池获取/归还的步骤？接下来我们带着这些问题去学习commo
Leetcode703. 数据流中的第K大元素 LonnieQ
题目设计一个找到数据流中第K大元素的类（class）。注意是排序后的第K大元素，不是第K个不同的元素。你的KthLargest类需要一个同时接收整数k和整数数组nums的构造器，它包含数据流中的初始元素。每次调用KthLargest.add，返回当前数据流中第K大的元素。示例:intk=3;int[]arr=[4,5,8,2];KthLargestkthLargest=newKthLargest(
米信使股票群诈骗真相！郑洪盛国浩盟国一带一路项目就是资金盘不要被骗了！不成功不收费
讲述:郑洪盛国浩盟国慈善投票被骗无法出金真相！套路太深教你该如何避！！骗子引诱人上当方式很简单：先给你一点甜头尝尝，一开始入金能正常提现，也能赚一点，但当投入更多钱时，你发现你的运气开始变差了。所以，荐股类骗局最大的迷惑性是：给受害人一种假象，你是投资亏损的，而不是被骗的！广大市民对此要提高警惕，如果是还没有投资，千万不要抱有侥幸心理，一定要及时远离！一定不要打草惊蛇低碳项目数字体育，人工智能ai
上位机知识篇---Prompt&PowerShell Prompt Atticus-Orion 上位机知识篇 prompt powershell
在Anaconda环境中，AnacondaPrompt和AnacondaPowerShellPrompt是两个常用的命令行工具，它们的核心功能都是为了方便管理Python环境和执行相关命令，但底层依赖的命令行解释器不同，因此在使用场景和语法上存在一些区别。下面详细介绍两者的差异：1.底层依赖的命令行解释器不同这是两者最根本的区别，决定了它们的语法规则和功能范围：AnacondaPrompt基于Wi
如何与父母和解？玲玲情绪转化教练
跟你说，昨天旁听了一个个案，是关于与父母和解的，我相信这个话题，很多的小伙伴都很感兴趣，尤其不是跟父母长大的孩子……故事是这样的！她说，自从弟弟出生之后，就跟奶奶吃住在一块，她觉得父母对他不公平，为什么弟弟一出生，我就要跟奶奶在一起，于是对父母，还有弟弟都有很多的怨气……虽然现在也是跟父母在同一个城市，离的也很近，但是关系却很疏远，有的时候为了不让父母担心，她从来不跟父母讲自己的近况，父母跟她说身
又见雪花飘运红
图片发自App又见雪花飘文/七色光春回大地，万物正欲复苏，乍暖还寒时，春雪送来了祝福。如柳絮一般，轻盈的亲吻着大地，带着欢笑，奔赴一场新生命的佳期。图片发自App
CSS样式中的布局、字体、响应式布局
目录一、使用内联块级元素布局二、使用float布局三、使用弹性盒子布局四、服务器字体五、响应式布局相关文章积累CSS样式属性：padding、margin、display:flex、font、position、cursor、:hover、:nth-child()、border-radius一、使用内联块级元素布局让想要横着的元素（left、mid、right）变成内联块级元素。示例leftmidr
2019-03-03 昊ge
偶尔喜欢倚窗而立，风景或远或近，只透过玻璃的凉意，将易逝的岁月纳入眼帘。今日周末，窗外有淡淡的雾霾，可行人浅浅忙碌穿行，呆在屋里我自静默，把喧嚣关于窗外，把凉意丢在身后，把温暖留在身旁。此刻的静好，岁月不可欺，可有爱有可爱，深深地记忆中，依着匆忙流逝的时光，捻起一颗真心，坚守着一路走！道一声早安，一天好心情[爱心][爱心]图片发自App
3000元的复刻表质量怎么样(这5个因素一定要知道) 爱表之家
复刻表，作为仿制版手表，一直以其相对低廉的价格吸引着不少消费者的目光。在市场上，3000元左右的复刻表成为了一个热门的选择区间微信:52226813(下单赠送精美礼品)那么，这个价格区间的复刻表质量究竟如何呢？本文将从材料、工艺、机芯及购买建议等多个方面进行深入探讨。1.材料品质首先，从材料方面来看，3000元的复刻表所使用的材料相较于几百元的复刻表有显著的提升。高品质的复刻表往往会采用类似甚至相
MongoDB创建集合命令db.createCollection详解 ywb201314 Mongodb
完整的命令如下：db.createCollection(name,{capped:,autoIndexId:,size:,max})name:集合的名字capped:是否启用集合限制，如果开启需要制定一个限制条件，默认为不启用，这个参数没有实际意义size:限制集合使用空间的大小，默认为没有限制max:集合中最大条数限制，默认为没有限制autoIndexId:是否使用_id作为索引，默认为使用(t
大森林里的瑞贝卡江洋二稻
图片发自App01瑞贝卡是一只眼睛很大，拥有红色眼珠的小兔子。她白色的毛像冬天的雪一样白。这个森林里所有的小动物都喜欢她。因为她太美丽了。02瑞贝卡每一天走在去找食物的长满苔藓的树林里，她都唱着那首最喜欢的歌：阳光照在脸上，我踩在小苔藓上，没有人知道我要去哪里，我也不知道我要去哪里。03这一天，她像往常一样走在路上，唱着歌。歌声太动听了。不过今天没有阳光，天气很阴。瑞贝卡唱着，突然，听到有什么声音
分布式推客系统全栈开发指南：SpringCloud+Neo4j+Redis实战解析 wx_ywyy6798 oracle 数据库推客系统推客小程序推客系统开发推客小程序开发推客分销系统
一、推客系统概述与市场背景推客系统（或称"推荐客"系统）是一种基于社交关系和内容分发的推荐营销平台，近年来在电商、内容平台和社交媒体领域迅速崛起。根据最新统计数据，2023年全球社交电商市场规模已达1.2万亿美元，其中推客模式的贡献率超过35%。1.1推客系统的核心价值推客系统通过以下机制创造商业价值：社交裂变：利用用户社交网络实现指数级传播精准推荐：基于用户行为和关系链的个性化内容分发激励机制：
风险来临，才真切体会保险是责任李庆建
“人没了，钱还有什么用？”对于处于悲痛中的人们，很能理解他们说这句话的心情。但是仔细想想，这话又不对。逝者是走了，人没了，但是活着的人还在，活着的人还要继续生活，钱对活着的人就有用。一个三口之家，暂不考虑赡养老人，单职工家庭，孩子在上高中，父亲突然离去，等于家里收入来源就断了。以前每个月有万把块钱的进账，一家的生活开支，孩子的教育费用，还有其它的休闲旅游等，一年还略有结余。发生在别人身上的是故事，
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他