只用40行Python代码就能写出pdf转word小工具

一、图示

上面为pdf截图内容，下面为转化后的word截图内容

接下来，我们试试自己动作写这个工具吧！

二、前期准备

由于我们采用的是python进行工具编写，并最终需要打包成一个exe文件供我们使用。为了降低包体大小，我们需要先创建一个虚拟环境备用。

另外，pdf转word有现成的第三方库pdf2docx，同时关于gui我们用的是pysimplegui，打包成exe采用的是pyinstaller。在创建虚拟环境后，我们将这些需要用到的第三方库也一一安装吧。

# 创建虚拟环境
conda create -n env_pdf python=3.8.8
 
# 激活虚拟环境
conda  activate env_pdf
 
# 安装三个库
pip install pdf2docx
pip install pysimplegui
pip install pyinstaller

关于这三个库，大家可以查阅官方文档了解更多：

pdf2word : https://dothinking.github.io/pdf2docx/index.html

pysimplegui：https://pysimplegui.readthedocs.io/en/latest/

pyinstaller：http://www.pyinstaller.org/

前期准备工具就绪，我们开始进入工具编写阶段。

三、pdf转word

pdf转word感觉是一个存在已久的话题，现在其实市面上很多工具可以使用，不过完全免费的可能需要认真找找。

我们知道python有很多处理pdf文档的第三方库以及处理word的第三方库，所以有人就将这两类库的功能进行了整合，从而有了今天的主角pdf2docx。

基本思路：

利用PyMuPDF获取页面元素，例如文本和形状及其位置
再利用元素间的相对位置关系推断内容
最后使用python-docx将上一步解析的内容元素重建为docx格式的Word文档

基于以上情况，咱们这个工具在进行操作的时候会存在以下不足：

无法识别和重建PDF扫描件
根据有限的、确定的规则建立PDF与docx元素之间的映射并非完全可靠，也就是说仅能处理常见的规范的格式，而非百分百还原

当然，以上这些我们都不用管，直接参考官方给到的代码即可：

from pdf2docx import Converter
import re
 
# 传入文件绝对路径
def pdf_to_word(fileName):
    pdf_file = fileName
    # 正则获取不含文件类型后缀的部分，用于组成word文档绝对路径
    name = re.findall(r'(.*?)\.',pdf_file)[0]
    docx_file = f'{name}.docx'
 
    cv = Converter(pdf_file)
    cv.convert(docx_file, start=0, end=None)
    cv.close()

其中，start和end参数指定待转换pdf文档的页码范围（默认是从0开始到最后一页）；也可以通过pages指定不连续的页面，例如pages=[1,3,5]。

四、GUI设计

关于pdf转word的功能，我们需要的就是选择待转化的文件、开始转化即可，另外记录一下操作流让我们知道进度就完美了。所以，功能其实很简单，我们基于以上功能设计简单的GUI如下：

ue设计手稿

由于我们这次用到的是pysimplegui这个超级简单好用的工具库，那么为了满足以上功能，编码如下（思路见注释）。

import PySimpleGUI as sg
import re
 
# 主题设置
sg.theme('DarkTeal7')
 
# 布局设置
layout = [
          [sg.Text('待转化的文件是：',font=("微软雅黑", 12)),sg.Text('',key='filename',size=(50,1),font=("微软雅黑", 10),text_color='blue')],
          [sg.Text('程序操作记录',justification='center')],
          [sg.Output(size=(80, 20),font=("微软雅黑", 10))],                
          [sg.FileBrowse('选择文件',key='file',target='filename'),sg.Button('开始转化'),sg.Button('关闭程序')]
         ]      
 
# 创建窗口
window = sg.Window('pdf转word工具，作者@微信公众号：可以叫我才哥', layout,font=("微软雅黑", 15),default_element_size=(50,1))    
 
# 事件循环
while True:
    event, values = window.read()
    if event in (None, '关闭程序'):
        break
    if event == '开始转化':
        if values['file'] and re.findall(r'\.(\S+)',values['file'])[0]=='pdf':
            fileName = values['file']
            pdf_to_word(fileName)
            print('\n----------转化完毕----------\n')
        else:
            print('文件未选取或文件非pdf文件\n请先选择文件')
 
window.close()

不得不说，确实会比PyQt5要来的简单。

sg.theme('DarkTeal7')是设置gui的主题，pysimplegui提供很多主题，大家可以自由选择；

layout就是设置布局，具体我们根据UE手稿需求从上到下依次设置：

sg.Text()设置文本内容和格式
sg.Output()设置print输出的地方
sg.FileBrowse()设置文件选择浏览器，key是指定健名称，target是选定的文件夹名
sg.Button()设置按钮
sg.Window()是创建窗口，可以带窗口名称等信息

event和values是当执行window.read()函数时的返回值：其中event是事件，如点击按钮、选择文件等；values是包含输入的值，比如我们选择文件后的文件名信息值。

结合之前的pdf转word函数，这里的逻辑如下：

当我们点击开始转化按钮，先判断是否选择了pdf文件，如果是则执行转化函数，否则就提示文件未选择或选择的非pdf文件。

五、打包代码

这里采用的是pyinstaller进行程序代码打包，操作指令如下：

pyinstaller -F -w pdf转word小工具.py

部分参数含义：

-F 表示生成单个可执行文件

-w 表示去掉控制台窗口，这在GUI界面时非常有用

-p 表示你自己自定义需要加载的类路径，一般情况下用不到

-i 表示可执行文件的图标

其实，最新版本的word（office2019）已经天然支持对非扫描版pdf的读取和转化了，大家通过以下流程进行处理：文档—>打开—>选择待转化pdf文件即可。

office-word自带转化功能

到此这篇关于只用40行Python代码就能写出pdf转word小工具的文章就介绍到这了,更多相关pdf转word小工具内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

你可能感兴趣的:(只用40行Python代码就能写出pdf转word小工具)

HCIP第一天课程笔记整理搞IT的马哥 IP 网络网络协议 tcp/ip 服务器
HCIP----huawei认证高级工程师抽象语言先转化成编码编码一定要转化成二进制（为什么一定要转化成二进制？）二进制信号转化成电信号处理电信号（协议等同于标准，目的就是提升服务）（1876年电话诞生，1946年第一台电子计算机诞生）OSI参考模型---OSI/RM---ISO（国际标准化组织）---1979年颁布开放式系统互联参考模型（应表会传网数物）应用层---提供各种应用服务，将抽象语言转
中原焦点团队焦点初级32期孙晓娟2022年️3月10日坚持分享第️30天 85b9745cfed8
一个连父母都不放在眼里的孩子，长大后也必然是一位斤斤计较、眼界狭窄、礼仪欠缺的人。父母就是孩子最初成长的学习对象，严格要求自我，把控好自己的一言一行。孩子才能从父母这里，学会包容与爱，学会理解与尊重。我们尊重孩子，也赢得孩子的尊敬.如此才能让良好的教育理念滋养孩子的心田，幻化成孩子前行的动力，陪他走过漫长的人生岁月。
热门网络小说推荐我想我会一直孤单孟思遐邵珈宸_我想我会一直孤单孟思遐邵珈宸已完结小说推荐 d036fb3b3d05
《我想我会一直孤单》主角：孟思遐邵珈宸简介：“爸，妈，我同意出国留学了。”听见女儿终于松口答应了，远在重洋的父母声音里满是欣慰。“思遐，你总算想明白了，爸妈心里的石头可算落地咯！这段时间你先准备一下，我和你爸爸马上安排，大概一个月后咱们一家就能团聚了。”不同于二老自在欢快的语气，孟思遐的语调很是低沉平淡。“我知道了。”寒暄几句后，电话被挂断了。窗外一片漆黑，孟思遐没有开灯，微红的眼眶里瞧不出太多情
新活法训练营第七天2022-03-21 Diana_58d9
破解困惑的根源必修：学完这一课，你有哪些收获和心得，写出至少三点。1、通过张老师对动物假死的讲解，知道了所有的疼痛都是潜意识里的一种自我保护，叫创伤胶囊。对于创伤胶囊里的人或动物，给他足够的时间让他自己恢复是最好的。2、困惑也是启动了心理保护机制，是一种自我保护，面对困惑，首先接纳他，允许他在，第二，慢慢走进它，接受他在我们身上，第三，放下，转身做该做的事。如何突破困惑，首先有足够的意愿度，才能醒
有什么软件看电影免费的看电影免费的哪个软件好用氧惠好物
面对现在出品了这么多好看的影视剧作品但是各个平台都需要会员才能观看大家是不是恨得牙痒痒，有没有免vip电视追剧软件自然也是小伙伴们一直以来都比较关注的内容。有哪些可以不用充会员就能够看电视剧的工具或者平台呢？甚至有一些还集合了众多的独播作品，千万部好看的电视一个软件就全部搞定，想想就让人十分激动。1、《今日影视》对全网的视频内容进行了整合，为大家从电影、综艺节目、电视剧、动漫等维度提供了海量的免费
NX636NX644美光固态闪存NX663NX665 18922804861 人工智能性能优化大数据服务器网络
美光固态闪存深度解析：NX636、NX644、NX663、NX665全面评测技术架构与核心性能美光NX636、NX644、NX663、NX665系列固态闪存均基于176层3DTLCNAND技术，采用美光自研主控芯片，支持PCIe4.0协议，理论带宽可达16GT/s。其中，NX665作为旗舰型号，连续读取速度突破7.4GB/s，随机写入性能较NX636提升约40%，相当于从“自行车道”升级至“高速公
揭秘低调却成就富豪的行业奇迹高省飞智导师
在我们日常生活中，经常可以发现一些不起眼的行业，但它们却能够在悄无声息中赚取丰厚的利润。特别是这5个行业，看似不起眼，但利润很不错。一、药品销售。药品销售行业，是一个利润空间极大的领域。虽然药品销售行业竞争激烈，但只要具备一定实力和专业知识，就能够在市场中占据一席之地。此外，随着人们生活水平的提高，越来越多的人开始关注健康和保健，药品需求也日益增加。因此，药品销售行业仍然具有很大的发展潜力。二、有
7个在家就能赚钱的副业推荐(建议收藏) 高省爱氧惠
大部分人只靠工资收入是很难攒钱的，吃饭、交通、住宿等等都是不小的支出。如果想增加自己的收入，我建议发展副业。有人说：上班已经用掉很多时间了，哪还有精力做副业呢？今天就教大家在家也能赚钱的6个副业兼职，人人都能做。氧惠APP购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购
行稳致远，抢抓机遇，推动广东高质量发展 96519f2b0729
时间不等人，发展不等人，历史不等人。莫道君行早，更有早行人。广东以“等不起”“慢不得”的危机感在农历新年上班第一天，广东省委、省政府在广州白云国际会议中心国际会堂召开全省高质量发展大会，大会主会场参会人数达1000人，其中参会企业超500家。同时，大会以视频直播的形式开至广东全省各地市、县(市、区)，分会场参会人数达2.5万人。走高质量发展之路，要稳中求进。习近平强调，推进中国式现代化必须抓好开局
你以为的岁月静好，背后多少人负重前行漫漫求索
岁月静好，是每个人的最基本追求。但苦难，常常猝不及防。015月14日，川航3U8633航班的两位机长让全国人民见证了航空史上的神奇，活脱脱一部好莱坞大片啊。让我们回顾一下这些让人膛目结舌的画面：10000米高空，飞着飞着，挡风玻璃碎了。这意味着什么？在这个高度，飞机外的气压只有地面的四分之一高空压力，人耳的鼓膜几乎不可能承受；大风，每秒250米的直面风，足以刮翻控制台的风力；零下40度的温度。最要
python折半查找算法_python二分查找代码试用递归法编写python程序实现折半查找算法...
python二分查找算法函数bi_search(),该函数实现检回忆，很美却很伤；回忆只是回不到过去的记忆。输入格式:第一行为正整数n接下来若干行为待查找的数字，每行输入一个总是女人为了天长地久而烦恼，男人却可以洒脱地出乎意料。defprime(n):ifnend:return-1mid=(start+end)//2ifprimelist[mid]==prime:returnmidelifprim
2023-10-31 牙医锦清
明朗人生充满美好希望不忘时时描绘梦想心怀浪漫怀抱积极的“思维方式”定能开拓未来对未来怀有无限的浪漫在京瓷的创业期，我把自己称为“做梦的梦夫”，不断地向员工诉说自己的梦想。至今我仍时刻不忘追逐梦想，保持一颗年轻的心灵。人生本来就充满美好的希望。只要能不忘描绘梦想，心存浪漫，秉持积极的思维方式，那么就能开拓未来。
java开发安卓和kotlin对比哈哈皮皮虾的皮 java android kotlin
Java和Kotlin都是用于Android开发的编程语言，它们各自具有独特的特点和优势。以下是对Java和Kotlin在Android开发中的对比：一、语法与简洁性Java：Java的语法相对繁琐，需要编写较多的样板代码。例如，在Java中，每一行代码的末尾都需要一个分号来表示语句的结束。Kotlin：Kotlin的语法更为简洁，支持更多的语法糖，可以减少冗余的代码。在Kotlin中，换行符通常
python小工具：测内网服务器网速和延迟秃了也弱了。 python大家庭服务器 python java
文章目录一、使用1、代码2、使用3、注意事项一、使用1、代码importargparseimportsocketimporttimeimportsubprocessimportreimportsysdefmeasure_latency(host):#使用ping命令测量延迟try:#根据操作系统选择ping参数ifsys.platform.startswith('win'):output=subp
Nmap --- Ingreslock后门漏洞唯师默蓝
目的：利用telnet连接目标主机的1524端口，直接获取root权限；原理：Ingreslock后门程序运行在1524端口，连接到1524端口就能直接获得root权限，经常用于入侵一个暴露的服务器；步骤：nmap-sV192.168.1.3,扫描目标主机端口，发现目标主机开启了1524端口；telnet192.168.1.31524连接目标主机并直接成功，在渗透进的主机中，输入whoami,查看
日精进第三十五天金缔尊周大生珠宝玉玉
尊敬的李老师，智慧的马教授，亲爱的家人们:大家好，我是（刘翠平)刘总的人，今天是2018年9月17号我的日精进第三十五天，我们互相勉励，携手前行，每天进步一点点，距离成功便不远。比学习:学习同事的素转非技巧，如何打动顾客的心，让顾客成为我们的老顾客。比改变:只要进店看的都是要买的，相信家人相信自己是最棒的，大家互相帮助，互相加油！比付出:总监中午来给我们开会，给我们从专卖店调货来辛苦了。比感恩:感
Python面试题-6 编织幻境的妖 python 服务器开发语言
1.请解释Python中的动态类型。Python中的动态类型Python是一种动态类型语言，这意味着你不需要在编程时声明变量的类型，而是在运行时自动推断类型。在Python中，变量的类型是在程序运行时决定的，这意味着同一个变量可以在不改变其类型的情形下被赋予不同类型的值。动态类型的优点在于它提高了编程的灵活性，因为你不需要预先确定数据的类型，可以更容易地写出简洁的代码。然而，这也可能导致运行时错误
毕业后的第一份工作叫我郭郭呀
今天是2020年3月28日，现在是晚上7点58分，今天是《21天个人品牌写作营》启动的第12天我的创业故事这段时间参加的这个写作营，是由36个创业者组织起来的，主要目标就是打造个人品牌，那打造个人品牌之前就要梳理个人标签，标签就包括个人的一些经历或故事。我觉得自己现在的事业还没有取得多大成功，所以害怕写出来了怕人笑话，但是今天听群里两个姐姐的分享，受到她们的鼓舞，我似乎没有那么害怕了，一个是以前读
C练题笔记之：牛客-HJ012.字符串反转
题目：描述接受一个只包含小写字母的字符串，然后输出该字符串反转后的字符串。（字符串长度不超过1000）输入描述：输入一行，为一个只包含小写字母的字符串。输出描述：输出该字符串反转后的字符串。示例1输入：abcd复制输出：dcba结果：解题思路：获取字符串，用双指针，一头一尾开始交换，直至到中间。代码：#include#includeintmain(){charstr[1024]={};scanf(
感觉没时间运动？这样走路，让你越走越瘦！柒月微凉
能管得住嘴，却迈不开腿？每每想到要“大汗淋漓”就望而却步了？不止一次花重金办了健身卡，却总是因为没毅力而打了水漂？其实，想要运动减肥，不一定非要这样“大动干戈”，只要迈开第一步，没事儿走走路，就能帮你燃脂哦！图片发自App走路竟然有这么多好处走路看起来是一项平平无奇的运动，甚至在很多人眼中它都算不上运动。可是如果能够每天坚持走路就会收获意想不到的好处哦！1改善心肺功能图片发自App作为一项持续性、
今天下雨恬淡风清
这会下班的时候明显感到气温下降了很多，穿了夏日短袖走在路上明显冷飕飕的感觉，不是用一般的凉爽来形容，而是有点冷。今天难得坐地铁上下班，早上把电动车放在地铁站，然后坐地铁，现在先坐公交出行再转地铁，刚才记错了，居然坐地铁坐反了，我在定安路坐，以为下一站是城站，就顺着坐了这一方向，坐到近江才反应过来，不对啊，做反了，应该下一站龙翔桥方向，记错了哈，又多坐了一站到江陵路下车，刚好下车对面的也来了，重新坐
可转债投资之——小盘可转债大秀大长腿蛙声叫叫一家亲
“感觉许久没提可转债了，这段时间确实没啥好说的，可转债价格跟随正股不断下跌，可转债等权指数从3月初冲高后持续回落，这几天稍微企稳。最近有个特别值得一提的现象，就是许多小规模转债，特别是次新小规模转债，轮番轰炸暴涨，天天秀着20cm、30cm的大长腿，看着让人眼馋。先说说蛙哥最近的可转债持仓情况，截至发文前，今年可转债亏损3.78%，仓位上升到80.68%。整体趋势是亏损仍在缓慢小幅加大，仓位却在上
淘宝客服招聘在家兼职?十大适合孕妇的小生意日常购物小技巧
淘宝客服招聘在家兼职?十大适合孕妇的小生意随着互联网的普及，越来越多的孕妇选择在家创业，既能照顾宝宝，又能实现经济收入。本文为您推荐十大适合孕妇的小生意，让您在家轻松赚钱。一、淘宝客服兼职淘宝客服兼职是孕妇在家创业的不错选择。只需具备一定的沟通能力和责任心，就能在家为客户提供优质的售后服务。此外，淘宝客服兼职时间灵活，可以根据孕妇的身体状况和宝宝作息进行调整。至于我为何用这款氧券app，当然是氧券
【沧海行系列】鬼域行——第十六章乱琼碎玉沧海行人
而我最不喜欢阴阳分明的东西了。要知道阴在阳之内，不在阳之对。我们要充分利用自己的优势，打入敌营陇南地界，早早就有人准备好了酒菜等候何平等人。为首的人回报道：“何长老，我等追查了很久，没有黄长老的痕迹啊。”何平听了，心里已经有九成把握听到的是这个回答了，但她还是叹了口气去，又问道：“上次那妖女的事可曾继续扩散？”那人又说：“这事奇就奇在这，眼下不知是什么人，平息了流言，如今知道那女子身有鉴空遗书的人
教师带领小学生跳舞支持肖战，引发争议：带给我们三点反思和思考十八点心理
师者，传道授业解惑也。每一位教师都需要在自己的工作岗位上以生为本，身正为师，德高为范，教师的一言一行对于学生的身心成长都是有深远意义的，这一种深远意义也许会影响学生这一辈子的人生观、世界观和价值观。我记得高中语文老师当时在我迷茫困惑的时候，跟我说过一句话：遇到任何事，都要沉着镇定。这句话我一直记到现在，从未忘记，因为老师的话就是在启迪我的心灵净化，让我在今后的人生道路上走得更稳。近日，宿迁一名小学
中国历史上的大奸大恶，秦始皇的近臣赵高，如何致秦朝15载而亡？百途美BatonMe
秦始皇统一天下，结束了各诸侯国间的长期混战，迎合了“分久必合”的历史发展大趋势；然而，为了加强咸阳朝堂对全国的控制，秦帝国刚建立不久便要大兴土木。修长城、修直道、修驰道、修六国宫殿群和举办各种盛大典礼，如此的耗费巨大成为了民生不可承受之重，令这个新生的帝国很快就危机四伏了。秦始皇崩于第五次大巡狩，秦帝国局势波谲云诡秦始皇最后一次大巡狩的行进路线队伍行至今山东平原县时，秦始皇突然一病不起，病势急转直
[资治通鉴365]8.17武后两次行废立太平公主嫁薛家明月无疆
8月17日武后两次行废立太平公主嫁薛家太子李弘死后，弟弟李贤被立为太子。可是宫里的人叽叽喳渣，私下里说李贤不是武后亲生的，是武后的大姐韩国夫人的儿子。这话传到太子耳中，他又疑又怕，不知如何是好。【680.8太子贤闻宫中窃议，以贤为天后姊韩国夫人所生，内自疑惧。】术士明崇俨，懂一套符咒和幻术，经常出入宫廷，使高宗和武后入了迷，官儿升到正谏大夫。他常在武后面前进谗言：“太子是不能继承大统的。其实，只有
时序数据库在数据库领域的行业应用数据库管理艺术数据库时序数据库 ai
时序数据库在数据库领域的行业应用关键词：时序数据库、数据库领域、行业应用、时间序列数据、实时分析摘要：本文深入探讨了时序数据库在数据库领域的行业应用。首先介绍了时序数据库的背景知识，包括其目的、适用读者、文档结构和相关术语。接着阐述了时序数据库的核心概念、架构和工作原理，通过Python代码详细讲解了核心算法。还介绍了相关的数学模型和公式，并举例说明。在项目实战部分，给出了开发环境搭建、源代码实现
时序数据库在工业物联网领域的核心优势与应用价值时序数据说时序数据库物联网数据库 iotdb 大数据
一、工业物联网的数据挑战与需求工业物联网(IIoT)正在重塑全球制造业格局，通过连接设备、传感器和控制系统，实现了生产过程的数字化与智能化。然而，这一转型也带来了前所未有的数据管理挑战：海量数据：单个工厂可能部署数万个传感器，每秒产生数千万数据点高速写入：工业设备常需毫秒级数据采集，对数据库写入性能要求极高严格时效：质量控制、故障预测等场景要求实时数据分析长期存储：设备生命周期数据需保存数年甚至数
cuda编程python接口_使用Python写CUDA程序的方法 weixin_39822184 cuda编程python接口
使用Python写CUDA程序有两种方式：*Numba*PyCUDAnumbapro现在已经不推荐使用了，功能被拆分并分别被集成到accelerate和Numba了。例子numbaNumba通过及时编译机制(JIT)优化Python代码，Numba可以针对本机的硬件环境进行优化，同时支持CPU和GPU的优化，并且可以和Numpy集成，使Python代码可以在GPU上运行，只需在函数上方加上相关的指
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他