ghost_fly

用Java操作Office 2007

作者 Ted Neward译者张立发布于 2007年9月20日上午12时41分

社区

Java

主题

数据访问,

Java+.NET集成

标签

OpenXML,

Microsoft Office

从以往看来，这其中经常会出现一些问题，这是由于Office文档（主要是Word，Excel和PowerPoint）是存储在一个二进制格式文件中，在COM中被称为结构化存储格式，是一个通过COM接口的层次化二进制格式。对COM开发者（或者其他使用COM相关语言的开发者，如Visual Basic， Delphi 和C++/ATL）而言非常方便，但产生的文件对于那些不能“讲COM”的语言是无法访问的。有许许多多的应用程序都是为了让Java语言可以访问这些文件的内容；比如大家都知道Excel可以读取逗号分隔符文件（CSV），因此，Java应用程序相应将数据导出到Excel友好的格式时一般会选用CSV格式（或是其他丑陋的格式）。Word则是可以读取富文本格式（RTF）文件，而RTF标准是公开和有详细文档的。Office的后来者，Office 2003，引入了一个新的XML格式（WordML），Java开发者可以用它来读写Office文档，但是这些格式并没有很好的文档，Java开发者频繁的发现自己是通过试错法来进行WordML格式的学习。各种各样的开源项目都参与进来想要解决这个问题，比如Apache的POI框架，可以用来读写Excel文档，还有各种各样的Java-COM解决方案，这些解决方案一般倾向于使用和Office自己使用的结构化存储应用程序接口相同的应用程序接口进行Excel文档的读写，但很难满足需要，直到现在，开发者不得不指出Office文档格式的内部结构是一个非常复杂的结构，另外一点毋庸置疑的是它是一个没有完整文档的结构。

总体上来说，如果温和一点说的话，Java/Office的故事是一个非常讨厌的境况。对于Java的开发人员而言，他们要么一边嘴里说着“Office这种破东西怎么还会有人想去用它”一边用记忆里的伊索寓言来安慰自己，要么干脆告诉那些使用Office的客户由于Microsoft和Sun两家公司之间的诉讼，Java不能操作Office。

对于Office 2007来说，微软毫无疑问的迈出了解决这些问题的一大步。没有比原始的JDK更复杂的东西---也就是说并不要求使用一些第三方的库---Java应用程序现在可以读写任何Office 2007的文档，这是由于Office 2007文档现在使用的是XML文档的ZIP格式文件。这种格式被称作“OpenMXL”规范并且已经被提交到欧洲计算机制造商协会（ECMA），这个协会同样拥有C#语言和CLI运行时规范，所有的OpenXML规范现在都可以被任何人自由的从ECMA的网站下载。除了这些，再安装好Office 2007（为了验证和作一些测试）和一个标准的Java6 JDK安装，Java现在可以打开任何的Office 2007文档，找出来文档中间的内容，操作它们，并且再次保存这些数据。

与上篇文章不同，在这篇文章中，除了创建一个简单的应用程序之外，代码将会使用一种首先由Stuart Halloway提出的、被称作探索测试（exploration testing）的技术。在一个探索测试中，开发者编写单元测试用来探索应用程序接口，使用单元测试世界中的断言验证结果的正确性。探索测试带来的好处是当一个新版本的应用程序接口可用时---在这个例子中，可能是一个新版本的Office---运行这些测试可以用来确认新版本的采用不会影响到原本对应用程序接口的使用。

对于初学者来说，让我们首先快速的了解一下Office 2007文档。首先看一个仅仅包含文本的Word 2007文档，就像下面一样：

当保存的时候，使用Word 2007将它保存为“Hello.docx”，除非你使用了向后兼容格式，比如说Office 2003的WordML格式，或者是更老的Word 97二进制结构化存储格式。“.docx”文件是OpenXML格式的，微软的文档中声称该格式是XML文档的ZIP压缩格式文件，这些文件中包含了文档中的数据和格式，存储的方式与之前的Office版本中的二进制结构化存储应用程序接口存储数据的方式有些类似。如果这是真的，那么使用Java中提供的用来处理ZIP和TAR格式的“jar”实用工具应该可以展示这些内容，而事实上，它的确可以：

Word 2007文档的基本格式已经非常明显了，仅仅通过控制台的输出就可以看到。（事实上，“jar”实用工具所展示的这激动人心的一切，说明java.util.jar和/或 java.util.zip包同样可以简单的访问这些内容。）几乎没有对规范作任何的破解，很明显，文档中的主要内容应该被存储到了“document.xml”文件中，剩余的其他XML文件则应该是各种各样的辅助部分，比如文档中应用到的字体（fontTable.xml）和使用到的Office主题（theme/theme1.xml），等等。

是时间来编写一些探索测试了。（我们鼓励感兴趣的读者打开一个文本编辑器或者集成开发环境，并将下面的内容填入你的JUnit 4测试类当中，并且扩展这些测试。）使用JUnit 4，第一个测试是为了简单的确认文件在我们预想的位置（显然这是下面测试可以运行的一个必要的需求）。

@Test public void verifyFileIsThere() {

 assertTrue(new File("hello.docx").exists());

assertTrue(new File("hello.docx").canRead());

assertTrue(new File("hello.docx").canWrite());}

下面的测试简单的验证了我们可以使用Java库中的java.util.zip.ZipFile来打开这个文件：

@Test public void openFile()  throws IOException, ZipException{
  ZipFile docxFile =    new ZipFile(new File("hello.docx"));  
 assertEquals(docxFile.getName(), "hello.docx");}

现在一切看来都非常不错。Java的ZipFile类正确的识别了我们的文件，一个zip文件，如果我们还能继续保持这样的运气，让我们继续我们的测试，来遍历一下，识别文档中的内容并找出其中的数据。让我们编写一个快速的测试来从“document.xml”文件中找出所有的内容。

@Test public void listContents()  throws IOException, ZipException{  
boolean documentFound = false; 
 ZipFile docxFile =     new ZipFile(new File("hello.docx"));  Enumeration entriesIter =    docxFile.entries(); 
 while (entriesIter.hasMoreElements()) 
 {   
      ZipEntry entry = entriesIter.nextElement(); 
   if (entry.getName().equals("document.xml"))       

 documentFound = true; 
 } 
 assertTrue(documentFound);}

令人诧异的是，当我们运行测试的时候，测试过程产生了一个失败；并没有找到“document.xml”文件，这是由于ZipFile/ZipEntry 应用程序接口需要压缩文件中完整的路径名称。将测试中的路径改为“word/document.xml”，测试就通过了。

很好，我们已经找到文件了，下面让我们打开这个文件看看XML里面是什么。这非常简单，因为ZipFile有一个返回ZipEntry的应用程序接口。

@Test public void getDocument()  throws IOException, ZipException
{ 
 ZipFile docxFile =     new ZipFile(new File("hello.docx")); 
 ZipEntry documentXML =    docxFile.getEntry("word/document.xml"); 
 assertNotNull(documentXML);}

ZipFile代码可以返回它包含的实体内容，通过调用getInputStream()方法即可，不要对InputStream产生任何怀疑。将InputStream发送到一个DOM节点中就可以创建一个关于该文档的DOM。

@Test public void fromDocumentIntoDOM()  throws IOException, ZipException, SAXException,      
   ParserConfigurationException
{  
ZipFile docxFile =    new ZipFile(new File("hello.docx"));  
ZipEntry documentXML =    docxFile.getEntry("word/document.xml"); 
 InputStream documentXMLIS =    docxFile.getInputStream(documentXML); 
 DocumentBuilderFactory dbf =    DocumentBuilderFactory.newInstance(); 
 Document doc =    dbf.newDocumentBuilder().parse(documentXMLIS); 
 assertEquals("[w:document: null]",               doc.getDocumentElement().toString());
}

事实上，与其他支持各种Word所需格式的XML文档相比，document.xml文件的内容（为了明显起见，将命名空间声明等内容去除）看起来也相当乏味：

<w:document ...> <w:body>
 <w:p w:rsidR="00DE36E5" w:rsidRDefault="00DE36E5">
 <w:r>
 <w:t>Hello, from Office 2007!</w:t> 
</w:r>
 </w:p>
 <w:sectPr w:rsidR="00DE36E5"> 
<w:pgSz w:w="12240" w:h="15840"/> 
<w:pgMar w:top="1440" w:right="1440" 
w:bottom="1440" w:left="1440" w:header="720" w:footer="720" w:gutter="0"/> 
<w:cols w:space="720"/>
 <w:docGrid w:linePitch="360"/> 
</w:sectPr>
 </w:body> 
</w:document>

关于文档中各个元素具体代表什么内容的细节已经超出了这篇文章的讨论范围，读者可以查阅OpenXML文档的具体内容来获得参考，但是文档中的主要内容是十分明显的。比如说文档中包括“p”元素（段落），包括“r”元素（文本区），包括“t”元素（文本），在本例的hello.docx文档中，单句“Hello from Office 2007”就是由这些元素构成的。

读过文件的内容后，现在可以来修改这些内容了，将其写到文件中，并用Word 2007打开它。快速的查看ZipFile和ZipEntry的应用程序接口可以发现这样一个问题：尽管这些类可以用来读取一个zip文件，但它们并不能写入或创建它们。

有很多可用的方法可以用于解决这个问题。一个简单的方法是将XML文件的内容文本写到一个字符串中，并将这个字符串存储到document.xml文件中，然后重新使用ZipOutStream类压缩所有的内容。另一个方法是使用一些可以编辑zip文件内容的第三方工具（或创建一个），但这些已经脱离了JDK的基本内容，所以在这篇文章中我们将使用ZipOutStream方法。

为了达到我们的目的，我们需要做很多事情。首先，Java应用程序必须定位到DOM的层次结构中，找到“t”节点，然后将它的文本内容替换为我们要写入到Word文档中的内容。（“Hello，Office 2007，from Java6！”是个不错的选择）产生的新DOM实例必须要保存到磁盘中，使用Java XML 应用程序接口时这并不是一个简单的任务。（简单的说来，开发者需要从javax.xml.transform包中创建一个Transformer，然后将XML转换为一个StreamResult，再交由ByteArrayOutputStream处理。）

一旦上面这些事情都处理完毕后，代码必须要产生一个ZIP格式的文件，是时候使用ZipOutputStream了，但由于只需要改变文档的内容，而不需要改变它的样式、字体以及格式，其他的部分可以从原始的文件中拷贝过来。使用一个简单的循环，遍历原始文件中的ZipEntries中所有的内容（除了word/document.xml，该文件中的内容需要被改变）并将其导出到一个新的ZipEntry中并写入该实体就足够了。当所有的工作都完成后，代码将会是以下的样子：

@Test public void modifyDocumentAndSave() 
 throws IOException, ZipException, SAXException,         ParserConfigurationException,         TransformerException,         TransformerConfigurationException
{ 
 ZipFile docxFile =    new ZipFile(new File("hello.docx")); 
 ZipEntry documentXML =    docxFile.getEntry("word/document.xml"); 
 InputStream documentXMLIS =    docxFile.getInputStream(documentXML); 
 DocumentBuilderFactory dbf =    DocumentBuilderFactory.newInstance(); 
 Document doc =    dbf.newDocumentBuilder().parse(documentXMLIS); 
 Element docElement = doc.getDocumentElement(); 
 assertEquals("w:document", docElement.getTagName());  Element bodyElement = (Element)    docElement.getElementsByTagName("w:body").item(0);  assertEquals("w:body", bodyElement.getTagName()); 
 Element pElement = (Element)    bodyElement.getElementsByTagName("w:p").item(0);  assertEquals("w:p", pElement.getTagName());  
Element rElement = (Element)    pElement.getElementsByTagName("w:r").item(0); 
 assertEquals("w:r", rElement.getTagName());  
Element tElement = (Element)    rElement.getElementsByTagName("w:t").item(0);  
assertEquals("w:t", tElement.getTagName());  
assertEquals("Hello, from Office 2007!",               tElement.getTextContent()); 
 tElement.setTextContent(    "Hello, Office 2007, from Java6!");  Transformer t =    TransformerFactory.newInstance().newTransformer(); 
 ByteArrayOutputStream baos =    new ByteArrayOutputStream();  
t.transform(new DOMSource(doc),    new StreamResult(baos));  ZipOutputStream docxOutFile = new ZipOutputStream(    new FileOutputStream("response.docx")); 
 Enumeration entriesIter =    docxFile.entries(); 
 while (entriesIter.hasMoreElements())  
{ 
   ZipEntry entry = entriesIter.nextElement(); 
   if (entry.getName().equals("word/document.xml"))
    { 
     byte[] data = baos.toByteArray();
      docxOutFile.putNextEntry(        new ZipEntry(entry.getName())); 
     docxOutFile.write(data, 0, data.length);      docxOutFile.closeEntry();  
  }    else    
{     
 InputStream incoming =        docxFile.getInputStream(entry);      byte[] data = new byte[1024 * 16];  
    int readCount =        incoming.read(data, 0, data.length);      docxOutFile.putNextEntry(     
   new ZipEntry(entry.getName())); 
     docxOutFile.write(data, 0, readCount);      docxOutFile.closeEntry();    
}  
}  
docxOutFile.close();
}

很抱歉这里展示了这么多代码，但是说实在的，这也是Java相比其他语言或者库的一个弱点。幸运的是我们的努力得到了以下的回报：

显然我们可以作很多事情来改善上面的场景。

首先，一个更好的XML操作库，可以更好的支持XPath技术，能够原生的序列化XML DOM结构到磁盘的库会对减少大量的代码有所帮助。JDOM，一个开源的Java/XML库（可以在jdom.org中找到），是一个可用的选择。Apache的XMLBeans也不错。一个必然的结果是我们可以获得更好的描述OpenXML格式的模式文档，并使用它们来产生一系列的Java类来更好的反映OpenXML文档的格式。开发者则可以更好的使用原生的Java类工作，而不是通过“Document”类和“Element”类。

其次，这些方法可以被绑定到一个更加针对Office的应用程序接口当中，可以改善针对实际存储的Word（或是Excel，PowerPoint）文档的XML文件操作的抽象层，关注那些拥有段落，字体等等其他的文档。实质上，像POI那样的库应该可以通过更新类反映Office XML格式的改动，理想的话，可以同时支持写入二进制结构化存储格式和新的OpenXML格式。

再次，Java可以对其ZIP文件格式的支持进行一些改动，同样，这样的目的也可以由使用一些第三方的库来完成。

尽管使用了一些笨重的应用程序接口调用，但是当想到Office平台对Java开发人员有多开放时还是非常的令人激动和振奋。在Java和Office应用程序的互操作性上，在Java应用程序中使用Office，还有在Java中创建和读写Office文件格式上，Office平台对Java社区的开发人员比以往任何时候都更加开放了。

本文附带的示例代码可以在

Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
钢筋长度超限检测检数据集VOC+YOLO格式215张1类别 futureflsl 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：215标注数量(xml文件个数)：215标注数量(txt文件个数)：215标注类别数：1标注类别名称:["iron"]每个类别标注的框数：iron框数=215总框数：215使用标注工具：labelImg标注规则：对类别进
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
SpringBlade dict-biz/list 接口 SQL 注入漏洞文章永久免费只为良心 oracle 数据库
SpringBladedict-biz/list接口SQL注入漏洞POC:构造请求包查看返回包你的网址/api/blade-system/dict-biz/list?updatexml(1,concat(0x7e,md5(1),0x7e),1)=1漏洞概述在SpringBlade框架中，如果dict-biz/list接口的后台处理逻辑没有正确地对用户输入进行过滤或参数化查询（PreparedSta
Java 重写(Override)与重载(Overload) 叨唧唧的
Java重写(Override)与重载(Overload)重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。即外壳不变，核心重写！重写的好处在于子类可以根据需要，定义特定于自己的行为。也就是说子类能够根据需要实现父类的方法。重写方法不能抛出新的检查异常或者比被重写方法申明更加宽泛的异常。例如：父类的一个方法申明了一个检查异常IOExceptio
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
白骑士的Java教学基础篇 2.5 控制流语句白骑士所长 Java 教学 java 开发语言
欢迎继续学习Java编程的基础篇！在前面的章节中，我们了解了Java的变量、数据类型和运算符。接下来，我们将探讨Java中的控制流语句。控制流语句用于控制程序的执行顺序，使我们能够根据特定条件执行不同的代码块，或重复执行某段代码。这是编写复杂程序的基础。通过学习这一节内容，你将掌握如何使用条件语句和循环语句来编写更加灵活和高效的代码。条件语句条件语句用于根据条件的真假来执行不同的代码块。if语句‘
python语法——三目运算符 HappyRocking python python 三目运算符
在java中，有三目运算符，如：intc=(a>b)?a:b表示c取两者中的较大值。但是在python，不能直接这样使用，估计是因为冒号在python有分行的关键作用。那么在python中，如何实现类似功能呢？可以使用ifelse语句，也是一行可以完成，格式为：aifbelsec表示如果b为True，则表达式等于a，否则等于c。如：c=(aif(a>b)elseb)同样是完成了取最大值的功能。
spring如何整合druid连接池？惜.己 spring spring junit 数据库 java idea 后端 xml
目录spring整合druid连接池1.新建maven项目2.新建mavenModule3.导入相关依赖4.配置log4j2.xml5.配置druid.xml1)xml中如何引入properties2)下面是配置文件6.准备jdbc.propertiesJDBC配置项解释7.配置druid8.测试spring整合druid连接池1.新建maven项目打开IDE（比如IntelliJIDEA,Ecl
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
python怎么将png转为tif_png转tif weixin_39977276
发国外的文章要求图片是tif，cmyk色彩空间的。大小尺寸还有要求。比如网上大神多，找到了一段代码，感谢！https://www.jianshu.com/p/ec2af4311f56https://github.com/KevinZc007/image2Tifimportjava.awt.image.BufferedImage;importjava.io.File;importjava.io.Fi
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。

用Java操作Office 2007

你可能感兴趣的:(java,xml,Excel,单元测试,Office)