黄泉颤抖

Jsoup解析HTML实例及文档方法详解

这篇文章主要介绍了Jsoup如何解析一个HTML文档、从文件加载文档、从URL加载Document等方法，对Jsoup常用方法做了详细讲解，最近提供了一个示例供大家参考使用DOM方法来遍历一个文档从元素抽取属性，文本和HTML 获取所有链接

解析和遍历一个HTML文档

如何解析一个HTML文档：

复制代码代码如下:

String html = "First parse"
+ "

Parsed HTML into a doc.

";
Document doc = Jsoup.parse(html);

其解析器能够尽最大可能从你提供的HTML文档来创见一个干净的解析结果，无论HTML的格式是否完整。比如它可以处理：

1、没有关闭的标签 (比如：

Lorem

Ipsum parses to

Lorem

Ipsum

)
2、隐式标签 (比如. 它可以自动将 Table data包装成

?)
3、创建可靠的文档结构（html标签包含head 和 body，在head只出现恰当的元素）

一个文档的对象模型

1、文档由多个Elements和TextNodes组成 (以及其它辅助nodes).
2、其继承结构如下：Document继承Element继承Node. TextNode继承 Node.
3、一个Element包含一个子节点集合，并拥有一个父Element。他们还提供了一个唯一的子元素过滤列表。

从一个URL加载一个Document

存在问题
你需要从一个网站获取和解析一个HTML文档，并查找其中的相关数据。你可以使用下面解决方法：

解决方法
使用 Jsoup.connect(String url)方法:

复制代码代码如下:

 
 Document doc = Jsoup.connect("http://www.jb51.net/").get(); 
   
 String title = doc.title();

说明
connect(String url) 方法创建一个新的 Connection, 和 get() 取得和解析一个HTML文件。如果从该URL获取HTML时发生错误，便会抛出 IOException，应适当处理。

Connection 接口还提供一个方法链来解决特殊请求，具体如下：

复制代码代码如下:

 
 Document doc = Jsoup.connect("http://www.jb51.net") 
   
 .data("query", "Java") 
   
 .userAgent("Mozilla") 
   
 .cookie("auth", "token") 
   
 .timeout(3000) 
   
 .post();

这个方法只支持Web URLs (http和https 协议); 假如你需要从一个文件加载，可以使用parse(File in, String charsetName) 代替。

从一个文件加载一个文档

问题
在本机硬盘上有一个HTML文件，需要对它进行解析从中抽取数据或进行修改。

办法
可以使用静态 Jsoup.parse(File in, String charsetName, String baseUri) 方法：

复制代码代码如下:

 
 File input = new File("/tmp/input.html"); 
   
 Document doc = Jsoup.parse(input, "UTF-8", "http://www.jb51.net/");

说明
parse(File in, String charsetName, String baseUri) 这个方法用来加载和解析一个HTML文件。如在加载文件的时候发生错误，将抛出IOException，应作适当处理。
baseUri 参数用于解决文件中URLs是相对路径的问题。如果不需要可以传入一个空的字符串。
另外还有一个方法parse(File in, String charsetName) ，它使用文件的路径做为 baseUri。这个方法适用于如果被解析文件位于网站的本地文件系统，且相关链接也指向该文件系统。

使用DOM方法来遍历一个文档

问题
你有一个HTML文档要从中提取数据，并了解这个HTML文档的结构。

方法
将HTML解析成一个Document之后，就可以使用类似于DOM的方法进行操作。示例代码：

复制代码代码如下:

File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://www.jb51.net/");

Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
String linkHref = link.attr("href");
String linkText = link.text();
}

说明
Elements这个对象提供了一系列类似于DOM的方法来查找元素，抽取并处理其中的数据。具体如下：
查找元素
getElementById(String id)
getElementsByTag(String tag)
getElementsByClass(String className)
getElementsByAttribute(String key) (and related methods)
Element siblings: siblingElements(), firstElementSibling(), lastElementSibling();nextElementSibling(), previousElementSibling()
Graph: parent(), children(), child(int index)

元素数据
attr(String key)获取属性attr(String key, String value)设置属性
attributes()获取所有属性
id(), className() and classNames()
text()获取文本内容text(String value) 设置文本内容
html()获取元素内HTMLhtml(String value)设置元素内的HTML内容
outerHtml()获取元素外HTML内容
data()获取数据内容（例如：script和style标签)
tag() and tagName()

操作HTML和文本
append(String html), prepend(String html)
appendText(String text), prependText(String text)
appendElement(String tagName), prependElement(String tagName)
html(String value)

使用选择器语法来查找元素
问题
你想使用类似于CSS或jQuery的语法来查找和操作元素。

方法
可以使用Element.select(String selector) 和 Elements.select(String selector) 方法实现：

复制代码代码如下:

File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://www.jb51.net./");

Elements links = doc.select("a[href]"); //带有href属性的a元素
Elements pngs = doc.select("img[src$=.png]");
//扩展名为.png的图片

Element masthead = doc.select("div.masthead").first();
//class等于masthead的div标签

Elements resultLinks = doc.select("h3.r > a"); //在h3元素之后的a元素

说明
jsoup elements对象支持类似于CSS (或jquery)的选择器语法，来实现非常强大和灵活的查找功能。.
这个select 方法在Document, Element,或Elements对象中都可以使用。且是上下文相关的，因此可实现指定元素的过滤，或者链式选择访问。
Select方法将返回一个Elements集合，并提供一组方法来抽取和处理结果。

Selector选择器概述
tagname: 通过标签查找元素，比如：a
ns|tag: 通过标签在命名空间查找元素，比如：可以用 fb|name 语法来查找元素
#id: 通过ID查找元素，比如：#logo
.class: 通过class名称查找元素，比如：.masthead
[attribute]: 利用属性查找元素，比如：[href]
[^attr]: 利用属性名前缀来查找元素，比如：可以用[^data-] 来查找带有HTML5 Dataset属性的元素
[attr=value]: 利用属性值来查找元素，比如：[width=500]
[attr^=value], [attr$=value], [attr*=value]: 利用匹配属性值开头、结尾或包含属性值来查找元素，比如：[href*=/path/]
[attr~=regex]: 利用属性值匹配正则表达式来查找元素，比如： img[src~=(?i)\.(png|jpe?g)]
*: 这个符号将匹配所有元素

Selector选择器组合使用
el#id: 元素+ID，比如： div#logo
el.class: 元素+class，比如： div.masthead
el[attr]: 元素+class，比如： a[href]
任意组合，比如：a[href].highlight
ancestor child: 查找某个元素下子元素，比如：可以用.body p 查找在"body"元素下的所有p元素
parent > child: 查找某个父元素下的直接子元素，比如：可以用div.content > p 查找 p 元素，也可以用body > * 查找body标签下所有直接子元素
siblingA + siblingB: 查找在A元素之前第一个同级元素B，比如：div.head + div
siblingA ~ siblingX: 查找A元素之前的同级X元素，比如：h1 ~ p
el, el, el:多个选择器组合，查找匹配任一选择器的唯一元素，例如：div.masthead, div.logo

伪选择器selectors
:lt(n): 查找哪些元素的同级索引值（它的位置在DOM树中是相对于它的父节点）小于n，比如：td:lt(3) 表示小于三列的元素
:gt(n):查找哪些元素的同级索引值大于n，比如： div p:gt(2)表示哪些div中有包含2个以上的p元素
:eq(n): 查找哪些元素的同级索引值与n相等，比如：form input:eq(1)表示包含一个input标签的Form元素
:has(seletor): 查找匹配选择器包含元素的元素，比如：div:has(p)表示哪些div包含了p元素
:not(selector): 查找与选择器不匹配的元素，比如： div:not(.logo) 表示不包含 class=logo 元素的所有 div 列表
:contains(text): 查找包含给定文本的元素，搜索不区分大不写，比如： p:contains(jsoup)
:containsOwn(text): 查找直接包含给定文本的元素
:matches(regex): 查找哪些元素的文本匹配指定的正则表达式，比如：div:matches((?i)login)
:matchesOwn(regex): 查找自身包含文本匹配指定正则表达式的元素
注意：上述伪选择器索引是从0开始的，也就是说第一个元素索引值为0，第二个元素index为1等
可以查看Selector API参考来了解更详细的内容

从元素抽取属性，文本和HTML

问题
在解析获得一个Document实例对象，并查找到一些元素之后，你希望取得在这些元素中的数据。

方法
要取得一个属性的值，可以使用Node.attr(String key) 方法
对于一个元素中的文本，可以使用Element.text()方法
对于要取得元素或属性中的HTML内容，可以使用Element.html(), 或 Node.outerHtml()方法
示例：

复制代码代码如下:

String html = "

An www.jb51.net link.

";
Document doc = Jsoup.parse(html);//解析HTML字符串返回一个Document实现
Element link = doc.select("a").first();//查找第一个a元素

String text = doc.body().text(); // "An www.jb51.net link"//取得字符串中的文本
String linkHref = link.attr("href"); // "http://www.jb51.net/"//取得链接地址
String linkText = link.text(); // "www.jb51.net""//取得链接地址中的文本

String linkOuterH = link.outerHtml();
// "www.jb51.net"
String linkInnerH = link.html(); // "www.jb51.net"//取得链接内的html内容

说明
上述方法是元素数据访问的核心办法。此外还其它一些方法可以使用：

Element.id()
Element.tagName()
Element.className() and Element.hasClass(String className)
这些访问器方法都有相应的setter方法来更改数据.

示例程序: 获取所有链接
这个示例程序将展示如何从一个URL获得一个页面。然后提取页面中的所有链接、图片和其它辅助内容。并检查URLs和文本信息。
运行下面程序需要指定一个URLs作为参数

复制代码代码如下:

package org.jsoup.www.jb51.nets;

import org.jsoup.Jsoup;
import org.jsoup.helper.Validate;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.IOException;

/**
* www.jb51.net program to list links from a URL.
*/
public class ListLinks {
public static void main(String[] args) throws IOException {
Validate.isTrue(args.length == 1, "usage: supply url to fetch");
String url = args[0];
print("Fetching %s...", url);

Document doc = Jsoup.connect(url).get();
Elements links = doc.select("a[href]");
Elements media = doc.select("[src]");
Elements imports = doc.select("link[href]");

print("\nMedia: (%d)", media.size());
for (Element src : media) {
if (src.tagName().equals("img"))
print(" * %s: <%s> %sx%s (%s)",
src.tagName(), src.attr("abs:src"), src.attr("width"), src.attr("height"),
trim(src.attr("alt"), 20));
else
print(" * %s: <%s>", src.tagName(), src.attr("abs:src"));
}

print("\nImports: (%d)", imports.size());
for (Element link : imports) {
print(" * %s <%s> (%s)", link.tagName(),link.attr("abs:href"), link.attr("rel"));
}

print("\nLinks: (%d)", links.size());
for (Element link : links) {
print(" * a: <%s> (%s)", link.attr("abs:href"), trim(link.text(), 35));
}
}

private static void print(String msg, Object... args) {
System.out.println(String.format(msg, args));
}

private static String trim(String s, int width) {
if (s.length() > width)
return s.substring(0, width-1) + ".";
else
return s;
}
}
org/jsoup/www.jb51.nets/ListLinks.java

java使用Jsoup组件生成word文档的方法

先利用jsoup将得到的html代码“标准化”（Jsoup.parse(String html)）方法，然后利用FileWiter将此html内容写到本地的template.doc文件中，此时如果文章中包含图片的话，template.doc就会依赖你的本地图片文件路径，如果你将图片更改一个名称或者将路径更改，再打开这个template.doc，图片就会显示不出来（出现一个叉叉）。为了解决此问题，利用jsoup组件循环遍历html文档的内容，将img元素替换成${image_自增值}的标识，取出img元素中的src属性，再以键值对的方式存储起来，例如：

复制代码代码如下:

 
 Map imgMap = new HashMap(); 
   
 imgMap.put(1,”D:\lucene.png”);

此时你的html内容会变成如下格式:（举个示例）

复制代码代码如下:

测试消息1

${image_1}

测试消息2

${image_2}

测试消息3

保存到本地文件以后，利用MSOfficeGeneratorUtils类（工具类详见下面，基于开源组件Jacob）打开你保存的这个template.doc,调用replaceText2Image,将上面代码的图片标识替换为图片，这样就消除了本地图片路径的问题。然后再调用copy方法，复制整篇文档，关闭template.doc文件，新建一个doc文件（createDocument），调用 paste方法粘贴你刚复制的template.doc里的内容，保存。基本上就ok了。
关于copy整个word文档的内容，也会出现一个隐式问题。就是当复制的内容太多时，关闭word程序的时候，会谈出一个对话框，问你是否将复制的数据应用于其它的程序。对于这个问题解决方法很简单，你可以在调用 quit（退出word程序方法）之前，新建一篇文档，输入一行字，然后调用 copy方法，对于复制的数据比较少时，关闭word程序时，它不会提示你的。见如下代码
//复制一个内容比较少的*.doc文档，防止在关闭word程序时提示有大量的copy内容在内存中，是否应用于其它程序对话框,

复制代码代码如下:

msOfficeUtils.createNewDocument();
msOfficeUtils.insertText("测试消息");
msOfficeUtils.copy();
msOfficeUtils.close();
msOfficeUtils.quit();
Jacob在sourceforge上的链接
Jsoup官网
MsOfficeGeneratorUtils
package com.topstar.test;
import java.io.File;
import java.io.IOException;
import java.util.List;
import com.jacob.activeX.ActiveXComponent;
import com.jacob.com.ComThread;
import com.jacob.com.Dispatch;
import com.jacob.com.Variant;
/**
* 利用JACOB对Microsoft Office Word 进行相关操作
*
* @author xiaowu
* @category topstar
* @version 1.0
* @since 2011-12-5
*/
public class MSOfficeGeneratorUtils {
/**
* Microsoft Office Word 程序对象
*/
private ActiveXComponent word = null;
/**
* Word 活动文档对象
*/
private Dispatch document = null;
/**
* 所有 Word 文档对象
*/
private Dispatch documents = null;
/**
* selection 代表当前活动文档窗口中的所选内容。如果文档中没有选中任何内容，则此对象代表插入点（即光标所在位置）。

* 每个文档窗口中只能存在一个selection对象，并且在整个应用程序中，只能存在一个活动的selection对象
*/
private Dispatch selection = null;
/**
* range 对象代表文档中的一个连续的区域。每个range对象由一个起始字符位置与结束字符位置定义。

* range 对象独立于所选内容。你可以定义和处理一个范围而无需改变所选内容。还可以在文档中定义多个范围。但每个文档中只能有一个所选内容
*/
private Dispatch range = null;
/**
* PageSetup 对象包含文档所有页面的设置属性（如纸张大小，左边距，下边距）
*/
private Dispatch pageSetup = null;
/**
* 文档中的所有表格对象
*/
private Dispatch tables = null;
/** 单个表格对象 */
private Dispatch table = null;
/** 表格所有行对象 */
private Dispatch rows = null;
/** 表格所有列对象 */
private Dispatch cols = null;
/** 表格指定行对象 */
private Dispatch row = null;
/** 表格指定列对象 */
private Dispatch col = null;
/** 表格中指定的单元格 */
private Dispatch cell = null;
/** 字体 */
private Dispatch font = null;
/** 对齐方式 */
private Dispatch alignment = null;
/**
* 构造方法
*
* @param visible
* 设置在生成word文档时，程序是否可见
*/
public MSOfficeGeneratorUtils(boolean visible) {
if (this.word == null) {
// 初始化Microsoft Office Word 实例
this.word = new ActiveXComponent("Word.Application");
this.word.setProperty("Visible", new Variant(visible));
// 禁用宏
this.word.setProperty("AutomationSecurity", new Variant(3));
}
if (this.documents == null)
this.documents = word.getProperty("Documents").toDispatch();
}
/**
* 设置页面方向与页边距
*
* @param orientation
* 页面方向
*

0 横向

1 纵向

* @param leftMargin
* 左边距
* @param rightMargin
* 右边距
* @param topMargin
* 上边距
* @param buttomMargin
* 下边距
*/
public void setPageSetup(int orientation, int leftMargin, int rightMargin,
int topMargin, int buttomMargin) {
if (this.pageSetup == null)
this.getPageSetup();
Dispatch.put(pageSetup, "Orientation", orientation);
Dispatch.put(pageSetup, "LeftMargin", leftMargin);
Dispatch.put(pageSetup, "RightMargin", rightMargin);
Dispatch.put(pageSetup, "TopMargin", topMargin);
Dispatch.put(pageSetup, "BottomMargin", buttomMargin);
}
/**
* 打开word文档
*
* @param docPath
* word文档路径
* @return 打开的文档对象
*/
public Dispatch openDocument(String docPath) {
this.document = Dispatch.call(documents, "Open", docPath).toDispatch();
this.getSelection();
this.getRange();
this.getAlignment();
this.getFont();
this.getPageSetup();
return this.document;
}
/**
* 创建一篇新文档
*
* @return 文档对象
*/
public Dispatch createNewDocument() {
this.document = Dispatch.call(documents, "Add").toDispatch();
this.getSelection();
this.getRange();
this.getPageSetup();
this.getAlignment();
this.getFont();
return this.document;
}
/**
* 获取选定的内容或插入点
*
* @return selection
*/
public Dispatch getSelection() {
this.selection = word.getProperty("Selection").toDispatch();
return this.selection;
}
/**
* 获取当前文档中可以修改的部分，前提是必须存在选中内容
*
* @return range
*/
public Dispatch getRange() {
this.range = Dispatch.get(this.selection, "Range").toDispatch();
return this.range;
}
/**
* 获得当前文档的页面属性
*/
public Dispatch getPageSetup() {
if (this.document == null)
return this.pageSetup;
this.pageSetup = Dispatch.get(this.document, "PageSetup").toDispatch();
return this.pageSetup;
}
/**
* 把选中内容或插入点向上移动
*
* @param count
* 移动的距离
*/
public void moveUp(int count) {
for (int i = 0; i < count; i++)
Dispatch.call(this.selection, "MoveUp");
}
/**
* 把选中内容或插入点向下移动
*
* @param count
* 移动的距离
*/
public void moveDown(int count) {
for (int i = 0; i < count; i++)
Dispatch.call(this.selection, "MoveDown");
}
/**
* 把选中内容或插入点向左移动
*
* @param count
* 移动的距离
*/
public void moveLeft(int count) {
for (int i = 0; i < count; i++)
Dispatch.call(this.selection, "MoveLeft");
}
/**
* 把选中内容或插入点向右移动
*
* @param count
* 移动的距离
*/
public void moveRight(int count) {
for (int i = 0; i < count; i++)
Dispatch.call(this.selection, "MoveRight");
}
/**
* 执行硬换行（回车键）
*
* @param count
* 换行数
*/
public void enterDown(int count) {
for (int i = 0; i < count; i++)
Dispatch.call(this.selection, "TypeParagraph");
}
/**
* 把插入点移动到文件首位置
*/
public void moveStart() {
Dispatch.call(this.selection, "HomeKey", new Variant(6));
}
/**
* 把插入点移动到文件末尾
*/
public void moveEnd() {
Dispatch.call(selection, "EndKey", new Variant(6));
}

/**
* 从选定内容或插入点开始查找文本
*
* @param toFindText
* 要查找的内容
* @return 查询到的内容并选中
*/
public boolean find(String toFindText) {
// 从selection所在位置开始查询
Dispatch find = Dispatch.call(this.selection, "Find").toDispatch();
// 设置要查找的?热?br /> Dispatch.put(find, "Text", toFindText);
// 向前查找
Dispatch.put(find, "Forward", "True");
// 设置格式
Dispatch.put(find, "Format", "True");
// 大小写匹配
Dispatch.put(find, "MatchCase", "True");
// 全字匹配
Dispatch.put(find, "MatchWholeWord", "True");
// 查找并选中
return Dispatch.call(find, "Execute").getBoolean();
}
/**
* 替换选定的内容
*
* @param newText
* 要替换的内容
*/
public void replace(String newText) {
// 设置替换文本
Dispatch.put(this.selection, "Text", newText);
}
/**
* 全局替换
*
* @param oldText
* 要替换的内容
* @param replaceObj
* 被替换的内容
*/
public void replaceAll(String oldText, Object replaceObj) {
// 将插入点移到文件开头
moveStart();
// 表格替换方式
String newText = (String) replaceObj;
// 图片替换方式
if (oldText.indexOf("image") != -1 || newText.lastIndexOf(".bmp") != -1 || newText.lastIndexOf(".jpg") != -1 || newText.lastIndexOf(".gif") != -1) {
while (find(oldText)) {
insertImage(newText);
Dispatch.call(this.selection, "MoveRight");
}
// 文本方式
} else {
while (find(oldText)) {
replace(newText);
Dispatch.call(this.selection, "MoveRight");
}
}
}

/**
* 将指定的内容替换成图片
* @param replaceText 指定的内容
* @param imgPath 图片路径
*/
public void replaceText2Image(String replaceText,String imgPath){
moveStart();
while(find(replaceText)){
insertImage(imgPath);
moveEnd();
enterDown(1);
}
}
/**
* 向当前插入点替换图片
*
* @param imagePath
* 图片的路径
*/
public void insertImage(String imagePath) {
Dispatch.call(Dispatch.get(selection, "InLineShapes").toDispatch(), "AddPicture", imagePath);
}
/**
* 合并单元格
*
* @param tableIndex
* 表格下标，从1开始
* @param fstCellRowIdx
* 开始行
* @param fstCellColIdx
* 开始列
* @param secCellRowIdx
* 结束行
* @param secCellColIdx
* 结束列
*/
public void mergeCell(int tableIndex, int fstCellRowIdx, int fstCellColIdx,
int secCellRowIdx, int secCellColIdx) {
getTable(tableIndex);
Dispatch fstCell = Dispatch.call(table, "Cell",
new Variant(fstCellRowIdx), new Variant(fstCellColIdx))
.toDispatch();
Dispatch secCell = Dispatch.call(table, "Cell",
new Variant(secCellRowIdx), new Variant(secCellColIdx))
.toDispatch();
Dispatch.call(fstCell, "Merge", secCell);
}
/**
* 拆分当前单元格
*
* @param numRows
* 拆分的行数，如果不想拆分行，请指定为1
* @param numColumns
* 拆分的列数，如果不想拆分列，请指定为1
*/
public void splitCell(int numRows, int numColumns) {
Dispatch.call(this.cell, "Split", new Variant(numRows), new Variant(
numColumns));
}
/**
* 向表格中写入内容
*
* @param list
* 要写入的内容

* 注：list.size() 应该与表格的rows一致，String数组的length属性应与表格的columns一致
*/
public void insertToTable(List list) {
if (list == null || list.size() <= 0)
return;
if (this.table == null)
return;
for (int i = 0; i < list.size(); i++) {
String[] strs = list.get(i);
for (int j = 0; j < strs.length; j++) {
// 遍历表格中每一??单元格，遍历次数所要填入的?热菔?肯嗤?br /> Dispatch cell = this.getCell(i + 1, j + 1);
// 选中此单元格
Dispatch.call(cell, "Select");
// 写入?热莸酱说ピ?裰?br /> Dispatch.put(this.selection, "Text", strs[j]);
// 将插入点移动至下一??位置
}
this.moveDown(1);
}
// 换行
this.enterDown(1);
}
/**
* 向当前插入点插入文本内容
*
* @param list
* 要插入的内容，list.size()代表行数
*/
public void insertToDocument(List list) {
if (list == null || list.size() <= 0)
return;
if (this.document == null)
return;
for (String str : list) {
Dispatch.put(this.selection, "Text", str);
this.moveDown(1);
this.enterDown(1);
}
}
/**
* 在当前插入点插入文本
*
* @param insertText
* 要插入的文本
*/
public void insertToText(String insertText) {
Dispatch.put(this.selection, "Text", insertText);
}
/**
* 在当前插入点插入字符串,利用此方法插入一行text后，Word会默认选中它，如果再调用此方法，会将原来的内容覆盖掉，所以调用此方法后，记得调用moveRight，将偏移量向右边移动一个位置。
* @param newText 要插入的新字符串
*/
public void insertText(String newText) {
Dispatch.put(selection, "Text", newText);
}
/**
* 创建新的表格
*
* @param rowCount
* 行
* @param colCount
* 列
* @param width
* 表格边框
*

0 无边框

1 有边框

* @return 表格对象
*/
public Dispatch createNewTable(int rowCount, int colCount, int width) {
if (this.tables == null)
this.getTables();
this.getRange();
if (rowCount > 0 && colCount > 0)
this.table = Dispatch.call(this.tables, "Add", this.range,
new Variant(rowCount), new Variant(colCount),
new Variant(width)).toDispatch();
return this.table;
}
/**
* 获取当前document对象中的所有表格对象
*
* @return tables
*/
public Dispatch getTables() {
if (this.document == null)
return this.tables;
this.tables = Dispatch.get(this.document, "Tables").toDispatch();
return this.tables;
}
/**
* 获取当前文档中的所有表格数量
*
* @return 表格数量
*/
public int getTablesCount() {
if (this.tables == null)
this.getTables();
return Dispatch.get(tables, "Count").getInt();
}
/**
* 根据索引获得table对象
*
* @param tableIndex
* 索引
* @return table
*/
public Dispatch getTable(int tableIndex) {
if (this.tables == null)
this.getTables();
if (tableIndex >= 0)
this.table = Dispatch.call(this.tables, "Item", new Variant(tableIndex)).toDispatch();
return this.table;
}
/**
* 在指定的单元格里填写数据
*
* @param tableIndex
* 表格索引
* @param cellRowIdx
* 行索引
* @param cellColIdx
* 列索引
* @param txt
* 文本
*/
public void putTxtToCell(int tableIndex, int cellRowIdx, int cellColIdx, String txt) {
getTable(tableIndex);
getCell(cellRowIdx, cellColIdx);
Dispatch.call(this.cell, "Select");
Dispatch.put(this.selection, "Text", txt);
}
/**
* 在当前文档末尾拷贝来自另一个文档中的段落
*
* @param anotherDocPath
* 另一个文档的磁盘路径
* @param tableIndex
* 被拷贝的段落在另一格文档中的序号(从1开始)
*/
public void copyParagraphFromAnotherDoc(String anotherDocPath, int paragraphIndex) {
Dispatch wordContent = Dispatch.get(this.document, "Content").toDispatch(); // 取得当前文档的内容
Dispatch.call(wordContent, "InsertAfter", "$selection$");// 插入特殊符定位插入点
copyParagraphFromAnotherDoc(anotherDocPath, paragraphIndex, "$selection$");
}
/**
* 在当前文档指定的位置拷贝来自另一个文档中的段落
*
* @param anotherDocPath
* 另一个文档的磁盘路径
* @param tableIndex
* 被拷贝的段落在另一格文档中的序号(从1开始)
* @param pos
* 当前文档指定的位置
*/
public void copyParagraphFromAnotherDoc(String anotherDocPath, int paragraphIndex, String pos) {
Dispatch doc2 = null;
try {
doc2 = Dispatch.call(documents, "Open", anotherDocPath).toDispatch();
Dispatch paragraphs = Dispatch.get(doc2, "Paragraphs").toDispatch();
Dispatch paragraph = Dispatch.call(paragraphs, "Item", new Variant(paragraphIndex)).toDispatch();
Dispatch range = Dispatch.get(paragraph, "Range").toDispatch();
Dispatch.call(range, "Copy");
if (this.find(pos)) {
getRange();
Dispatch.call(this.range, "Paste");
}
} catch (Exception e) {
e.printStackTrace();
} finally {
if (doc2 != null) {
Dispatch.call(doc2, "Close", new Variant(true));
doc2 = null;
}
}
}
/**
* 在当前文档指定的位置拷贝来自另一个文档中的表格
*
* @param anotherDocPath
* 另一个文档的磁盘路径
* @param tableIndex
* 被拷贝的表格在另一格文档中的序号(从1开始)
* @param pos
* 当前文档指定的位置
*/
public void copyTableFromAnotherDoc(String anotherDocPath, int tableIndex,
String pos) {
Dispatch doc2 = null;
try {
doc2 = Dispatch.call(documents, "Open", anotherDocPath)
.toDispatch();
Dispatch tables = Dispatch.get(doc2, "Tables").toDispatch();
Dispatch table = Dispatch.call(tables, "Item",
new Variant(tableIndex)).toDispatch();
Dispatch range = Dispatch.get(table, "Range").toDispatch();
Dispatch.call(range, "Copy");
if (this.find(pos)) {
getRange();
Dispatch.call(this.range, "Paste");
}
} catch (Exception e) {
e.printStackTrace();
} finally {
if (doc2 != null) {
Dispatch.call(doc2, "Close", new Variant(true));
doc2 = null;
}
}
}
/**
* 在当前文档指定的位置拷贝来自另一个文档中的图片
*
* @param anotherDocPath
* 另一个文档的磁盘路径
* @param shapeIndex
* 被拷贝的图片在另一格文档中的位置
* @param pos
* 当前文档指定的位置
*/
public void copyImageFromAnotherDoc(String anotherDocPath, int shapeIndex,
String pos) {
Dispatch doc2 = null;
try {
doc2 = Dispatch.call(documents, "Open", anotherDocPath)
.toDispatch();
Dispatch shapes = Dispatch.get(doc2, "InLineShapes").toDispatch();
Dispatch shape = Dispatch.call(shapes, "Item",
new Variant(shapeIndex)).toDispatch();
Dispatch imageRange = Dispatch.get(shape, "Range").toDispatch();
Dispatch.call(imageRange, "Copy");
if (this.find(pos)) {
getRange();
Dispatch.call(this.range, "Paste");
}
} catch (Exception e) {
e.printStackTrace();
} finally {
if (doc2 != null) {
Dispatch.call(doc2, "Close", new Variant(true));
doc2 = null;
}
}
}
/**
* 在指定的表格的指定行前面增加行
*
* @param tableIndex
* word文件中的第N张表(从1开始)
* @param rowIndex
* 指定行的序号(从1开始)
*/
public void addTableRow(int tableIndex, int rowIndex) {
getTable(tableIndex);
getTableRows();
getTableRow(rowIndex);
Dispatch.call(this.rows, "Add", new Variant(this.row));
}
/**
* 在第1行前增加一行
*
* @param tableIndex
* word文档中的第N张表(从1开始)
*/
public void addFirstTableRow(int tableIndex) {
getTable(tableIndex);
getTableRows();
Dispatch row = Dispatch.get(rows, "First").toDispatch();
Dispatch.call(this.rows, "Add", new Variant(row));
}
/**
* 在最后1行前增加一行
*
* @param tableIndex
* word文档中的第N张表(从1开始)
*/
public void addLastTableRow(int tableIndex) {
getTable(tableIndex);
getTableRows();
Dispatch row = Dispatch.get(this.rows, "Last").toDispatch();
Dispatch.call(this.rows, "Add", new Variant(row));
}
/**
* 增加一行
*
* @param tableIndex
* word文档中的第N张表(从1开始)
*/
public void addRow(int tableIndex) {
getTable(tableIndex);
getTableRows();
Dispatch.call(this.rows, "Add");
}
/**
* 增加一列
*
* @param tableIndex
* word文档中的第N张表(从1开始)
*/
public void addCol(int tableIndex) {
getTable(tableIndex);
getTableColumns();
Dispatch.call(this.cols, "Add").toDispatch();
Dispatch.call(this.cols, "AutoFit");
}
/**
* 在指定列前面增加表格的列
*
* @param tableIndex
* word文档中的第N张表(从1开始)
* @param colIndex
* 指定列的序号 (从1开始)
*/
public void addTableCol(int tableIndex, int colIndex) {
getTable(tableIndex);
getTableColumns();
getTableColumn(colIndex);
Dispatch.call(this.cols, "Add", this.col).toDispatch();
Dispatch.call(this.cols, "AutoFit");
}
/**
* 在第1列前增加一列
*
* @param tableIndex
* word文档中的第N张表(从1开始)
*/
public void addFirstTableCol(int tableIndex) {
getTable(tableIndex);
Dispatch cols = getTableColumns();
Dispatch col = Dispatch.get(cols, "First").toDispatch();
Dispatch.call(cols, "Add", col).toDispatch();
Dispatch.call(cols, "AutoFit");
}
/**
* 在最后一列前增加一列
*
* @param tableIndex
* word文档中的第N张表(从1开始)
*/
public void addLastTableCol(int tableIndex) {
getTable(tableIndex);
Dispatch cols = getTableColumns();
Dispatch col = Dispatch.get(cols, "Last").toDispatch();
Dispatch.call(cols, "Add", col).toDispatch();
Dispatch.call(cols, "AutoFit");
}
/**
* 获取当前表格的列数
*
* @return 列总数
*/
public int getTableColumnsCount() {
if (this.table == null)
return 0;
return Dispatch.get(this.cols, "Count").getInt();
}
/**
* 获取当前表格的行数
*
* @return 行总数
*/
public int getTableRowsCount() {
if (this.table == null)
return 0;
return Dispatch.get(this.rows, "Count").getInt();
}
/**
* 获取当前表格的所有列对象
*
* @return cols
*/
public Dispatch getTableColumns() {
if (this.table == null)
return this.cols;
this.cols = Dispatch.get(this.table, "Columns").toDispatch();
return this.cols;
}
/**
* 获取当前表格的所有行对象
*
* @return rows
*/
public Dispatch getTableRows() {
if (this.table == null)
return this.rows;
this.rows = Dispatch.get(this.table, "Rows").toDispatch();
return this.rows;
}
/**
* 根据索引获得当前表格的列对象
*
* @param columnIndex
* 列索引
* @return col
*/
public Dispatch getTableColumn(int columnIndex) {
if (this.cols == null)
this.getTableColumns();
if (columnIndex >= 0)
this.col = Dispatch.call(this.cols, "Item",
new Variant(columnIndex)).toDispatch();
return this.col;
}
/**
* 根据索引获得当前表格的行对象
*
* @param rowIndex
* 行索引
* @return row
*/
public Dispatch getTableRow(int rowIndex) {
if (this.rows == null)
this.getTableRows();
if (rowIndex >= 0)
this.row = Dispatch.call(this.rows, "Item", new Variant(rowIndex))
.toDispatch();
return this.row;
}
/**
* 自动调整当前所有表格
*/
public void autoFitTable() {
int count = this.getTablesCount();
for (int i = 0; i < count; i++) {
Dispatch table = Dispatch.call(tables, "Item", new Variant(i + 1))
.toDispatch();
Dispatch cols = Dispatch.get(table, "Columns").toDispatch();
Dispatch.call(cols, "AutoFit");
}
}
/**
* 根据行索引与列索引获取当前表格中的单元格
*
* @param cellRowIdx
* 行索引
* @param cellColIdx
* 列索引
* @return cell对象
*/
public Dispatch getCell(int cellRowIdx, int cellColIdx) {
if (this.table == null)
return this.cell;
if (cellRowIdx >= 0 && cellColIdx >= 0)
this.cell = Dispatch.call(this.table, "Cell",
new Variant(cellRowIdx), new Variant(cellColIdx))
.toDispatch();
return this.cell;
}
public void selectCell(int cellRowIdx, int cellColIdx) {
if (this.table == null)
return;
getCell(cellRowIdx, cellColIdx);
if (cellRowIdx >= 0 && cellColIdx >= 0)
Dispatch.call(this.cell, "select");
}
/**
* 设置当前文档的标题
*
* @param title 标题
* @param alignmentType 对齐方式
* @see setAlignment
*/
public void setTitle(String title, int alignmentType) {
if (title == null || "".equals(title))
return;
if (this.alignment == null)
this.getAlignment();
if(alignmentType != 0 && alignmentType != 1 && alignmentType != 2)
alignmentType = 0;
Dispatch.put(this.alignment, "Alignment", alignmentType);
Dispatch.call(this.selection, "TypeText", title);
}
/**
* 设置当前表格边框的粗细
*
* @param width
* 范围：1 < w < 13，如果是0，就代表?]有框

*/
public void setTableBorderWidth(int width) {
if (this.table == null)
return;
/*
* 设置表格线的粗细 1：代表最上边一条线 2：代表最左边一条线 3：最下边一条线 4：最右边一条线 5：除最上边最下边之外的所有横线
* 6：除最左边最右边之外的所有竖线 7：从左上角到右下角的斜线 8：从左下角到右上角的斜线
*/
Dispatch borders = Dispatch.get(table, "Borders").toDispatch();
Dispatch border = null;
for (int i = 1; i < 7; i++) {
border = Dispatch.call(borders, "Item", new Variant(i))
.toDispatch();
if (width != 0) {
Dispatch.put(border, "LineWidth", new Variant(width));
Dispatch.put(border, "Visible", new Variant(true));
} else if (width == 0) {
Dispatch.put(border, "Visible", new Variant(false));
}
}
}
/**
* 得到指定的表格指定的单元格中的值
*
* @param tableIndex
* 表格索引（从1开始）
* @param rowIndex
* 行索引（从1开始）
* @param colIndex
* 列索引（从1开始）
* @return
*/
public String getTxtFromCell(int tableIndex, int rowIndex, int colIndex) {
String value = "";
// 设置为当前表格
getTable(tableIndex);
getCell(rowIndex, colIndex);
if (cell != null) {
Dispatch.call(cell, "Select");
value = Dispatch.get(selection, "Text").toString();
value = value.substring(0, value.length() - 2); // 去掉最后的回车符;
}
return value;
}
/**
* 对当前选中的内容设置项目符号与列表
*
* @param tabIndex
*

1.项目编号

2.编号

3.多级编号

4.列表样式

* @param index
* 0表示没有，其它数字代表是该tab页中的第几项内容
*/
public void applyListTemplate(int tabIndex, int index) {
// 取得ListGalleries对象列表
Dispatch listGalleries = Dispatch.get(this.word, "ListGalleries")
.toDispatch();
// 取得列表中一个对象
Dispatch listGallery = Dispatch.call(listGalleries, "Item",
new Variant(tabIndex)).toDispatch();
Dispatch listTemplates = Dispatch.get(listGallery, "ListTemplates")
.toDispatch();
if (this.range == null)
this.getRange();
Dispatch listFormat = Dispatch.get(this.range, "ListFormat")
.toDispatch();
Dispatch.call(listFormat, "ApplyListTemplate",
Dispatch.call(listTemplates, "Item", new Variant(index)),
new Variant(true), new Variant(1), new Variant(0));
}
/**
* 增加文档目录
*/
public void addTablesOfContents() {
// 取得ActiveDocument、TablesOfContents、range对象
Dispatch ActiveDocument = word.getProperty("ActiveDocument")
.toDispatch();
Dispatch TablesOfContents = Dispatch.get(ActiveDocument,
"TablesOfContents").toDispatch();
Dispatch range = Dispatch.get(this.selection, "Range").toDispatch();
// 增加目录
Dispatch.call(TablesOfContents, "Add", range, new Variant(true),
new Variant(1), new Variant(3), new Variant(true), new Variant(
""), new Variant(true), new Variant(true));
}
/**
* 设置当前selection对齐方式
*
* @param alignmentType
*

0.居左

1.居中

2.居右

*/
public void setAlignment(int alignmentType) {
if (this.alignment == null)
this.getAlignment();
Dispatch.put(this.alignment, "Alignment", alignmentType);
}
/**
* 获取当前selection的对齐方式
*
* @return alignment
*/
public Dispatch getAlignment() {
if (this.selection == null)
this.getSelection();
this.alignment = Dispatch.get(this.selection, "ParagraphFormat")
.toDispatch();
return this.alignment;
}
/**
* 获取字体对象
*
* @return font
*/
public Dispatch getFont() {
if (this.selection == null)
this.getSelection();
this.font = Dispatch.get(this.selection, "Font").toDispatch();
return this.font;
}
/**
* 设置当前selection的字体
*
* @param fontName
* 字体名称，如“微软雅黑”
* @param isBold
* 是否粗体
* @param isItalic
* 是否斜体
* @param isUnderline
* 是否下划线
* @param rgbColor
* 颜色值"1,1,1,1"
* @param Scale
* 字体间距
* @param fontSize
* 字体大小
*/
@Deprecated
public void setFontScale(String fontName, boolean isBold, boolean isItalic,
boolean isUnderline, String rgbColor, int Scale, int fontSize) {
Dispatch.put(this.font, "Name", fontName);
Dispatch.put(this.font, "Bold", isBold);
Dispatch.put(this.font, "Italic", isItalic);
Dispatch.put(this.font, "Underline", isUnderline);
Dispatch.put(this.font, "Color", rgbColor);
Dispatch.put(this.font, "Scaling", Scale);
Dispatch.put(this.font, "Size", fontSize);
}

/**
* 设置当前选定内容的字体
* @param isBold 是否为粗体
* @param isItalic 是否为斜体
* @param isUnderLine 是否带下划线
* @param color rgb 字体颜色例如：红色 255,0,0
* @param size 字体大小 12:小四 16:三号
* @param name 字体名称例如：宋体，新宋体，楷体，隶书
*/
public void setFont(boolean isBold,boolean isItalic,boolean isUnderLine,String color,String size,String name) {
Dispatch font = Dispatch.get(getSelection(), "Font").toDispatch();
Dispatch.put(font, "Name", new Variant(name));
Dispatch.put(font, "Bold", new Variant(isBold));
Dispatch.put(font, "Italic", new Variant(isItalic));
Dispatch.put(font, "Underline", new Variant(isUnderLine));
if(!"".equals(color))
Dispatch.put(font, "Color", color);
Dispatch.put(font, "Size", size);
}

/**
* 保存文件
*
* @param outputPath
* 保存路径
*/
public void saveAs(String outputPath) {
if (this.document == null)
return;
if (outputPath == null || "".equals(outputPath))
return;
Dispatch.call(this.document, "SaveAs", outputPath);
}
/**
* 另存为HTML内容
*
* @param htmlFile
* html文件路径
*/
public void saveAsHtml(String htmlFile) {
Dispatch.invoke(this.document, "SaveAs", Dispatch.Method, new Object[] {
htmlFile, new Variant(8) }, new int[1]);
}
/**
* saveFormat | Member name Description 0 | wdFormatDocument Microsoft Word
* format. 1 | wdFormatTemplate Microsoft Word template format. 2 |
* wdFormatText Microsoft Windows text format. 3 | wdFormatTextLineBreaks
* Microsoft Windows text format with line breaks preserved. 4 |
* wdFormatDOSText Microsoft DOS text format. 5 | wdFormatDOSTextLineBreaks
* Microsoft DOS text with line breaks preserved. 6 | wdFormatRTF Rich text
* format (RTF). 7 | wdFormatEncodedText Encoded text format. 7 |
* wdFormatUnicodeText Unicode text format. 8 | wdFormatHTML Standard HTML
* format. 9 | wdFormatWebArchive Web archive format. 10 |
* wdFormatFilteredHTML Filtered HTML format. 11 | wdFormatXML Extensible
* Markup Language (XML) format.
*/
/**
* 关闭当前word文档
*/
public void close() {
if (document == null)
return;
Dispatch.call(document, "Close", new Variant(0));
}
/**
* 执行当前文档打印命令
*/
public void printFile() {
if (document == null)
return;
Dispatch.call(document, "PrintOut");
}
/**
* 退出Microsoft Office Word程序
*/
public void quit() {
word.invoke("Quit", new Variant[0]);
ComThread.Release();
}

/**
* 选中整篇文档
*/
public void selectAllContent(){
Dispatch.call(this.document,"select");
}

/**
* 复制整篇文档
* @param target
*/
public void copy(){
Dispatch.call(this.document,"select");
Dispatch.call(this.selection,"copy");
}

/**
* 在当前插入点位置粘贴选中的内容
*/
public void paste(){
Dispatch.call(this.selection,"paste");
}

public static void main(String[] args) throws IOException {
MSOfficeGeneratorUtils officeUtils = new MSOfficeGeneratorUtils(true);
// officeUtils.openDocument("D:\TRS\TRSWCMV65HBTCIS\Tomcat\webapps\wcm\eipv65\briefreport\templates\zhengfa\头部.doc");
// officeUtils.replaceAll("${briefreport_year}", "2011");
// officeUtils.replaceAll("${briefreport_issue}", "3");
// File file = File.createTempFile("test", ".tmp");
// System.out.println(file.getAbsolutePath());
// file.delete();
// File file = new File("C:\DOCUME~1\ADMINI~1\LOCALS~1\Temp\test5411720146039914615.tmp");
// System.out.println(file.exists());

officeUtils.createNewDocument();
// officeUtils.createNewTable(1, 1, 1);
// officeUtils.insertText("发表时间:2011-11-11");
// officeUtils.moveRight(1);
// officeUtils.insertText("t");
// officeUtils.moveRight(1);
// officeUtils.insertText("所在频道:宏观环境/社会环境");
// officeUtils.moveRight(1);
// officeUtils.insertText("t");
// officeUtils.moveRight(1);
// officeUtils.insertText("文章作者:杨叶茂");
// officeUtils.moveRight(1);
officeUtils.insertText("I'm Chinese");
officeUtils.moveRight(1);
officeUtils.enterDown(1);
officeUtils.insertText("I'm not Chinese");
officeUtils.moveRight(1);

/* doc2 = Dispatch.call(documents, "Open", anotherDocPath).toDispatch();
Dispatch paragraphs = Dispatch.get(doc2, "Paragraphs").toDispatch();
Dispatch paragraph = Dispatch.call(paragraphs, "Item", new Variant(paragraphIndex)).toDispatch();*/

// officeUtils.setFontScale("微软雅黑", true, true, true, "1,1,1,1", 100,
// 18);
// officeUtils.setAlignment(1);
// officeUtils.insertToText("这是一个测试");
// officeUtils.moveEnd();
// officeUtils.setFontScale("微软雅黑", false, false, false, "1,1,1,1", 100,
// 18);
// officeUtils.insertImage("d:\11.jpg");
// officeUtils.enterDown(1);
// officeUtils.insertToText("这是我的照片");
// officeUtils.enterDown(1);
// officeUtils.createNewTable(3, 5, 1);
// List list = new ArrayList();
// for (int i = 0; i < 3; i++) {
// String[] strs = new String[5];
// for (int j = 0; j < 5; j++) {
// strs[j] = j + i + "";
// }
// list.add(strs);
// }
// officeUtils.insertToTable(list);
// officeUtils.createNewTable(10, 10, 1);
// officeUtils.moveEnd();
// officeUtils.enterDown(1);
// officeUtils.createNewTable(3,2,1);
// officeUtils.mergeCell(1, 1, 7, 1, 9);
// officeUtils.mergeCell(1, 2, 2, 3, 7);
// officeUtils.mergeCell(1, 3, 4, 9, 10);
// officeUtils.insertText("123");
// officeUtils.getCell(1, 2);
// officeUtils.splitCell(2 , 4);
// officeUtils.selectCell(1, 2);
// officeUtils.insertText("split");
// officeUtils.selectCell(1, 5);
// officeUtils.insertText("split1");
// officeUtils.selectCell(1, 6);
// officeUtils.insertText("yy");
// officeUtils.selectCell(2, 4);
// officeUtils.insertText("ltg");
// officeUtils.saveAs("D:\" + System.currentTimeMillis() + ".doc");
// officeUtils.close();
// officeUtils.quit();
}
}
TestJsoupComponent
package com.topstar.test;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Map.Entry;
import java.util.UUID;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.nodes.Node;
import com.eprobiti.trs.TRSException;
/** * 基本思路：得到html内容,因为是非标准的html内容，利用Jsoup组件将读取出来的内容转换为标准的html文件内容,
* 然后遍历每个节点，找到img标签，记录其索引，再根据其文件名规则拼接出图片的物理路径，将其替换为${image_index}标识，而后将{索引，路径}
* 以键值对的方式丰入Map中，如
* "${image_1,d:lucene.png}"格式，然后利用jacob组件打开template.doc,选中整篇文档并复制，而后新建一篇文档，粘贴刚复制的内
* 容查找图片标识位，将其替换为图片
*
* @since 2011-12-09
* @author xioawu
* @cateogry topstar
* @version 1.0
*/
public class TestJsoupComponent {
private static Document document;
private static Map imgMap = new HashMap(); //存放图片标识符及物理路径 i.e {"image_1","D:\lucene.png"};
private static List files = new ArrayList(); //存入本地生成的各个文章doc的文件名
private static Integer imgIndex = 1; //图片标识
public static void main(String[] args) throws TRSException, IOException {
MSOfficeGeneratorUtils officeUtils = new MSOfficeGeneratorUtils(true); // 将生成过程设置为不可见

String html = ".....";// 得到正文内容 , 此处自己填写html内容
String header = "测试标题"; // 得到文章标题
document = Jsoup.parse(html);
// System.out.println(document.html());
for (Element element : document.body().select("body > *"))
// 递归遍历body下的所有直接子元素，找出img标签，@see SysElementText Method
sysElementText(element);
File file = new File("D:" + File.separator + "template.doc");
file.createNewFile(); // 创建模板html
FileWriter fw = new FileWriter(file);
fw.write(document.html(), 0, document.html().length());// 写入文件
fw.flush(); // 清空FileWriter缓冲区
fw.close();
officeUtils.openDocument("D:\template.doc"); // 打开template.doc .由trsserver eipdocument库中的dochtmlcon生成的template.doc文件
officeUtils.copy(); // 拷贝整篇文档
officeUtils.close();
officeUtils.createNewDocument();
officeUtils.paste(); // 粘贴整篇文档
for (Entry entry : imgMap.entrySet()) //循环将图片标识位替换成图片
officeUtils.replaceText2Image(entry.getKey(), entry.getValue());
officeUtils.moveStart(); // 将插入点移动至Word文档的最顶点
officeUtils.setFont(true, false, false, "0,0,0", "20", "宋体"); // 设置字体,具体参数，自己看API
officeUtils.setTitle(header, 1); // 设置标题
officeUtils.enterDown(1); // 设置一行回车
String filename = UUID.randomUUID().toString();
files.add(filename); // 记录文件名，
officeUtils.saveAs("D:" + File.separator + filename + ".doc"); // 生成D:\UUID.doc文件，利用UUID防止同名
officeUtils.close(); // 关闭Office Word创建的文档
officeUtils.quit(); // 退出Office Word程序
MSOfficeGeneratorUtils msOfficeUtils = new MSOfficeGeneratorUtils(false); // 整合过程设置为可见
msOfficeUtils.createNewDocument();
msOfficeUtils.saveAs("D:" + File.separator + "complete.doc");
msOfficeUtils.close();
for (String fileName : files) {
msOfficeUtils.openDocument("D:" + File.separator + fileName + ".doc");
msOfficeUtils.copy();
msOfficeUtils.close();
msOfficeUtils.openDocument("D:" + File.separator + "complete.doc");
msOfficeUtils.moveEnd();
msOfficeUtils.enterDown(1);
msOfficeUtils.paste();
msOfficeUtils.saveAs("D:" + File.separator + "complete.doc");
msOfficeUtils.close();
}
//复制一个内容比较少的*.doc文档，防止在关闭word程序时提示有大量的copy内容在内存中，是否应用于其它程序对话框,
msOfficeUtils.createNewDocument();
msOfficeUtils.insertText("测试消息");
msOfficeUtils.copy();
msOfficeUtils.close();
msOfficeUtils.quit();
imgIndex = 1;
imgMap.clear();
}
public static void sysElementText(Node node) {
if (node.childNodes().size() == 0) {
if (node.nodeName().equals("img")) { // 处理图片路径问题
node.after("

${image_" + imgIndex + "}

"); // 为img添加同级P标签，内容为

${image_imgIndexNumber}

String src = node.attr("src");
node.remove(); // 删除Img标签。
StringBuffer imgUrl = new StringBuffer("D:\TRS\TRSWCMV65HBTCIS\WCMData\webpic\"); // 暂时将路径直接写死，正式应用上应将此处改写为WebPic的配置项
imgUrl.append(src.substring(0, 8)).append("\").append(src.subSequence(0, 10)).append("\").append(src);
// node.attr("src", imgUrl.toString()); //这一句没有必要，因为此img标签已经移除了
imgMap.put("${image_" + imgIndex++ + "}", imgUrl.toString());
}
} else {
for (Node rNode : node.childNodes()) {
sysElementText(rNode);
}
}
}
}

你可能感兴趣的:(Jsoup解析HTML实例及文档方法详解)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动李蕾1229
为促进我校教师专业发展，发挥骨干教师的引领带头作用，11月6日下午，我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动。图片发自App会议由教师发展处李蕾主任主持，首先，由范校长宣读新老教师结对名单及双方承担职责。随后，两位新调入教师陈玉萍、莫正杰分别和他们的师傅鲍元美、刘召彬老师签订了师徒结对协议书。图片发自App图片发自App师徒拥抱、握手。有了师傅就有了目标有了方向，相信两位新教师在师
向内而求陈陈_19b4
10月27日，阴。阅读书目:《次第花开》。作者:希阿荣博堪布，是当今藏传佛家宁玛派最伟大的上师法王，如意宝晋美彭措仁波切颇具影响力的弟子之一。多年以来，赴海内外各地弘扬佛法，以正式授课、现场开示、发表文章等多种方法指导佛学弟子修行佛法。代表作《寂静之道》、《生命这出戏》、《透过佛法看世界》自出版以来一直是佛教类书籍中的畅销书。图片发自App金句:1.佛陀说，一切痛苦的根源在于我们长期以来对自身及外
html 中如何使用 uniapp 的部分方法某公司摸鱼前端 html uni-app 前端
示例代码：Documentconsole.log(window);效果展示：好了，现在就可以uni.使用相关的方法了
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
水平垂直居中的几种方法（总结） LJ小番茄 CSS_玄学语言 html javascript 前端 css css3
1.使用flexbox的justify-content和align-items.parent{display:flex;justify-content:center;/*水平居中*/align-items:center;/*垂直居中*/height:100vh;/*需要指定高度*/}2.使用grid的place-items:center.parent{display:grid;place-item
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
下载github patch到本地小米人er 我的博客 git patch
以下是几种从GitHub上下载以.patch结尾的补丁文件的方法：通过浏览器直接下载打开包含该.patch文件的GitHub仓库。在仓库的文件列表中找到对应的.patch文件。点击该文件，浏览器会显示文件的内容，在页面的右上角通常会有一个“Raw”按钮，点击它可以获取原始文件内容。然后在浏览器中使用快捷键（如Ctrl+S或者Command+S）将原始文件保存到本地，选择保存的文件名并确保后缀为.p
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
拥有断舍离的心态，过精简生活--《断舍离》读书笔记爱吃丸子的小樱桃
不知不觉间房间里的东西越来越多，虽然摆放整齐，但也时常会觉得空间逼仄，令人心生烦闷。抱着断舍离的态度，我开始阅读《断舍离》这本书，希望从书中能找到一些有效的方法，帮助我实现空间、物品上的断舍离。《断舍离》是日本作家山下英子通过自己的经历、思考和实践总结而成的，整体内涵也从刚开始的私人生活哲学的“断舍离”升华成了“人生实践哲学”，接着又成为每个人都能实行的“改变人生的断舍离”，从“哲学”逐渐升华成“
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
如果做到轻松在股市赚钱？只要坚持这三个原则。履霜之人
大A股里向来就有七亏二平一赚的说法，能赚钱的都是少数人。否则股市就成了慈善机构，人人都有钱赚，谁还要上班？所以说亏钱是正常的，或者说是应该的。那么那些赚钱的人又是如何做到的呢？普通人能不能找到捷径去分一杯羹呢？方法是有的，但要做到需要你有极高的自律。第一，控制仓位，散户最大的问题是追涨杀跌，只要涨起来，就把钱往股票上砸，然后被套，隔天跌的受不了，又一刀切，全部割肉。来来回回间，遍体鳞伤。所以散户首
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
从0到500+，我是如何利用自媒体赚钱？一列脚印
运营公众号半个多月，从零基础的小白到现在慢慢懂了一些运营的知识。做好公众号是很不容易的，要做很多事情；排版、码字、引流…通通需要自己解决，业余时间全都花费在这上面涨这么多粉丝是真的不容易，对比知乎大佬来说，我们这种没资源，没人脉，还没钱的小透明来说，想要一个月涨粉上万，怕是今天没睡醒（不过你有的方法，算我piapia打脸）至少我是清醒的，自己慢慢努力，实现我的万粉目标！大家快来围观、支持我吧！孩子
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
春季养肝正当时 dxn悟
重温快乐2023年2月4日立春。春天来了，春暖花开，小鸟欢唱，那在这样的季节我们如何养肝呢？自然界的春季对应中医五行的木，人体五脏肝属木，“木曰曲直”，是以树干曲曲直直地向上、向外伸长舒展的生发姿态，来形容具有生长、升发、条达、舒畅等特征的食物及现象。根据中医天人相应的理念，肝五行属木，喜条达，主疏泄，与春天相应，所以春天最适合养肝。养肝首先要少生气，因为肝喜条达恶抑郁。人体五志肝为怒，生气发怒最
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他