xcy13638760

Jsoup解析HTML实例及文档方法详解

这篇文章主要介绍了Jsoup如何解析一个HTML文档、从文件加载文档、从URL加载Document等方法，对Jsoup常用方法做了详细讲解，最近提供了一个示例供大家参考使用DOM方法来遍历一个文档从元素抽取属性，文本和HTML 获取所有链接

解析和遍历一个HTML文档

如何解析一个HTML文档：

复制代码代码如下:

 
 String html = "<html><head><title>First parse</title></head>" 
  
   + "<body><p>Parsed HTML into a doc.</p></body></html>"; 
  
 Document doc = Jsoup.parse(html);

其解析器能够尽最大可能从你提供的HTML文档来创见一个干净的解析结果，无论HTML的格式是否完整。比如它可以处理：

1、没有关闭的标签 (比如： Lorem Ipsum parses to Lorem Ipsum)
2、隐式标签 (比如. 它可以自动将 <td>Table data</td>包装成<table><tr><td>?)
3、创建可靠的文档结构（html标签包含head 和 body，在head只出现恰当的元素）

一个文档的对象模型

1、文档由多个Elements和TextNodes组成 (以及其它辅助nodes).
2、其继承结构如下：Document继承Element继承Node. TextNode继承 Node.
3、一个Element包含一个子节点集合，并拥有一个父Element。他们还提供了一个唯一的子元素过滤列表。

从一个URL加载一个Document

存在问题
你需要从一个网站获取和解析一个HTML文档，并查找其中的相关数据。你可以使用下面解决方法：

解决方法
使用 Jsoup.connect(String url)方法:

复制代码代码如下:

 
 Document doc = Jsoup.connect("http://www.jb51.net/").get(); 
  
 String title = doc.title();

说明
connect(String url) 方法创建一个新的 Connection, 和 get() 取得和解析一个HTML文件。如果从该URL获取HTML时发生错误，便会抛出 IOException，应适当处理。

Connection 接口还提供一个方法链来解决特殊请求，具体如下：

复制代码代码如下:

 
 Document doc = Jsoup.connect("http://www.jb51.net") 
  
   .data("query", "Java") 
  
   .userAgent("Mozilla") 
  
   .cookie("auth", "token") 
  
   .timeout(3000) 
  
   .post();

这个方法只支持Web URLs (http和https 协议); 假如你需要从一个文件加载，可以使用parse(File in, String charsetName) 代替。

从一个文件加载一个文档

问题
在本机硬盘上有一个HTML文件，需要对它进行解析从中抽取数据或进行修改。

办法
可以使用静态 Jsoup.parse(File in, String charsetName, String baseUri) 方法：

复制代码代码如下:

 
 File input = new File("/tmp/input.html"); 
  
 Document doc = Jsoup.parse(input, "UTF-8", "http://www.jb51.net/");

说明
parse(File in, String charsetName, String baseUri) 这个方法用来加载和解析一个HTML文件。如在加载文件的时候发生错误，将抛出IOException，应作适当处理。
baseUri 参数用于解决文件中URLs是相对路径的问题。如果不需要可以传入一个空的字符串。
另外还有一个方法parse(File in, String charsetName) ，它使用文件的路径做为 baseUri。这个方法适用于如果被解析文件位于网站的本地文件系统，且相关链接也指向该文件系统。

使用DOM方法来遍历一个文档

问题
你有一个HTML文档要从中提取数据，并了解这个HTML文档的结构。

方法
将HTML解析成一个Document之后，就可以使用类似于DOM的方法进行操作。示例代码：

复制代码代码如下:

File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://www.jb51.net/");

Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
String linkHref = link.attr("href");
String linkText = link.text();
}

说明
Elements这个对象提供了一系列类似于DOM的方法来查找元素，抽取并处理其中的数据。具体如下：
查找元素
getElementById(String id)
getElementsByTag(String tag)
getElementsByClass(String className)
getElementsByAttribute(String key) (and related methods)
Element siblings: siblingElements(), firstElementSibling(), lastElementSibling();nextElementSibling(), previousElementSibling()
Graph: parent(), children(), child(int index)

元素数据
attr(String key)获取属性attr(String key, String value)设置属性
attributes()获取所有属性
id(), className() and classNames()
text()获取文本内容text(String value) 设置文本内容
html()获取元素内HTMLhtml(String value)设置元素内的HTML内容
outerHtml()获取元素外HTML内容
data()获取数据内容（例如：script和style标签)
tag() and tagName()

操作HTML和文本
append(String html), prepend(String html)
appendText(String text), prependText(String text)
appendElement(String tagName), prependElement(String tagName)
html(String value)

使用选择器语法来查找元素
问题
你想使用类似于CSS或jQuery的语法来查找和操作元素。

方法
可以使用Element.select(String selector) 和 Elements.select(String selector) 方法实现：

复制代码代码如下:

File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://www.jb51.net./");

Elements links = doc.select("a[href]"); //带有href属性的a元素
Elements pngs = doc.select("img[src$=.png]");
//扩展名为.png的图片

Element masthead = doc.select("div.masthead").first();
//class等于masthead的div标签

Elements resultLinks = doc.select("h3.r > a"); //在h3元素之后的a元素

说明
jsoup elements对象支持类似于CSS (或jquery)的选择器语法，来实现非常强大和灵活的查找功能。.
这个select 方法在Document, Element,或Elements对象中都可以使用。且是上下文相关的，因此可实现指定元素的过滤，或者链式选择访问。
Select方法将返回一个Elements集合，并提供一组方法来抽取和处理结果。

Selector选择器概述
tagname: 通过标签查找元素，比如：a
ns|tag: 通过标签在命名空间查找元素，比如：可以用 fb|name 语法来查找 <fb:name> 元素
#id: 通过ID查找元素，比如：#logo
.class: 通过class名称查找元素，比如：.masthead
[attribute]: 利用属性查找元素，比如：[href]
[^attr]: 利用属性名前缀来查找元素，比如：可以用[^data-] 来查找带有HTML5 Dataset属性的元素
[attr=value]: 利用属性值来查找元素，比如：[width=500]
[attr^=value], [attr$=value], [attr*=value]: 利用匹配属性值开头、结尾或包含属性值来查找元素，比如：[href*=/path/]
[attr~=regex]: 利用属性值匹配正则表达式来查找元素，比如： img[src~=(?i)\.(png|jpe?g)]
*: 这个符号将匹配所有元素

Selector选择器组合使用
el#id: 元素+ID，比如： div#logo
el.class: 元素+class，比如： div.masthead
el[attr]: 元素+class，比如： a[href]
任意组合，比如：a[href].highlight
ancestor child: 查找某个元素下子元素，比如：可以用.body p 查找在"body"元素下的所有p元素
parent > child: 查找某个父元素下的直接子元素，比如：可以用div.content > p 查找 p 元素，也可以用body > * 查找body标签下所有直接子元素
siblingA + siblingB: 查找在A元素之前第一个同级元素B，比如：div.head + div
siblingA ~ siblingX: 查找A元素之前的同级X元素，比如：h1 ~ p
el, el, el:多个选择器组合，查找匹配任一选择器的唯一元素，例如：div.masthead, div.logo

伪选择器selectors
:lt(n): 查找哪些元素的同级索引值（它的位置在DOM树中是相对于它的父节点）小于n，比如：td:lt(3) 表示小于三列的元素
:gt(n):查找哪些元素的同级索引值大于n，比如： div p:gt(2)表示哪些div中有包含2个以上的p元素
:eq(n): 查找哪些元素的同级索引值与n相等，比如：form input:eq(1)表示包含一个input标签的Form元素
:has(seletor): 查找匹配选择器包含元素的元素，比如：div:has(p)表示哪些div包含了p元素
:not(selector): 查找与选择器不匹配的元素，比如： div:not(.logo) 表示不包含 class=logo 元素的所有 div 列表
:contains(text): 查找包含给定文本的元素，搜索不区分大不写，比如： p:contains(jsoup)
:containsOwn(text): 查找直接包含给定文本的元素
:matches(regex): 查找哪些元素的文本匹配指定的正则表达式，比如：div:matches((?i)login)
:matchesOwn(regex): 查找自身包含文本匹配指定正则表达式的元素
注意：上述伪选择器索引是从0开始的，也就是说第一个元素索引值为0，第二个元素index为1等
可以查看Selector API参考来了解更详细的内容

从元素抽取属性，文本和HTML

问题
在解析获得一个Document实例对象，并查找到一些元素之后，你希望取得在这些元素中的数据。

方法
要取得一个属性的值，可以使用Node.attr(String key) 方法
对于一个元素中的文本，可以使用Element.text()方法
对于要取得元素或属性中的HTML内容，可以使用Element.html(), 或 Node.outerHtml()方法
示例：

复制代码代码如下:

String html = "An <a href='http://www.jb51.net/'>www.jb51.net</a> link.";
Document doc = Jsoup.parse(html);//解析HTML字符串返回一个Document实现
Element link = doc.select("a").first();//查找第一个a元素

String text = doc.body().text(); // "An www.jb51.net link"//取得字符串中的文本
String linkHref = link.attr("href"); // "http://www.jb51.net/"//取得链接地址
String linkText = link.text(); // "www.jb51.net""//取得链接地址中的文本

String linkOuterH = link.outerHtml();
// "<a href="http://www.jb51.net">www.jb51.net</a>"
String linkInnerH = link.html(); // "www.jb51.net"//取得链接内的html内容

说明
上述方法是元素数据访问的核心办法。此外还其它一些方法可以使用：

Element.id()
Element.tagName()
Element.className() and Element.hasClass(String className)
这些访问器方法都有相应的setter方法来更改数据.

示例程序: 获取所有链接
这个示例程序将展示如何从一个URL获得一个页面。然后提取页面中的所有链接、图片和其它辅助内容。并检查URLs和文本信息。
运行下面程序需要指定一个URLs作为参数

复制代码代码如下:

package org.jsoup.www.jb51.nets;

import org.jsoup.Jsoup;
import org.jsoup.helper.Validate;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.IOException;

/**
* www.jb51.net program to list links from a URL.
*/
public class ListLinks {
    public static void main(String[] args) throws IOException {
        Validate.isTrue(args.length == 1, "usage: supply url to fetch");
        String url = args[0];
        print("Fetching %s...", url);

        Document doc = Jsoup.connect(url).get();
        Elements links = doc.select("a[href]");
        Elements media = doc.select("[src]");
        Elements imports = doc.select("link[href]");

print("\nMedia: (%d)", media.size());
 for (Element src : media) {
 if (src.tagName().equals("img"))
 print(" * %s: <%s> %sx%s (%s)",
 src.tagName(), src.attr("abs:src"), src.attr("width"), src.attr("height"),
 trim(src.attr("alt"), 20));
 else
 print(" * %s: <%s>", src.tagName(), src.attr("abs:src"));
 }

print("\nImports: (%d)", imports.size());
 for (Element link : imports) {
 print(" * %s <%s> (%s)", link.tagName(),link.attr("abs:href"), link.attr("rel"));
 }

print("\nLinks: (%d)", links.size());
 for (Element link : links) {
 print(" * a: <%s> (%s)", link.attr("abs:href"), trim(link.text(), 35));
 }
 }

    private static void print(String msg, Object... args) {
        System.out.println(String.format(msg, args));
    }

    private static String trim(String s, int width) {
        if (s.length() > width)
            return s.substring(0, width-1) + ".";
        else
            return s;
    }
}
org/jsoup/www.jb51.nets/ListLinks.java

java使用Jsoup组件生成word文档的方法

先利用jsoup将得到的html代码“标准化”（Jsoup.parse(String html)）方法，然后利用FileWiter将此html内容写到本地的template.doc文件中，此时如果文章中包含图片的话，template.doc就会依赖你的本地图片文件路径，如果你将图片更改一个名称或者将路径更改，再打开这个template.doc，图片就会显示不出来（出现一个叉叉）。为了解决此问题，利用jsoup组件循环遍历html文档的内容，将img元素替换成${image_自增值}的标识，取出img元素中的src属性，再以键值对的方式存储起来，例如：

复制代码代码如下:

 
 Map<Integer,String> imgMap = new HashMap<Integer,String>(); 
  
 imgMap.put(1,”D:\lucene.png”);

此时你的html内容会变成如下格式:（举个示例）

复制代码代码如下:

 
 <html> 
  
  <head></head> 
  
  <body> 
  
   <p>测试消息1</p> 
  
   <p>${image_1}<p> 
  
   <table> 
  
    <tr> 
  
     <td> <td> 
  
    </tr> 
  
   </table> 
  
   <p>测试消息2</p> 
  
   <a href=http://www.jb51.net><p>${image_2}</p></a> 
  
   <p>测试消息3</p> 
  
  </body> 
  
 </html>

保存到本地文件以后，利用MSOfficeGeneratorUtils类（工具类详见下面，基于开源组件Jacob）打开你保存的这个template.doc,调用replaceText2Image,将上面代码的图片标识替换为图片，这样就消除了本地图片路径的问题。然后再调用copy方法，复制整篇文档，关闭template.doc文件，新建一个doc文件（createDocument），调用 paste方法粘贴你刚复制的template.doc里的内容，保存。基本上就ok了。
关于copy整个word文档的内容，也会出现一个隐式问题。就是当复制的内容太多时，关闭word程序的时候，会谈出一个对话框，问你是否将复制的数据应用于其它的程序。对于这个问题解决方法很简单，你可以在调用 quit（退出word程序方法）之前，新建一篇文档，输入一行字，然后调用 copy方法，对于复制的数据比较少时，关闭word程序时，它不会提示你的。见如下代码
//复制一个内容比较少的*.doc文档，防止在关闭word程序时提示有大量的copy内容在内存中，是否应用于其它程序对话框,

复制代码代码如下:

msOfficeUtils.createNewDocument();
msOfficeUtils.insertText("测试消息");
msOfficeUtils.copy();
msOfficeUtils.close();
msOfficeUtils.quit();
Jacob在sourceforge上的链接
Jsoup官网
MsOfficeGeneratorUtils
package com.topstar.test;
import java.io.File;
import java.io.IOException;
import java.util.List;
import com.jacob.activeX.ActiveXComponent;
import com.jacob.com.ComThread;
import com.jacob.com.Dispatch;
import com.jacob.com.Variant;
/**
* 利用JACOB对Microsoft Office Word 进行相关操作
*
* @author xiaowu
* @category topstar
* @version 1.0
* @since 2011-12-5
*/
public class MSOfficeGeneratorUtils {
/**
* Microsoft Office Word 程序对象
*/
private ActiveXComponent word = null;
/**
* Word 活动文档对象
*/
private Dispatch document = null;
/**
* 所有 Word 文档对象
*/
private Dispatch documents = null;
/**
* selection 代表当前活动文档窗口中的所选内容。如果文档中没有选中任何内容，则此对象代表插入点（即光标所在位置）。 
* 每个文档窗口中只能存在一个selection对象，并且在整个应用程序中，只能存在一个活动的selection对象
*/
private Dispatch selection = null;
/**
* range 对象代表文档中的一个连续的区域。每个range对象由一个起始字符位置与结束字符位置定义。 
* range 对象独立于所选内容。你可以定义和处理一个范围而无需改变所选内容。还可以在文档中定义多个范围。但每个文档中只能有一个所选内容
*/
private Dispatch range = null;
/**
* PageSetup 对象包含文档所有页面的设置属性（如纸张大小，左边距，下边距）
*/
private Dispatch pageSetup = null;
/**
* 文档中的所有表格对象
*/
private Dispatch tables = null;
/** 单个表格对象 */
private Dispatch table = null;
/** 表格所有行对象 */
private Dispatch rows = null;
/** 表格所有列对象 */
private Dispatch cols = null;
/** 表格指定行对象 */
private Dispatch row = null;
/** 表格指定列对象 */
private Dispatch col = null;
/** 表格中指定的单元格 */
private Dispatch cell = null;
/** 字体 */
private Dispatch font = null;
/** 对齐方式 */
private Dispatch alignment = null;
/**
* 构造方法
*
* @param visible
* 设置在生成word文档时，程序是否可见
*/
public MSOfficeGeneratorUtils(boolean visible) {
if (this.word == null) {
 // 初始化Microsoft Office Word 实例
 this.word = new ActiveXComponent("Word.Application");
 this.word.setProperty("Visible", new Variant(visible));
 // 禁用宏
 this.word.setProperty("AutomationSecurity", new Variant(3));
}
if (this.documents == null)
 this.documents = word.getProperty("Documents").toDispatch();
}
/**
* 设置页面方向与页边距
*
* @param orientation
* 页面方向
* <ul>
* <li>0 横向</li>
* <li>1 纵向</li>
* </ul>
* @param leftMargin
* 左边距
* @param rightMargin
* 右边距
* @param topMargin
* 上边距
* @param buttomMargin
* 下边距
*/
public void setPageSetup(int orientation, int leftMargin, int rightMargin,
 int topMargin, int buttomMargin) {
if (this.pageSetup == null)
 this.getPageSetup();
Dispatch.put(pageSetup, "Orientation", orientation);
Dispatch.put(pageSetup, "LeftMargin", leftMargin);
Dispatch.put(pageSetup, "RightMargin", rightMargin);
Dispatch.put(pageSetup, "TopMargin", topMargin);
Dispatch.put(pageSetup, "BottomMargin", buttomMargin);
}
/**
* 打开word文档
*
* @param docPath
* word文档路径
* @return 打开的文档对象
*/
public Dispatch openDocument(String docPath) {
this.document = Dispatch.call(documents, "Open", docPath).toDispatch();
this.getSelection();
this.getRange();
this.getAlignment();
this.getFont();
this.getPageSetup();
return this.document;
}
/**
* 创建一篇新文档
*
* @return 文档对象
*/
public Dispatch createNewDocument() {
this.document = Dispatch.call(documents, "Add").toDispatch();
this.getSelection();
this.getRange();
this.getPageSetup();
this.getAlignment();
this.getFont();
return this.document;
}
/**
* 获取选定的内容或插入点
*
* @return selection
*/
public Dispatch getSelection() {
this.selection = word.getProperty("Selection").toDispatch();
return this.selection;
}
/**
* 获取当前文档中可以修改的部分，前提是必须存在选中内容
*
* @return range
*/
public Dispatch getRange() {
this.range = Dispatch.get(this.selection, "Range").toDispatch();
return this.range;
}
/**
* 获得当前文档的页面属性
*/
public Dispatch getPageSetup() {
if (this.document == null)
 return this.pageSetup;
this.pageSetup = Dispatch.get(this.document, "PageSetup").toDispatch();
return this.pageSetup;
}
/**
* 把选中内容或插入点向上移动
*
* @param count
* 移动的距离
*/
public void moveUp(int count) {
for (int i = 0; i < count; i++)
 Dispatch.call(this.selection, "MoveUp");
}
/**
* 把选中内容或插入点向下移动
*
* @param count
* 移动的距离
*/
public void moveDown(int count) {
for (int i = 0; i < count; i++)
 Dispatch.call(this.selection, "MoveDown");
}
/**
* 把选中内容或插入点向左移动
*
* @param count
* 移动的距离
*/
public void moveLeft(int count) {
for (int i = 0; i < count; i++)
 Dispatch.call(this.selection, "MoveLeft");
}
/**
* 把选中内容或插入点向右移动
*
* @param count
* 移动的距离
*/
public void moveRight(int count) {
for (int i = 0; i < count; i++)
 Dispatch.call(this.selection, "MoveRight");
}
/**
* 执行硬换行（回车键）
*
* @param count
* 换行数
*/
public void enterDown(int count) {
for (int i = 0; i < count; i++)
 Dispatch.call(this.selection, "TypeParagraph");
}
/**
* 把插入点移动到文件首位置
*/
public void moveStart() {
Dispatch.call(this.selection, "HomeKey", new Variant(6));
}
/**
* 把插入点移动到文件末尾
*/
public void moveEnd() {
Dispatch.call(selection, "EndKey", new Variant(6));
}

/**
* 从选定内容或插入点开始查找文本
*
* @param toFindText
* 要查找的内容
* @return 查询到的内容并选中
*/
public boolean find(String toFindText) {
// 从selection所在位置开始查询
Dispatch find = Dispatch.call(this.selection, "Find").toDispatch();
// 设置要查找的?热?br /> Dispatch.put(find, "Text", toFindText);
// 向前查找
Dispatch.put(find, "Forward", "True");
// 设置格式
Dispatch.put(find, "Format", "True");
// 大小写匹配
Dispatch.put(find, "MatchCase", "True");
// 全字匹配
Dispatch.put(find, "MatchWholeWord", "True");
// 查找并选中
return Dispatch.call(find, "Execute").getBoolean();
}
/**
* 替换选定的内容
*
* @param newText
* 要替换的内容
*/
public void replace(String newText) {
// 设置替换文本
Dispatch.put(this.selection, "Text", newText);
}
/**
* 全局替换
*
* @param oldText
* 要替换的内容
* @param replaceObj
* 被替换的内容
*/
public void replaceAll(String oldText, Object replaceObj) {
// 将插入点移到文件开头
moveStart();
// 表格替换方式
String newText = (String) replaceObj;
// 图片替换方式
if (oldText.indexOf("image") != -1 || newText.lastIndexOf(".bmp") != -1 || newText.lastIndexOf(".jpg") != -1 || newText.lastIndexOf(".gif") != -1) {
 while (find(oldText)) {
 insertImage(newText);
 Dispatch.call(this.selection, "MoveRight");
 }
 // 文本方式
} else {
 while (find(oldText)) {
 replace(newText);
 Dispatch.call(this.selection, "MoveRight");
 }
}
}

/**
* 将指定的内容替换成图片
* @param replaceText 指定的内容
* @param imgPath 图片路径
*/
public void replaceText2Image(String replaceText,String imgPath){
moveStart();
while(find(replaceText)){
 insertImage(imgPath);
 moveEnd();
 enterDown(1);
}
}
/**
* 向当前插入点替换图片
*
* @param imagePath
* 图片的路径
*/
public void insertImage(String imagePath) {
Dispatch.call(Dispatch.get(selection, "InLineShapes").toDispatch(), "AddPicture", imagePath);
}
/**
* 合并单元格
*
* @param tableIndex
* 表格下标，从1开始
* @param fstCellRowIdx
* 开始行
* @param fstCellColIdx
* 开始列
* @param secCellRowIdx
* 结束行
* @param secCellColIdx
* 结束列
*/
public void mergeCell(int tableIndex, int fstCellRowIdx, int fstCellColIdx,
 int secCellRowIdx, int secCellColIdx) {
getTable(tableIndex);
Dispatch fstCell = Dispatch.call(table, "Cell",
 new Variant(fstCellRowIdx), new Variant(fstCellColIdx))
 .toDispatch();
Dispatch secCell = Dispatch.call(table, "Cell",
 new Variant(secCellRowIdx), new Variant(secCellColIdx))
 .toDispatch();
Dispatch.call(fstCell, "Merge", secCell);
}
/**
* 拆分当前单元格
*
* @param numRows
* 拆分的行数，如果不想拆分行，请指定为1
* @param numColumns
* 拆分的列数，如果不想拆分列，请指定为1
*/
public void splitCell(int numRows, int numColumns) {
Dispatch.call(this.cell, "Split", new Variant(numRows), new Variant(
 numColumns));
}
/**
* 向表格中写入内容
*
* @param list
* 要写入的内容 
* 注：list.size() 应该与表格的rows一致，String数组的length属性应与表格的columns一致
*/
public void insertToTable(List<String[]> list) {
if (list == null || list.size() <= 0)
 return;
if (this.table == null)
 return;
for (int i = 0; i < list.size(); i++) {
 String[] strs = list.get(i);
 for (int j = 0; j < strs.length; j++) {
 // 遍历表格中每一??单元格，遍历次数所要填入的?热菔?肯嗤?br /> Dispatch cell = this.getCell(i + 1, j + 1);
 // 选中此单元格
 Dispatch.call(cell, "Select");
 // 写入?热莸酱说ピ?裰?br /> Dispatch.put(this.selection, "Text", strs[j]);
 // 将插入点移动至下一??位置
 }
 this.moveDown(1);
}
// 换行
this.enterDown(1);
}
/**
* 向当前插入点插入文本内容
*
* @param list
* 要插入的内容，list.size()代表行数
*/
public void insertToDocument(List<String> list) {
if (list == null || list.size() <= 0)
 return;
if (this.document == null)
 return;
for (String str : list) {
 Dispatch.put(this.selection, "Text", str);
 this.moveDown(1);
 this.enterDown(1);
}
}
/**
* 在当前插入点插入文本
*
* @param insertText
* 要插入的文本
*/
public void insertToText(String insertText) {
Dispatch.put(this.selection, "Text", insertText);
}
/**
* 在当前插入点插入字符串,利用此方法插入一行text后，Word会默认选中它，如果再调用此方法，会将原来的内容覆盖掉，所以调用此方法后，记得调用moveRight，将偏移量向右边移动一个位置。
* @param newText 要插入的新字符串
*/
public void insertText(String newText) {
Dispatch.put(selection, "Text", newText);
}
/**
* 创建新的表格
*
* @param rowCount
* 行
* @param colCount
* 列
* @param width
* 表格边框
* <ul>
* <li>0 无边框</li>
* <li>1 有边框</li>
* </ul>
* @return 表格对象
*/
public Dispatch createNewTable(int rowCount, int colCount, int width) {
if (this.tables == null)
 this.getTables();
this.getRange();
if (rowCount > 0 && colCount > 0)
 this.table = Dispatch.call(this.tables, "Add", this.range,
 new Variant(rowCount), new Variant(colCount),
 new Variant(width)).toDispatch();
return this.table;
}
/**
* 获取当前document对象中的所有表格对象
*
* @return tables
*/
public Dispatch getTables() {
if (this.document == null)
 return this.tables;
this.tables = Dispatch.get(this.document, "Tables").toDispatch();
return this.tables;
}
/**
* 获取当前文档中的所有表格数量
*
* @return 表格数量
*/
public int getTablesCount() {
if (this.tables == null)
 this.getTables();
return Dispatch.get(tables, "Count").getInt();
}
/**
* 根据索引获得table对象
*
* @param tableIndex
* 索引
* @return table
*/
public Dispatch getTable(int tableIndex) {
if (this.tables == null)
 this.getTables();
if (tableIndex >= 0)
 this.table = Dispatch.call(this.tables, "Item", new Variant(tableIndex)).toDispatch();
return this.table;
}
/**
* 在指定的单元格里填写数据
*
* @param tableIndex
* 表格索引
* @param cellRowIdx
* 行索引
* @param cellColIdx
* 列索引
* @param txt
* 文本
*/
public void putTxtToCell(int tableIndex, int cellRowIdx, int cellColIdx, String txt) {
getTable(tableIndex);
getCell(cellRowIdx, cellColIdx);
Dispatch.call(this.cell, "Select");
Dispatch.put(this.selection, "Text", txt);
}
/**
* 在当前文档末尾拷贝来自另一个文档中的段落
*
* @param anotherDocPath
* 另一个文档的磁盘路径
* @param tableIndex
* 被拷贝的段落在另一格文档中的序号(从1开始)
*/
public void copyParagraphFromAnotherDoc(String anotherDocPath, int paragraphIndex) {
Dispatch wordContent = Dispatch.get(this.document, "Content").toDispatch(); // 取得当前文档的内容
Dispatch.call(wordContent, "InsertAfter", "$selection$");// 插入特殊符定位插入点
copyParagraphFromAnotherDoc(anotherDocPath, paragraphIndex, "$selection$");
}
/**
* 在当前文档指定的位置拷贝来自另一个文档中的段落
*
* @param anotherDocPath
* 另一个文档的磁盘路径
* @param tableIndex
* 被拷贝的段落在另一格文档中的序号(从1开始)
* @param pos
* 当前文档指定的位置
*/
public void copyParagraphFromAnotherDoc(String anotherDocPath, int paragraphIndex, String pos) {
Dispatch doc2 = null;
try {
 doc2 = Dispatch.call(documents, "Open", anotherDocPath).toDispatch();
 Dispatch paragraphs = Dispatch.get(doc2, "Paragraphs").toDispatch();
 Dispatch paragraph = Dispatch.call(paragraphs, "Item", new Variant(paragraphIndex)).toDispatch();
 Dispatch range = Dispatch.get(paragraph, "Range").toDispatch();
 Dispatch.call(range, "Copy");
 if (this.find(pos)) {
 getRange();
 Dispatch.call(this.range, "Paste");
 }
} catch (Exception e) {
 e.printStackTrace();
} finally {
 if (doc2 != null) {
 Dispatch.call(doc2, "Close", new Variant(true));
 doc2 = null;
 }
}
}
/**
* 在当前文档指定的位置拷贝来自另一个文档中的表格
*
* @param anotherDocPath
* 另一个文档的磁盘路径
* @param tableIndex
* 被拷贝的表格在另一格文档中的序号(从1开始)
* @param pos
* 当前文档指定的位置
*/
public void copyTableFromAnotherDoc(String anotherDocPath, int tableIndex,
 String pos) {
Dispatch doc2 = null;
try {
 doc2 = Dispatch.call(documents, "Open", anotherDocPath)
 .toDispatch();
 Dispatch tables = Dispatch.get(doc2, "Tables").toDispatch();
 Dispatch table = Dispatch.call(tables, "Item",
 new Variant(tableIndex)).toDispatch();
 Dispatch range = Dispatch.get(table, "Range").toDispatch();
 Dispatch.call(range, "Copy");
 if (this.find(pos)) {
 getRange();
 Dispatch.call(this.range, "Paste");
 }
} catch (Exception e) {
 e.printStackTrace();
} finally {
 if (doc2 != null) {
 Dispatch.call(doc2, "Close", new Variant(true));
 doc2 = null;
 }
}
}
/**
* 在当前文档指定的位置拷贝来自另一个文档中的图片
*
* @param anotherDocPath
* 另一个文档的磁盘路径
* @param shapeIndex
* 被拷贝的图片在另一格文档中的位置
* @param pos
* 当前文档指定的位置
*/
public void copyImageFromAnotherDoc(String anotherDocPath, int shapeIndex,
 String pos) {
Dispatch doc2 = null;
try {
 doc2 = Dispatch.call(documents, "Open", anotherDocPath)
 .toDispatch();
 Dispatch shapes = Dispatch.get(doc2, "InLineShapes").toDispatch();
 Dispatch shape = Dispatch.call(shapes, "Item",
 new Variant(shapeIndex)).toDispatch();
 Dispatch imageRange = Dispatch.get(shape, "Range").toDispatch();
 Dispatch.call(imageRange, "Copy");
 if (this.find(pos)) {
 getRange();
 Dispatch.call(this.range, "Paste");
 }
} catch (Exception e) {
 e.printStackTrace();
} finally {
 if (doc2 != null) {
 Dispatch.call(doc2, "Close", new Variant(true));
 doc2 = null;
 }
}
}
/**
* 在指定的表格的指定行前面增加行
*
* @param tableIndex
* word文件中的第N张表(从1开始)
* @param rowIndex
* 指定行的序号(从1开始)
*/
public void addTableRow(int tableIndex, int rowIndex) {
getTable(tableIndex);
getTableRows();
getTableRow(rowIndex);
Dispatch.call(this.rows, "Add", new Variant(this.row));
}
/**
* 在第1行前增加一行
*
* @param tableIndex
* word文档中的第N张表(从1开始)
*/
public void addFirstTableRow(int tableIndex) {
getTable(tableIndex);
getTableRows();
Dispatch row = Dispatch.get(rows, "First").toDispatch();
Dispatch.call(this.rows, "Add", new Variant(row));
}
/**
* 在最后1行前增加一行
*
* @param tableIndex
* word文档中的第N张表(从1开始)
*/
public void addLastTableRow(int tableIndex) {
getTable(tableIndex);
getTableRows();
Dispatch row = Dispatch.get(this.rows, "Last").toDispatch();
Dispatch.call(this.rows, "Add", new Variant(row));
}
/**
* 增加一行
*
* @param tableIndex
* word文档中的第N张表(从1开始)
*/
public void addRow(int tableIndex) {
getTable(tableIndex);
getTableRows();
Dispatch.call(this.rows, "Add");
}
/**
* 增加一列
*
* @param tableIndex
* word文档中的第N张表(从1开始)
*/
public void addCol(int tableIndex) {
getTable(tableIndex);
getTableColumns();
Dispatch.call(this.cols, "Add").toDispatch();
Dispatch.call(this.cols, "AutoFit");
}
/**
* 在指定列前面增加表格的列
*
* @param tableIndex
* word文档中的第N张表(从1开始)
* @param colIndex
* 指定列的序号 (从1开始)
*/
public void addTableCol(int tableIndex, int colIndex) {
getTable(tableIndex);
getTableColumns();
getTableColumn(colIndex);
Dispatch.call(this.cols, "Add", this.col).toDispatch();
Dispatch.call(this.cols, "AutoFit");
}
/**
* 在第1列前增加一列
*
* @param tableIndex
* word文档中的第N张表(从1开始)
*/
public void addFirstTableCol(int tableIndex) {
getTable(tableIndex);
Dispatch cols = getTableColumns();
Dispatch col = Dispatch.get(cols, "First").toDispatch();
Dispatch.call(cols, "Add", col).toDispatch();
Dispatch.call(cols, "AutoFit");
}
/**
* 在最后一列前增加一列
*
* @param tableIndex
* word文档中的第N张表(从1开始)
*/
public void addLastTableCol(int tableIndex) {
getTable(tableIndex);
Dispatch cols = getTableColumns();
Dispatch col = Dispatch.get(cols, "Last").toDispatch();
Dispatch.call(cols, "Add", col).toDispatch();
Dispatch.call(cols, "AutoFit");
}
/**
* 获取当前表格的列数
*
* @return 列总数
*/
public int getTableColumnsCount() {
if (this.table == null)
 return 0;
return Dispatch.get(this.cols, "Count").getInt();
}
/**
* 获取当前表格的行数
*
* @return 行总数
*/
public int getTableRowsCount() {
if (this.table == null)
 return 0;
return Dispatch.get(this.rows, "Count").getInt();
}
/**
* 获取当前表格的所有列对象
*
* @return cols
*/
public Dispatch getTableColumns() {
if (this.table == null)
 return this.cols;
this.cols = Dispatch.get(this.table, "Columns").toDispatch();
return this.cols;
}
/**
* 获取当前表格的所有行对象
*
* @return rows
*/
public Dispatch getTableRows() {
if (this.table == null)
 return this.rows;
this.rows = Dispatch.get(this.table, "Rows").toDispatch();
return this.rows;
}
/**
* 根据索引获得当前表格的列对象
*
* @param columnIndex
* 列索引
* @return col
*/
public Dispatch getTableColumn(int columnIndex) {
if (this.cols == null)
 this.getTableColumns();
if (columnIndex >= 0)
 this.col = Dispatch.call(this.cols, "Item",
 new Variant(columnIndex)).toDispatch();
return this.col;
}
/**
* 根据索引获得当前表格的行对象
*
* @param rowIndex
* 行索引
* @return row
*/
public Dispatch getTableRow(int rowIndex) {
if (this.rows == null)
 this.getTableRows();
if (rowIndex >= 0)
 this.row = Dispatch.call(this.rows, "Item", new Variant(rowIndex))
 .toDispatch();
return this.row;
}
/**
* 自动调整当前所有表格
*/
public void autoFitTable() {
int count = this.getTablesCount();
for (int i = 0; i < count; i++) {
 Dispatch table = Dispatch.call(tables, "Item", new Variant(i + 1))
 .toDispatch();
 Dispatch cols = Dispatch.get(table, "Columns").toDispatch();
 Dispatch.call(cols, "AutoFit");
}
}
/**
* 根据行索引与列索引获取当前表格中的单元格
*
* @param cellRowIdx
* 行索引
* @param cellColIdx
* 列索引
* @return cell对象
*/
public Dispatch getCell(int cellRowIdx, int cellColIdx) {
if (this.table == null)
 return this.cell;
if (cellRowIdx >= 0 && cellColIdx >= 0)
 this.cell = Dispatch.call(this.table, "Cell",
 new Variant(cellRowIdx), new Variant(cellColIdx))
 .toDispatch();
return this.cell;
}
public void selectCell(int cellRowIdx, int cellColIdx) {
if (this.table == null)
 return;
getCell(cellRowIdx, cellColIdx);
if (cellRowIdx >= 0 && cellColIdx >= 0)
 Dispatch.call(this.cell, "select");
}
/**
* 设置当前文档的标题
*
* @param title 标题
* @param alignmentType 对齐方式
* @see setAlignment
*/
public void setTitle(String title, int alignmentType) {
if (title == null || "".equals(title))
 return;
if (this.alignment == null)
 this.getAlignment();
if(alignmentType != 0 && alignmentType != 1 && alignmentType != 2)
 alignmentType = 0;
Dispatch.put(this.alignment, "Alignment", alignmentType);
Dispatch.call(this.selection, "TypeText", title);
}
/**
* 设置当前表格边框的粗细
*
* @param width
* 范围：1 < w < 13，如果是0，就代表?]有框 
*/
public void setTableBorderWidth(int width) {
if (this.table == null)
 return;
/*
 * 设置表格线的粗细 1：代表最上边一条线 2：代表最左边一条线 3：最下边一条线 4：最右边一条线 5：除最上边最下边之外的所有横线
 * 6：除最左边最右边之外的所有竖线 7：从左上角到右下角的斜线 8：从左下角到右上角的斜线
 */
Dispatch borders = Dispatch.get(table, "Borders").toDispatch();
Dispatch border = null;
for (int i = 1; i < 7; i++) {
 border = Dispatch.call(borders, "Item", new Variant(i))
 .toDispatch();
 if (width != 0) {
 Dispatch.put(border, "LineWidth", new Variant(width));
 Dispatch.put(border, "Visible", new Variant(true));
 } else if (width == 0) {
 Dispatch.put(border, "Visible", new Variant(false));
 }
}
}
/**
* 得到指定的表格指定的单元格中的值
*
* @param tableIndex
* 表格索引（从1开始）
* @param rowIndex
* 行索引（从1开始）
* @param colIndex
* 列索引（从1开始）
* @return
*/
public String getTxtFromCell(int tableIndex, int rowIndex, int colIndex) {
String value = "";
// 设置为当前表格
getTable(tableIndex);
getCell(rowIndex, colIndex);
if (cell != null) {
 Dispatch.call(cell, "Select");
 value = Dispatch.get(selection, "Text").toString();
 value = value.substring(0, value.length() - 2); // 去掉最后的回车符;
}
return value;
}
/**
* 对当前选中的内容设置项目符号与列表
*
* @param tabIndex
* <ul>
* <li>1.项目编号</li>
* <li>2.编号</li>
* <li>3.多级编号</li>
* <li>4.列表样式</li>
* </ul>
* @param index
* 0表示没有，其它数字代表是该tab页中的第几项内容
*/
public void applyListTemplate(int tabIndex, int index) {
// 取得ListGalleries对象列表
Dispatch listGalleries = Dispatch.get(this.word, "ListGalleries")
 .toDispatch();
// 取得列表中一个对象
Dispatch listGallery = Dispatch.call(listGalleries, "Item",
 new Variant(tabIndex)).toDispatch();
Dispatch listTemplates = Dispatch.get(listGallery, "ListTemplates")
 .toDispatch();
if (this.range == null)
 this.getRange();
Dispatch listFormat = Dispatch.get(this.range, "ListFormat")
 .toDispatch();
Dispatch.call(listFormat, "ApplyListTemplate",
 Dispatch.call(listTemplates, "Item", new Variant(index)),
 new Variant(true), new Variant(1), new Variant(0));
}
/**
* 增加文档目录
*/
public void addTablesOfContents() {
// 取得ActiveDocument、TablesOfContents、range对象
Dispatch ActiveDocument = word.getProperty("ActiveDocument")
 .toDispatch();
Dispatch TablesOfContents = Dispatch.get(ActiveDocument,
 "TablesOfContents").toDispatch();
Dispatch range = Dispatch.get(this.selection, "Range").toDispatch();
// 增加目录
Dispatch.call(TablesOfContents, "Add", range, new Variant(true),
 new Variant(1), new Variant(3), new Variant(true), new Variant(
 ""), new Variant(true), new Variant(true));
}
/**
* 设置当前selection对齐方式
*
* @param alignmentType
* <ul>
* <li>0.居左</li>
* <li>1.居中</li>
* <li>2.居右</li>
* </ul>
*/
public void setAlignment(int alignmentType) {
if (this.alignment == null)
 this.getAlignment();
Dispatch.put(this.alignment, "Alignment", alignmentType);
}
/**
* 获取当前selection的对齐方式
*
* @return alignment
*/
public Dispatch getAlignment() {
if (this.selection == null)
 this.getSelection();
this.alignment = Dispatch.get(this.selection, "ParagraphFormat")
 .toDispatch();
return this.alignment;
}
/**
* 获取字体对象
*
* @return font
*/
public Dispatch getFont() {
if (this.selection == null)
 this.getSelection();
this.font = Dispatch.get(this.selection, "Font").toDispatch();
return this.font;
}
/**
* 设置当前selection的字体
*
* @param fontName
* 字体名称，如“微软雅黑”
* @param isBold
* 是否粗体
* @param isItalic
* 是否斜体
* @param isUnderline
* 是否下划线
* @param rgbColor
* 颜色值"1,1,1,1"
* @param Scale
* 字体间距
* @param fontSize
* 字体大小
*/
@Deprecated
public void setFontScale(String fontName, boolean isBold, boolean isItalic,
 boolean isUnderline, String rgbColor, int Scale, int fontSize) {
Dispatch.put(this.font, "Name", fontName);
Dispatch.put(this.font, "Bold", isBold);
Dispatch.put(this.font, "Italic", isItalic);
Dispatch.put(this.font, "Underline", isUnderline);
Dispatch.put(this.font, "Color", rgbColor);
Dispatch.put(this.font, "Scaling", Scale);
Dispatch.put(this.font, "Size", fontSize);
}

/**
* 设置当前选定内容的字体
* @param isBold 是否为粗体
* @param isItalic 是否为斜体
* @param isUnderLine 是否带下划线
* @param color rgb 字体颜色例如：红色 255,0,0
* @param size 字体大小 12:小四 16:三号
* @param name 字体名称例如：宋体，新宋体，楷体，隶书
*/
public void setFont(boolean isBold,boolean isItalic,boolean isUnderLine,String color,String size,String name) {
 Dispatch font = Dispatch.get(getSelection(), "Font").toDispatch();
 Dispatch.put(font, "Name", new Variant(name));
 Dispatch.put(font, "Bold", new Variant(isBold));
 Dispatch.put(font, "Italic", new Variant(isItalic));
 Dispatch.put(font, "Underline", new Variant(isUnderLine));
 if(!"".equals(color))
 Dispatch.put(font, "Color", color);
 Dispatch.put(font, "Size", size);
}

/**
* 保存文件
*
* @param outputPath
* 保存路径
*/
public void saveAs(String outputPath) {
if (this.document == null)
 return;
if (outputPath == null || "".equals(outputPath))
 return;
Dispatch.call(this.document, "SaveAs", outputPath);
}
/**
* 另存为HTML内容
*
* @param htmlFile
* html文件路径
*/
public void saveAsHtml(String htmlFile) {
Dispatch.invoke(this.document, "SaveAs", Dispatch.Method, new Object[] {
 htmlFile, new Variant(8) }, new int[1]);
}
/**
* saveFormat | Member name Description 0 | wdFormatDocument Microsoft Word
* format. 1 | wdFormatTemplate Microsoft Word template format. 2 |
* wdFormatText Microsoft Windows text format. 3 | wdFormatTextLineBreaks
* Microsoft Windows text format with line breaks preserved. 4 |
* wdFormatDOSText Microsoft DOS text format. 5 | wdFormatDOSTextLineBreaks
* Microsoft DOS text with line breaks preserved. 6 | wdFormatRTF Rich text
* format (RTF). 7 | wdFormatEncodedText Encoded text format. 7 |
* wdFormatUnicodeText Unicode text format. 8 | wdFormatHTML Standard HTML
* format. 9 | wdFormatWebArchive Web archive format. 10 |
* wdFormatFilteredHTML Filtered HTML format. 11 | wdFormatXML Extensible
* Markup Language (XML) format.
*/
/**
* 关闭当前word文档
*/
public void close() {
if (document == null)
 return;
Dispatch.call(document, "Close", new Variant(0));
}
/**
* 执行当前文档打印命令
*/
public void printFile() {
if (document == null)
 return;
Dispatch.call(document, "PrintOut");
}
/**
* 退出Microsoft Office Word程序
*/
public void quit() {
word.invoke("Quit", new Variant[0]);
ComThread.Release();
}

/**
* 选中整篇文档
*/
public void selectAllContent(){
Dispatch.call(this.document,"select");
}

/**
* 复制整篇文档
* @param target
*/
public void copy(){
Dispatch.call(this.document,"select");
Dispatch.call(this.selection,"copy");
}

/**
* 在当前插入点位置粘贴选中的内容
*/
public void paste(){
Dispatch.call(this.selection,"paste");
}

public static void main(String[] args) throws IOException {
MSOfficeGeneratorUtils officeUtils = new MSOfficeGeneratorUtils(true);
// officeUtils.openDocument("D:\TRS\TRSWCMV65HBTCIS\Tomcat\webapps\wcm\eipv65\briefreport\templates\zhengfa\头部.doc");
// officeUtils.replaceAll("${briefreport_year}", "2011");
// officeUtils.replaceAll("${briefreport_issue}", "3");
// File file = File.createTempFile("test", ".tmp");
// System.out.println(file.getAbsolutePath());
// file.delete();
// File file = new File("C:\DOCUME~1\ADMINI~1\LOCALS~1\Temp\test5411720146039914615.tmp");
// System.out.println(file.exists());

officeUtils.createNewDocument();
// officeUtils.createNewTable(1, 1, 1);
// officeUtils.insertText("发表时间:2011-11-11");
// officeUtils.moveRight(1);
// officeUtils.insertText("t");
// officeUtils.moveRight(1);
// officeUtils.insertText("所在频道:宏观环境/社会环境");
// officeUtils.moveRight(1);
// officeUtils.insertText("t");
// officeUtils.moveRight(1);
// officeUtils.insertText("文章作者:杨叶茂");
// officeUtils.moveRight(1);
officeUtils.insertText("I'm Chinese");
officeUtils.moveRight(1);
officeUtils.enterDown(1);
officeUtils.insertText("I'm not Chinese");
officeUtils.moveRight(1);


/* doc2 = Dispatch.call(documents, "Open", anotherDocPath).toDispatch();
Dispatch paragraphs = Dispatch.get(doc2, "Paragraphs").toDispatch();
Dispatch paragraph = Dispatch.call(paragraphs, "Item", new Variant(paragraphIndex)).toDispatch();*/

// officeUtils.setFontScale("微软雅黑", true, true, true, "1,1,1,1", 100,
// 18);
// officeUtils.setAlignment(1);
// officeUtils.insertToText("这是一个测试");
// officeUtils.moveEnd();
// officeUtils.setFontScale("微软雅黑", false, false, false, "1,1,1,1", 100,
// 18);
// officeUtils.insertImage("d:\11.jpg");
// officeUtils.enterDown(1);
// officeUtils.insertToText("这是我的照片");
// officeUtils.enterDown(1);
// officeUtils.createNewTable(3, 5, 1);
// List<String[]> list = new ArrayList<String[]>();
// for (int i = 0; i < 3; i++) {
// String[] strs = new String[5];
// for (int j = 0; j < 5; j++) {
// strs[j] = j + i + "";
// }
// list.add(strs);
// }
// officeUtils.insertToTable(list);
// officeUtils.createNewTable(10, 10, 1);
// officeUtils.moveEnd();
// officeUtils.enterDown(1);
// officeUtils.createNewTable(3,2,1);
// officeUtils.mergeCell(1, 1, 7, 1, 9);
// officeUtils.mergeCell(1, 2, 2, 3, 7);
// officeUtils.mergeCell(1, 3, 4, 9, 10);
// officeUtils.insertText("123");
// officeUtils.getCell(1, 2);
// officeUtils.splitCell(2 , 4);
// officeUtils.selectCell(1, 2);
// officeUtils.insertText("split");
// officeUtils.selectCell(1, 5);
// officeUtils.insertText("split1");
// officeUtils.selectCell(1, 6);
// officeUtils.insertText("yy");
// officeUtils.selectCell(2, 4);
// officeUtils.insertText("ltg");
// officeUtils.saveAs("D:\" + System.currentTimeMillis() + ".doc");
// officeUtils.close();
// officeUtils.quit();
}
}
TestJsoupComponent
package com.topstar.test;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Map.Entry;
import java.util.UUID;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.nodes.Node;
import com.eprobiti.trs.TRSException;
/** * 基本思路：得到html内容,因为是非标准的html内容，利用Jsoup组件将读取出来的内容转换为标准的html文件内容,
* 然后遍历每个节点，找到img标签，记录其索引，再根据其文件名规则拼接出图片的物理路径，将其替换为${image_index}标识，而后将{索引，路径}
* 以键值对的方式丰入Map中，如
* "${image_1,d:lucene.png}"格式，然后利用jacob组件打开template.doc,选中整篇文档并复制，而后新建一篇文档，粘贴刚复制的内
* 容查找图片标识位，将其替换为图片
*
* @since 2011-12-09
* @author xioawu
* @cateogry topstar
* @version 1.0
*/
public class TestJsoupComponent {
private static Document document;
private static Map<String, String> imgMap = new HashMap<String, String>(); //存放图片标识符及物理路径 i.e {"image_1","D:\lucene.png"};
private static List<String> files = new ArrayList<String>(); //存入本地生成的各个文章doc的文件名
private static Integer imgIndex = 1; //图片标识
public static void main(String[] args) throws TRSException, IOException {
MSOfficeGeneratorUtils officeUtils = new MSOfficeGeneratorUtils(true); // 将生成过程设置为不可见

String html = "<html>.....</html>";// 得到正文内容 , 此处自己填写html内容
String header = "测试标题"; // 得到文章标题
document = Jsoup.parse(html);
// System.out.println(document.html());
for (Element element : document.body().select("body > *"))
 // 递归遍历body下的所有直接子元素，找出img标签，@see SysElementText Method
 sysElementText(element);
File file = new File("D:" + File.separator + "template.doc");
file.createNewFile(); // 创建模板html
FileWriter fw = new FileWriter(file);
fw.write(document.html(), 0, document.html().length());// 写入文件
fw.flush(); // 清空FileWriter缓冲区
fw.close();
officeUtils.openDocument("D:\template.doc"); // 打开template.doc .由trsserver eipdocument库中的dochtmlcon生成的template.doc文件
officeUtils.copy(); // 拷贝整篇文档
officeUtils.close();
officeUtils.createNewDocument();
officeUtils.paste(); // 粘贴整篇文档
for (Entry<String, String> entry : imgMap.entrySet()) //循环将图片标识位替换成图片
 officeUtils.replaceText2Image(entry.getKey(), entry.getValue());
officeUtils.moveStart(); // 将插入点移动至Word文档的最顶点
officeUtils.setFont(true, false, false, "0,0,0", "20", "宋体"); // 设置字体,具体参数，自己看API
officeUtils.setTitle(header, 1); // 设置标题
officeUtils.enterDown(1); // 设置一行回车
String filename = UUID.randomUUID().toString();
files.add(filename); // 记录文件名，
officeUtils.saveAs("D:" + File.separator + filename + ".doc"); // 生成D:\UUID.doc文件，利用UUID防止同名
officeUtils.close(); // 关闭Office Word创建的文档
officeUtils.quit(); // 退出Office Word程序
MSOfficeGeneratorUtils msOfficeUtils = new MSOfficeGeneratorUtils(false); // 整合过程设置为可见
msOfficeUtils.createNewDocument();
msOfficeUtils.saveAs("D:" + File.separator + "complete.doc");
msOfficeUtils.close();
for (String fileName : files) {
 msOfficeUtils.openDocument("D:" + File.separator + fileName + ".doc");
 msOfficeUtils.copy();
 msOfficeUtils.close();
 msOfficeUtils.openDocument("D:" + File.separator + "complete.doc");
 msOfficeUtils.moveEnd();
 msOfficeUtils.enterDown(1);
 msOfficeUtils.paste();
 msOfficeUtils.saveAs("D:" + File.separator + "complete.doc");
 msOfficeUtils.close();
}
//复制一个内容比较少的*.doc文档，防止在关闭word程序时提示有大量的copy内容在内存中，是否应用于其它程序对话框,
msOfficeUtils.createNewDocument();
msOfficeUtils.insertText("测试消息");
msOfficeUtils.copy();
msOfficeUtils.close();
msOfficeUtils.quit();
imgIndex = 1;
imgMap.clear();
}
public static void sysElementText(Node node) {
if (node.childNodes().size() == 0) {
 if (node.nodeName().equals("img")) { // 处理图片路径问题
 node.after("${image_" + imgIndex + "}"); // 为img添加同级P标签，内容为${image_imgIndexNumber}
 String src = node.attr("src");
 node.remove(); // 删除Img标签。
 StringBuffer imgUrl = new StringBuffer("D:\TRS\TRSWCMV65HBTCIS\WCMData\webpic\"); // 暂时将路径直接写死，正式应用上应将此处改写为WebPic的配置项
 imgUrl.append(src.substring(0, 8)).append("\").append(src.subSequence(0, 10)).append("\").append(src);
 // node.attr("src", imgUrl.toString()); //这一句没有必要，因为此img标签已经移除了
 imgMap.put("${image_" + imgIndex++ + "}", imgUrl.toString());
 }
} else {
 for (Node rNode : node.childNodes()) {
 sysElementText(rNode);
 }
}
}
}

你可能感兴趣的:(Jsoup解析HTML实例及文档方法详解)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动李蕾1229
为促进我校教师专业发展，发挥骨干教师的引领带头作用，11月6日下午，我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动。图片发自App会议由教师发展处李蕾主任主持，首先，由范校长宣读新老教师结对名单及双方承担职责。随后，两位新调入教师陈玉萍、莫正杰分别和他们的师傅鲍元美、刘召彬老师签订了师徒结对协议书。图片发自App图片发自App师徒拥抱、握手。有了师傅就有了目标有了方向，相信两位新教师在师
向内而求陈陈_19b4
10月27日，阴。阅读书目:《次第花开》。作者:希阿荣博堪布，是当今藏传佛家宁玛派最伟大的上师法王，如意宝晋美彭措仁波切颇具影响力的弟子之一。多年以来，赴海内外各地弘扬佛法，以正式授课、现场开示、发表文章等多种方法指导佛学弟子修行佛法。代表作《寂静之道》、《生命这出戏》、《透过佛法看世界》自出版以来一直是佛教类书籍中的畅销书。图片发自App金句:1.佛陀说，一切痛苦的根源在于我们长期以来对自身及外
html 中如何使用 uniapp 的部分方法某公司摸鱼前端 html uni-app 前端
示例代码：Documentconsole.log(window);效果展示：好了，现在就可以uni.使用相关的方法了
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
水平垂直居中的几种方法（总结） LJ小番茄 CSS_玄学语言 html javascript 前端 css css3
1.使用flexbox的justify-content和align-items.parent{display:flex;justify-content:center;/*水平居中*/align-items:center;/*垂直居中*/height:100vh;/*需要指定高度*/}2.使用grid的place-items:center.parent{display:grid;place-item
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
下载github patch到本地小米人er 我的博客 git patch
以下是几种从GitHub上下载以.patch结尾的补丁文件的方法：通过浏览器直接下载打开包含该.patch文件的GitHub仓库。在仓库的文件列表中找到对应的.patch文件。点击该文件，浏览器会显示文件的内容，在页面的右上角通常会有一个“Raw”按钮，点击它可以获取原始文件内容。然后在浏览器中使用快捷键（如Ctrl+S或者Command+S）将原始文件保存到本地，选择保存的文件名并确保后缀为.p
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
拥有断舍离的心态，过精简生活--《断舍离》读书笔记爱吃丸子的小樱桃
不知不觉间房间里的东西越来越多，虽然摆放整齐，但也时常会觉得空间逼仄，令人心生烦闷。抱着断舍离的态度，我开始阅读《断舍离》这本书，希望从书中能找到一些有效的方法，帮助我实现空间、物品上的断舍离。《断舍离》是日本作家山下英子通过自己的经历、思考和实践总结而成的，整体内涵也从刚开始的私人生活哲学的“断舍离”升华成了“人生实践哲学”，接着又成为每个人都能实行的“改变人生的断舍离”，从“哲学”逐渐升华成“
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
如果做到轻松在股市赚钱？只要坚持这三个原则。履霜之人
大A股里向来就有七亏二平一赚的说法，能赚钱的都是少数人。否则股市就成了慈善机构，人人都有钱赚，谁还要上班？所以说亏钱是正常的，或者说是应该的。那么那些赚钱的人又是如何做到的呢？普通人能不能找到捷径去分一杯羹呢？方法是有的，但要做到需要你有极高的自律。第一，控制仓位，散户最大的问题是追涨杀跌，只要涨起来，就把钱往股票上砸，然后被套，隔天跌的受不了，又一刀切，全部割肉。来来回回间，遍体鳞伤。所以散户首
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
从0到500+，我是如何利用自媒体赚钱？一列脚印
运营公众号半个多月，从零基础的小白到现在慢慢懂了一些运营的知识。做好公众号是很不容易的，要做很多事情；排版、码字、引流…通通需要自己解决，业余时间全都花费在这上面涨这么多粉丝是真的不容易，对比知乎大佬来说，我们这种没资源，没人脉，还没钱的小透明来说，想要一个月涨粉上万，怕是今天没睡醒（不过你有的方法，算我piapia打脸）至少我是清醒的，自己慢慢努力，实现我的万粉目标！大家快来围观、支持我吧！孩子
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
春季养肝正当时 dxn悟
重温快乐2023年2月4日立春。春天来了，春暖花开，小鸟欢唱，那在这样的季节我们如何养肝呢？自然界的春季对应中医五行的木，人体五脏肝属木，“木曰曲直”，是以树干曲曲直直地向上、向外伸长舒展的生发姿态，来形容具有生长、升发、条达、舒畅等特征的食物及现象。根据中医天人相应的理念，肝五行属木，喜条达，主疏泄，与春天相应，所以春天最适合养肝。养肝首先要少生气，因为肝喜条达恶抑郁。人体五志肝为怒，生气发怒最
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS