java文档处理工具包——iText、apache poi

最近看了篇关于WEB报表工具的文章,里面提到了一些java工具包,在这里简单整理一下。


一、iText生成PDF

 

iText是用于生成pdf的一个java类库,可以将txt/html/xm/图片等生成pdf。

这里有一个实例,还比较详细http://www.blogjava.net/rosen/archive/2008/12/07/244858.html

 

二、apache poi读写MS Excel

 

Apache POI 是用Java编写的免费开源的跨平台的 Java API,Apache POI提供API给Java程式对Microsoft Office格式档案读和写的功能。

  Apache POI 是创建和维护操作各种符合Office Open XML(OOXML)标准和微软的OLE 2复合文档格式(OLE2)的Java API。用它可以使用Java读取和创建,修改MS Excel文件.而且,还可以使用Java读取和创建MS Word和MSPowerPoint文件。Apache POI 提供Java操作Excel解决方案(适用于Excel97-2008)。

 

核心API:

  HSSF - 提供读写Microsoft Excel XLS格式档案的功能。

  XSSF - 提供读写Microsoft Excel OOXML XLSX格式档案的功能。

  HWPF - 提供读写Microsoft Word DOC格式档案的功能。

  HSLF - 提供读写Microsoft PowerPoint格式档案的功能。

  HDGF - 提供读Microsoft Visio格式档案的功能。

  HPBF - 提供读Microsoft Publisher格式档案的功能。

 

  HSMF - 提供读Microsoft Outlook格式档案的功能。

 

代码示例:

创建Excel 文档

 

import org.apache.poi.hssf.usermodel.HSSFWorkbook;
  import org.apache.poi.hssf.usermodel.HSSFSheet;
  import org.apache.poi.hssf.usermodel.HSSFRow;
  import org.apache.poi.hssf.usermodel.HSSFCell;
  import javaioFileOutputStream;
  public class CreateXL {
  public static String outputFile="D:\\test.xls";
  public static void main(String argv[]){
  try{
  // 创建新的Excel 工作簿
  HSSFWorkbook workbook = new HSSFWorkbook();
  // 在Excel工作簿中建一工作表,其名为缺省值
  // 如要新建一名为"效益指标"的工作表,其语句为:
  // HSSFSheet sheet = workbook.createSheet("效益指标");
  HSSFSheet sheet = workbook.createSheet();
  // 在索引0的位置创建行(最顶端的行)
  HSSFRow row = sheet.createRow((short)0);
  //在索引0的位置创建单元格(左上端)
  HSSFCell cell = row.createCell((short) 0);
  // 定义单元格为字符串类型
  cell.setCellType(HSSFCell.CELL_TYPE_STRING);
  // 在单元格中输入一些内容
  cell.setCellValue("增加值");
  // 新建一输出文件流
  FileOutputStream fOut = new FileOutputStream(outputFile);
  // 把相应的Excel 工作簿存盘
  workbook.write(fOut);
  fOut.flush();
  // 操作结束,关闭文件
  fOut.close();
  System.out.println("文件生成...");
  }catch(Exception e) {
  System.out.println("已运行 xlCreate() : " + e );
  }
  }
  }

 读取Excel文档中的数据

 

import org.apache.poi.hssf.usermodel.HSSFWorkbook;
  import org.apache.poi.hssf.usermodel.HSSFSheet;
  import org.apache.poi.hssf.usermodel.HSSFRow;
  import org.apache.poi.hssf.usermodel.HSSFCell;
  import javaioFileOutputStream;
  public class ReadXL {
  public static String fileToBeRead="D:\\test1.xls";
  public static void main(String argv[]){
  try{
  // 创建对Excel工作簿文件的引用
  HSSFWorkbook workbook = new HSSFWorkbook(newFileInputStream(fileToBeRead));
  // 创建对工作表的引用。
  // 本例是按名引用(让我们假定那张表有着缺省名"Sheet1")
  HSSFSheet sheet = workbook.getSheet("Sheet1");
  // 也可用getSheetAt(int index)按索引引用,
  // 在Excel文档中,第一张工作表的缺省索引是0,
  // 其语句为:HSSFSheet sheet = workbook.getSheetAt(0);
  // 读取左上端单元
  HSSFRow row = sheet.getRow(0);
  HSSFCell cell = row.getCell((short)0);
  // 输出单元内容,cell.getStringCellValue()就是取所在单元的值
  System.out.println("左上端单元是: " + cell.getStringCellValue());
  }catch(Exception e) {
  System.out.println("已运行xlRead() : " + e );
  }
  }
  }

 设置单元格格式

  在这里,我们将只介绍一些和格式设置有关的语句,我们假定workbook就是对一个工作簿的引用。

在Java中,第一步要做的就是创建和设置字体和单元格的格式,然后再应用这些格式:  

1、创建字体,设置其为红色、粗体:  

HSSFFont font = workbook.createFont();  font.setColor(HSSFFont.COLOR_RED);  font.setBoldweight(HSSFFont.BOLDWEIGHT_BOLD);  

2、创建格式  

HSSFCellStyle cellStyle= workbook.createCellStyle();  cellStyle.setFont(font);  

3、应用格式  

HSSFCell cell = row.createCell((short) 0);  cell.setCellStyle(cellStyle);  cell.setCellType(HSSFCell.CELL_TYPE_STRING);

  cell.setCellValue("标题 "); 

处理WORD文档

 

 import javaio*;
  import org.textmining.text.extraction.WordExtractor;
  import org.apache.poi.hssf.usermodel.HSSFWorkbook;
  import org.apache.poi.hssf.usermodel.HSSFSheet;
  import org.apache.poi.hssf.usermodel.HSSFRow;
  import org.apache.poi.hssf.usermodel.HSSFCell;
  public class TestPoi {
  public TestPoi() {
  }
  public static void main(String args[]) throws Exception
  {
  FileInputStream in = new FileInputStream ("D:\\a.doc");
  WordExtractor extractor = new WordExtractor();
  String str = extractor.extractText(in);
  //System.out.println("the result length is"+str.length());
  System.out.println(str);
  }
  }

 参考:http://baike.baidu.com/view/3029809.htm

你可能感兴趣的:(apache)