Java读取excel2007

import java.io.File;

import java.io.InputStream;

import java.util.ArrayList;

import java.util.List;

import java.util.zip.ZipEntry;

import java.util.zip.ZipFile;

 

import javax.xml.parsers.DocumentBuilderFactory;

 

import org.w3c.dom.Document;

import org.w3c.dom.Element;

import org.w3c.dom.NodeList;

 

/**

 * 首先介绍excel2007文件的格式,这里单只工作表文件,不包括加载宏的以及其他格式的,即.xlsx扩展名的

 * 你可以把Book1.xlsx这个文件用解压缩文件打开,这是office2007的新格式,所有的该版本的文件都可以用 解压缩文件打开。

 * 在解压到的文件夹里主要用到的是xl这个文件夹,这里也只介绍这个文件夹里的部分文件,其他信息可以在微软 的msdn上找到。

 * xl文件夹下有sharedStrings.xml,styles.xml,workbook.xml三个文件,第一个是放共享字符的,在msdn上说

 * 在这里可以定义各种语言的字符,然后在sheet.xml里引用这个来达到国际化,而不用为每种语言建立一个excel,styles

 * 可能是样式吧,workbook.xml是表的总体情况,有几个sheet等等。

 * 接着是该文件夹下的worksheets文件夹,里面放的是每个sheet的具体内容,比如在workbook.xml定义有3个sheet,那么

 * 在这里你就能看到三个文件,文件名对应workbook.xml中sheet节点的name属性,但是这里要注意大小写

 * 打开一个sheet1.xml文件,可以看到这里定义了该sheet中的行和列的信息,具体在程序里有介绍。

 * 读取简单的工作表文件的内容基本上用到这些,如果还要对文件进行操作的话,可能还可以修改字体,样式什么的。

 * 

 * 如有错误望请指正

 */

public class ReadExcel2007 {

 

public static void main(String[] args) {

try {

 

// 解压Book1.xlsx

ZipFile xlsxFile = new ZipFile(new File("C:\\Documents and Settings\\Administrator\\桌面\\银泰\\代销结算格式.xlsx"));

DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();

 

// 先读取sharedStrings.xml这个文件备用

ZipEntry sharedStringXML = xlsxFile

.getEntry("xl/sharedStrings.xml");

InputStream sharedStringXMLIS = xlsxFile

.getInputStream(sharedStringXML);

Document sharedString = dbf.newDocumentBuilder().parse(

sharedStringXMLIS);

NodeList str = sharedString.getElementsByTagName("t");

String sharedStrings[] = new String[str.getLength()];

for (int n = 0; n < str.getLength(); n++) {

Element element = (Element) str.item(n);

// System.out.println(element.getTextContent());

sharedStrings[n] = element.getTextContent();

}

// 找到解压文件夹里的workbook.xml,此文件中包含了这张工作表中有几个sheet

ZipEntry workbookXML = xlsxFile.getEntry("xl/workbook.xml");

InputStream workbookXMLIS = xlsxFile.getInputStream(workbookXML);

Document doc = dbf.newDocumentBuilder().parse(workbookXMLIS);

// 获取一共有几个sheet

NodeList nl = doc.getElementsByTagName("sheet");

 

for (int i = 0; i < nl.getLength(); i++) {

Element element = (Element) nl.item(i);// 将node转化为element,用来得到每个节点的属性

System.out.println(element.getAttribute("name"));// 输出sheet节点的name属性的值

// 接着就要到解压文件夹里找到对应的name值的xml文件,比如在workbook.xml中有<sheet

// name="Sheet1" sheetId="1" r:id="rId1" /> 节点

// 那么就可以在解压文件夹里的xl/worksheets下找到sheet1.xml,这个xml文件夹里就是包含的表格的内容

ZipEntry sheetXML = xlsxFile.getEntry("xl/worksheets/"

+ element.getAttribute("name").toLowerCase() + ".xml");

InputStream sheetXMLIS = xlsxFile.getInputStream(sheetXML);

Document sheetdoc = dbf.newDocumentBuilder().parse(sheetXMLIS);

NodeList rowdata = sheetdoc.getElementsByTagName("row");

for (int j = 0; j < rowdata.getLength(); j++) {

 

List<String> rowlist = new ArrayList<String>();

 

// 得到每个行

// 行的格式:

/*

* <row r="1" spans="1:3">r表示第一行,spans表示有几列 <c r="A1"

* t="s">/

* /r表示该列的列表,t="s"个人认为是表示这个单元格的内容可以在sharedStrings.xml这个文件里找到

* ,对应的节点 下标就是v节点的值,即0,若没有t属性,则v的值就是该单元格的内容 <v>0</v> </c> <c

* r="B1" t="s"> <v>1</v> </c> <c r="C1" t="s"> <v>2</v>

* </c> </row>

*/

Element row = (Element) rowdata.item(j);

// 根据行得到每个行中的列

NodeList columndata = row.getElementsByTagName("c");

for (int k = 0; k < columndata.getLength(); k++) {

Element column = (Element) columndata.item(k);

NodeList values = column.getElementsByTagName("v");

Element value = (Element) values.item(0);

if (column.getAttribute("t") != null & column.getAttribute("t").equals("s")) {

// 如果是共享字符串则在sharedstring.xml里查找该列的值

System.out.print(k + ":-" + sharedStrings[Integer

.parseInt(value.getTextContent())] + " ");

rowlist.add(sharedStrings[Integer.parseInt(value.getTextContent())]);

 

} else {

if(value != null){

System.out.print( k + ":-" + value.getTextContent() + " ");

rowlist.add(value.getTextContent());

}

else {

System.out.print( k + ":-" + "null ");

rowlist.add("");

}

}

}

System.out.println();

}

}

} catch (Exception e) {

e.printStackTrace();

}

}

}

你可能感兴趣的:(excel2007)