颖波

利用POI将word转换成html实现在线阅读

一、分析

通过网上找资料，发现用java实现word在线阅读有以下的实现方式：

1	Word=>PDF(OpenOffice+JodConverter)=>SWF(pdf2swf)=>FlexPaper浏览
2	Word=>PDF(MSOffice+JACOB)=>SWF(pdf2swf)=>FlexPaper浏览
3	Word =>SWF (FlashPaper)=> FlexPaper浏览
4	Word=>SWF(print2flash)=> FlexPaper浏览
5	用第三方收费组件：PageOffice
6	1）利用 POI把 Word2003转换成 html； 2）利用OpenOffice+JodConverter将word2003转换成html

前4种方式，目标都是一致的，就是都将word文档转换成flash文件，只是中间的实现不大一样。前两种方式比较麻烦，都是先转成PDF，再转成SWF，最后用FlexPaper浏览。两种比较快捷，可直接将源文件转为SWF，用FlexPaper浏览。第二种方式用到的jacob是微软的组件，在linux平台下基本是无望的了，第一个淘汰。由于FlashPaper不是开源工具，加之Win8系统不兼容(我现在用的系统)，所以就没采用第三种实现方式。Print2flash是开源工具，即使公司产品中用到也不会出现版权纠纷，遗憾的是没找到如何用程序控制该工具转换文件的命令。所以第3，4种方式也淘汰了。通过下载，预使用，发现第5种方式用PageOffice是最省时省力的，也能将word文档完美的展现，但是，要钱！！好吧，一提到钱，此种实现只能暂作废。

后面一开始是想用OpenOffice+JodConverter实现转swf的，后面在逛百度文库的时候，发现一个让我很好奇的东西。就是，百度文库里的文档基本上都用html进行展示了，也就是说，我们上传的word文档，百度对其做了html转换的处理，与页面的嵌合也相当的好。这让我想到，我们的项目中是否也可以用此方式实现word的在线预览呢。

基于这个想法，我到谷歌找相关的资料，发现将word转html的开源工具没几个。其中，介绍得比较多的就是用POI进行转换，但是，由于POI对word的处理功能相当的弱，因此，开启了使用POI将wordàhtml的艰苦历程（后面发现网上有介绍用OpenOffice+JodConverter将word2003转换成html的方式，但是，我没有深究，有兴趣的同学可以去观望一下http://www.cnblogs.com/codeplus/archive/2011/10/22/2220952.html）：

二、实现

1. POI介绍：

Apache POI 是用Java编写的免费开源的跨平台的 Java API，Apache POI提供API给Java程式对Microsoft Office格式档案读和写的功能。POI为“Poor Obfuscation Implementation”的首字母缩写，意为“可怜的模糊实现”。

Apache POI 是创建和维护操作各种符合Office Open XML（OOXML）标准和微软的OLE 2复合文档格式（OLE2）的Java API。用它可以使用Java读取和创建,修改MS Excel文件.而且,还可以使用Java读取和创建MS Word和MSPowerPoint文件。Apache POI 提供Java操作Excel解决方案（适用于Excel97-2008）。

基本结构：

HSSF －提供读写Microsoft Excel XLS格式档案的功能。

XSSF －提供读写Microsoft Excel OOXML XLSX格式档案的功能。

HWPF －提供读写Microsoft Word DOC格式档案的功能。

HSLF －提供读写Microsoft PowerPoint格式档案的功能。

HDGF －提供读Microsoft Visio格式档案的功能。

HPBF －提供读Microsoft Publisher格式档案的功能。

HSMF －提供读Microsoft Outlook格式档案的功能。

其实，POI比较拿手的是处理Excel表格，即上面的HSSF及XSSF，我们的很多项目，只要涉及报表的，基本上都有用到它吧。用对于HWPF即处理DOC的包，功能就没有那么健全了，且API也不完善。

2. poi相关包及依赖包配置。

3. 处理流程图：

1）主体流程：

2）进行word文档解释转换子流程

3）处理表格子流程（略）

4）处理图片子流程（略）

4. 代码实现

package com;

import java.awt.image.BufferedImage;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStream;
import java.io.OutputStreamWriter;

import javax.imageio.ImageIO;

import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.model.PicturesTable;
import org.apache.poi.hwpf.usermodel.CharacterRun;
import org.apache.poi.hwpf.usermodel.Paragraph;
import org.apache.poi.hwpf.usermodel.Picture;
import org.apache.poi.hwpf.usermodel.Range;
import org.apache.poi.hwpf.usermodel.Table;
import org.apache.poi.hwpf.usermodel.TableCell;
import org.apache.poi.hwpf.usermodel.TableIterator;
import org.apache.poi.hwpf.usermodel.TableRow;
import org.apache.xmlbeans.impl.piccolo.io.FileFormatException;


/**
 * @Description: 利用poi将word简单的转换成html文件
 * @author 柯颖波
 * @date 2013-12-20 上午09:32:44
 * @version v1.0
 */
public class Word2Html {
	/**
	 * 回车符ASCII码
	 */
	private static final short ENTER_ASCII = 13;

	/**
	 * 空格符ASCII码
	 */
	private static final short SPACE_ASCII = 32;

	/**
	 * 水平制表符ASCII码
	 */
	private static final short TABULATION_ASCII = 9;

	private static String htmlText = "";
	private static String htmlTextTbl = "";
	private static int counter = 0;
	private static int beginPosi = 0;
	private static int endPosi = 0;
	private static int beginArray[];
	private static int endArray[];
	private static String htmlTextArray[];
	private static boolean tblExist = false;

	/**
	 * 项目路径
	 */
	private static String projectRealPath = "";
	/**
	 * 临时文件路径
	 */
	private static String tempPath = "/upfile/" + File.separator + "transferFile" + File.separator;
	/**
	 * word文档名称
	 */
	private static String wordName = "";

	public static void main(String argv[]) {
		try {
			wordToHtml("F:\\SVN\\BobUtil\\web\\", "2012年高考广东数学（文）试卷解析（精析word版）（学生版）.doc");
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

	/**
	 * 读取每个文字样式
	 * 
	 * @param fileName
	 * @throws Exception
	 */

	private static void getWordAndStyle(String fileName) throws Exception {
		FileInputStream in = new FileInputStream(new File(fileName));
		HWPFDocument doc = new HWPFDocument(in);

		Range rangetbl = doc.getRange();// 得到文档的读取范围
		TableIterator it = new TableIterator(rangetbl);

		int num = 100;

		beginArray = new int[num];
		endArray = new int[num];
		htmlTextArray = new String[num];
		tblExist = false;

		// 取得文档中字符的总数
		int length = doc.characterLength();
		// 创建图片容器
		PicturesTable pTable = doc.getPicturesTable();
		// 创建段落容器

		htmlText = ""
				+ doc.getSummaryInformation().getTitle()
				+ "";
		// 创建临时字符串,好加以判断一串字符是否存在相同格式

		if (it.hasNext()) {
			readTable(it, rangetbl);
		}

		int cur = 0;
		String tempString = "";
		for (int i = 0; i < length - 1; i++) {
			// 整篇文章的字符通过一个个字符的来判断,range为得到文档的范围
			Range range = new Range(i, i + 1, doc);
			CharacterRun cr = range.getCharacterRun(0);
			// beginArray=new int[num];
			// endArray=new int[num];
			// htmlTextArray=new String[num];
			if (tblExist) {
				if (i == beginArray[cur]) {
					htmlText += tempString + htmlTextArray[cur];
					tempString = "";
					i = endArray[cur] - 1;
					cur++;
					continue;
				}
			}
			if (pTable.hasPicture(cr)) {
				htmlText += tempString;
				// 读写图片
				try {
					readPicture(pTable, cr);
				} catch (Exception e) {
					e.printStackTrace();
				}
				tempString = "";
			} else {

				Range range2 = new Range(i + 1, i + 2, doc);
				// 第二个字符
				CharacterRun cr2 = range2.getCharacterRun(0);
				char c = cr.text().charAt(0);
				// System.out.println(c);
				// /System.out.println(i+"::"+range.getEndOffset()+"::"+range.getStartOffset()+"::"+c);

				// 判断是否为回车符
				if (c == ENTER_ASCII) {
					tempString += "
";
				}
				// 判断是否为空格符
				else if (c == SPACE_ASCII)
					tempString += " ";
				// 判断是否为水平制表符
				else if (c == TABULATION_ASCII)
					tempString += "    ";
				// 比较前后2个字符是否具有相同的格式
				boolean flag = compareCharStyle(cr, cr2);
				if (flag)
					tempString += cr.text();
				else {
					String fontStyle = "> 0) & 0xff; // red;
						rgb[1] = (fontcolor >> 8) & 0xff; // green
						rgb[2] = (fontcolor >> 16) & 0xff; // blue
					}
					fontStyle += "color: rgb(" + rgb[0] + "," + rgb[1] + "," + rgb[2] + ");";
					htmlText += fontStyle + "\">" + tempString + cr.text() + "";
					tempString = "";
				}
			}
		}

		htmlText += tempString + "";
		// System.out.println(htmlText);
	}

	/**
	 * 读写文档中的表格
	 * 
	 * @param pTable
	 * @param cr
	 * @throws Exception
	 */
	private static void readTable(TableIterator it, Range rangetbl) throws Exception {

		htmlTextTbl = "";
		// 迭代文档中的表格

		counter = -1;
		while (it.hasNext()) {
			tblExist = true;
			htmlTextTbl = "";
			Table tb = (Table) it.next();
			beginPosi = tb.getStartOffset();
			endPosi = tb.getEndOffset();

			// System.out.println("............"+beginPosi+"...."+endPosi);
			counter = counter + 1;
			// 迭代行，默认从0开始
			beginArray[counter] = beginPosi;
			endArray[counter] = endPosi;

			htmlTextTbl += "";
			for (int i = 0; i < tb.numRows(); i++) {
				TableRow tr = tb.getRow(i);

				htmlTextTbl += "";
				// 迭代列，默认从0开始
				for (int j = 0; j < tr.numCells(); j++) {
					TableCell td = tr.getCell(j);// 取得单元格
					int cellWidth = td.getWidth();

					// 取得单元格的内容
					for (int k = 0; k < td.numParagraphs(); k++) {
						Paragraph para = td.getParagraph(k);
						CharacterRun crTemp = para.getCharacterRun(0);
						String fontStyle = "" + para.text().toString().trim() + "";
						if (s == "") {
							s = " ";
						}
						// System.out.println(s);
						htmlTextTbl += "";
						// System.out.println(i + ":" + j + ":" + cellWidth + ":" + s);
					} // end for
				} // end for
			} // end for
			htmlTextTbl += "" + s + "";
			htmlTextArray[counter] = htmlTextTbl;

		} // end while
	}

	/**
	 * 读写文档中的图片
	 * 
	 * @param pTable
	 * @param cr
	 * @throws Exception
	 */
	private static void readPicture(PicturesTable pTable, CharacterRun cr) throws Exception {
		// 提取图片
		Picture pic = pTable.extractPicture(cr, false);
		BufferedImage image = null;// 图片对象
		// 获取图片样式
		int picHeight = pic.getHeight() * pic.getAspectRatioY() / 100;
		int picWidth = pic.getAspectRatioX() * pic.getWidth() / 100;
		if (picWidth > 500) {
			picHeight = 500 * picHeight / picWidth;
			picWidth = 500;
		}
		String style = " style='height:" + picHeight + "px;width:" + picWidth + "px'";

		// 返回POI建议的图片文件名
		String afileName = pic.suggestFullFileName();
		//单元测试路径
		String directory = "images/" + wordName + "/";
		//项目路径
		//String directory = tempPath + "images/" + wordName + "/";
		makeDir(projectRealPath, directory);// 创建文件夹

		int picSize = cr.getFontSize();
		int myHeight = 0;

		if (afileName.indexOf(".wmf") > 0) {
			OutputStream out = new FileOutputStream(new File(projectRealPath + directory + afileName));
			out.write(pic.getContent());
			out.close();
			afileName = Wmf2Png.convert(projectRealPath + directory + afileName);

			File file = new File(projectRealPath + directory + afileName);

			try {
				image = ImageIO.read(file);
			} catch (Exception e) {
				e.printStackTrace();
			}

			int pheight = image.getHeight();
			int pwidth = image.getWidth();
			if (pwidth > 500) {
				htmlText += "";
			} else {
				myHeight = (int) (pheight / (pwidth / (picSize * 1.0)) * 1.5);
				htmlText += "";
			}

		} else {
			OutputStream out = new FileOutputStream(new File(projectRealPath + directory + afileName));
			// pic.writeImageContent(out);
			out.write(pic.getContent());
			out.close();
			// 处理jpg或其他（即除png外）
			if (afileName.indexOf(".png") == -1) {
				try {
					File file = new File(projectRealPath + directory + afileName);
					image = ImageIO.read(file);
					picHeight = image.getHeight();
					picWidth = image.getWidth();
					if (picWidth > 500) {
						picHeight = 500 * picHeight / picWidth;
						picWidth = 500;
					}
					style = " style='height:" + picHeight + "px;width:" + picWidth + "px'";
				} catch (Exception e) {
					// e.printStackTrace();
				}
			}
			htmlText += "";
		}
		if (pic.getWidth() > 450) {
			htmlText += "
";
		}
	}

	private static boolean compareCharStyle(CharacterRun cr1, CharacterRun cr2) {
		boolean flag = false;
		if (cr1.isBold() == cr2.isBold() && cr1.isItalic() == cr2.isItalic()
				&& cr1.getFontName().equals(cr2.getFontName()) && cr1.getFontSize() == cr2.getFontSize()) {
			flag = true;
		}
		return flag;
	}

	/**
	 * 写文件（成功返回true，失败则返回false）
	 * 
	 * @param s
	 *            要写入的内容
	 * @param filePath
	 *            文件
	 */
	private static boolean writeFile(String s, String filePath) {
		FileOutputStream fos = null;
		BufferedWriter bw = null;
		s = s.replaceAll("EMBED", "").replaceAll("Equation.DSMT4", "");
		try {
			makeDir(projectRealPath, tempPath);// 创建文件夹
			File file = new File(filePath);
			if (file.exists()) {
				return false;
			}
			fos = new FileOutputStream(file);
			bw = new BufferedWriter(new OutputStreamWriter(fos, "utf-8"));
			bw.write(s);
			// System.out.println(filePath + "文件写入成功！");
		} catch (FileNotFoundException fnfe) {
			fnfe.printStackTrace();
		} catch (IOException ioe) {
			ioe.printStackTrace();
		} finally {
			try {
				if (bw != null)
					bw.close();
				if (fos != null)
					fos.close();
			} catch (IOException ie) {
				ie.printStackTrace();
			}
		}
		return true;
	}

	/**
	 * 根据路径名生成多级路径
	 * 
	 * @param url
	 *            参数要以"\classes\cn\qtone\"或者"/classes/cn/qtone/"
	 */
	private static String makeDir(String root, String url) {
		String[] sub;
		url = url.replaceAll("\\/", "\\\\");
		if (url.indexOf("\\") > -1) {
			sub = url.split("\\\\");
		} else {
			return "-1";
		}

		File dir = null;
		try {
			dir = new File(root);
			for (int i = 0; i < sub.length; i++) {
				if (!dir.exists() && !sub[i].equals("")) {
					dir.mkdir();
				}
				File dir2 = new File(dir + File.separator + sub[i]);
				if (!dir2.exists()) {
					dir2.mkdir();
				}
				dir = dir2;
			}
		} catch (Exception e) {
			e.printStackTrace();
			return "-1";
		}
		return dir.toString();
	}

	/**
	 * 将word文档转化,返回转化后的文件路径
	 * 
	 * @param projectPath
	 *            项目路径
	 * @param relativeFilePath
	 *            文件相对路径
	 * @return 返回生成的htm路径（如果出错，则返回null）
	 */
	public static String wordToHtml(String projectPath, String relativeFilePath) {
		String resultPath = null;
		projectRealPath = projectPath;// 项目路径
		String filePath = "";
		// System.out.println(projectRealPath + tempPath);
		// System.out.println(makeDir(projectRealPath, tempPath));
		try {
			File file = new File(projectPath + relativeFilePath);
			if (file.exists()) {
				if (file.getName().indexOf(".doc") == -1 || file.getName().indexOf(".docx") > 0) {
					throw new FileFormatException("请确认文件格式为doc!");
				} else {
					wordName = file.getName();
					wordName = wordName.substring(0, wordName.indexOf("."));

					filePath = projectRealPath + tempPath + wordName + ".htm";
					synchronized (relativeFilePath) {// 处理线程同步问题
						File ff = new File(filePath);
						if (!ff.exists()) {// 如果不存在则进行转换
							getWordAndStyle(projectPath + relativeFilePath);
							writeFile(htmlText, filePath);
						}
					}
					resultPath = tempPath + wordName + ".htm";
				}
			} else {
				throw new FileNotFoundException("没找到相关文件！");
			}
		} catch (NullPointerException e) {
			e.printStackTrace();
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		} catch (Exception e) {
			e.printStackTrace();
		}
		return resultPath;
	}
}

package com;

import java.io.ByteArrayInputStream;
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.InputStream;
import java.io.OutputStream;
import java.util.Scanner;
import java.util.zip.GZIPOutputStream;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.OutputKeys;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import net.arnx.wmf2svg.gdi.svg.SvgGdi;
import net.arnx.wmf2svg.gdi.wmf.WmfParser;

import org.apache.batik.transcoder.TranscoderInput;
import org.apache.batik.transcoder.TranscoderOutput;
import org.apache.batik.transcoder.TranscodingHints;
import org.apache.batik.transcoder.image.PNGTranscoder;
import org.apache.batik.transcoder.wmf.tosvg.WMFTranscoder;
import org.apache.commons.lang.StringUtils;
import org.w3c.dom.Document;
import org.w3c.dom.Element;

public class Wmf2Png {
	public static void main(String[] args) throws Exception {
		// convert("F:\\SVN\\BobUtil\\web\\25177.wmf");
		// System.out.println((20 / (21 * 1.0)));
		// svgToPng("F:\\SVN\\BobUtil\\web\\25177.svg", "F:\\SVN\\BobUtil\\web\\25177.png");
	}

	/**
	 * @Description: 进行转换
	 * @param filePath
	 *            文件路径
	 * @return 设定文件
	 */
	public static String convert(String filePath) {
		String pngFile = "";
		File wmfFile = new File(filePath);
		try {
			if (!wmfFile.getName().contains(".wmf")) {
				throw new Exception("请确认输入的文件类型是wmf");
			}
			// wmf -> svg
			String svgFile = filePath.replace("wmf", "svg");
			wmfToSvg(filePath, svgFile);
			// 对svg做预出理
			PreprocessSvgFile(svgFile);
			// svg -> png
			pngFile = filePath.replace("wmf", "png");
			svgToPng(svgFile, pngFile);
			// 删除 svg
			File file = new File(svgFile);
			if (file.exists()) {
				file.delete();
			}
			// 删除 wmf
			if (wmfFile.exists()) {
				wmfFile.delete();
			}

		} catch (Exception e) {
			try {
				e.printStackTrace();
				wmfToJpg(filePath);
			} catch (Exception e1) {
				e1.printStackTrace();
			}
		}
		return wmfFile.getName().replace("wmf", "png");
	}

	/**
	 * 将wmf转换为svg
	 * 
	 * @param src
	 * @param dest
	 */
	public static void wmfToSvg(String src, String dest) throws Exception {
		boolean compatible = false;
		try {
			InputStream in = new FileInputStream(src);
			WmfParser parser = new WmfParser();
			final SvgGdi gdi = new SvgGdi(compatible);
			parser.parse(in, gdi);

			Document doc = gdi.getDocument();
			OutputStream out = new FileOutputStream(dest);
			if (dest.endsWith(".svgz")) {
				out = new GZIPOutputStream(out);
			}

			output(doc, out);
		} catch (Exception e) {
			throw e;
		}
	}

	/**
	 * @Description: 输出svg文件
	 * @param doc
	 * @param out
	 * @throws Exception
	 *             设定文件
	 */
	private static void output(Document doc, OutputStream out) throws Exception {
		TransformerFactory factory = TransformerFactory.newInstance();
		Transformer transformer = factory.newTransformer();
		transformer.setOutputProperty(OutputKeys.METHOD, "xml");
		transformer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
		transformer.setOutputProperty(OutputKeys.INDENT, "yes");
		transformer.setOutputProperty(OutputKeys.DOCTYPE_PUBLIC, "-//W3C//DTD SVG 1.0//EN");
		transformer.setOutputProperty(OutputKeys.DOCTYPE_SYSTEM,
				"http://www.w3.org/TR/2001/REC-SVG-20010904/DTD/svg10.dtd");
		transformer.transform(new DOMSource(doc), new StreamResult(out));
		out.flush();
		out.close();
		out = null;
	}

	/**
	 * @Description:对svg文件做预处理(这里主要是调整大小，先缩小10倍，如果还大于默认值，则按比例缩小)
	 * @param svgFile
	 * @throws Exception
	 *             设定文件
	 */
	private static void PreprocessSvgFile(String svgFile) throws Exception {
		int defaultWeight = 500;// 默认宽度
		FileInputStream inputs = new FileInputStream(svgFile);
		Scanner sc = new Scanner(inputs, "UTF-8");
		ByteArrayOutputStream os = new ByteArrayOutputStream();
		while (sc.hasNextLine()) {
			String ln = sc.nextLine();
			if (!ln.startsWith(" defaultWeight) {
			newWidth = defaultWeight;
			newHeight = defaultWeight * height / width;
		}

		((Element) doc.getElementsByTagName("svg").item(0)).setAttribute("width", String.valueOf(newWidth));
		((Element) doc.getElementsByTagName("svg").item(0)).setAttribute("height", String.valueOf(newHeight));
		OutputStream out = new FileOutputStream(svgFile);
		output(doc, out);
	}

	/**
	 * 将svg图片转成png图片
	 * 
	 * @param filePath
	 * @throws Exception
	 */
	public static void svgToPng(String svgPath, String pngFile) throws Exception {
		File svg = new File(svgPath);
		FileInputStream wmfStream = new FileInputStream(svg);
		ByteArrayOutputStream imageOut = new ByteArrayOutputStream();
		int noOfByteRead = 0;
		while ((noOfByteRead = wmfStream.read()) != -1) {
			imageOut.write(noOfByteRead);
		}
		imageOut.flush();
		imageOut.close();
		wmfStream.close();

		ByteArrayOutputStream jpg = new ByteArrayOutputStream();
		FileOutputStream jpgOut = new FileOutputStream(pngFile);

		byte[] bytes = imageOut.toByteArray();
		PNGTranscoder t = new PNGTranscoder();
		TranscoderInput in = new TranscoderInput(new ByteArrayInputStream(bytes));
		TranscoderOutput out = new TranscoderOutput(jpg);
		t.transcode(in, out);
		jpgOut.write(jpg.toByteArray());
		jpgOut.flush();
		jpgOut.close();
		imageOut = null;
		jpgOut = null;
	}

	/**
	 * 将wmf图片转成png图片(备用方法，即当上面的转换失败时用这个)
	 * 
	 * @param filePath
	 * @throws Exception
	 */
	public static String wmfToJpg(String wmfPath) throws Exception {
		//先wmf-->svg
		File wmf = new File(wmfPath);
		FileInputStream wmfStream = new FileInputStream(wmf);
		ByteArrayOutputStream imageOut = new ByteArrayOutputStream();
		int noOfByteRead = 0;
		while ((noOfByteRead = wmfStream.read()) != -1) {
			imageOut.write(noOfByteRead);
		}
		imageOut.flush();
		imageOut.close();
		wmfStream.close();

		// WMFHeaderProperties prop = new WMFHeaderProperties(wmf);
		WMFTranscoder transcoder = new WMFTranscoder();
		TranscodingHints hints = new TranscodingHints();
		transcoder.setTranscodingHints(hints);
		TranscoderInput input = new TranscoderInput(new ByteArrayInputStream(imageOut.toByteArray()));
		ByteArrayOutputStream svg = new ByteArrayOutputStream();
		TranscoderOutput output = new TranscoderOutput(svg);
		transcoder.transcode(input, output);
		
		//再svg-->png
		ByteArrayOutputStream jpg = new ByteArrayOutputStream();
		String jpgFile = StringUtils.replace(wmfPath, "wmf", "png");
		FileOutputStream jpgOut = new FileOutputStream(jpgFile);

		byte[] bytes = svg.toByteArray();
		PNGTranscoder t = new PNGTranscoder();
		TranscoderInput in = new TranscoderInput(new ByteArrayInputStream(bytes));
		TranscoderOutput out = new TranscoderOutput(jpg);
		t.transcode(in, out);
		jpgOut.write(jpg.toByteArray());
		jpgOut.flush();
		jpgOut.close();
		return jpgFile;
	}
}

重点难点解释探讨：

1）读取表格部分：

a) 找出表格的开始与结束标记；

b) 遍历整个表格内容，逐个单元格的内容取出并追加到变量中。

2）读取图片部分

a) 图片文件的格式问题。

如果图片格式为png或者jpg，则可以直接进行处理并加入标签中，前台的html展示没有问题，但是，如果图片格式为wmf（详细看附录1），则html无法对基解释，那么我们只能对其进行转换格式：

百度后，网上很多说法都建议用batik工具包进行格式转换，其实思路就是：wmfàsvgàpng。查阅相关资料（如附录2），发现其处理svg文件的能力相当的强，即从svg—>png这一步是比较完美的。但是，在处理wmf—>svg这一步却导致部分图像丢失，即失真的情况，且很严重。查看相关的api看是否参数设置问题，但是无论怎么设置，结果还是不尽人意。一度想放弃，找别的包。

后来，无意中，在csdn中有网友建议先用wmf2svg工具类将wmf转换为svg，再用batik将svg转换为png。Very good!!有了这个思路，感觉已经看到署光了。

类写出来后，进行类型转换测试，确实效果很好，完全没有失真。于是将其嵌入word—>html这个工具类中。再用各种包含了wmf图片的文档进行测试。生成的html文件，基本没有问题，当时那个开心啊！！（我去，程序员也就这德行）

好景不长，放到正式项目进行测试过程中，发现有个别文档一进行转换，服务器就跨了，直接报内存溢出。通过排查检测，原来就是进行图片转换过程中，将内存给挤爆了。奇怪了，虽然知道图片处理是比较耗内存，但也没想到1G的内存，一下子就被挤爆（刚跑起来占去300M左右，一跑word转换功能，不过一会就报OutOfMemorry）。

一度怀疑，是不是batik这个工具包是不是有bug，处理不了大的svg。还将问题放上了bakit的官网。后来，查看相关资料后，发现是wmf2svg工具生成的svg的高与宽都太大了，举个例子：15040* 13088，宽高都达到上万级别，结果得到的象素是上亿的，不爆内存才怪。

用dom工具，将每一个生成的svg文件再进行预处理，即将其高与宽都先缩小一倍，如果宽度依然比500要大，则将其设成500，并将高也按比例缩小。经过此步骤生成的svg再用batik进行转换就没有任何问题了。

到这里，差不多已经解决图片转换的问题了，但是，在使用过程中，发现wmf2svg这个工具也不是很稳定，偶尔会报异常，并且，我测试发现，报异常的这个wmf用之前batik直接进行wmf—>svgàpng的方案可以成功生成没有失真的png，于是，在wmf2svg的产生异常进行捕捉，并调用了wmfToJpg（String wmfPath）的备用方法。到此，大部分的wmf转换问题已经解决。

b) 生成html文本的标签的width与height问题。

如果图片格式原本为png的话，直接用

// 获取图片样式
 intpicHeight = pic.getHeight() * pic.getAspectRatioY() / 100;

  intpicWidth = pic.getAspectRatioX() * pic.getWidth() / 100;

即可以将图片的宽与高设置与word文档一致；但是，发果wmf格式，要分两种情况分析：

Ø 如果转换生成的png宽度不小于500，则将期作为一般图片处理：

BufferedImage  image = ImageIO.read(file);
int pheight = image.getHeight();
int pwidth = image.getWidth();

Ø 如果转换生成的png宽度小于500，则认为是一般的公式，则应该与它旁边的字体宽度相近，这里设成字体的1.5倍宽度，高度为：

myHeight= (int) (pheight / (pwidth / (picSize * 1.0)) * 1.5);

如果图片即非wmf与非png（如jpg）的情况下，上面获取高与宽的方法不起作用，不知道是不是POI的bug。只能按以下方式处理：

BufferedImage  image = ImageIO.read(file);
int pheight = image.getHeight();
int pwidth = image.getWidth();

即跟上面处理wmf的第一种方式一致。

三、结束语

讲到这，将word转换成html的处理也大体上讲完了。这几天的边学边用，特别是真正能解决问题的时候，非常有成就感。其实，上面的处理还存在以下的问题待解决的：

1）读取表格部分：

a) 表格中如果再含有表格，POI无法进行很好的区分，比如，有一个两行两列的表格中，第一行第一列中又包含了一个两行两列的表格，那POI会将此表格解释成：第一行为2+2*2 = 6个单元格；第二行为2个单元格，这样解释出来的表格就很怪异了。

b) 表格中有果有合并单格的情况，程序暂未做此处理（后续看不能优化），表格也很怪异。

c) 表格中如果有图像，程序没有做相应的处理。

2）读取图片部分：

a) 有部分wmf->png的方式有个别图片还是没有转换成功，会报异常，但没有影响整体的功能；

b) word有部分公式生成的图片无法识别模式，不知道是不是POI无法将其解释，还是其他原因，就是有文档，生成没有后缀的图片文件，且这部分文件无法读取，用图片工具也打不开，暂时未找到很好的解决方案。

3）读取word的目录：

在读取目录会出现将格式化符号也解释出来。

4）其他未知的一些问题，反正，就觉得用POI来解释word是件很坚苦的事情，如果全是文本还好，如果里面包含图片，表格，公式等这些对象的时候，POI就显得太弱了。

附：

1. wmf文件：

MicrosoftOffice 的剪贴画使用的就是这个格式。

Wmf是WindowsMetafile 的缩写，简称图元文件，它是微软公司定义的一种Windows平台下的图形文件格式。

wmf格式文件的特点如下：

1） wmf格式文件是MicrosoftWindows操作平台所支持的一种图形格式文件，目前，其它操作系统尚不支持这种格式，如Unix、Linux等。

2）与bmp格式不同，wmf格式文件是和设备无关的，即它的输出特性不依赖于具体的输出设备。

3）其图象完全由Win32 API所拥有的GDI函数来完成。

4） wmf格式文件所占的磁盘空间比其它任何格式的图形文件都要小得多。

5）在建立图元文件时，不能实现即画即得，而是将GDI调用记录在图元文件中，之后，在GDI环境中重新执行，才可显示图象。

6）显示图元文件的速度要比显示其它格式的图象文件慢，但是它形成图元文件的速度要远大于其它格式。

2. Batik介绍

Batik是使用svg格式图片来实现各种功能的应用程序以及Applet提供的一个基于java的工具包。

通过Batik,你可以在JAVA可以使用的地方操作SVG文档，您还可以在你的应用程序使用Batik模块来生成，处理和转码SVG图像。Batik很容易让基于Java的应用程序或小程序来处理SVG内容。例如，使用Batik的SVG的发生器模块，Java应用程序或小程序可以很轻松地导出SVG格式的图形到。用Batik的SVG的查看组件，应用程序或小程序可以很容易地集成SVG的浏览和交互功能。另一种可能性是使用Batik的模块转换成各种格式SVG的通过，如光栅图像（JPEG，PNG或TIFF格式）或其它矢量格式（EPS或PDF格式，后两者由于转码器由Apache FOP提供）。 Batik工程创建的目的是为开发者提供一系列可以结合或单独使用来支持特殊的svg解决方案的核心模块。模块主要有SVGParser,SVGGernerator,SVGDOM。Batik工程的其他目的是使它具有高度的扩展性。

（SVG的规范：可缩放矢量图形（SVG），是一个W3C的推荐标准。它定义了丰富的2D图形的XML语法，其中包括诸如透明度功能，几何形状，滤镜效果（阴影，灯光效果等），脚本和动画）

3.本实例相关的项目文件：点击打开链接

你可能感兴趣的:(J2EE学习)

情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
2019-12-22-22:30 涓涓1016
今天是冬至，写下我的日更，是因为这两天的学习真的是能量的满满，让我看到了自己，未来另外一种可能性，也让我看到了这两年这几年的过程中我所接受那些痛苦的来源。一切的根源和痛苦都来自于人生，家庭，而你的原生家庭，你的爸爸和妈妈，是因为你这个灵魂在那一刻选择他们作为你的爸爸和妈妈来的，所以你得接受他，你得接纳他，他就是因为他的存在而给你的学习和成长带来这些痛苦，那其实是你必然要经历的这个过程，当你去接纳的
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
阶段总结反思轻争
马上就要进入10月份了，今天做一下前段时间的总结和反思。前段时间，日更、英语、健身、护肤坚持的比较好。阅读、书法坚持的不好。1.中间被迫停更半个多月，其余时间一直在坚持日更挑战。偶尔也有不想写的时候，就做一下摘抄。因为阅读（输入）没跟上来，所以写作（输出）质量有待进一步加强。2.英语做到了一周至少学习5天，每次不少于30分钟，但是小班课没有跟上更新速度，下一步要争取利用零碎时间补听小班课。3.减肥
ARM驱动学习之基础小知识 JT灬新一 ARM 嵌入式 arm开发学习
ARM驱动学习之基础小知识•sch原理图工程师工作内容–方案–元器件选型–采购（能不能买到，价格）–原理图（涉及到稳定性）•layout画板工程师–layout（封装、布局，布线，log）（涉及到稳定性）–焊接的一部分工作（调试阶段板子的焊接）•驱动工程师–驱动，原理图，layout三部分的交集容易发生矛盾•PCB研发流程介绍–方案，原理图(网表)–layout工程师（gerber文件）–PCB板
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
ARM驱动学习之4小结 JT灬新一嵌入式 C++arm开发学习 linux
ARM驱动学习之4小结#include#include#include#include#include#defineDEVICE_NAME"hello_ctl123"MODULE_LICENSE("DualBSD/GPL");MODULE_AUTHOR("TOPEET");staticlonghello_ioctl(structfile*file,unsignedintcmd,unsignedlo
展现思维导图魅力，不断挖掘人生宝藏思维导图讲师Mandy
第13期最强思维导图训练营已经结束一周了，但是我依旧是感觉所有学员还在努力的学习，这些学员中有教师、学生、白领、公务员、宝妈等等，只要你努力，只要你想改变自己，任何行业，任何岗位都可以参与进来，28天足以让你见成效，在这28天中，我们的学员不仅仅是收获了一枚毕业证，最重要的是让自己的思维方式得到升级，今天的你为自己投资，明天的你就会感谢你今天的付出，我们来听一听来自13期最强思维导图训练营优秀学员
2019-3-23晨间日记红红火火小耳朵
今天是什么日子起床：7点40就寝：23点半天气：有太阳，不过一会儿出来一会儿进去特别清爽的凉意，还蛮舒服的心情：小激动要给女朋友过生日啦纪念日：田田女士过生日任务清单昨日完成的任务，最重要的三件事：1.英语一对一2.运动计划3.认真护肤习惯养成：调整状态周目标·完成进度英语七天打卡（5/7）轻课阅读（87/180）音标课（25/30）读书（福尔摩斯一章）学习·信息·阅读#英语课#Cookingte
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
教育用心灵温暖心灵
@陈春丽长期学习班冯倩。今天一早就听到说高职合并，取消中专教育的教育信息。感觉是虽然知道，再听还是吓一跳。国家重视职业教育为何还要取消中专技术学校的教育？再听高中就要进行技术教育了，一部分人学习好继续努力学习考大学，一部分人在高中就可以进行职业教育接受职业教育了还要中专技术教育学校干什么呢！a有些职业教育学校转型升级快，不是孩子上完给找工作，而是学校帮孩子创业，我觉得是不错的方向！新闻新你得实时更
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
学习“论语”-第59天春峰轩
12.14子张问政。子曰：“居之无倦，行之以忠。”子张问为政之道。孔子说：“在位尽职不懈怠，执行政令要忠诚。”12.15子曰：“博学于文，约之以礼，亦可以弗畔矣夫！”孔子说：“君子广泛地学习文献，并且用礼节约束自己，也就不会离经叛道了。”12.16子曰：“君子成人之美，不成人之恶。小人反是。”孔子说：“君子成全别人的好事，而不助长别人的坏处。小人则与此相反行事。”知识点:“成人之美，不成人之恶”贯
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
2019-01-19 王小康KK
姓名:王康公司:扬州市方圆建筑工程有限公司2018年3月16日～3月18日上海361期《六项精进》感谢二组学员【日精进打卡第307天】【知～学习】《六项精进》大纲3遍共862遍《大学》通篇3遍共860遍《六项精进》全书40页【经典名句】思想决定行为，行为决定习惯，习惯决定性格，性格决定命运。【行～实践】一、修身：（对自己个人）1、践行六项精进的理念。二、齐家：（对家庭和家人）1、和女朋友视频聊天。
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio