Asp.net中将Word文件转换成HTML的方法

本文所述为一个Asp.net实现将Word转换为HTML的功能,其关键代码如下:

//存放word文件的完整路径
 string wordPath = Server.MapPath("/word/test.doc");
 //存放html文件的完整路径
 string htmlPath = Server.MapPath("/html/test.html");
 //上传word文件, 由于只是做示例,在这里不多做文件类型、大小、格式以及是否存在的判断
 FileUpload1.SaveAs(wordPath);
 #region 文件格式转换
 //请引用Microsoft.Office.Interop.Word
 ApplicationClass word = new ApplicationClass();
Type wordType = word.GetType();
Documents docs = word.Documents;

 //打开文件
 Type docsType = docs.GetType();
 object fileName = wordPath; 
 //"f:\\cc.doc";
 Document doc =(Document)docsType.InvokeMember("Open", BindingFlags.InvokeMethod, null, (object)docs, new Object[] { fileName, true, true});

 //判断与文件转换相关的文件是否存在,存在则删除。(这里,最好还判断一下存放文件的目录是否存在,不存在则创建)
 if(File.Exists(htmlPath)) { File.Delete(htmlPath); }
 //每一个html文件,有一个对应的存放html相关元素的文件夹(html文件名.files)
 if(Directory.Exists(htmlPath.Replace(".html" ,".files")))  
 { 
  Directory.Delete(htmlPath.Replace(".html", ".files"), true);
 };

 //转换格式,调用word的“另存为”方法
 Type docType =doc.GetType();
 object saveFileName = htmlPath; 
 //"f:\\aaa.html";
 docType.InvokeMember("SaveAs", BindingFlags.InvokeMethod, null, doc, new object[] { saveFileName, WdSaveFormat.wdFormatHTML });
 //退出 Word
 wordType.InvokeMember("Quit", BindingFlags.InvokeMethod, null, word, null);
 #endregion

上述代码,在.net framework4.0 中,可能会出一编译错误,如下所示:
无法嵌入互操作类型“……”,请改用适用的接口

经过查阅资料,找到解决方案如下:
选中项目中引入word的dll,鼠标右键,选择属性,把“嵌入互操作类型”设置为False。

该实例完整代码点击此处本站下载。

你可能感兴趣的:(Asp.net中将Word文件转换成HTML的方法)