网页转PDF档做法很多( Convert HTML to PDF in .NET )
这边纪录一下老外最多人加分的那篇做法,使用wkhtmtopdf (采GPL授权)可以省很多程式码
首先到官网http://code.google.com/p/wkhtmltopdf/downloads/list
找installer.exe下载,这边Demo我是下载wkhtmltopdf-0.9.9-installer.exe
下载完后执行安装它
选择要安装的路径
安装完成
(如果要解除安装的话,就到刚刚安装的资料夹下找uninstall.exe执行即可)
接着看它的原始使用方式
在安装路径下有个wkhtmltopdf.exe档
到命令提示字元(开始→执行→cmd)
输入
这边就抓中国MSDN论坛网页转PDF为例
按下Enter转换完成
打开刚刚转换完成的PDF档
该文字的地方就是文字,该图片的地方就是图片,该超连结的地方就是超连结
既然知道底层使用方式,那就可以使用
System.Diagnostics.Process.Start 方法(String, String)
第一个参数传执行档路径,第二个传参数(URL和PDF档的存放路径)
如下:
protected void Button1_Click( object sender, EventArgs e) |
{ |
//因为是两个argument,所以记得要空格 |
System.Diagnostics.Process.Start( @"D:\wkhtmltopdf\wkhtmltopdf.exe" , @" http://msdn.microsoft.com/zh-cn D:\myFileName.pdf" ); |
|
} |
此小工具不会像WinForm的WebBrowser控制项一样会共用IE浏览器的Cookie
而且要抓的网页来源不一定要URL,也可以像这样直接抓本机上的Html档转PDF
protected void Button1_Click( object sender, EventArgs e) |
{ |
System.Diagnostics.Process.Start( @"D:\wkhtmltopdf\wkhtmltopdf.exe" , @"D:\index.html D:\myFileName.pdf" ); |
} |
只是抓本机的Html转成PDF后,图片会不见这点要注意
相关讨论:
如何得知System.Diagnostics.Process.Start 完毕后的讯息?
国外讨论:
Calling wkhtmltopdf to generate PDF from HTML
另外GridView汇出PDF的话,请参考:
ASP.NET 轻松转GridView 资料转档到PDF - 使用iTextSharp
请注意使用iTextSharp预设不支援中文字和背景色
中文字的解决方案:GridView透过iTextSharp输出PDF中文问题
2011.11.29 好人做到底
把ASP.net C#的Code补完
using System; |
using System.Collections.Generic; |
using System.Linq; |
using System.Web; |
using System.Web.UI; |
using System.Web.UI.WebControls; |
/*要引用以下命名空间*/ |
using System.Diagnostics; |
using System.IO; |
public partial class _Default : System.Web.UI.Page |
{ |
//Button的Click事件(把Url的网页内容转成PDF) |
protected void btn_execute_Click( object sender, EventArgs e) |
{ |
//因为Web 是多执行绪环境,避免甲产生的文件被乙下载去,所以档名都用唯一 |
string fileNameWithOutExtention = Guid.NewGuid().ToString(); |
//执行wkhtmltopdf.exe |
Process p = System.Diagnostics.Process.Start( @"D:\wkhtmltopdf\wkhtmltopdf.exe" , @" http://msdn.microsoft.com/zh-cn D:\" + fileNameWithOutExtention + ".pdf") ; |
//若不加这一行,程式就会马上执行下一句而抓不到档案发生例外:System.IO.FileNotFoundException: 找不到档案''。 |
p.WaitForExit(); |
//把档案读进串流 |
FileStream fs = new FileStream( @"D:\" + fileNameWithOutExtention + ".pdf", FileMode.Open); |
byte [] file = new byte [fs.Length]; |
fs.Read(file, 0, file.Length); |
fs.Close(); |
//Response给用户端下载 |
Response.Clear(); |
Response.AddHeader( "content-disposition" , "attachment; filename=" +fileNameWithOutExtention+ ".pdf" ); //强制下载 |
Response.ContentType = "application/octet-stream" ; |
Response.BinaryWrite(file); |
|
} |
} |
2013.9.20 追记:
今天才发现此程式已经被包装成.dll,可以在.net程式码叫用:参考HTML转PDF -使用Pechkin套件 by黑暗执行绪
然后根据之前同事经验,直接使用wkhtmltopdf.exe产PDF,可能在64位元作业系统上产不出来。
在ASP.net MVC中使用的话,请见:[ASP.net MVC]在Web专案上使用Pechkin套件将网页转成PDF档