无法获取下载文件名的无奈之举

最近,领导又让我发挥余热,开发些网页操作工具。其中涉及到需要下载文件,以前也研究过webbrower截获下载并接管下载,不过太麻烦了,而且我只是针对特定网页拦截下载,重新刮资料,从这里(使用没有 url 的 WebBrowser 自动下载文件)获得启发:

--------------------------------------------------------------------------------------------------------------------------

我认为你甚至应该阻止下载对话框的显示。 这可能是一种方法:

  • Javascript 代码使您的 WebBrowser 控件导航到特定的 Url(这会导致下载对话框出现)

  • 为了防止 WebBrowser 控件实际导航到此 Url,请将事件处理程序附加到导航事件。

  • 在您的导航事件中,您必须分析这是否是您想要停止的实际导航操作(这是下载 URL,也许检查文件扩展名,必须有可识别的格式)。 使用 WebBrowserNavigatingEventArgs.Url 来执行此操作。

  • 如果这是正确的 Url,请通过设置 WebBrowserNavigatingEventArgs.Cancel 属性停止导航。

  • 使用 HttpWebRequest 或 WebClient 类继续自行下载

查看此页面以获取有关该事件的更多信息:
http://msdn.microsoft.com/en -us/library/system.windows.forms.webbrowser.navigating.aspx

=========================================================================

实现了拦截下载触发并获得了下载url,通过url及Webclient就可以下载文件了,但无法通过ResponseHeaders获取下载文件名,原因是无法获取响应标头Content-Disposition,相关的原因是

------------------------------------------------------------------------------------------------------------------------------

Access-Control-Expose-Headers

响应标头 Access-Control-Expose-Headers 允许服务器指示那些响应标头可以暴露给浏览器中运行的脚本,以响应跨源请求。

默认情况下,仅暴露 CORS 安全列表的响应标头 (en-US)。如果想要让客户端可以访问到其他的标头,服务器必须将它们在 Access-Control-Expose-Headers 里面列出来。

CORS-safelisted response header

CORS-safelisted response header is an HTTP header in a CORS response that it is considered safe to expose to client scripts. Only safelisted response headers are made available to web pages.

By default, the safelist includes the following response headers:

  • Cache-Control
  • Content-Language
  • Content-Length
  • Content-Type
  • Expires
  • Last-Modified
  • Pragma

 =========================================================================

无奈的解决办法:文件名随便定了,关键是文件后缀(也就是文件类型),这涉及到文件的打开方式,可以通过Content-Type获取文件类型,下载完成后修改文件的后缀即可。

最后发现,对简单的下载没有问题,对需要用户验证授权的下载,无效,而且网上通过cookie方式解决的办法对我也遇到的问题也无效,cookie返回空,测试过其他网页,cookie返回非空,说明获取cookie方法没有问题,是网站安全导致没办法。只能继续走回原来复杂的办法(问题解决):VB.net webbrowser 自定义下载接口实现

你可能感兴趣的:(1024程序员节)