这两天在写爬虫,需要iconv来转换字符编码,昨天在解决一个不存在的问题。。
嗯,我的意思是这个问题是别人的问题,不是我的问题。
Iconv.iconv("UTF-8//IGNORE","GB18030//IGNORE",str)居然还会出错导致程序中断。但是我一直没有注意到出错的时候没有输出任何ruby异常,而是只显示一个类似这样的字符串"\277"。搜索了一整天没有结果,后来仔细一想,感觉输出不太对劲,会不会是iconv底层c那部分的问题?于是换到ubuntu下用ree1.8.7来试,结果就没问题了……
========================================================
另外还有一个奇怪的问题……
begin
@topic_page = @topic_page.link_with(:text => "#{@page}").click
rescue Net::HTTPInternalServerError
retry
end
这里居然还会抛Net::HTTPInternalServerError,真是不合逻辑啊不合逻辑……
=======================================================
郁闷了,搞了半天,Net::HTTPInternalServerError居然不是一个Error,不是StandardError的子类。
自己启动了个服务器,在articles controller的index方法里写个raise '',再用以下代码访问:
require 'mechanize'
agent=WWW::Mechanize.new
begin
page = agent.get 'http://localhost:3000/admin/articles'
rescue =>err
puts "#{err.class}##{err}"
end
输出:WWW::Mechanize::ResponseCodeError#500 => Net::HTTPInternalServerError
原来如此啊....rake任务打印出的异常信息全都不带类名么?这样前面第1个错误的解决也是歪打正着了……
改个加强型的,哇哈哈哈哈:
def self.access(target)
begin
if target.respond_to? 'click'
url = target.href
target.click
else
url = target
@@agent.get(target)
end
rescue WWW::Mechanize::ResponseCodeError => err
#FIXME: puts到时候改为log
puts "#{err}, caused by accessing: #{url}"
sleep 10
retry
end
end