记录报错:Jsoup爬虫 [Torg.jsoup.HttpStatusException: HTTP error fetching URL. Status=500,,URL=http://xxx

控制台信息如下:
org.jsoup.HttpStatusException: HTTP error fetching URL. Status=500, URL=“http://XXXXXX/xxxxx/xxxxxxx/index.jhtml”
at org.jsoup.helper.HttpConnection $ Response.execute(HttpConnection.java:679)
at org.jsoup.helper.HttpConnection $ Response.execute(HttpConnection.java:628)
at org.jsoup.helper.HttpConnection.execute(HttpConnection.java:260)
at org.jsoup.helper.HttpConnection.post(HttpConnection.java:255)
at com.zz.spiders.test.main(test.java:15)

jsoup爬虫报错记录

这边有搜索很多,大部分都说参数错误就是字符的问题,
所以先请大家先检查一下自己绑定的参数。遇到了中文最好编码一下
URLEncoder.encode()
URLDecoder.decode()

但是我那路径什么参数都没有,所以肯定行不通
纯粹就是一个jhtml , 找了半天最后自己碰运气解决了
原本获得Document 时是用的post请求。
Document document = connect.followRedirects(true).timeout(60000).post();
改成get就能拿到对应的Document了。
Document document = connect.followRedirects(true).timeout(60000).get();

你可能感兴趣的:(Jsoup,爬虫)