通过检查服务器头部信息可以知道其HTTP状态码。下面七个状态码(200|301|302|304|307|404|410)对于搜索引擎的内容抓取和收录来说非常重要,同样的对于SEO研究来说也很重要。必要时请确认你的URI可以返回适当的状态码,而不会被搜索引擎惩罚。
26
常见HTTP状态码
初始的请求已经接受,客户应当继续发送请求的其余部分
服务器将遵从客户的请求转换到另外一种协议
一切正常,对GET和POST请求的应答文档跟在后面
服务器已经创建了文档,Location头给出了它的URL。
已经接受请求,但处理尚未完成。
文档已经正常地返回,但一些应答头可能不正确,因为使用的是文档的拷贝
没有新文档,浏览器应该继续显示原来的文档。如果用户定期地刷新页面,而Servlet可以确定用户文档足够新,这个状态代码是很有用的
没有新的内容,但浏览器应该重置它所显示的内容。用来强制浏览器清除表单输入内容
客户发送了一个带有Range头的GET请求,服务器完成了它
客户请求的文档可以在多个位置找到,这些位置已经在返回的文档内列出。如果服务器要提出优先选择,则应该在Location应答头指明。
客户请求的文档在其他地方,新的URL在Location头中给出,浏览器应该自动地访问新的URL。
类似于301,但新的URL应该被视为临时性的替代,而不是永久性的。
类似于301/302,不同之处在于,如果原来的请求是POST,Location头指定的重定向目标文档应该通过GET提取
客户端有缓冲的文档并发出了一个条件性的请求(一般是提供If-Modified-Since头表示客户只想比指定日期更新的文档)。服务器告诉客户,原来缓冲的文档还可以继续使用。
客户请求的文档应该通过Location头所指明的代理服务器提取
和302(Found)相同。许多浏览器会错误地响应302应答进行重定向,即使原来的请求是 POST,即使它实际上只能在POST请求的应答是303时才能重定向。由于这个原因,HTTP 1.1新增了307,以便更加清除地区分几个状态代码: 当出现303应答时,浏览器可以跟随重定向的GET和POST请求;如果是307应答,则浏览器只能跟随对GET请求的重定向。
请求出现语法错误。
客户试图未经授权访问受密码保护的页面。应答中会包含一个WWW-Authenticate头,浏览器据此显示用户名字/密码对话框,然后在填写合适的Authorization头后再次发出请求。
资源不可用。
无法找到指定位置的资源
请求方法(GET、POST、HEAD、Delete、PUT、TRACE等)对指定的资源不适用。
指定的资源已经找到,但它的MIME类型和客户在Accpet头中所指定的不兼容
类似于401,表示客户必须先经过代理服务器的授权。
在服务器许可的等待时间内,客户一直没有发出任何请求。客户可以在以后重复同一请求。
通常和PUT请求有关。由于请求和资源的当前状态相冲突,因此请求不能成功。
所请求的文档已经不再可用,而且服务器不知道应该重定向到哪一个地址。它和404的不同在于,返回407表示文档永久地离开了指定的位置,而404表示由于未知的原因文档不可用。
服务器不能处理请求,除非客户发送一个Content-Length头。
请求头中指定的一些前提条件失败
目标文档的大小超过服务器当前愿意处理的大小。如果服务器认为自己能够稍后再处理该请求,则应该提供一个Retry-After头
URI太长
服务器不能满足客户在请求中指定的Range头
服务器遇到了意料不到的情况,不能完成客户的请求
服务器不支持实现请求所需要的功能。例如,客户发出了一个服务器不支持的PUT请求
服务器作为网关或者代理时,为了完成请求访问下一个服务器,但该服务器返回了非法的应答
服务器由于维护或者负载过重未能应答。例如,Servlet可能在数据库连接池已满的情况下返回503。服务器返回503时可以提供一个Retry-After头
由作为代理或网关的服务器使用,表示不能及时地从远程服务器获得应答
服务器不支持请求中所指明的HTTP版本
注:
v0.15 增加reCAPTCHA验证,防止spam。 2008-02-20
v0.12 修正一个已知问题,因某些服务器不支持直接获取header而返回403错误。 2008.02.14
v0.11 增加了代理;增加判断跳转的路径。 2008.02.11
v0.10 改进循环机制,最多可以检查连续五次跳转。 2008.02.05
v0.03 可以检查两次跳转。 2008.02.04
v0.02 可以检测所有的状态值。比如301永久重定向,302临时重定向,404错误,或者是200正常等。
v0.01 可以检测网址或者网页的部分服务器返回之状态值