HTTP 头部的编码方式——ASCII编码

先说结果,http请求行、响应行的编码方式都为ASCII,这也是为什么需要对url进行url编码,将非ASCII字符转为ASCII字符。

我们知道在HTTP头部中传入的信息不会被url encode,那header头如果有非ASCII码,如中文字符等,会怎么被处理呢?

答案是,只有ASCII字符才能保证正常工作,在服务器、浏览器中被读出来,中文字符在被读取时可能会出错(取决于服务器自身读取数据的编码方式。)

HTTP 的规范中如此描述(3.2.4. Field Parsing):

ISO-8859-1 编码是单字节编码,向下兼容ASCII,其编码范围是0x00-0xFF,0x00-0x7F之间完全和ASCII一致,0x80-0x9F之间是控制字符,0xA0-0xFF之间是文字符号。

即 HTTP 头部的事实字符集乃是 US-ASCII 一个子集,所以HTTP 规范允许的字符集是 ISO-8859-1。

如果想在服务器支持HTTP头部有汉字,那么只好把可能包含中文的头部值进行 url编码,然后整体进行ISO-8859-1编码。

你可能感兴趣的:(HTTP,头部,请求头,编码,ASCII)