Windows与Linux下InputStream读取字节与字符的不同

近做了一个报文发送接收解析的客户端,发现了这样的问题: 
某程序: 
Java代码   
        Socket con = new Socket(ip, port);//一个socket
	InputStream socketIn = con.getInputStream();
        InputStreamReader isr=new InputStreamReader(socketIn, "UTF-8");
        while ((headchar = isr.read()) != -1) {// 读取报文头 用字符流来读取
				headres += (char) headchar;
			......//一些逻辑 处理报文头
			}

        ...
        //报文头读完了 获取了报文体的大小等内容 开始读报文体
        byte tempbuf[] = new byte[buffsize];
			int start = 0;
			int tem = -1;
        //用字节流来读报文体
			while ((tem = socketIn.read(tempbuf, start, buffsize)) != -1) {
				log.info("从"+start+"开始读"+buffsize);
				log.info("实际读取" + tem);
				if (tem < outparamsizes[i]) {
					start = start + tem;
					buffsize = buffsize - tem;
        ...//一些逻辑 处理报文体 读取完毕
        }


这样的程序,在windows下正常工作,再放到linux下,读完报文头开始读取报文体的时候,并没有从报文体的开头开始读取,而是丢失了报文体前面的一些数据,导致读不到足够的数据直到超时。 

经过一番调试和请教后发现原因:在linux下一个InputStream不能用字符流和字节流分段读取,因为linux下的字符由于utf8编码会多加几位,用字符读完报文头后其实就已经多读了许多位,再用字节读就丢掉多读的那部分了。 
因此,只要将读取报文头的部分也改成字节流读取就可以了 
Java代码  
while ((headchar = socketIn.read()) != -1) {
...}

你可能感兴趣的:(Windows与Linux下InputStream读取字节与字符的不同)