转自:http://blog.csdn.net/dabing69221/article/details/17222595
【Java TCP/IP Soket】— 消息边界的问题解决
关于消息边界问题,在TCP套接字处理接收消息中尤为重要,所以大家一定要学会解决它!
场景:
当接收者试图从套接字中读取比消息本身更多的字节时,将可能发生两种情况:
1.如果套接字中没有其他消息,接收者将会阻塞等待,同时无法处理接收到的消息;如果发送者也在等待接收端的响应消息,则会形成死锁;
2.如果套接字中有其他消息,接收者会将后面消息的一部分甚至全部读到第一条消息中去,这将产生一些协议错误;
应用:
当我们使用TCP套接字时,处理“消息边界” 是一个重要的考虑因素;如果使用UDP套接字时,不存在这个问题,因为在DatagramPacket中存放的数据
有一个确定的长度(DatagramPacket.getLength()方法),接收者能够精确的知道“消息边界”(或消息结束位置)
现在介绍两个技术可以使接收者能够精确的找到“消息边界”(也就是消息的结束位置)
1. 基于定界符
消息的结束由一个唯一的标记指出,即发送者在传输消息后显示添加一个特殊标记。这个特殊标记不能在传输消息本身中出现。
注意:
(1)前提条件:
使用“基于定界符”的方法来解决消息边界问题时,消息本身不能包含有“定界符”,否则接收者将提前认为消息已经结束;
(2)特殊的实现:
使用Socket.close( )或Socket.shutdownOutput( ) 来实现“基于定界符”的方法:在“基于定界符”中有一个特殊情况是,可以用在TCP连接上传输的最后一个消息
上。 在发送完这个消息后,发送者就可以简单的关闭(使用socket.shutdownOutput()方法或socket.close()方法)发送端的TCP连接。接收者读取完这条消息
的最后一个字节后,将接收到一个流结束标记(即InputStream.read() 返回 -1),该标记指出了已经读取到流的末尾;
(2)应用场景:
“基于定界符”的方法通常用在“以文本方式编码的消息”中,不能用在“以二进制方式编码的消息”中(例如图片、MP3),其中最大的一个原因就是:接收者需要遍历
消息信息来查找“定界符”(定界符:其实就是使用一个特殊的字符或字符串来标识消息的结束)。假如这个消息信息是一个图片,你在图片(二进制文件)中去查找
一个“字符”合适吗?肯定不合适,二进制肯定不能与字符来进行比较;
2.显示长度
在变长字段或消息前附加一个固定大小的字段,用来指示该字段或消息中包含了多少字节;
注意:使用这种方式必须要知道消息的上限,但是,假如在无意间发送的消息超过了消息的上限,如果不处理妥当,将会发生消息丢失;
例子:
一.基于定界符的实现例子
1.使用“自定义定界符”,解决消息边界问题:
(1). 处理定界符的消息类
- public class DelimFramer
- {
- private static final int DELIMITER = '\n';
- /**
- * 添加成帧信息并将信息写入到输出流
- *
- * @param message
- * @param out
- * @throws IOException
- */
- public void frameMsg(byte[] message, OutputStream out) throws IOException
- {
- for (byte b : message)
- {
- /*
- * 注意:发送的消息本身不能包含定界符。如果存在,则抛出异常
- */
- if (b == DELIMITER)
- {
- throw new IOException("Message contains delimiter");
- }
- }
- out.write(message);
- out.write(DELIMITER);
- out.flush();
- }
- /**
- * 读入输入流,直到读取到了定界符,并返回定界符前面的所有字符
- *
- * 1.包含定界符的信息 2.不包含定界符的信息
- *
- * @return
- * @throws IOException
- */
- public byte[] nextMsg(InputStream in) throws IOException
- {
- ByteArrayOutputStream messageBuffer = new ByteArrayOutputStream();
- int nextByte;
- /*
- * 情况一:判断消息中是否包含定界符; 如果输入流读取到了定界符,则返回定界前面的所有字符(不包括定界符)
- */
- while ((nextByte = in.read()) != DELIMITER)
- {
- /*
- * 情况二:判断消息中是否不包含定界符;如果输入流读取到了-1(说明该消息中不包括定界符)
- */
- if (nextByte == -1)
- {
- /*
- * 判断BytaArrayOutputStream的缓冲区中是否有数据:
- * 1.如果没有数据:说明从该输入流中没有读取到消息,就到达输入流的末尾 ;
- * 2.如果有数据:说明从该输入流中读取的消息是一个不带分界符的非空消息;
- */
- if (messageBuffer.size() == 0)
- {
- return null;
- }
- else
- {
- throw new EOFException(
- "Non-empty message without delimiter");
- }
- }
- messageBuffer.write(nextByte);
- }
- return messageBuffer.toByteArray();
- }
- }
(2). TCP客户端类
- public class TCPClient
- {
- public static void main(String[] args) throws UnknownHostException,
- IOException
- {
- Socket client = new Socket(InetAddress.getLocalHost(), 8888);
- OutputStream output = client.getOutputStream();
- InputStream input = client.getInputStream();
- DelimFramer delimFramer = new DelimFramer();
- byte[] msg = new String("Hello").getBytes();
- // 发送消息
- delimFramer.frameMsg(msg, output);
- // 接收消息
- byte[] receiveByte = delimFramer.nextMsg(input);
- String receiveMsg = new String(receiveByte);
- System.out.println("Client receive msg:" + receiveMsg);
- input.close();
- output.close();
- client.close();
- }
- }
(3).TCP服务端类
- public class TCPServer
- {
- public static void main(String[] args) throws IOException
- {
- DelimFramer delimFramer = new DelimFramer();
- ServerSocket server = new ServerSocket(8888);
- OutputStream output;
- InputStream input;
- while (true)
- {
- Socket client = server.accept();
- System.out.println("Handing client at "
- + client.getRemoteSocketAddress());
- output = client.getOutputStream();
- input = client.getInputStream();
- byte[] msg = delimFramer.nextMsg(input);
- System.out.println("Server receive msg:" + new String(msg));
- delimFramer.frameMsg(msg, output);
- }
- }
- }
这个例子还有一个缺点,就是只考虑了“定界符”是单字节的情况,对于多字节的情况没有考虑。自己也没有找到什么好的办法,如果大家有知道的请回复一下。
2.使用定界符的“特殊的实现”(close( )或shutdownOutput( )方法), 解决消息边界问题:
(1)TCP客户端
- import java.io.ByteArrayOutputStream;
- import java.io.IOException;
- import java.io.InputStream;
- import java.io.OutputStream;
- import java.net.InetAddress;
- import java.net.Socket;
- import java.net.UnknownHostException;
- public class TestClient
- {
- public static void main(String[] args) throws UnknownHostException,
- IOException
- {
- byte[] msg = new String("Hello Server!").getBytes();
- Socket client = new Socket(InetAddress.getLocalHost(), 8888);
- OutputStream output = client.getOutputStream();
- InputStream input = client.getInputStream();
- output.write(msg);
- output.flush();
- client.shutdownOutput();
- ByteArrayOutputStream byteArray = new ByteArrayOutputStream();
- int readSize = 0;
- byte[] temp = new byte[1024];
- while ((readSize = input.read(temp)) != -1)
- {
- byteArray.write(temp, 0, readSize);
- }
- byte[] recvByte = byteArray.toByteArray();
- System.out.println("Client receive message:" + new String(recvByte));
- byteArray.close();
- input.close();
- output.close();
- client.close();
- }
- }
(2)TCP服务端
- import java.io.ByteArrayOutputStream;
- import java.io.IOException;
- import java.io.InputStream;
- import java.io.OutputStream;
- import java.net.ServerSocket;
- import java.net.Socket;
- public class TestServer
- {
- public static void main(String[] args) throws IOException
- {
- ServerSocket server = new ServerSocket(8888);
- byte[] msg = new String("Hello Client!").getBytes();
- while (true)
- {
- Socket client = server.accept();
- System.out.println("Handling clint at:"
- + client.getRemoteSocketAddress());
- InputStream input = client.getInputStream();
- OutputStream output = client.getOutputStream();
- ByteArrayOutputStream byteArrayOut = new ByteArrayOutputStream();
- byte[] temp = new byte[1024];
- int readSize = 0;
- while ((readSize = input.read(temp)) != -1)
- {
- byteArrayOut.write(temp, 0, readSize);
- }
- byte[] recvByte = byteArrayOut.toByteArray();
- System.out
- .println("Server receive message:" + new String(recvByte));
- output.write(recvByte);
- output.flush();
- client.shutdownOutput();
- output.close();
- input.close();
- }
- }
- }
注意:
使用该方法 适用于 客户端与服务端的两次握手通信,一般能够瞒住大部分业务逻辑需求。两次握手通信为:客户端发送消息 服务端接收、服务端发送消息 客户端接收;
如果要实现多次握手通信,请使用 “自定义定界符” 方式实现。
二. 显示长度的实现例子
前面已经说过,使用 “显示长度” 的方式必须要知道 “消息长度的上限”,所以我们可以使用DataInputStream类来读取消息长度,它提供了两个方法,分别为:
DataInputStream.readUnsignedByte( ): 读取此输入流的下一个字节并返回”无符号 8 位数“, 所以它的取值范围为:0 ~ 255 (2^8-1) , 所以, 消息长度上限为: 255;
DataInputStream.readUnsignedShort():读取此输入流的下两个字节并返回” 一个无符号 16 位整数“ , 所以它的取值范围为:0 ~ 65535 (2^16-1), 所以, 消息长度上限为: 65535;
(1). 处理定界符的消息类:
- public class LengthFramer implements Framer
- {
- public static final int MAXMESSAGELENGTH = 65535;
- public static final int BYTEMASK = 255;
- public static final int SHORTMASK = 65535;
- public static final int BYTESHTFT = 8;
- @Override
- public void frameMsg(byte[] message, OutputStream output)
- throws IOException
- {
- /**
- * 这里的接收端接收的消息长度上限为65535个byte,所以这里必须判断发送消息的长度上限。 如果超出消息长度上限,超出的部分会被忽略
- */
- if (message.length > MAXMESSAGELENGTH)
- {
- throw new IOException("message to long");
- }
- // 这里使用了Java中的移位运算与位运算,将发送的消息长度拆分为2个字节并发送(readUnsignedShort()方法:读取输入流的下两个字节,所以这里必须将消息长度拆分为2个字节发送)
- output.write((message.length >> BYTESHTFT) & BYTEMASK);
- output.write(message.length & BYTEMASK);
- output.write(message);
- output.flush();
- }
- @Override
- public byte[] nextMsg(InputStream input) throws IOException
- {
- int length;
- DataInputStream dataInput;
- try
- {
- /**
- * 使用readUnsignedShort()返回的最大值为65535,所以接收msg数组的长度最大为65535,所以,
- * 接收消息长度的上限为65535个字节
- */
- dataInput = new DataInputStream(input);
- length = dataInput.readUnsignedShort();
- }
- catch (EOFException e)
- {
- return null;
- }
- byte[] msg = new byte[length];
- dataInput.readFully(msg);
- return msg;
- }
- }
注意:
使用 “显示长度” 的方式 处理消息边界有一个弊端,就是必须要知道消息长度上限。但是,在实际应用中,我们发送的消息长度往往都在不经意间超出了消息长度,如果不处理妥当
这时候就会造成消息的丢失,所以,这个方法也不实用,大概了解一下吧。