无论是TCP还是UDP通过代理,首先要同代理取得联系。为了能够确保在第一阶段顺利确保数据传输,协议规定客户端采用TCP方式连接联系代理服务器。
一旦客户同代理的1080端口连接上,客户首先要发送一个版本标识/方法选择的TCP报文给代理服务器,具体格式为:
版本号(1字节) | 可供选择的认证方法(1字节) | 方法序列(1-255个字节长度)
如果是socks4协议,版本号就是0x04,但是这里是支持UDP的Socks5,所以是字节0x05。此说明对于后面的报文格式解释的版本部分也都适用。
Socks协议定义了0-255种通过代理的认证方法:
0x00 无验证需求
0x01 通用安全服务应用程序接口(GSSAPI)
0x02 用户名/密码(USERNAME/PASSWORD)
0x03 至 X'7F' IANA 分配(IANA ASSIGNED)
0x80 至 X'FE' 私人方法保留(RESERVED FOR PRIVATE METHODS)
0xFF 无可接受方法(NO ACCEPTABLE METHODS)
显然,无论是发起Socks请求的客户端还是负责转发Socks数据的代理都不可能完全实现所有的(起码目前还没有)方法,所以客户端需要把自己能够支持的方法列出来供代理服务器选择。如果支持无验证,那么此报文的字节序列就为:0x05 0x01 0x00,其中的0x01表示客户端只支持一种验证,0x00表示能够支持的方法是编号为0x00的(无验证)的方法。如果客户端还支持用户名/密码的验证方式,那么报文就应当是:0x05 0x02 0x00 0x02。
代理接收到客户的请求,会根据自身系统的实现返回告诉客户验证采用哪一种方法,返回的保文格式为:
版本号 | 服务器选定的方法
如果服务器仅支持无验证的验证方法,它返回字节序列:0x05 0x00。客户端同代理的数据报文的来回应答就是Socks协议的验证方法选择阶段。
接下来就是根据选择的方法来,验证客户身份了。虽然我们这里不需要验证,但是还是简单讲一下0x02的用户名/口令的验证客户端发送报文格式:
0x01 | 用户名长度(1字节)| 用户名(长度根据用户名长度域指定) | 口令长度(1字节) | 口令(长度由口令长度域指定)
不清楚为什么报文的首字节是0x01(按照惯例应当是0x05)。整个报文长度根据用户名和口令的实际长度决定。用户名和口令都不需要以’’结束。服务器会根据提供的信息进行验证,返回如下的报文字节序列映像为:
0x01 | 验证结果标志
验证结果标志可以为:0x00 验证通过,其余均表示有故障,不可以继续下一步的协议步骤。
在通过了验证步骤之后,接下来就是确定UDP传输的端口了。这里面需要确定两个重要的端口:1、客户端发送UDP数据的本机端口,一方面可以为发送数据指定端口,另一方面告诉代理,如果有数据返回,就传递给该端口,构成一个UDP传输回路。2、代理想在哪个端口接收客户发送的UDP数据报,作为对外UDP Socket的申请方,双方协商确定一个端口后,可以持续通过此端口向外部主机发送数据,也可以通过此端口由代理接收外部主机发回的UDP数据,再通过此端口发给UDP发送请求客户端。客户端会按照以下格式发送TCP数据字节序列:
协议版本 | Socks命令 | 保留字节 | 地址类型 | 特定地址 | 特定端口
Socks命令有3种:CONNECT (编号0x01) BIND (0x02) UDP(编号0x03)
保留字节长度1,为0x00
地址类型有3种:
0X01 该地址是IPv4地址,长4个8bit字节。
0X03 该地址包含一个完全的域名。第一个8bit字节包含了后面名称的8bit的数目,没有中止的’’。
0X04 该地址是IPv6地址,长16个8bit字节。
特定地址一般对于多IP的主机有意义,如果不是或者不关心哪一个IP发起UDP数据传输,就可以填0。0。0。0,地址类型选择0x01。比较重要的就是UDP传输将要从哪一个UDP端口发起。一般为了避免因为硬性指定一个端口导致引起冲突,会首先生成一个UDP套接字,用生成的套接字既定端口来作为自己传输UDP的端口,并通过此步骤告知代理服务器。譬如临时生成一个UDP套接字,UDP选择端口2233作为传输UDP数据的本地端口,那么此报文就为:0x05 0x03 0x00 0x00 0x00 0x00 0x00 0x08 0xb9 其中0x08 0xb9换算成10进制就是2233。
代理服务器会根据自己的端口占用情况,给出一个有关代理服务器的端口的回复字节序列,告诉客户可以将UDP数据发送到此地址和端口中去,以实现UDP穿透代理。返回的字节序列为:
版本 | 代理的应答 | 保留1字节 | 地址类型 | 代理服务器地址 | 绑定的代理端口
代理的应答可以为值:
0X00 成功协商
0X01 常见的Socks故障
0x02 不允许连接
0X03 网络不可到达
0X04 主机不可到达
0X05 连接被重置
0X06 TTL 失效
0X07 命令不支持
0X08 地址类型不支持
0X09 一直到0xff都保留
代理的地址指客户端需要发给那一个IP,绑定的端口指代理将在哪一个端口上为客户接收数据并转发出去。地址类型、地址参照上面的解释。
通过以上的TCP协商几个步骤后,现在客户端明确了自己将需要发送的UDP数据发给代理服务器的某个IP的某个端口了。代理服务器也知道是哪一个IP发送数据报给自己,如果接收到由于转发此UDP数据报而从远端目标主机传回的数据报,他需要根据协议将收到的数据报返回给客户的特定端口。此特定端口就是此步骤中字节序列中绑定的代理端口
在传输UDP数据时,由于通过代理,所以需要按照一定的格式进行包装,在需要传送的数据之前添加一个报头,具体为:
保留2字节的0 | 是否数据报分段重组标志 | 地址类型 | 将要发到代理外的目标地址 | 远端目标主机的端口 | 需要通过代理传送出去的数据
是否数据报分段重组标志为0表示该数据报文是独立的不需要重新组合,其他的表示特定的序列号,以利于UDP报文整合。
这里的地址是最终接收此UDP数据的代理外的服务器地址,我们这个例子中就是192。168。0。250。端口就是8100。根据地址类型
例子: