Bencode编码

DHT网络中,用的都是bencode这种编码格式。
bencode有4种数据类型:string,integer,listdictionary

  1. string:字符是以这种方式编码的: <字符串长度>:<字符串>

    如,"hello":5:hello
    
  2. integer:整数是以这种方式编码的: i<整数>e

    如,1234:i1234e
    
  3. list:列表是以这种方式编码的: l[数据1][数据2][数据3][…]e

    如,["hello","world",1234]
    1. "hello"编码:5:hello
    2. "world"编码:5:world
    3. 1234编码:i1234e
    4. 最终编码:l5:hello5:worldi1234ee
    
  4. dictionary:字典是以这种方式编码的: d[key1][value1][key2][value2][…]e,其中key必须是string而且按照字母顺序排序

    如,{"name":"jisen","coin":"btc","balance":1000}
    1. "name":"jisen"编码:4:name5:jisen
    2. "coin":"btc"编码:4:coin3:btc
    3. "balance":1000编码:7:balancei1000e
    4. 最终编码,按key的字母排序:d7:balancei1000e4:coin3:btc4:name5:jisene
    

KRPC协议请求的bencode编码

接下来来看看DHT网络中KRPC协议请求的bencode编码。

每条KRPC消息都包含t关键字,它是一个代表了 transaction ID 的字符串类型;还应包含y,它由一个字节组成,表明这个消息的类型。y对应的值有三种类型:q表示请求,r表示回复,e表示错误。

  • q:请求,包含2个附加的关键字qa。关键字q是字符串类型,包含了请求的方法名字。关键字 a一个字典类型包含了请求所附加的参数。

  • r:回复,包含了一个附加的关键字r。关键字r是字典类型,包含了返回的值。发送回复消息是在正确解析了请求消息的基础上完成的。

  • e:错误,包含一个附加的关键字e。关键字e是列表类型。第一个元素是数字类型,表明了错误码。第二个元素是字符串类型,表明了错误信息。当一个请求不能解析或出错时,错误包将被发送。下表描述了可能出现的错误码:

    • 201 一般错误
    • 202 服务错误
    • 203 协议错误,比如不规范的包,无效的参数,或者错误的token
    • 204 未知方法

ping

Ping请求包含一个参数id,它是一个20字节的字符串包含了发送者网络字节序的节点ID。对应的ping回复也包含一个参数id,包含了回复者的节点ID。

ping Query的报文为:{"t":"tx1", "y":"q", "q":"ping", "a":{"id":"abcdefghij0123456789"}}

bencode编码过程:
1. "t":"tx1"编码:1:t3:tx1
2. "y":"q"编码:1:y1:q
3. "q":"ping"编码:1:q4:ping
4. "a":{"id":"abcdefghij0123456789"}编码:1:ad2:id20:abcdefghij0123456789e
5. 最终编码,按key的字母排序:d1:ad2:id20:abcdefghij0123456789e1:q4:ping1:t3:tx11:y1:qe

Response的报文为:{"t":"tx1", "y":"r", "r": {"id":"mnopqrstuvwxyz123456"}}

bencode编码过程:
1. "t":"tx1"编码:1:t3:tx1
2. "y":"r"编码:1:y1:r
3. "r": {"id":"mnopqrstuvwxyz123456"}编码:1:rd2:id20:mnopqrstuvwxyz123456e
4. 最终编码,按key的字母排序:d1:rd2:id20:mnopqrstuvwxyz123456e1:t3:tx11:y1:re

find_node

find_node被用来查找给定ID的节点的联系信息。find_node请求包含2个参数,第一个参数是id,包含了请求节点的ID。第二个参数是target,包含了请求者正在查找的节点的ID。当一个节点接收到了find_node的请求,他应该给出对应的回复,回复中包含2个关键字idnodes,nodes是字符串类型,包含了被请求节点的路由表中最接近目标节点的K(8)个最接近的节点的联系信息。

find_node Query的报文:{"t":"tx1", "y":"q", "q":"find_node", "a": {"id":"abcdefghij0123456789", "target":"mnopqrstuvwxyz123456"}}

bencode编码过程:
1. "t":"tx1"、"y":"q"编码同上:1:t3:tx1、1:y1:q
2. "q":"find_node"编码:1:q9:find_node
3. "a": {"id":"abcdefghij0123456789", "target":"mnopqrstuvwxyz123456"}编码:1:ad2:id20:abcdefghij01234567896:target20:mnopqrstuvwxyz123456e
4. 最终编码:d1:ad2:id20:abcdefghij01234567896:target20:mnopqrstuvwxyz123456e1:q9:find_node1:t3:tx11:y1:qe

Response的报文:{"t":"tx1", "y":"r", "r": {"id":"0123456789abcdefghij", "nodes": "def456..."}}

bencode编码:d1:rd2:id20:0123456789abcdefghij5:nodes9:def456...e1:t3:tx11:y1:re

get_peers

get_peers请求包含2个参数。第一个参数是id,包含了请求节点的ID。第二个参数是info_hash,它代表torrent文件的infohash。如果被请求的节点有对应info_hash的peers,他将返回一个关键字values,这是一个列表类型的字符串。每一个字符串包含了"CompactIP-address/portinfo"格式的peers信息。如果被请求的节点没有这个infohash的peers,那么他将返回关键字nodes,这个关键字包含了被请求节点的路由表中离info_hash最近的K个节点,使用"Compactnodeinfo"格式回复。在这两种情况下,关键字token都将被返回。token关键字在今后的annouce_peer请求中必须要携带。token是一个短的二进制字符串。

get_peers Query的报文:{"t":"aa", "y":"q", "q":"get_peers", "a": {"id":"abcdefghij0123456789", "info_hash":"mnopqrstuvwxyz123456"}}

bencode编码:d1:ad2:id20:abcdefghij01234567899:info_hash20:mnopqrstuvwxyz123456e1:q9:get_peers1:t2:aa1:y1:qe

Response with peers的报文:{"t":"aa", "y":"r", "r": {"id":"abcdefghij0123456789", "token":"aoeusnth", "values": ["axje.u", "idhtnm"]}}

bencode编码:d1:rd2:id20:abcdefghij01234567895:token8:aoeusnth6:valuesl6:axje.u6:idhtnmee1:t2:aa1:y1:re

Response with closest nodes的报文:{"t":"aa", "y":"r", "r": {"id":"abcdefghij0123456789", "token":"aoeusnth", "nodes": "def456..."}}

bencode编码:d1:rd2:id20:abcdefghij01234567895:nodes9:def456...5:token8:aoeusnthe1:t2:aa1:y1:re

announce_peer

announce_peer包含4个参数。第一个参数是id,包含了请求节点的ID;第二个参数是info_hash;第三个参数是port,包含了整型的端口号,表明peer在哪个端口下载;第四个参数数是token,这是在之前的get_peers请求中收到的回复中包含的。收到announce_peer请求的节点必须检查这个token与之前我们回复给这个节点get_peers的token是否相同。如果相同,那么被请求的节点将记录发送announce_peer节点的IP和请求中包含的port端口号在peer联系信息中对应的infohash下。

announce_peers Query的报文:{"t":"aa", "y":"q", "q":"announce_peer", "a": {"id":"abcdefghij0123456789", "info_hash":"mnopqrstuvwxyz123456", "port": 6881, "token": "aoeusnth"}}

bencode编码:d1:ad2:id20:abcdefghij01234567899:info_hash20:mnopqrstuvwxyz1234564:porti6881e5:token8:aoeusnthe1:q13:announce_peer1:t2:aa1:y1:qe

Response的报文:{"t":"aa", "y":"r", "r": {"id":"mnopqrstuvwxyz123456"}}

bencode编码:d1:rd2:id20:mnopqrstuvwxyz123456e1:t2:aa1:y1:re

你可能感兴趣的:(Bencode编码)