原文:http://blog.csdn.net/bhw98/archive/2003/03/27/19666.aspx
我们要对由ESTI制订的SMS规范有所了解。与我们讨论的短消息收发有关的规范主要包括GSM 03.38、GSM 03.40和GSM 07.05。前二者着重描述SMS的技术实现(含编码方式),后者则规定了SMS的DTE-DCE接口标准(AT命令集)。
一共有三种方式来发送和接收SMS信息:Block Mode, Text Mode和PDU Mode。Block Mode已是昔日黄花,目前很少用了。Text Mode是纯文本方式,可使用不同的字符集,从技术上说也可用于发送中文短消息,但国内手机基本上不支持,主要用于欧美地区。PDU Mode被所有手机支持,可以使用任何字符集,这也是手机默认的编码方式。Text Mode比较简单,而且不适合做自定义数据传输,我们就不讨论了。下面介绍的内容,是在PDU Mode下发送和接收短消息的实现方法。原文:http://blog.csdn.net/bhw98/archive/2003/03/27/19666.aspx
我们要对由ESTI制订的SMS规范有所了解。与我们讨论的短消息收发有关的规范主要包括GSM 03.38、GSM 03.40和GSM 07.05。前二者着重描述SMS的技术实现(含编码方式),后者则规定了SMS的DTE-DCE接口标准(AT命令集)。
一共有三种方式来发送和接收SMS信息:Block Mode, Text Mode和PDU Mode。Block Mode已是昔日黄花,目前很少用了。Text Mode是纯文本方式,可使用不同的字符集,从技术上说也可用于发送中文短消息,但国内手机基本上不支持,主要用于欧美地区。PDU Mode被所有手机支持,可以使用任何字符集,这也是手机默认的编码方式。Text Mode比较简单,而且不适合做自定义数据传输,我们就不讨论了。下面介绍的内容,是在PDU Mode下发送和接收短消息的实现方法。
PDU串表面上是一串ASCII码,由‘0’-‘9’、 ‘A’-‘F’这些数字和字母组成。它们是8位字节的十六进制数,或者BCD码十进制数。PDU串不仅包含可显示的消息本身,还包含很多其它信息,如SMS服务中心号码、目标号码、回复号码、编码方式和服务时间等。发送和接收的PDU串,结构是不完全相同的。我们先用两个实际的例子说明PDU串的结构和编排方式。
例1 发送:SMSC号码是+8613800250500,对方号码是13851872468,消息内容是“Hello!”。从手机发出的PDU串可以是
08 91 68 31 08 20 05 05 F0 11 00 0D 91 68 31 58 81 27 64 F8 00 00 00 06 C8 32 9B FD 0E 01
对照规范,具体分析:
分段 | 含义 | 说明 |
08 | SMSC地址信息的长度 | 共8个八位字节(包括91) |
91 | SMSC地址格式(TON/NPI) | 用国际格式号码(在前面加‘+’) |
68 31 08 20 05 05 F0 | SMSC地址 | 8613800250500,补‘F’凑成偶数个 |
11 | 基本参数(TP-MTI/VFP) | 发送,TP-VP用相对格式 |
00 | 消息基准值(TP-MR) | 0 |
0D | 目标地址数字个数 | 共13个十进制数(不包括91和‘F’) |
91 | 目标地址格式(TON/NPI) | 用国际格式号码(在前面加‘+’) |
68 31 58 81 27 64 F8 | 目标地址(TP-DA) | 8613851872468,补‘F’凑成偶数个 |
00 | 协议标识(TP-PID) | 是普通GSM类型,点到点方式 |
00 | 用户信息编码方式(TP-DCS) | 7-bit编码 |
00 | 有效期(TP-VP) | 5分钟 |
06 | 用户信息长度(TP-UDL) | 实际长度6个字节 |
C8 32 9B FD 0E 01 | 用户信息(TP-UD) | “Hello!” |
分段 | 含义 | 说明 |
08 | 地址信息的长度 | 个八位字节(包括91) |
91 | SMSC地址格式(TON/NPI) | 用国际格式号码(在前面加‘+’) |
68 31 08 20 05 05 F0 | SMSC地址 | 8613800250500,补‘F’凑成偶数个 |
84 | 基本参数(TP-MTI/MMS/RP) | 接收,无更多消息,有回复地址 |
0D | 回复地址数字个数 | 共13个十进制数(不包括91和‘F’) |
91 | 回复地址格式(TON/NPI) | 用国际格式号码(在前面加‘+’) |
68 31 58 81 27 64 F8 | 回复地址(TP-RA) | 8613851872468,补‘F’凑成偶数个 |
00 | 协议标识(TP-PID) | 是普通GSM类型,点到点方式 |
08 | 用户信息编码方式(TP-DCS) | UCS2编码 |
30 30 21 80 63 54 80 | 时间戳(TP-SCTS) | 2003-3-12 08:36:45 +8时区 |
06 | 用户信息长度(TP-UDL) | 实际长度6个字节 |
4F 60 59 7D 00 21 | 用户信息(TP-UD) | “你好!” |
若基本参数的最高位(TP-RP)为0,则没有回复地址的三个段。从Internet上发出的短消息常常是这种情形。
注意号码和时间的表示方法,不是按正常顺序顺着来的,而且要以‘F’将奇数补成偶数。
Q 上面两例中已经出现了7-bit和UCS2编码,请详细介绍一下这些编码方式?
A 在PDU Mode中,可以采用三种编码方式来对发送的内容进行编码,它们是7-bit、8-bit和UCS2编码。7-bit编码用于发送普通的ASCII字符,它将一串7-bit的字符(最高位为0)编码成8-bit的数据,每8个字符可“压缩”成7个;8-bit编码通常用于发送数据消息,比如图片和铃声等;而UCS2编码用于发送Unicode字符。PDU串的用户信息(TP-UD)段最大容量是140字节,所以在这三种编码方式下,可以发送的短消息的最大字符数分别是160、140和70。这里,将一个英文字母、一个汉字和一个数据字节都视为一个字符。
需要注意的是,PDU串的用户信息长度(TP-UDL),在各种编码方式下意义有所不同。7-bit编码时,指原始短消息的字符个数,而不是编码后的字节数。8-bit编码时,就是字节数。UCS2编码时,也是字节数,等于原始短消息的字符数的两倍。如果用户信息(TP-UD)中存在一个头(基本参数的TP-UDHI为1),在所有编码方式下,用户信息长度(TP-UDL)都等于头长度与编码后字节数之和。如果采用GSM 03.42所建议的压缩算法(TP-DCS的高3位为001),则该长度也是压缩编码后字节数或头长度与压缩编码后字节数之和。
下面以一个具体的例子说明7-bit编码的过程。我们对英文短信“Hello!”进行编码:
将源串每8个字符分为一组(这个例子中不满8个)进行编码,在组内字符间压缩,但每组之间是没有什么联系的。