短信格式(sms)以及编码总结

短信开发指通过串口 at 命令驱动短信猫进行短信发送和接收操作。

 

 

AT 命令 :AT命令是驱动短信设备的标准工业命令,除了业界的标准之外,每个厂商可能会对其进行扩展,不过一般来说,标准命令应该够用,我在这里用的是西门子 MC39i ,有专门的 AT 命令文档。

 

一、短信猫操作分为三种模式 Block、Pdu Text

1Block 模式基本已经被 Pdu 模式取代,没有具体研究

2Text 模式比较简单,但是支持的设备不是很全,而且不能实现中文。

AT CGMF=1

AT CGMS= 13612344321 ,129 >Hello World!<^Z>

 

3Pdu 模式

Pdu 编码主要包括两个主要的部分,一是 pdu 串的整体数据格式,分别因为发送信息串和接收信息串而有区别,二是 pdu 中文本部分的编码,分别因为字符集而不同。

我们也可以这样来理解这个 pdu 编码的格式, sms 相当于一个协议栈,最简单的协议栈:

 

根据 gsm03.40 规范, sms 协议包括以下几层:

1 SM-AL :应用层。这个部分就是数据部分。

2 SM-TL :传输层。我们可以清楚的看到这里描述了主要的短信内容,包括发送号码,接收号码,信息类型,编码,数据报长度等等,这也是我们编程主要要面对的问题。

3 SM-RL :中继层。这个指的是短信在网关之间中继需要的协议。

4 SM-LL:链路层。

从上述描述中我们可以清楚的看到,我们编程主要集中于传输层

 

 

 

二、短信传送有三种编码 7 位, 8 位, UniCode

 

1、英文 7 位编码

这是 gsm 的默认编码方式

由于这样的移位,我们可以看到我们能发的最多英文字符等于: 140*8/7 = 160

2、数据 8 位编码

8-bit 编码通常用于发送数据消息,比如图片和铃声等;

3、中文 pdu 编码

发送中文时,必须用 UCS2 utf-16 )进行编码,最多可以发 140/2 70 个汉字。

UniCode 编码转换也比较简单,以中文为例,一个中文字符是两个字节,直接对高位字节和低位字节进行十六进制转换就可以了。如“欢迎”, UniCode 编码是 6B22 8FCE ,这同时也就是转换的结果,如果发送的串中有英文字符,那么在前面补全 00 以保证一个字符对应两个字节。

 

4、PDU 串的用户信息 (TP-UD) 段最大容量是 140 字节,所以在这三种编码方式下,可以发送的短消息的最大字符数分别是 160 、 140 和 70 。这里,将一个英文字母、一个汉字和一个数据字节都视为一个字符。

 

三、地址编码

短信发送中都会涉及到短信地址的问题,他们的编码规则是一致的 , 简单来说就是 BCD8421码编码。

如: 08 91  6808501505F0

08 :地址长度,(号码类型 + 号码长度) /2 的十六进制表示

91 :号码类型

683108501505F0 :号码,实际号码应为: +8613805515500 ,号码处理方法为 , 如果为 +86 开始 , + 号去掉 , 然后判断是否为偶数 , 不是在末尾补 F, 然后将奇数位和偶数位互换

 

四、编码示例

1、发送信息的 PDU 串:

用手机写一条短信息,发送手机号码为 13605696031 ,信息内容为“ Hello World! ”。通过执行 AT CMGL=2 可以读出此条信息。

 

AT+CMGL=2 {读未发短信息} +CMGL: 1,2,,24 {1表示信息个数,2表示未发信息,24表示信息总容量} 08 91 683108501505F0 11 00 0B 81 3106656930F1 0000FF 0B E8329BFD06DDDF723619 OK

 

下面分析这条信息:

08

短信息中心地址长度。(短信息中心号码类型 + 短信息中心号码长度 /2 的十六进制表示)

91

短信息中心号码类型, 91 TON/NPI TON/NPI 遵守 International/E.164 标准,指在号码前需加‘+’号 ; 此外还可有其他数值,但 91 最常用。

683108501505F0

短信息中心号码,是所使用的服务中心地址。由于位置上略有处理,实际号码应为: 8613805515500( 字母 F 意指长度减 1), 这是作者所在地 GSM 短信息中心的号码。 ( 号码处理方法为 , 如果为 +86 开始 , + 号去掉 , 然后判断是否为偶数 ,不是在末尾补 F, 然后将奇数位和偶数位互换 )

11

文件头字节 (header byte, 是一种 bitmask) 。这里 11 指正常地发送短信息。

00

信息参考号。( TP-MR

0D

被叫号码长度。被叫号码长度的十六进制表示。

81

被叫号码类型。

3106656930F1

被叫号码,也经过了移位处理,实际号码为 13605696031

00

协议标识 (TP-PID),是普通 GSM 类型,点到点方式

00

用户信息编码方式 (TP-DCS), 7-bit 编码( 08 : UCS2 编码)

FF

有效期 (TP-VP),短信的有效时间

0B

短信息长度

E8329BFD06DDDF723619

短信息内容“ Hello World! ”。

 

2、接收信息的 PDU 串

读取以上发送出来的短信,可以收到如下信息 ,

接受到来自 13600554267 的“欢迎PDU 串为: 08 91 683108503705F0 04 0D 91 683106504562F7 00 08 30507080635400 046B228FCE。

对以上的 PDU 串分析如下表

 

含义

说明

08

SMSC 地址信息的长度

共 8 个八位字节 ( 包括 91)

91

SMSC 地址格式 (TON/NPI)

用国际格式号码 ( 在前面加 ‘+’)

683108503705F 0

SMSC 地址

8613800573500 ,补 ‘F’ 凑成偶数个

04

基本参数 (TP-MTI/MMS/RP)

接收,无更多消息,有回复地址,如果为 00 ,就没有以下关于回复地址的三个段

0D

回复地址数字个数

共 13 个十进制数 ( 不包括 91 和 ‘F’)

91

回复地址格式 (TON/NPI)

用国际格式号码 ( 在前面加 ‘+’)

683106504562F 7

回复地址 (TP-RA)

8613600554267 ,补 ‘F’ 凑成偶数个

00

协议标识 (TP-PID)

是普通 GSM 类型,点到点方式

08

用户信息编码方式 (TP-DCS)

UCS2 编码(即中文)

30507080635400

时间戳 (TP-SCTS)

2003-5-7 08:36:45 +8 时区

04

用户信息长度 (TP-UDL)

实际长度 4 个字节

6B228FCE

用户信息 (TP-UD)

“ 欢迎 !”

 

五、接收短消息

一般有两种接模式

1 .AT+CNMI=2,1,0,0,0 接受并存到 SIM 串口接到以下信息: +CMTI:"SM",X AT+CMGR=X回车   (从X存储区读短消息) AT+CMGD=X回车   (从X存储区删除短消息) PDU状态: at+cmgf=0 OK +CMTI: "SM",1 at+cmgr=1 +CMGR: 0,,24 0891683108501705 F0240D91683157805300F50000502082000281000462F11804 OK 文本状态: +CMGR: "REC READ","+86 13750835005",,"05/02/28,0:20:18+00" bbc    OK 2 .AT+CNMI=2,2,0,0,0 接受并直接到串口 串口接受到以下信息: +CMT: "+8613501154105",,"01/09/13,11:04:09+32" AAA   

 

 

附录:关于PDU模式发送短信:

 

      第一,对模块写入 AT+CMGF=0<回车>   的AT命令(<回车> 要用 /r 来实现),之后应该得到一个 OK 响应,才能继续进行下一步;

      第二,对模块写入 AT+CMGS=<回车>   的AT命令(其中 是一个数字,该数字是代表了PDU串中某一部分的长度,这一部分就是指除了SMSC地址之外的那一部分),之后应该得到一个 /r/n> /r/n   响应(特别要注意:/r是回车,/n是换行,>是一个大于号,>后面还有一个空格!),才能继续进行下一步;

      第三,可以开始写入要发送的内容了。这一部分只是PDU串中的一部分,并不是完整的PDU串(如前所述,去掉了SMSC地址那一部分),这一部分要以 Ctrl+Z 结尾,但是我们要知道,在字符串中要带上 Ctrl+Z 的话,必须是用ACSII码。Ctrl+Z的ASCII码是16进制的 1A ,所以你可以在你的字符串后面用strcat函数附加上 "/x1A " 来实现。

这样之后,如果发送成功,你就会收到GSM模块的一个发送成功的响应,形如:

          +CMGS: 246

 

          OK

      如果只有一个“OK”响应,没有类似于“+CMGS: 246”的部分,则并不能发送成功!所以,当你只收到一个 OK 响应的时候,那肯定是哪里出错了。

你可能感兴趣的:(短信编码)