unicode编码:
非空格:
全角字符:65281~65374 (十六进制 0xFF01 ~ 0xFF5E)
半角字符:33~126 (十六进制 0x21~ 0x7E)
空格:
空格全角:12288(0x3000)
空格半角:32(0x20)
解释一下什么是全角、半角:
全角字符是指一个字(字母、数字、汉字)占两个字节,而半角则是占一个字节。
中文全部都是全角字符,只有数字、英文字符、标点符号才区分是全角还是半角。
从unicode编码规律,对于非空格的字符,半角+65248=全角
参考资料说半角+(0x7E)= 全角,我没看明白0x7E也不等于十进制的65248呀??看懂的同学欢迎留言。
# -*- coding: cp936 -*-
def strQ2B(ustring):
"""全角转半角"""
rstring = ""
for uchar in ustring:
inside_code=ord(uchar)
if inside_code == 12288: #全角空格直接转换
inside_code = 32
elif (inside_code >= 65281 and inside_code <= 65374): #全角字符(除空格)根据关系转化
inside_code -= 65248
rstring += unichr(inside_code)
return rstring
def strB2Q(ustring):
"""半角转全角"""
rstring = ""
for uchar in ustring:
inside_code=ord(uchar)
if inside_code == 32: #半角空格直接转化
inside_code = 12288
elif inside_code >= 32 and inside_code <= 126: #半角字符(除空格)根据关系转化
inside_code += 65248
rstring += chr(inside_code)
return rstring
b = strQ2B("mn123abc博客园")
print(b)
c = strB2Q("mn123abc博客园")
print (c)
以上 转载自python实现全角半角的相互转换: