Load数据到MySQL,入库部分数据乱码问题


面对着字符编码load到 MySQL的问题:可能是 gbk/utf-8/或者混合编码。

为了保证数据的原始性,雷哥的解决办法是:通过 Python转为16进制,然后通过 MySQL解析解析16进制,非常完美。


案例如下:

Python 的编码case:

>>> import binascii

       ### 转为16进制

>>> print binascii.b2a_hex('wo草')

776fe88d89

       ### 转为汉字

>>> print binascii.a2b_hex('776fe88d89')

wo草

MySQL 的反编码 case

       ### 转为16进制

mysql> select hex('wo草');

+--------------+

| hex('wo草')  |

+--------------+

| 776FE88D89   |

+--------------+

1 row in set (0.00 sec)


       ### 转为汉字

mysql> select unhex('776fe88d89')

    -> ;

+---------------------+

| unhex('776fe88d89') |

+---------------------+

| wo草                |

+---------------------+

1 row in set (0.00 sec)



你可能感兴趣的:(Load数据到MySQL,入库部分数据乱码问题)