保存特殊字符到utf8编码的mysql数据库中

由于特殊字符需要四个字节才能保存,而mysql5.5.3以下的版本中的utf8并不支持四字节的存储,(mysql5.5.3以上才有utf8mb4类型支持存储),此时,如果不能升级数据库,又不考虑过滤掉特殊字符,可以将特殊字符转换成iso8859-1保存到数据库中,但是会乱码,在需要使用的时候需要进行转码处理。

ps:

过滤特殊字符的方法:

public String removeEmojiUnicode(String str)
    {
        if (str == null)
        {
            return null;
        }
        str = str.replaceAll("[^\\u0000-\\uFFFF]", "");
        return str;
    }


转换编码:

public String encodeString(String value)
    {
        String retval = null;
        try
        {
            retval = new String(value.getBytes("utf-8"), "ISO-8859-1");
        } catch (UnsupportedEncodingException e)
        {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
        return retval;
    }


public String decodeString(String value)
    {
        String retval = null;
        try
        {
            retval = new String(value.getBytes("ISO-8859-1"), "utf-8");
        } catch (UnsupportedEncodingException e)
        {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
        return retval;
    }


 retval = new String(value.getBytes("ISO-8859-1"), "utf-8");

此时需要保证value 为"ISO-8859-1"编码,否则转换将不成功。

具体表现:调用decodeString多次,乱码。

原因:String.getBytes("XX")是将String按照“XX”编码方式变成byte数组,

http://blog.sina.com.cn/s/blog_6d3fcc7e0101a4pn.html


你可能感兴趣的:(保存特殊字符到utf8编码的mysql数据库中)