html代码中转义字符 &#xxxx 转换为文字的方法

 
html代码中转义字符 &#xxxx  转换为文字的方法
 
情况1: entity char
   
     html预设了一些类似   的html转义字符。使用对应表将这些字符转化成原字符。
 
情况2: &#nnn nnn<255
  
     转义字符就是 nnn 本身, 例如 &#97就是'a'
 
情况3: &#nnn nnn >= 255
 
    2字节unicode表示,使用 widechar2multiplebytes 函数进行转化。
 
   函数可以用:
 
    l inux 系统函数
 
    wcstombs  目标字符集使用setlocale进行设置
 
    IBM ICU库函数
 
    ucnv_convert( locale, "UTF-16LE", ....  目标字符集是locale, UTF-16LE的意思是HTML使用了UTF-16 litter-endian 方法进行编码的unicode
 
   Windows   
   windows可用widechartomultibyte函数
 
   

你可能感兴趣的:(html,转义,文字,字符,xxxx)