fengsh998

大端小端,ascii,unicode,utf8,utf16,utf32,gb2312,gbk,gb18030等字符编码问题

字符编码的问题让我困惑了好久的一段时间，其实简单的想，字符编码没有什么东西的，可是想真弄明白还是花去了我一点时间，前端时间写了一个简单的log程序，主要的工作就是支持系统运行时输出日志信息，同时允许定制不同级别的日志输出，刚开始的时候只是写入到文件中，可用过之后发现，只是写入到文件中，在进行系统调试的时候不是很方便，还要打开文件，浏览，再返回源代码，如果能够有一个界面展示岂不是更好，列表显示日志，可以选择显示的日志级别，实现日志输出位置的定位，类似下图中展示的一样：

感觉还是能方便一点的，而显示窗口的实现可以通过exe或者dll的方式，这就需要进行两个独立进程之间的通信，为了支持多个日志显示窗口，我要枚举现在打开的窗口比较窗口名，还要创建命名管道，比较管道名，不幸的是，log显示窗口系统用的是unicode编码，而在写日志主系统程序的时候用的却是多字节编码，在进行通信的时候总是出现这样那样的问题，同时为了使得log主系统可以在服务的主程序选用不同的字符编码方案的时候可以正常工作，费了点事情，因为当时对字符编码不了解，然后就去网上查了下，总结一下子，同时，为了使用方便，写了一个VAUTF8类实现UTF8编码方案，同时实现不同编码方案的转化。

这篇文章里主要阐述下面几个问题

1: 字符和字节的区别

2: Big Endian和Little Endian

3: ASCII

4: Unicode的定义

5: Unicode的编码方案

6: Unicode的实现方式

7: 一些名词解释

字符和字节的区别

字节(octet):是一个八位的存储单元，取值范围一定是0～255。

字符(character):为语言意义上的符号，范围不一定。例如在UCS-2中定义的字符范围为0～65535,一个字符占用两个字节。

Big Endian和Little Endian

上面提到了一个字符可能占用多个字节，那么这多个字节在计算机中如何存储呢？比如字符0xABCD，它的存储格式到底是 AB CD，还是 CD AB 呢？

实际上两者都有可能，并分别有不同的名字。如果存储为 AB CD，则称为Big Endian；如果存储为 CD AB，则称为Little Endian。

Big Endian:高字节在前,低字节在后

Little Endian:低字节在前,高字节在后

X86系统都是Little Endian的,也就是低字节在前,高字节在后.也就是低地址存储低位字节,高地址存储高位字节.

ASCII

ASCII使用数字32到 127来表示所有的英文字母，比如空格是32，字母"A"是65等等。使用7个比特就可以存储所有这样字符。那个时代的大多数计算机使用8个比特来，所以你不但可以存储全部的ASCII，而且还有一个比特可以多出来用作其他。如果你想，你可以把它用作你不可告人的目的。32以下的码字是不可打印的，它们属于控制字符，像7表示响铃，12表示打印机换纸。

标准中，对于低128个码字大家都无异议，差不多就是ASCII了，但对于高128个码字，根据你所在地的不同，会有不同的处理方式。我们称这样相异的编码系统为码页(code pages)。举个例子，比如在以色列发布的DOS中使用的码页是862，而在希腊使用的是737。它们的低128个完全相同，但从128往上，就有了很大差别。MS-DOS的国际版有很多这样的码页，涵盖了从英语到冰岛语各种语言，甚至还有一些"多语言"码页。但是还得说，如果想让希伯来语和希腊语在同一台计算机上和平共处，基本上没有可能。除非你自己写程序，程序中的显示部分直接使用位图。因为希伯来语对高128个码字的解释与希腊语压根不同。

在亚洲，更疯狂的事情正在上演。因为亚洲的字母系统中要上千个字母，8个比特无论如何也是满足不了的。一般的解决方案就是使用DBCS- "双字节字符集"，即有的字母使用一个字节来表示，有的使用两个字节。所以处理字符串时，指针移动到下一个字符比较容易，但移动到上一个字符就变得非常危险了。于是s++或s—不再被鼓励使用，相应的比如Windows下的AnsiNext和AnsiPrev被用来处理这种情况。

不少人依然坚信一个字节就是一个字符，一个字符就是8个比特。当然，如果你从来都没有试着把一个字符串从一台计算机移到另一台计算机，或者你不用说除英文以外的另一种语言，那么你的坚信不会出问题。但是互联网出现让字符串在计算机间移动变得非常普遍，于是所有的混乱都爆发了。非常幸运，Unicode适时而生。

Unicode的定义

Unicode是为整合全世界的所有语言文字而诞生的。任何文字在Unicode中都对应一个值，这个值称为代码点（code point）。代码点的值通常写成 U+ABCD 的格式。

一些人误以为Unicode只是简单的使用16比特的码字，也就是说每一个字符对应 16比特，总共可以表示65536个字符。这是完全不正确的。

在Unicode中，一个字母被映射到一个叫做码点(code point)的东西，这个码点可以看作一个纯粹的逻辑概念。至于码点(code point)如何在内存或磁盘中存储是另外的一个故事了。

码点(code point)的形式：U+0639

U+的意思就是"Unicode"，后面跟的数字是十六进制的。

事实上Unicode可以定义的字符数并没有上限，而且现在已经超过65536了。显然，并不是任何Unicode字符都可以用2个字节来表示了。

例如：Hello

在Unicode中，对应的码点(code point)如下：

U+0048 U+0065 U+006C U+006C U+006F

仅仅是一堆码点而已，或者说数字。不过到现在为止，我们还没有说这些码点究竟是如何存储到内存或如何表示在email信息中的

Unicode最早的编码想法，就是把每一个码点(code point)都存储在两个字节中，这也就导致了大多数人的误解。于是Hello就变成了：

00 48 00 65 00 6C 00 6C 00 6F

这样对吗？如下如何？

48 00 65 00 6C 00 6C 00 6F 00

技术上说，我相信这样是可以的。事实上，早期的实现者们的确想把Unicode的码点(code point)按照大端或小端两种方式存储，这样至少已经有两种存储Unicode的方法了。于是人们就必须使用FE FF作为每一个Unicode字符串的开头，我们称这个为Unicode Byte Order Mark。如果你互换了你的高位与低位，就变成了FF FE，这样读取这个字符串的程序就知道后面字节也需要互换了。可惜，不是每一个Unicode字符串都有字节序标记。

现在，看起来好像问题已经解决了，可是这帮程序员仍在抱怨。"看看这些零！"他们会这样说，因为他们是美国人，他们只看不会码点不会超过U+00FF的英文字母。同时他们也是California的嬉皮士，他们想节省一点。如果他们是得克萨斯人，可能他们就不会介意两倍的字节数。但是这样California节俭的人却无法忍受字符串所占空间翻倍。而且现在大堆的文档使用的是ANSI和DBCS字符集，谁去转换它们？于是这帮人选择忽略Unicode，继续自己的路，这显然让事情变得更糟。

Unicode的编码方式

Unicode的编码方式与ISO 10646的通用字符集（Universal Character Set，UCS）概念相对应，目前实际应用的Unicode版本对应于UCS-2，使用16位的编码空间。也就是每个字符占用2个字节。这样理论上一共最多可以表示2¹⁶即65536个字符。基本满足各种语言的使用。实际上目前版本的Unicode尚未填充满这16 位编码，保留了大量空间作为特殊使用或将来扩展。

上述16位Unicode字符构成基本多文种平面（Basic Multilingual Plane，简称BMP）。最新（但未实际广泛使用）的Unicode版本定义了16个辅助平面，两者合起来至少需要占据21位的编码空间，比3字节略少。但事实上辅助平面字符仍然占用4字节编码空间，与UCS-4保持一致。未来版本会扩充到ISO 10646-1实现级别3，即涵盖UCS-4的所有字符。UCS-4是一个更大的尚未填充完全的31位字符集，加上恒为0的首位，共需占据32位，即4字节。理论上最多能表示2³¹个字符，完全可以涵盖一切语言所用的符号。

BMP字符的Unicode编码表示为U+hhhh，其中每个h 代表一个十六进制数位。与UCS-2编码完全相同。对应的4字节UCS-4编码后两个字节一致，前两个字节的所有位均为0。

Unicode的实现方式: Unicode Translation Format（UTF）

Unicode的实现方式不同于编码方式。一个字符的Unicode编码是确定的。但是在实际传输过程中，由于不同系统平台的设计不一定一致，以及出于节省空间的目的，对Unicode编码的实现方式有所不同。Unicode的实现方式称为Unicode转换格式（Unicode Translation Format，简称为UTF）。

Unicode.org定义了百万个以上的字符，如果将所有的字符用统一的格式表示，需要的是4个字节。“a“的Unicode表示就会变成0x00000061，而“一“的Unicode值是0x00004E00。实际上，这就是UTF32，Linux操作系统上所使用的Unicode方案。而Windows平台下默认的Unicode编码方式为Little Endian的UTF-16。

UTF16

UTF-16由RFC2781规定，它使用两个字节来表示一个代码点。

不难猜到，UTF-16是完全对应于UCS-2的，即把UCS-2规定的代码点通过Big Endian或Little Endian方式直接保存下来。UTF-16包括三种：UTF-16，UTF-16BE（Big Endian），UTF-16LE（Little Endian）。

UTF-16BE和UTF-16LE不难理解，而UTF-16就需要通过在文件开头以名为BOM（Byte Order Mark）的字符来表明文件是Big Endian还是Little Endian。BOM为U+FEFF这个字符。

其实BOM是个小聪明的想法。由于UCS-2没有定义U+FFFE，因此只要出现 FF FE 或者 FE FF 这样的字节序列，就可以认为它是U+FEFF，并且可以判断出是Big Endian还是Little Endian。

举个例子。“ABC”这三个字符用各种方式编码后的结果如下：

Windows平台下默认的Unicode编码为Little Endian的UTF-16（即上述的 FF FE 41 00 42 00 43 00）。你可以打开记事本，写上ABC，然后保存，再用二进制编辑器看看它的编码结果。

UTF32

UTF-32用四个字节表示代码点，这样就可以完全表示UCS-4的所有代码点，而无需像UTF-16那样使用复杂的算法。与UTF-16类似，UTF-32也包括UTF-32、UTF-32BE、UTF-32LE三种编码，UTF-32也同样需要BOM字符。仅用'ABC'举例：

但是，仔细分析可以发现，其实绝大部分字符只使用2个字节就可以表示了。英文的Unicode范围是0x0000-0x007F，中文的Unicode范围是0x4E00-0x9F**，真正需要扩展到4个字节来表示的字符少之又少，所以有些系统直接使用2个字节来表示Unicode。比如Windows系统上，Unicode就是两个字节的。对于那些需要4个字节才能表示的字符，使用一种代理的手法来扩展(其实就是在低两个字节上做一个标记，表示这是一个代理，需要连接上随后的两个字节，才能组成一个字符)。这样的好处是大量的节约了存取空间，也提高了处理的速度。这种Unicode表示方法就是UTF16。一般在Windows平台上，提到Unicode,那就是指UTF16了。

UTF8

UTF-16和UTF-32的一个缺点就是它们固定使用两个或四个字节，这样在表示纯ASCII文件时会有很多00字节，造成浪费。而RFC3629定义的 UTF-8则解决了这个问题。UTF-8用1～4个字节来表示代码点。表示方式如下：

可见，ASCII字符（U+0000～U+007F）部分完全使用一个字节，避免了存储空间的浪费。而且UTF-8不再需要BOM字节。

另外，从上表中可以看出，单字节编码的第一字节为[00-7F]，双字节编码的第一字节为[C2-DF]，三字节编码的第一字节为[E0-EF]。这样只要看到第一个字节的范围就可以知道编码的字节数。这样也可以大大简化算法。

GB2312,GBK,GB18030

从ASCII、GB2312、GBK到GB18030，这些编码方法是向下兼容的，即同一个字符在这些方案中总是有相同的编码，后面的标准支持更多的字符。在这些编码中，英文和中文可以统一地处理。区分中文编码的方法是高字节的最高位不为0。按照程序员的称呼，GB2312、GBK到GB18030都属于双字节字符集 (DBCS)。

在MS的IDE中我们可以看到这样一个选项

这里的Unicode一般就是指的UTF16，双字节宽字符，也就是wchar_t

而多字节字符集就是不确定使用的字节数的那种情况了……

一般在编写应用程序的时候，应该使用unicode字符编码方案，而在写文件的时候应该使用多字节字符编码方案，比较节省空间。

VAUTF8.h 
     
   
 
    1  
    #include  
    < 
    string 
    > 
    
  
    2  
      
    #define 
     MAX_LENGTH_VAUTF8 16384 
    
  
    3  
      
    namespace 
     nsVAUTF8
  
    4  
    {
  
    5  
    /// 
     字符编码模式 
    
  
    6  
      
    enum 
     eCharacterEncodingMode
  
    7  
    {
  
    8  
    UNDEFINED,
  
    9  
    ANSI,
  
    10  
    UTF8,
  
    11  
    UTF16LE,
  
    12  
    UTF16BE,
  
    13  
    UTF32LE,
  
    14  
    UTF32BE
  
    15  
    };
  
    16  
    }
  
    17  
    
  
    18  
      
    extern 
    char 
     cUTF8Hdr[];
  
    19  
    extern 
    bool 
     UTF8_Unicode_Possible;
  
    20  
    
  
    21  
    int 
     UTF8CharLen( 
    char 
    in 
    );
  
    22  
    int 
     IsUTF8( 
    const 
    char 
    * 
     src, size_t max_source_len);
  
    23  
    void 
     utf8_EnableRealUnicode( 
    bool 
     bEnabled);
  
    24  
    bool 
     utf8_IsUnicodeEnabled();
  
    25  
    
  
    26  
    int 
     _stdcall UTF82WStr( 
    const 
    char 
    * 
     source,  
    char 
    * 
     dest,  
    int 
     max_len  
    = 
     MAX_LENGTH_VAUTF8);
  
    27  
    int 
     _stdcall UTF82WStr( 
    const 
    char 
    * 
     source,  
    char 
    ** 
     dest);
  
    28  
    
  
    29  
    int 
     _stdcall UTF82Str( 
    const 
    char 
    * 
     source,  
    char 
    * 
     dest,  
    int 
     max_len  
    = 
     MAX_LENGTH_VAUTF8);
  
    30  
    int 
     _stdcall UTF82Str( 
    const 
    char 
    * 
     source,  
    char 
    ** 
     dest);
  
    31  
    
  
    32  
    int 
     _stdcall WStr2UTF8( 
    const 
    char 
    * 
     source,  
    char 
    * 
     dest,  
    int 
     max_len  
    = 
     MAX_LENGTH_VAUTF8);
  
    33  
    int 
     _stdcall WStr2UTF8( 
    const 
     wchar_t 
    * 
     source,  
    char 
    * 
     dest,  
    int 
     max_len  
    = 
     MAX_LENGTH_VAUTF8);
  
    34  
    int 
     _stdcall WStr2UTF8( 
    const 
    char 
    * 
     source,  
    char 
    ** 
     dest);
  
    35  
    int 
     _stdcall WStr2UTF8( 
    const 
     wchar_t 
    * 
     source,  
    char 
    ** 
     dest);
  
    36  
    
  
    37  
    int 
     _stdcall Str2UTF8( 
    const 
    char 
    * 
     source,  
    char 
    * 
     dest,  
    int 
     max_len  
    = 
     MAX_LENGTH_VAUTF8);
  
    38  
    int 
     _stdcall Str2UTF8( 
    const 
    char 
    * 
     source,  
    char 
    ** 
     dest);
  
    39  
    
  
    40  
    int 
     _stdcall Str2WStr( 
    const 
    char 
    * 
     source,  
    char 
    * 
     dest,  
    int 
     max_len  
    = 
     MAX_LENGTH_VAUTF8);
  
    41  
    int 
     _stdcall Str2WStr( 
    const 
    char 
    * 
     source,  
    char 
    ** 
     dest);
  
    42  
    
  
    43  
    int 
     _stdcall WStr2Str( 
    const 
    char 
    * 
     source,  
    char 
    * 
     dest,  
    int 
     max_len  
    = 
     MAX_LENGTH_VAUTF8); 
  
    44  
    int 
     _stdcall WStr2Str( 
    const 
    char 
    * 
     source,  
    char 
    ** 
     dest);
  
    45  
    
  
    46  
    int 
     StringConvert( 
    const 
    char 
    * 
     source, nsVAUTF8::eCharacterEncodingMode source_format,
  
    47  
    char 
    ** 
     dest, nsVAUTF8::eCharacterEncodingMode dest_format);
  
    48  
    
  
    49  
    int 
     FromUTF8( 
    const 
    char 
    * 
     source, wchar_t 
    ** 
     dest);
  
    50  
    int 
     FromUTF8( 
    const 
    char 
    * 
     source,  
    char 
    ** 
     dest);
  
    51  
    
  
    52  
    int 
     ToUTF8( 
    const 
    char 
    * 
     source,  
    char 
    ** 
     dest);
  
    53  
    int 
     ToUTF8( 
    const 
     wchar_t 
    * 
     source,  
    char 
    ** 
     dest);
  
    54  
    
  
    55  
    typedef std:: 
    string 
     EncodingStirngA;
  
    56  
    typedef std::wstring EncodingStirngW;
  
    57  
    class 
     VAUTF8
  
    58  
    {
  
    59  
    private 
    :
  
    60  
    EncodingStirngA m_sANSI;
  
    61  
    EncodingStirngA m_sUTF8;
  
    62  
    EncodingStirngW m_sUNICODE;
  
    63  
    private 
    :
  
    64  
    void 
     Complete();
  
    65  
    public 
    :
  
    66  
    /// 
     构造函数 
    
  
    67  
    VAUTF8() {};
  
    68  
    virtual 
    ~ 
    VAUTF8(){}
  
    69  
    VAUTF8( 
    const 
    char 
    * 
     pSrc);
  
    70  
    VAUTF8( 
    const 
     wchar_t 
    * 
     pSrc);
  
    71  
    VAUTF8( 
    const 
    char 
    * 
     pSrc,  
    int 
     Encoding);
  
    72  
    VAUTF8( 
    const 
     EncodingStirngA 
    & 
     src);
  
    73  
    VAUTF8( 
    const 
     EncodingStirngW 
    & 
     src);
  
    74  
    
  
    75  
    // 
     拷贝构造函数 
    
  
    76  
    VAUTF8( 
    const 
     VAUTF8 
    & 
     other);
  
    77  
    VAUTF8 
    & 
    operator 
    = 
    ( 
    const 
     VAUTF8 
    & 
     rhs);
  
    78  
    
  
    79  
    operator 
     EncodingStirngA()  
    const 
     {  
    return 
     m_sANSI;}
  
    80  
    operator 
     EncodingStirngW()  
    const 
     {  
    return 
     m_sUNICODE;}
  
    81  
    const 
    char 
    * 
     UTF8()  
    const 
     {  
    return 
     m_sUTF8.c_str();}
  
    82  
    const 
     size_t Size()  
    const 
     {  
    return 
     m_sUTF8.size();}
  
    83  
    const 
    char 
    * 
     Str()  
    const 
     {  
    return 
     m_sANSI.c_str();}
  
    84  
    const 
     wchar_t 
    * 
     WStr()  
    const 
     {  
    return 
     m_sUNICODE.c_str();}
  
    85  
    
  
    86  
    // 
     如果定义了TCHAR,则可调用该方法 
    
  
    87  
    #ifdef _TCHAR_DEFINED
  
    88  
    const 
     TCHAR 
    * 
     TStr()  
    const 
     {
  
    89  
    #ifdef _UNICODE
  
    90  
    return 
     WStr();
  
    91  
    #else 
    
  
    92  
    return 
     Str();
  
    93  
    #endif 
    
  
    94  
    }
  
    95  
    #endif 
    
  
    96  
    }; 
   
 
     
   

VAUTF8.cpp 
     
   
 
    1  
    #include  
    " 
    VAUTF8.h 
    " 
    
  
    2  
    #include  
    < 
    windows.h 
    > 
     
  
    3  
    
  
    4  
    bool 
     UTF8_Unicode_Possible  
    = 
    true 
    ;
  
    5  
    char 
     cUTF8Hdr[]  
    = 
     {( 
    char 
    ) 
    0xEF 
    ,( 
    char 
    ) 
    0xBB 
    ,( 
    char 
    ) 
    0xBF 
    , 
    0 
    };
  
    6  
    
  
    7  
    int 
     UTF8CharLen( 
    char 
    in 
    )
  
    8  
    {
  
    9  
    unsigned  
    char 
     uin  
    = 
     (unsigned  
    char 
    ) 
    in 
    ;
  
    10  
    
  
    11  
    if 
     (uin  
    < 
    128 
    )
  
    12  
    return 
    1 
    ;
  
    13  
    
  
    14  
    if 
     (uin  
    < 
    192 
    )
  
    15  
    return 
    - 
    1 
    ;
  
    16  
    
  
    17  
    if 
     (uin  
    < 
    0xE0 
    )
  
    18  
    return 
    2 
    ;
  
    19  
    
  
    20  
    if 
     (uin  
    < 
    0xF0 
    )
  
    21  
    return 
    3 
    ;
  
    22  
    
  
    23  
    if 
     (uin  
    < 
    0xF8 
    )
  
    24  
    return 
    4 
    ;
  
    25  
    
  
    26  
    if 
     (uin  
    < 
    0xFC 
    )
  
    27  
    return 
    5 
    ;
  
    28  
    
  
    29  
    if 
     (uin  
    < 
    0xFE 
    )
  
    30  
    return 
    6 
    ;
  
    31  
    
  
    32  
    if 
     (uin  
    < 
    0xFF 
    )
  
    33  
    return 
    7 
    ;
  
    34  
    
  
    35  
    return 
    8 
    ;
  
    36  
    }
  
    37  
    int 
     IsUTF8( 
    const 
    char 
    * 
     src, size_t max_source_len)
  
    38  
    {
  
    39  
    if 
     (max_source_len  
    < 
    0 
    )
  
    40  
    return 
    0 
    ;
  
    41  
    
  
    42  
    if 
     (max_source_len  
    == 
    0 
    )
  
    43  
    return 
    1 
    ;
  
    44  
    
  
    45  
    while 
     ( 
    * 
    src  
    && 
     max_source_len 
    -- 
    )
  
    46  
    {
  
    47  
    int 
     bytes  
    = 
     UTF8CharLen( 
    * 
    src 
    ++ 
    );
  
    48  
    if 
     (bytes  
    < 
    0 
    )
  
    49  
    return 
    0 
    ;
  
    50  
    if 
     (static_cast 
    < 
    int 
    > 
    (max_source_len)  
    < 
    -- 
    bytes)
  
    51  
    return 
    0 
    ;
  
    52  
    while 
     (bytes 
    -- 
    ) {
  
    53  
    if 
     (( 
    * 
    src 
    ++ 
    & 
    0xC0 
    )  
    != 
    0x80 
    )
  
    54  
    return 
    0 
    ;
  
    55  
    }
  
    56  
    }
  
    57  
    
  
    58  
    return 
    1 
    ;
  
    59  
    }
  
    60  
    
  
    61  
    // 
    ===================================================================================================
  
    62  
    // 
     宽字节字符串转化为UTF8 
    
  
    63  
    int 
     _stdcall WStr2UTF8( 
    const 
    char 
    * 
     source,  
    char 
    ** 
     dest)
  
    64  
    {
  
    65  
    int 
     len  
    = 
    1 
    ;
  
    66  
    
  
    67  
    if 
     (source) 
  
    68  
    len  
    = 
     WStr2UTF8(source, NULL,  
    0 
    );
  
    69  
    
  
    70  
    * 
    dest  
    = 
     ( 
    char 
    * 
    )malloc(len);
  
    71  
    
  
    72  
    if 
     ( 
    ! 
    source) {
  
    73  
    * 
    dest  
    = 
    0 
    ;
  
    74  
    return 
    1 
    ;
  
    75  
    }
  
    76  
    
  
    77  
    return 
     WideCharToMultiByte(CP_UTF8,  
    0 
    , (LPCWSTR)source,  
    - 
    1 
    ,
  
    78  
    * 
    dest, len, NULL, NULL);
  
    79  
    }
  
    80  
    
  
    81  
    int 
     _stdcall WStr2UTF8( 
    const 
     wchar_t 
    * 
     source,  
    char 
    ** 
     dest)
  
    82  
    {
  
    83  
    return 
     WStr2UTF8(( 
    char 
    * 
    )source, dest);
  
    84  
    }
  
    85  
    
  
    86  
    int 
     _stdcall WStr2UTF8( 
    const 
    char 
    * 
     source,  
    char 
    * 
     dest,  
    int 
     max_len)
  
    87  
    {
  
    88  
    if 
     (dest) {
  
    89  
    if 
     (source 
    != 
    dest) {
  
    90  
    return 
     WideCharToMultiByte(CP_UTF8,  
    0 
    , 
  
    91  
    (LPCWSTR)source,  
    - 
    1 
    , dest, max_len, NULL, NULL);
  
    92  
    }  
    else 
     {
  
    93  
    int 
     dest_size  
    = 
     WStr2UTF8(source, NULL,  
    0 
    );
  
    94  
    
  
    95  
    char 
    * 
     cTemp  
    = 
     NULL;
  
    96  
    WStr2UTF8(source,  
    & 
    cTemp);
  
    97  
    strcpy_s(dest, max_len, cTemp);
  
    98  
    free(cTemp); 
  
    99  
    
  
    100  
    return 
     dest_size;
  
    101  
    }
  
    102  
    }  
    else 
     {
  
    103  
    return 
     WideCharToMultiByte(CP_UTF8, 
    0 
    ,(LPCWSTR)source, 
    - 
    1 
    ,NULL, 
    0 
    ,NULL,NULL);
  
    104  
    }
  
    105  
    
  
    106  
    return 
    0 
    ;
  
    107  
    }
  
    108  
    // 
    ===================================================================================================
  
    109  
    
  
    110  
    // 
    ===================================================================================================
  
    111  
    // 
     短字节字符串转化为宽字节字符串 
    
  
    112  
    int 
     _stdcall Str2WStr( 
    const 
    char 
    * 
     source,  
    char 
    * 
     dest,  
    int 
     max_len)
  
    113  
    {
  
    114  
    if 
     ( 
    ! 
    source) 
  
    115  
    {
  
    116  
    memset(dest,  
    0 
    ,  
    2 
    );
  
    117  
    return 
    2 
    ;
  
    118  
    }
  
    119  
    size_t source_len  
    = 
    1 
    + 
     strlen(source);
  
    120  
    
  
    121  
    if 
     (source 
    != 
    dest) 
  
    122  
    {
  
    123  
    if 
     ( 
    ! 
    dest) 
  
    124  
    return 
    2 
    * 
     MultiByteToWideChar(CP_THREAD_ACP,  
    0 
    , source,  
    - 
    1 
    , NULL,  
    0 
    ); 
  
    125  
    
  
    126  
    
  
    127  
    return 
    2 
    * 
    MultiByteToWideChar(CP_THREAD_ACP, 
    0 
    ,source, 
    - 
    1 
    ,(LPWSTR)dest,max_len 
    / 
    2 
    );
  
    128  
    } 
  
    129  
    else 
     
  
    130  
    {
  
    131  
    char 
    * 
     cTemp  
    = 
    new 
    char 
    [ 
    2 
    * 
     source_len];
  
    132  
    int 
     i  
    = 
    2 
    * 
    MultiByteToWideChar(CP_THREAD_ACP, 
    0 
    ,source, 
    - 
    1 
    ,(LPWSTR)cTemp,max_len 
    / 
    2 
    );
  
    133  
    memcpy(dest, cTemp, i);
  
    134  
    delete[] cTemp;
  
    135  
    return 
     i;
  
    136  
    }
  
    137  
    }
  
    138  
    
  
    139  
    int 
     _stdcall Str2WStr( 
    const 
    char 
    * 
     source,  
    char 
    ** 
     dest)
  
    140  
    {
  
    141  
    if 
     ( 
    ! 
    source) 
  
    142  
    {
  
    143  
    * 
    dest  
    = 
    new 
    char 
    [ 
    2 
    ];
  
    144  
    memset( 
    * 
    dest,  
    0 
    ,  
    2 
    );
  
    145  
    return 
    2 
    ;
  
    146  
    }
  
    147  
    int 
     dest_len  
    = 
     Str2WStr(source, NULL,  
    0 
    );
  
    148  
    * 
    dest  
    = 
     ( 
    char 
    * 
    )calloc( 
    1 
    , dest_len);
  
    149  
    return 
    2 
    * 
    MultiByteToWideChar(CP_THREAD_ACP, 
    0 
    ,source, 
    - 
    1 
    ,(LPWSTR) 
    * 
    dest,dest_len 
    / 
    2 
    );
  
    150  
    }
  
    151  
    // 
    ===================================================================================================
  
    152  
    
  
    153  
    
  
    154  
    // 
    ===================================================================================================
  
    155  
    // 
     宽字节字符串转化为短字节字符串 
    
  
    156  
    int 
     _stdcall WStr2Str( 
    const 
    char 
    * 
     source,  
    char 
    * 
     dest,  
    int 
     max_len)
  
    157  
    {
  
    158  
    int 
     len  
    = 
     WideCharToMultiByte(CP_THREAD_ACP,  
    0 
    , (LPCWSTR)source,  
    - 
    1 
    ,
  
    159  
    (LPSTR)dest, max_len, NULL, NULL);
  
    160  
    return 
     len;
  
    161  
    }
  
    162  
    
  
    163  
    int 
     _stdcall WStr2Str( 
    const 
    char 
    * 
     source,  
    char 
    ** 
     dest)
  
    164  
    {
  
    165  
    int 
     len  
    = 
    1 
    ;
  
    166  
    if 
     (source)
  
    167  
    len  
    = 
     WideCharToMultiByte(CP_THREAD_ACP, 
    0 
    ,(LPCWSTR)source, 
    - 
    1 
    ,NULL, 
    0 
    , 
    0 
    , 
    0 
    );
  
    168  
    * 
    dest  
    = 
     ( 
    char 
    * 
    )malloc(len);
  
    169  
    return 
     WideCharToMultiByte(CP_THREAD_ACP,  
    0 
    , (LPCWSTR)source,
  
    170  
    - 
    1 
    ,  
    * 
    dest, len,  
    0 
    ,  
    0 
    );
  
    171  
    }
  
    172  
    // 
    ===================================================================================================
  
    173  
    
  
    174  
    
  
    175  
    // 
    ===================================================================================================
  
    176  
    // 
     短字节字符串转化到UTF8字符串 
    
  
    177  
    int 
     _stdcall Str2UTF8( 
    const 
    char 
    * 
     source,  
    char 
    * 
     dest,  
    int 
     max_len)
  
    178  
    {
  
    179  
    if 
     ( 
    ! 
    source) 
  
    180  
    {
  
    181  
    * 
    dest  
    = 
    0 
    ;
  
    182  
    return 
    1 
    ;
  
    183  
    }
  
    184  
    
  
    185  
    if 
     (max_len  
    < 
    0 
    )
  
    186  
    return 
    0 
    ;
  
    187  
    
  
    188  
    int 
     temp_size;
  
    189  
    size_t source_len  
    = 
     strlen(source)  
    + 
    1 
    ;
  
    190  
    if 
     (UTF8_Unicode_Possible) 
  
    191  
    {
  
    192  
    temp_size  
    = 
     Str2WStr(source, ( 
    char 
    * 
    )NULL);
  
    193  
    }  
    else 
     {
  
    194  
    temp_size  
    = 
    1 
    + 
    ( 
    int 
    )strlen(source);
  
    195  
    }
  
    196  
    int 
     i;
  
    197  
    
  
    198  
    unsigned  
    short 
    * 
     temp  
    = 
    new 
     unsigned  
    short 
    [temp_size];
  
    199  
    
  
    200  
    if 
     (UTF8_Unicode_Possible) {
  
    201  
    ZeroMemory(temp, 
    sizeof 
    (unsigned  
    short 
    )  
    * 
     temp_size);
  
    202  
    
  
    203  
    if 
     (dest) {
  
    204  
    MultiByteToWideChar(CP_THREAD_ACP, 
    0 
    ,source, 
    - 
    1 
    ,(LPWSTR)temp,temp_size);
  
    205  
    i  
    = 
     WideCharToMultiByte(CP_UTF8, 
    0 
    ,(LPCWSTR)temp, 
    - 
    1 
    ,dest,max_len, 
    0 
    , 
    0 
    );
  
    206  
    delete[] temp;
  
    207  
    return 
     i;
  
    208  
    }  
    else 
     {
  
    209  
    MultiByteToWideChar(CP_THREAD_ACP, 
    0 
    ,source, 
    - 
    1 
    ,(LPWSTR)temp,temp_size);
  
    210  
    i  
    = 
     WideCharToMultiByte(CP_UTF8, 
    0 
    ,(LPCWSTR)temp, 
    - 
    1 
    , 
    0 
    , 
    0 
    , 
    0 
    , 
    0 
    );
  
    211  
    delete[] temp;
  
    212  
    return 
     i;
  
    213  
    }
  
    214  
    }  
    else 
     {
  
    215  
    delete[] temp;
  
    216  
    if 
     (dest) {
  
    217  
    if 
     (( 
    int 
    )source_len  
    < 
     max_len) 
  
    218  
    strcpy_s(dest, max_len, source);
  
    219  
    else 
     {
  
    220  
    strncpy_s(dest, max_len, source, max_len);
  
    221  
    dest[( 
    int 
    )max_len 
    - 
    1 
    ]  
    = 
    0 
    ;
  
    222  
    }
  
    223  
    }
  
    224  
    return 
    1 
    + 
    ( 
    int 
    )strlen(source);
  
    225  
    }
  
    226  
    
  
    227  
    }
  
    228  
    
  
    229  
    int 
     _stdcall Str2UTF8( 
    const 
    char 
    * 
     source,  
    char 
    ** 
     dest)
  
    230  
    {
  
    231  
    if 
     ( 
    ! 
    dest)
  
    232  
    return 
    - 
    1 
    ;
  
    233  
    
  
    234  
    if 
     ( 
    ! 
    source) {
  
    235  
    * 
    dest  
    = 
     ( 
    char 
    * 
    )calloc( 
    1 
    ,  
    1 
    );
  
    236  
    return 
    1 
    ;
  
    237  
    }
  
    238  
    
  
    239  
    if 
     (UTF8_Unicode_Possible) {
  
    240  
    unsigned  
    short 
    * 
     temp  
    = 
     NULL;
  
    241  
    Str2WStr(source, ( 
    char 
    ** 
    ) 
    & 
    temp);
  
    242  
    int 
     result  
    = 
     WStr2UTF8(( 
    char 
    * 
    )temp, dest);
  
    243  
    free(temp);
  
    244  
    return 
     result;
  
    245  
    }  
    else 
     {
  
    246  
    * 
    dest  
    = 
     _strdup(source);
  
    247  
    return 
     ( 
    int 
    )( 
    1 
    + 
    strlen(source));
  
    248  
    }
  
    249  
    }
  
    250  
    // 
    ===================================================================================================
  
    251  
    
  
    252  
    
  
    253  
    
  
    254  
    // 
    ===================================================================================================
  
    255  
    // 
     UTF8串转化到短字节字符串 
    
  
    256  
    int 
     _stdcall UTF82Str( 
    const 
    char 
    * 
     source,  
    char 
    ** 
     dest)
  
    257  
    {
  
    258  
    if 
     ( 
    ! 
    dest) {
  
    259  
    return 
    - 
    1 
    ;
  
    260  
    }
  
    261  
    
  
    262  
    if 
     ( 
    ! 
    source) {
  
    263  
    * 
    dest  
    = 
     ( 
    char 
    * 
    )calloc( 
    1 
    ,  
    1 
    ); 
  
    264  
    return 
    1 
    ;
  
    265  
    }
  
    266  
    
  
    267  
    unsigned  
    short 
    * 
     temp  
    = 
     NULL;
  
    268  
    
  
    269  
    if 
     (UTF8_Unicode_Possible) {
  
    270  
    UTF82WStr(source,( 
    char 
    ** 
    ) 
    & 
    temp);
  
    271  
    int 
     dest_len  
    = 
     WideCharToMultiByte(CP_THREAD_ACP, 
    0 
    ,(LPCWSTR)temp, 
    - 
    1 
    , 
    0 
    , 
    0 
    , 
    0 
    , 
    0 
    );
  
    272  
    
  
    273  
    if 
     (dest) {
  
    274  
    * 
    dest  
    = 
     ( 
    char 
    * 
    )calloc( 
    1 
    , dest_len);
  
    275  
    int 
     r  
    = 
     WideCharToMultiByte(CP_THREAD_ACP, 
    0 
    ,(LPCWSTR)temp, 
    - 
    1 
    , 
    * 
    dest,dest_len, 
    0 
    , 
    0 
    );
  
    276  
    free(temp);
  
    277  
    return 
     r;
  
    278  
    }  
    else 
     {
  
    279  
    int 
     r  
    = 
     WideCharToMultiByte(CP_THREAD_ACP, 
    0 
    ,(LPCWSTR)temp, 
    - 
    1 
    , 
    0 
    , 
    0 
    , 
    0 
    , 
    0 
    );
  
    280  
    free(temp);
  
    281  
    return 
     r;
  
    282  
    }
  
    283  
    }  
    else 
     {
  
    284  
    * 
    dest  
    = 
     _strdup(source);
  
    285  
    return 
     ( 
    int 
    )strlen( 
    * 
    dest) 
    + 
    1 
    ;
  
    286  
    }
  
    287  
    }
  
    288  
    
  
    289  
    int 
     _stdcall UTF82Str( 
    const 
    char 
    * 
     source,  
    char 
    * 
     dest,  
    int 
     max_len)
  
    290  
    {
  
    291  
    int 
     i;
  
    292  
    
  
    293  
    if 
     ( 
    ! 
    source) {
  
    294  
    if 
     (dest)
  
    295  
    * 
    dest  
    = 
    0 
    ;
  
    296  
    return 
    1 
    ;
  
    297  
    }
  
    298  
    
  
    299  
    unsigned  
    short 
    * 
     temp  
    = 
     NULL;
  
    300  
    
  
    301  
    if 
     (UTF8_Unicode_Possible) {
  
    302  
    UTF82WStr(source, ( 
    char 
    ** 
    ) 
    & 
    temp);
  
    303  
    if 
     (dest) {
  
    304  
    i  
    = 
     WideCharToMultiByte(CP_THREAD_ACP, 
    0 
    ,(LPCWSTR)temp, 
    - 
    1 
    ,dest,max_len, 
    0 
    , 
    0 
    );
  
    305  
    delete[] temp;
  
    306  
    return 
     i;
  
    307  
    }  
    else 
     {
  
    308  
    i  
    = 
     WideCharToMultiByte(CP_THREAD_ACP, 
    0 
    ,(LPCWSTR)temp, 
    - 
    1 
    , 
    0 
    , 
    0 
    , 
    0 
    , 
    0 
    );
  
    309  
    delete[] temp;
  
    310  
    return 
     i;
  
    311  
    }
  
    312  
    }  
    else 
     {
  
    313  
    delete[] temp;
  
    314  
    if 
     (dest) 
  
    315  
    strcpy_s(dest, max_len, source);
  
    316  
    
  
    317  
    return 
     ( 
    int 
    )strlen(source);
  
    318  
    }
  
    319  
    }
  
    320  
    // 
    ===================================================================================================
  
    321  
    
  
    322  
    // 
    ===================================================================================================
  
    323  
    // 
     UTF8串转化到宽字节字符串 
    
  
    324  
    int 
     _stdcall UTF82WStr( 
    const 
    char 
    * 
     source,  
    char 
    ** 
     dest)
  
    325  
    {
  
    326  
    size_t source_len  
    = 
     strlen(source)  
    + 
    1 
    ;
  
    327  
    int 
     dest_len  
    = 
    2 
    ;
  
    328  
    
  
    329  
    if 
     (source)
  
    330  
    dest_len  
    = 
    2 
    * 
     MultiByteToWideChar(CP_UTF8,  
    0 
    , source,  
    - 
    1 
    ,  
    0 
    ,  
    0 
    );
  
    331  
    
  
    332  
    if 
     (dest) {
  
    333  
    * 
    dest  
    = 
     ( 
    char 
    * 
    )malloc(dest_len);
  
    334  
    return 
    sizeof 
    (wchar_t) 
    * 
    MultiByteToWideChar(CP_UTF8,  
    0 
    , source,  
    - 
    1 
    ,
  
    335  
    (LPWSTR) 
    * 
    dest, dest_len  
    / 
    sizeof 
    (wchar_t));
  
    336  
    }  
    else 
     {
  
    337  
    return 
    sizeof 
    (wchar_t) 
    * 
    MultiByteToWideChar(CP_UTF8,  
    0 
    , source,  
    - 
    1 
    ,  
    0 
    ,  
    0 
    );
  
    338  
    }
  
    339  
    }
  
    340  
    
  
    341  
    
  
    342  
    int 
     _stdcall UTF82WStr( 
    const 
    char 
    * 
     source,  
    char 
    * 
     dest,  
    int 
     max_len)
  
    343  
    {
  
    344  
    int 
     i;
  
    345  
    
  
    346  
    if 
     ( 
    ! 
    source)
  
    347  
    return 
    0 
    ;
  
    348  
    
  
    349  
    size_t source_len  
    = 
     strlen(source)  
    + 
    1 
    ;
  
    350  
    
  
    351  
    if 
     (dest) {
  
    352  
    if 
     (source 
    != 
    dest) {
  
    353  
    return 
    sizeof 
    (wchar_t)  
    * 
     MultiByteToWideChar(CP_UTF8,  
    0 
    , source,  
    - 
    1 
    ,
  
    354  
    (LPWSTR)dest, max_len  
    / 
    sizeof 
    (wchar_t));
  
    355  
    }  
    else 
     {
  
    356  
    char 
    * 
     cTemp  
    = 
     ( 
    char 
    * 
    )malloc(UTF82WStr(source, NULL,  
    0 
    ));
  
    357  
    i  
    = 
    sizeof 
    (wchar_t)  
    * 
     MultiByteToWideChar(CP_UTF8,  
    0 
    , source, 
  
    358  
    - 
    1 
    , (LPWSTR)cTemp, max_len  
    / 
    sizeof 
    (wchar_t));
  
    359  
    memcpy(dest, cTemp, i);
  
    360  
    free(cTemp);
  
    361  
    return 
     i;
  
    362  
    }
  
    363  
    }  
    else 
     {
  
    364  
    return 
    2 
    * 
    MultiByteToWideChar(CP_UTF8, 
    0 
    ,source, 
    - 
    1 
    , 
    0 
    , 
    0 
    );
  
    365  
    }
  
    366  
    }
  
    367  
    
  
    368  
    // 
    =================================================================================================== 
    
  
    369  
    
  
    370  
    
  
    371  
    int 
     StringConvert(  
    const 
    char 
    * 
     source, nsVAUTF8::eCharacterEncodingMode source_format, 
    /* 
     int max_source_len, 
    */ 
    char 
    ** 
     dest, nsVAUTF8::eCharacterEncodingMode dest_format )
  
    372  
    {
  
    373  
    char 
    * 
     _source  
    = 
     ( 
    char 
    * 
    )source;
  
    374  
    switch 
     (source_format)
  
    375  
    {
  
    376  
    case 
     nsVAUTF8::ANSI:
  
    377  
    switch 
     (dest_format) {
  
    378  
    case 
     nsVAUTF8::ANSI:  
    * 
    dest  
    = 
     _strdup(_source);  
    break 
    ;
  
    379  
    case 
     nsVAUTF8::UTF8: Str2UTF8(_source, dest);  
    break 
    ;
  
    380  
    case 
     nsVAUTF8::UTF16LE: Str2WStr(_source, dest);  
    break 
    ;
  
    381  
    }
  
    382  
    break 
    ;
  
    383  
    case 
     nsVAUTF8::UTF8:
  
    384  
    switch 
     (dest_format) {
  
    385  
    case 
     nsVAUTF8::ANSI: UTF82Str(_source, dest);  
    break 
    ;
  
    386  
    case 
     nsVAUTF8::UTF8:  
    * 
    dest  
    = 
     _strdup(_source);  
    break 
    ;
  
    387  
    case 
     nsVAUTF8::UTF16LE: UTF82WStr(_source, dest);  
    break 
    ;
  
    388  
    }
  
    389  
    break 
    ;
  
    390  
    case 
     nsVAUTF8::UTF16LE:
  
    391  
    switch 
     (dest_format) {
  
    392  
    case 
     nsVAUTF8::ANSI: 
  
    393  
    WStr2Str(_source, dest); 
  
    394  
    break 
    ;
  
    395  
    case 
     nsVAUTF8::UTF8: 
  
    396  
    WStr2UTF8(_source, dest); 
  
    397  
    break 
    ;
  
    398  
    case 
     nsVAUTF8::UTF16LE: 
  
    399  
    * 
    dest  
    = 
     ( 
    char 
    * 
    )_wcsdup((wchar_t 
    * 
    )_source); 
  
    400  
    break 
    ;
  
    401  
    }
  
    402  
    break 
    ;
  
    403  
    }
  
    404  
    return 
    1 
    ;
  
    405  
    }
  
    406  
    
  
    407  
    int 
     FromUTF8( 
    const 
    char 
    * 
     source, wchar_t 
    ** 
     dest)
  
    408  
    {
  
    409  
    return 
     StringConvert(source, nsVAUTF8::UTF8,
  
    410  
    ( 
    char 
    ** 
    )dest, nsVAUTF8::UTF16LE);
  
    411  
    }
  
    412  
    
  
    413  
    int 
     FromUTF8( 
    const 
    char 
    * 
     source,  
    char 
    ** 
     dest)
  
    414  
    {
  
    415  
    return 
     StringConvert(source, nsVAUTF8::UTF8,
  
    416  
    ( 
    char 
    ** 
    )dest, nsVAUTF8::ANSI);
  
    417  
    }
  
    418  
    
  
    419  
    int 
     ToUTF8( 
    const 
    char 
    * 
     source,  
    char 
    ** 
     dest)
  
    420  
    {
  
    421  
    return 
     StringConvert(source, nsVAUTF8::ANSI,
  
    422  
    ( 
    char 
    ** 
    )dest, nsVAUTF8::UTF8);
  
    423  
    }
  
    424  
    
  
    425  
    int 
     ToUTF8( 
    const 
     wchar_t 
    * 
     source,  
    char 
    ** 
     dest)
  
    426  
    {
  
    427  
    return 
     StringConvert(( 
    char 
    * 
    )source, nsVAUTF8::UTF16LE,
  
    428  
    ( 
    char 
    ** 
    )dest, nsVAUTF8::UTF8);
  
    429  
    }
  
    430  
    
  
    431  
    void 
     utf8_EnableRealUnicode(  
    bool 
     bEnabled )
  
    432  
    {
  
    433  
    UTF8_Unicode_Possible  
    = 
     bEnabled;
  
    434  
    }
  
    435  
    
  
    436  
    bool 
     utf8_IsUnicodeEnabled()
  
    437  
    {
  
    438  
    return 
     UTF8_Unicode_Possible;
  
    439  
    }
  
    440  
    VAUTF8::VAUTF8(  
    const 
    char 
    * 
     pSrc,  
    int 
     Encoding )
  
    441  
    {
  
    442  
    if 
     (pSrc)
  
    443  
    {
  
    444  
    if 
     (Encoding  
    == 
     nsVAUTF8::UTF8)
  
    445  
    {
  
    446  
    m_sUTF8  
    = 
     pSrc;
  
    447  
    }
  
    448  
    else 
    
  
    449  
    {
  
    450  
    m_sANSI  
    = 
     pSrc;
  
    451  
    }
  
    452  
    
  
    453  
    Complete();
  
    454  
    }
  
    455  
    
  
    456  
    }
  
    457  
    
  
    458  
    
  
    459  
    VAUTF8::VAUTF8(  
    const 
    char 
    * 
     pSrc )
  
    460  
    {
  
    461  
    if 
     (pSrc)
  
    462  
    {
  
    463  
    if 
     (IsUTF8(pSrc, strlen(pSrc)))
  
    464  
    {
  
    465  
    m_sUTF8  
    = 
     pSrc;
  
    466  
    }
  
    467  
    else 
    
  
    468  
    {
  
    469  
    m_sANSI  
    = 
     pSrc;
  
    470  
    }
  
    471  
    
  
    472  
    Complete();
  
    473  
    }
  
    474  
    }
  
    475  
    
  
    476  
    VAUTF8::VAUTF8(  
    const 
     wchar_t 
    * 
     pSrc )
  
    477  
    {
  
    478  
    if 
     (pSrc)
  
    479  
    {
  
    480  
    m_sUNICODE  
    = 
     pSrc;
  
    481  
    Complete();
  
    482  
    }
  
    483  
    }
  
    484  
    
  
    485  
    VAUTF8::VAUTF8(  
    const 
     EncodingStirngA 
    & 
     src )
  
    486  
    {
  
    487  
    if 
     (IsUTF8(src.c_str(), src.size()))
  
    488  
    {
  
    489  
    m_sUTF8  
    = 
     src;
  
    490  
    }
  
    491  
    else 
    
  
    492  
    {
  
    493  
    m_sANSI  
    = 
     src;
  
    494  
    }
  
    495  
    
  
    496  
    Complete();
  
    497  
    }
  
    498  
    
  
    499  
    
  
    500  
    VAUTF8::VAUTF8(  
    const 
     EncodingStirngW 
    & 
     src )
  
    501  
    {
  
    502  
    m_sUNICODE  
    = 
     src;
  
    503  
    Complete();
  
    504  
    }
  
    505  
    
  
    506  
    VAUTF8::VAUTF8(  
    const 
     VAUTF8 
    & 
     other )
  
    507  
    {
  
    508  
    * 
    this 
    = 
     other;
  
    509  
    }
  
    510  
    
  
    511  
    
  
    512  
    VAUTF8 
    & 
     VAUTF8:: 
    operator 
    = 
    ( 
    const 
     VAUTF8 
    & 
     rhs )
  
    513  
    {
  
    514  
    m_sUTF8  
    = 
     rhs.m_sUTF8;
  
    515  
    Complete();
  
    516  
    return 
    * 
    this 
    ;
  
    517  
    }
  
    518  
    
  
    519  
    void 
     VAUTF8::Complete()
  
    520  
    {
  
    521  
    char 
    * 
     p  
    = 
     NULL;
  
    522  
    
  
    523  
    if 
     ( 
    ! 
    m_sANSI.empty())
  
    524  
    {
  
    525  
    Str2UTF8(m_sANSI.c_str(),  
    & 
    p);
  
    526  
    m_sUTF8  
    = 
     p;
  
    527  
    free(p);
  
    528  
    
  
    529  
    Str2WStr(m_sANSI.c_str(),  
    & 
    p);
  
    530  
    m_sUNICODE  
    = 
     (wchar_t 
    * 
    )p;
  
    531  
    free(p);
  
    532  
    }
  
    533  
    else 
    
  
    534  
    {
  
    535  
    if 
     ( 
    ! 
    m_sUTF8.empty())
  
    536  
    {
  
    537  
    UTF82Str(( 
    char 
    * 
    )m_sUTF8.c_str(),  
    & 
    p);
  
    538  
    m_sANSI  
    = 
     p;
  
    539  
    free(p);
  
    540  
    
  
    541  
    UTF82WStr(( 
    char 
    * 
    )m_sUTF8.c_str(),  
    & 
    p);
  
    542  
    m_sUNICODE  
    = 
     (wchar_t 
    * 
    )p;
  
    543  
    free(p);
  
    544  
    }
  
    545  
    else 
    
  
    546  
    {
  
    547  
    if 
     ( 
    ! 
    m_sUNICODE.empty())
  
    548  
    {
  
    549  
    WStr2Str(( 
    char 
    * 
    )m_sUNICODE.c_str(),  
    & 
    p);
  
    550  
    m_sANSI  
    = 
     p;
  
    551  
    free(p);
  
    552  
    
  
    553  
    WStr2UTF8(( 
    char 
    * 
    )m_sUNICODE.c_str(),  
    & 
    p);
  
    554  
    m_sUTF8  
    = 
     p;
  
    555  
    free(p);
  
    556  
    }
  
    557  
    }
  
    558  
    }
  
    559  
    }
  
    560 
   
 
     
   

你可能感兴趣的:(大端小端,ascii,unicode,utf8,utf16,utf32,gb2312,gbk,gb18030等字符编码问题)

微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
扫地机类清洁产品之直流无刷电机控制悟空胆好小清洁服务机器人单片机人工智能
扫地机类清洁产品之直流无刷电机控制1.1前言扫地机产品有很多的电机控制，滚刷电机1个，边刷电机1-2个，清水泵电机，风机一个，部分中高端产品支持抹布功能，也就是存在抹布盘电机，还有追觅科沃斯石头等边刷抬升电机，滚刷抬升电机等的，这些电机有直流有刷电机，直接无刷电机，步进电机，电磁阀，挪动泵等不同类型。电机的原理，驱动控制方式也不行。接下来一段时间的几个文章会作个专题分析分享。直流有刷电机会自动持续
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
向内而求陈陈_19b4
10月27日，阴。阅读书目:《次第花开》。作者:希阿荣博堪布，是当今藏传佛家宁玛派最伟大的上师法王，如意宝晋美彭措仁波切颇具影响力的弟子之一。多年以来，赴海内外各地弘扬佛法，以正式授课、现场开示、发表文章等多种方法指导佛学弟子修行佛法。代表作《寂静之道》、《生命这出戏》、《透过佛法看世界》自出版以来一直是佛教类书籍中的畅销书。图片发自App金句:1.佛陀说，一切痛苦的根源在于我们长期以来对自身及外
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
《大清方方案》| 第二话谁佐清欢
和珅究竟说了些什么？竟能令堂堂九五之尊龙颜失色！此处暂且按下不表；单说这位乾隆皇帝，果真不愧是康熙从小带过的，一旦决定了要做的事，便杀伐决断毫不含糊。他当即亲自拟旨，着令和珅为钦差大臣，全权负责处理方方事件，并钦赐尚方宝剑，遇急则三品以下官员可先斩后奏。和珅身负皇上重托，岂敢有半点怠慢，当夜即率领相关人等，马不停蹄杀奔江汉。这一路上，和珅的几位幕僚一直在商讨方方事件的处置方案。有位年轻幕僚建议快刀
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
每日一题——第九十题互联网打工人no1 C语言程序设计每日一练 c语言
题目：判断子串是否与主串匹配#include#include#include//////判断子串是否在主串中匹配//////主串///子串///boolisSubstring(constchar*str,constchar*substr){intlenstr=strlen(str);//计算主串的长度intlenSub=strlen(substr);//计算子串的长度//遍历主字符串，对每个可能得
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
每日一题——第八十一题互联网打工人no1 C语言程序设计每日一练 c语言
打印如下图案:#includeintmain(){inti,j;charch='A';for(i=1;i<5;i++,ch++){for(j=0;j<5-i;j++){printf("");//控制空格输出}for(j=1;j<2*i;j++)//条件j<2*i{printf("%c",ch);//控制字符输出}printf("\n");}return0;}
每日一题——第八十二题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将一个控制台输入的字符串中的所有元音字母复制到另一字符串中#include#include#include#include#defineMAX_INPUT1024boolisVowel(charp);intmain(){charinput[MAX_INPUT];charoutput[MAX_INPUT];printf("请输入一串字符串：\n");fgets(input,sizeof(inp
C#中使用split分割字符串互联网打工人no1 c#
1、用字符串分隔：usingSystem.Text.RegularExpressions;stringstr="aaajsbbbjsccc";string[]sArray=Regex.Split(str,"js",RegexOptions.IgnoreCase);foreach(stringiinsArray)Response.Write(i.ToString()+"");输出结果：aaabbbc
怎么起诉借钱不还的人？怎样起诉欠款不还的人？影子爱学习
怎么起诉借钱不还的人？怎样起诉欠款不还的人？如果遇到难以解决的法律问题，我们可以匹配专业律师。例如：婚姻家庭（离婚纠纷）、刑事辩护、合同纠纷、债权债务、房产（继承）纠纷、交通事故、劳动争议、人身损害、公司相关法律事务（法律顾问）等咨询推荐手机/微信:15633770876【全国案件皆可】借钱不还起诉对方需要哪些资料起诉欠钱不还的，一般需要的材料包括以下这些：借据、收据、欠条、付款凭证等证据，以及向
相信相信的力量孙丽_cdb3
孙丽中级十期坚持分享第345天有一个特别有哲理的故事：有一只老鹰下了蛋，这个蛋，不知怎的就滚到了鸡窝里去了，鸡也下了一窝蛋，然后鸡妈妈把这些蛋全都浮出来了，孵出来之后等小鸡长大一点了，就觉得鹰蛋孵出来的那只小鹰怪模怪样，这些小鸡都嘲笑它，真难看，真笨，丑死了，那只小鹰觉得自己真是谁也不像，真是不好看，后来鸡妈妈也不喜欢他，我怎么生出你这样的孩子来了？真烦人，后来这群小鸡和小鹰一起生活，有一天，老鹰
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
春季养肝正当时 dxn悟
重温快乐2023年2月4日立春。春天来了，春暖花开，小鸟欢唱，那在这样的季节我们如何养肝呢？自然界的春季对应中医五行的木，人体五脏肝属木，“木曰曲直”，是以树干曲曲直直地向上、向外伸长舒展的生发姿态，来形容具有生长、升发、条达、舒畅等特征的食物及现象。根据中医天人相应的理念，肝五行属木，喜条达，主疏泄，与春天相应，所以春天最适合养肝。养肝首先要少生气，因为肝喜条达恶抑郁。人体五志肝为怒，生气发怒最
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
2022现在哪个打车软件比较好用又便宜实惠的打车软件合集高省APP珊珊
这是一个信息高速传播的社会。信息可以通过手机，微信，自媒体，抖音等方式进行传播。但同时这也是一个交通四通发达的社会。高省APP，是2022年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入。珊珊导师，高省邀请码777777，注册送2皇冠会员，送万元推广大礼包，教你如何1年做到百万团队。高
webpack图片等资源的处理 dmengmeng
需要的loaderfile-loader（让我们可以引入这些资源文件）url-loader（其实是file-loader的二次封装）img-loader（处理图片所需要的）在没有使用任何处理图片的loader之前，比如说css中用到了背景图片，那么最后打包会报错的，因为他没办法处理图片。其实你只想能够使用图片的话。只加一个file-loader就可以，打开网页能准确看到图片。{test:/\.(p
走向以教育叙事为载体的教育叙事研究 666小飞鱼
今天我读了吴松超老师的《给教师的68条建写作建议》中的第23条《如何通过教育叙事走向研究》，吴老师在文中与我们分享了一个德育案例，这是一个反面的案例，意在告知我们在处理问题时，不能就考虑的点太窄，思考要全面。走向教育叙事研究，教师要有敏锐的“感知力”，这个感知力来自于背后专业知识的支撑，思维能力以及广阔的视野和见识等。所以对于同一件事处理方法不同，这个就是教师背后“敏锐力”的不同造成的，也就是说是
CX8903：Ebike自行车仪表电源方案开发,Ebike智能仪表电源芯片诚芯微科技社交电子
CX8903：电动Ebike自行车仪表电源方案开发,Ebike智能仪表电源芯片推荐。电动助力自行车EBIKE凭借其环保、健康、低噪、和便捷等特点，成为了越来越受欢迎的骑行便利交通工具。提供电动Ebike自行车仪表电源方案开发、E-BIKE电动助力自行车仪表供电电源解决方案。CX8903采用100V高压制造工艺（芯片最高耐压可到100V以上），SOP-8L贴片封装，CX8903内置100V/90mΩ
CX8836：小体积大功率升降压方案推荐（附Demo设计指南）诚芯微科技社交电子
CX8836是一颗同步四开关单向升降压控制器，在4.5V-40V宽输入电压范围内稳定工作，持续负载电流10A，能够在输入高于或低于输出电压时稳定调节输出电压，可适用于USBPD快充、车载充电器、HUB、汽车启停系统、工业PC电源等多种升降压应用场合，为大功率TYPE-CPD车载充电器提供最优解决方案。提供CX8836Demo测试、CX8836样品申请及CX8836方案开发技术支持。CX8836同升
穷人做什么生意最赚钱？10个适合穷人赚钱的路子？氧惠爱高省
不管在什么地方，一般都是穷人占大量数，而富人只有少数，但是它们却掌握着大量的财富。对于穷人来说，想要买车、买房等奢侈品就难如登天，因为他们只能通过打工来赚取几千元的月薪。➤推荐网购返利app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。（应用市场搜“氧惠”下载，邀请码:521521，全网优惠上氧惠！
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
高级 ECharts 技巧：自定义图表主题与样式 SnowMan1993 echarts 信息可视化数据分析
ECharts是一个强大的数据可视化库，提供了多种内置主题和样式，但你也可以根据项目的设计需求，自定义图表的主题与样式。本文将介绍如何使用ECharts自定义图表主题，以提升数据可视化的吸引力和一致性。1.什么是ECharts主题？ECharts的主题是指定义图表样式的配置项，包括颜色、字体、线条样式等。通过预设主题，你可以快速更改图表的整体风格，而自定义主题则允许你在此基础上进行个性化设置。2.
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &