weixin_30436101

Unicode与UTF-8互转（c语言和lua语言）

1. 基础

1.1 ASCII码

我们知道, 在计算机内部, 全部的信息终于都表示为一个二进制的字符串. 每个二进制
位(bit)有0和1两种状态, 因此八个二进制位就能够组合出 256种状态, 这被称为一个字
节(byte). 也就是说, 一个字节一共能够用来表示256种不同的状态, 每个状态相应一
个符号, 就是256个符号, 从 0000000到11111111.

上个世纪60年代, 美国制定了一套字符编码, 对英语字符与二进制位之间的关系, 做了统
一规定. 这被称为ASCII码, 一直沿用至今.

ASCII码一共规定了128个字符的编码, 比方空格"SPACE"是32(二进制00100000), 大写的
字母A是65(二进制01000001). 这128个符号(包含32个不能打印出来的控制符号), 仅仅占用
了一个字节的后面7位, 最前面的1位统一规定为0.

1.2 非ASCII编码

英语用128个符号编码就够了, 可是用来表示其它语言, 128个符号是不够的. 比方, 在法
语中, 字母上方有注音符号, 它就无法用ASCII码表示. 于是, 一些欧洲国家就决定, 利
用字节中闲置的最高位编入新的符号. 比方, 法语中的é的编码为130(二进制10000010).
这样一来, 这些欧洲国家使用的编码体系, 能够表示最多256个符号.

可是, 这里又出现了新的问题. 不同的国家有不同的字母, 因此, 哪怕它们都使用256个
符号的编码方式, 代表的字母却不一样. 比方, 130在法语编码中代表了é, 在希伯来语
编码中却代表了字母Gimel (ג), 在俄语编码中又会代表还有一个符号.

NOTE:
可是无论如何, 全部这些编码方式中, 0-127表示的符号是一样的, 不一样的仅仅是128-255
的这一段. // MMMMM

至于亚洲国家的文字, 使用的符号就很多其它了, 汉字就多达10万左右. 一个字节仅仅能表示
256种符号, 肯定是不够的, 就必须使用多个字节表达一个符号. 比方, 中文简体常见的
编码方式是GB2312, 使用两个字节表示一个汉字, 所以理论上最多能够表示
256x256=65536个符号.

2. Unicode

2.1 Unicode的定义

正如上一节所说, 世界上存在着多种编码方式, 同一个二进制数字能够被解释成不同的符
号. 因此, 要想打开一个文本文件, 就必须知道它的编码方式, 否则用错误的编码方式解
读, 就会出现乱码. 为什么电子邮件经常出现乱码?

就是由于发信人和收信人使用的编码
方式不一样.

能够想象, 假设有一种编码, 将世界上全部的符号都纳入当中. 每个符号都给予一个独
一无二的编码, 那么乱码问题就会消失. 这就是Unicode, 就像它的名字都表示的, 这是
一种全部符号的编码.

Unicode也是一种字符编码方法, 只是它是由国际组织设计, 能够容纳全世界全部语言文
字的编码方案. Unicode的学名是"Universal Multiple-Octet Coded Character Set",
简称为UCS. UCS能够看作是"Unicode Character Set"的缩写.

Unicode当然是一个非常大的集合, 如今的规模能够容纳100多万个符号. 每一个符号的编码都
不一样, 比方, U+0639表示阿拉伯字母Ain, U+0041表示英语的大写字母A, U+4E25表示汉
字"严". 详细的符号相应表, 能够查询unicode.org, 或者专门的汉字相应表.

2.2 Unicode的问题

须要注意的是, "Unicode仅仅是一个符号集, 它仅仅规定了符号的二进制代码, 却没有规定这
个二进制代码应该怎样存储".

比方, 汉字"严"的unicode是十六进制数4E25, 转换成二进制数足足有15位
(100111000100101), 也就是说这个符号的表示至少须要2个字节. 表示其它更大的符号,
可能须要3个字节或者4个字节, 甚至很多其它.

这里就有两个严重的问题, 第一个问题是, 怎样才干差别unicode和ascii?计算机怎么知
道三个字节表示一个符号, 而不是分别表示三个符号呢?

第二个问题是, 我们已经知道,
英文字母仅仅用一个字节表示就够了, 假设unicode统一规定, 每一个符号用三个或四个字节
表示, 那么每一个英文字母前都必定有二到三个字节是0, 这对于存储来说是极大的浪费,
文本文件的大小会因此大出二三倍, 这是无法接受的.

它们造成的结果是:

1)  出现了unicode的多种存储方式, 也就是说有很多种不同的二进制格式,
    能够用来表示unicode.
2)  unicode在非常长一段时间内无法推广, 直到互联网的出现

3. UTF-8

互联网的普及, 强烈要求出现一种统一的编码方式. UTF-8就是在互联网上使用最广的一
种unicode的实现方式. 其它实现方式还包含UTF-16和UTF-32, 只是在互联网上基本不用.
反复一遍, 这里的关系是, UTF-8是Unicode的实现方式之中的一个.

UTF-8最大的一个特点, 就是它是一种变长的编码方式. 它能够使用1~6个字节表示一个符
号, 依据不同的符号而变化字节长度.

3.1 UTF-8的编码规则

UTF-8的编码规则非常easy, 仅仅有两条:

1) 对于单字节的符号, 字节的第一位设为0, 后面7位为这个符号的unicode码. 因此对于
   英语字母, UTF-8编码和ASCII码是同样的.

2) 对于n字节的符号(n>1), 第一个字节的前n位都设为1, 第n+1位设为0, 后面字节的前
   两位一律设为10. 剩下的没有提及的二进制位, 所有为这个符号的unicode码.

下表总结了编码规则, 字母x表示可用编码的位.

[plain]  view plain copy 
        
       
 // #txt---  
    |  Unicode符号范围      |  UTF-8编码方式  
  n |  (十六进制)           | (二进制)  
 ---+-----------------------+------------------------------------------------------  
  1 | 0000 0000 - 0000 007F |                                              0xxxxxxx  
  2 | 0000 0080 - 0000 07FF |                                     110xxxxx 10xxxxxx  
  3 | 0000 0800 - 0000 FFFF |                            1110xxxx 10xxxxxx 10xxxxxx  
  4 | 0001 0000 - 0010 FFFF |                   11110xxx 10xxxxxx 10xxxxxx 10xxxxxx  
  5 | 0020 0000 - 03FF FFFF |          111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx  
  6 | 0400 0000 - 7FFF FFFF | 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx  
   
                     表 1. UTF-8的编码规则  
 // #txt---end  
   

以下, 还是以汉字" 严 "为例, 演示怎样实现UTF-8编码.

已知" 严 "的unicode是4E25 (1001110 00100101) , 依据上表, 能够发现4E25处在第三行的
范围内 (0000 0800 - 0000 FFFF) , 因此" 严 "的UTF-8编码须要三个字节, 即格式是
" 1110xxxx 10xxxxxx 10xxxxxx ". 然后, 从" 严 "的最后一个二进制位開始, 依次从后向前
填入格式中的x, 多出的位补0. 这样就得到了, " 严 "的UTF-8编码是 " 11100100 10111000
10100101", 转换成十六进制就是E4B8A5.

4. Little endian和Big endian

上一节已经提到, Unicode码能够採用UCS-2格式直接存储. 以汉字" 严 "为例, Unicode码
是4E25, 须要用两个字节存储, 一个字节是4E, 还有一个字节是25. 存储的时候, 4E在前,
25在后, 就是Big endian方式; 25在前, 4E在后, 就是Little endian方式.
// Big Endian(4E25) Little Endian(254E)

因此, 第一个字节在前, 就是" 大头方式 " (Big endian) , 第二个字节在前就是" 小头方式
" (Little endian) .

4.1 计算机怎么知道某一个文件究竟採用哪一种方式编码?

(零宽度非换行空格(FEFF))

Unicode规范中定义, 每个文件的最前面分别增加一个表示编码顺序的字符, 这个字符
的名字叫做" 零宽度非换行空格 " (ZERO WIDTH NO-BREAK SPACE) , 用FEFF表示. 这正好是
两个字节, 并且FF比FE大1.
// Big Endian(FEFF) Little Endian(FFFE)

NOTE :
假设一个文本文件的头两个字节是FE FF, 就表示该文件採用大头方式; 假设头两个字节
是FF FE, 就表示该文件採用小头方式.

5. Unicode与UTF-8之间的转换（C语言版）

从表1我们非常明显能够得知Unicode与UTF-8的关系, 以下以C语言实现两者之间的转换.

[cpp]  view plain copy 
        
       
 1) 将一个字符的Unicode(UCS-2和UCS-4)编码转换成UTF-8编码.  
   
 // #c---  
 /***************************************************************************** 
  * 将一个字符的Unicode(UCS-2和UCS-4)编码转换成UTF-8编码. 
  * 
  * 參数: 
  *    unic     字符的Unicode编码值 
  *    pOutput  指向输出的用于存储UTF8编码值的缓冲区的指针 
  *    outsize  pOutput缓冲的大小 
  * 
  * 返回值: 
  *    返回转换后的字符的UTF8编码所占的字节数, 假设出错则返回 0 . 
  * 
  * 注意: 
  *     1. UTF8没有字节序问题, 可是Unicode有字节序要求; 
  *        字节序分为大端(Big Endian)和小端(Little Endian)两种; 
  *        在Intel处理器中採用小端法表示, 在此採用小端法表示. (低地址存低位) 
  *     2. 请保证 pOutput 缓冲区有最少有 6 字节的空间大小! 
  ****************************************************************************/  
 int enc_unicode_to_utf8_one(unsigned long unic, unsigned char *pOutput,  
         int outSize)  
 {  
     assert(pOutput != NULL);  
     assert(outSize >= 6);  
   
     if ( unic <= 0x0000007F )  
     {  
         // * U-00000000 - U-0000007F:  0xxxxxxx  
         *pOutput     = (unic & 0x7F);  
         return 1;  
     }  
     else if ( unic >= 0x00000080 && unic <= 0x000007FF )  
     {  
         // * U-00000080 - U-000007FF:  110xxxxx 10xxxxxx  
         *(pOutput+1) = (unic & 0x3F) | 0x80;  
         *pOutput     = ((unic >> 6) & 0x1F) | 0xC0;  
         return 2;  
     }  
     else if ( unic >= 0x00000800 && unic <= 0x0000FFFF )  
     {  
         // * U-00000800 - U-0000FFFF:  1110xxxx 10xxxxxx 10xxxxxx  
         *(pOutput+2) = (unic & 0x3F) | 0x80;  
         *(pOutput+1) = ((unic >>  6) & 0x3F) | 0x80;  
         *pOutput     = ((unic >> 12) & 0x0F) | 0xE0;  
         return 3;  
     }  
     else if ( unic >= 0x00010000 && unic <= 0x001FFFFF )  
     {  
         // * U-00010000 - U-001FFFFF:  11110xxx 10xxxxxx 10xxxxxx 10xxxxxx  
         *(pOutput+3) = (unic & 0x3F) | 0x80;  
         *(pOutput+2) = ((unic >>  6) & 0x3F) | 0x80;  
         *(pOutput+1) = ((unic >> 12) & 0x3F) | 0x80;  
         *pOutput     = ((unic >> 18) & 0x07) | 0xF0;  
         return 4;  
     }  
     else if ( unic >= 0x00200000 && unic <= 0x03FFFFFF )  
     {  
         // * U-00200000 - U-03FFFFFF:  111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx  
         *(pOutput+4) = (unic & 0x3F) | 0x80;  
         *(pOutput+3) = ((unic >>  6) & 0x3F) | 0x80;  
         *(pOutput+2) = ((unic >> 12) & 0x3F) | 0x80;  
         *(pOutput+1) = ((unic >> 18) & 0x3F) | 0x80;  
         *pOutput     = ((unic >> 24) & 0x03) | 0xF8;  
         return 5;  
     }  
     else if ( unic >= 0x04000000 && unic <= 0x7FFFFFFF )  
     {  
         // * U-04000000 - U-7FFFFFFF:  1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx  
         *(pOutput+5) = (unic & 0x3F) | 0x80;  
         *(pOutput+4) = ((unic >>  6) & 0x3F) | 0x80;  
         *(pOutput+3) = ((unic >> 12) & 0x3F) | 0x80;  
         *(pOutput+2) = ((unic >> 18) & 0x3F) | 0x80;  
         *(pOutput+1) = ((unic >> 24) & 0x3F) | 0x80;  
         *pOutput     = ((unic >> 30) & 0x01) | 0xFC;  
         return 6;  
     }  
   
     return 0;  
 }  
 // #c---end  

2) 将一个字符的UTF8编码转换成Unicode (UCS-2和UCS-4) 编码.

[cpp]  view plain copy 
        
       
 "http://www.w3.org/1999/xhtml" style="">// #c---  
 /***************************************************************************** 
  * 将一个字符的UTF8编码转换成Unicode(UCS-2和UCS-4)编码. 
  * 
  * 參数: 
  *    pInput      指向输入缓冲区, 以UTF-8编码 
  *    Unic        指向输出缓冲区, 其保存的数据即是Unicode编码值, 
  *                类型为unsigned long . 
  * 
  * 返回值: 
  *    成功则返回该字符的UTF8编码所占用的字节数; 失败则返回0. 
  * 
  * 注意: 
  *     1. UTF8没有字节序问题, 可是Unicode有字节序要求; 
  *        字节序分为大端(Big Endian)和小端(Little Endian)两种; 
  *        在Intel处理器中採用小端法表示, 在此採用小端法表示. (低地址存低位) 
  ****************************************************************************/  
 int enc_utf8_to_unicode_one(const unsigned char* pInput, unsigned long *Unic)  
 {  
     assert(pInput != NULL && Unic != NULL);  
   
     // b1 表示UTF-8编码的pInput中的高字节, b2 表示次高字节, ...  
     char b1, b2, b3, b4, b5, b6;  
   
     *Unic = 0x0; // 把 *Unic 初始化为全零  
     int utfbytes = enc_get_utf8_size(*pInput);  
     unsigned char *pOutput = (unsigned char *) Unic;  
   
     switch ( utfbytes )  
     {  
         case 0:  
             *pOutput     = *pInput;  
             utfbytes    += 1;  
             break;  
         case 2:  
             b1 = *pInput;  
             b2 = *(pInput + 1);  
             if ( (b2 & 0xE0) != 0x80 )  
                 return 0;  
             *pOutput     = (b1 << 6) + (b2 & 0x3F);  
             *(pOutput+1) = (b1 >> 2) & 0x07;  
             break;  
         case 3:  
             b1 = *pInput;  
             b2 = *(pInput + 1);  
             b3 = *(pInput + 2);  
             if ( ((b2 & 0xC0) != 0x80) || ((b3 & 0xC0) != 0x80) )  
                 return 0;  
             *pOutput     = (b2 << 6) + (b3 & 0x3F);  
             *(pOutput+1) = (b1 << 4) + ((b2 >> 2) & 0x0F);  
             break;  
         case 4:  
             b1 = *pInput;  
             b2 = *(pInput + 1);  
             b3 = *(pInput + 2);  
             b4 = *(pInput + 3);  
             if ( ((b2 & 0xC0) != 0x80) || ((b3 & 0xC0) != 0x80)  
                     || ((b4 & 0xC0) != 0x80) )  
                 return 0;  
             *pOutput     = (b3 << 6) + (b4 & 0x3F);  
             *(pOutput+1) = (b2 << 4) + ((b3 >> 2) & 0x0F);  
             *(pOutput+2) = ((b1 << 2) & 0x1C)  + ((b2 >> 4) & 0x03);  
             break;  
         case 5:  
             b1 = *pInput;  
             b2 = *(pInput + 1);  
             b3 = *(pInput + 2);  
             b4 = *(pInput + 3);  
             b5 = *(pInput + 4);  
             if ( ((b2 & 0xC0) != 0x80) || ((b3 & 0xC0) != 0x80)  
                     || ((b4 & 0xC0) != 0x80) || ((b5 & 0xC0) != 0x80) )  
                 return 0;  
             *pOutput     = (b4 << 6) + (b5 & 0x3F);  
             *(pOutput+1) = (b3 << 4) + ((b4 >> 2) & 0x0F);  
             *(pOutput+2) = (b2 << 2) + ((b3 >> 4) & 0x03);  
             *(pOutput+3) = (b1 << 6);  
             break;  
         case 6:  
             b1 = *pInput;  
             b2 = *(pInput + 1);  
             b3 = *(pInput + 2);  
             b4 = *(pInput + 3);  
             b5 = *(pInput + 4);  
             b6 = *(pInput + 5);  
             if ( ((b2 & 0xC0) != 0x80) || ((b3 & 0xC0) != 0x80)  
                     || ((b4 & 0xC0) != 0x80) || ((b5 & 0xC0) != 0x80)  
                     || ((b6 & 0xC0) != 0x80) )  
                 return 0;  
             *pOutput     = (b5 << 6) + (b6 & 0x3F);  
             *(pOutput+1) = (b5 << 4) + ((b6 >> 2) & 0x0F);  
             *(pOutput+2) = (b3 << 2) + ((b4 >> 4) & 0x03);  
             *(pOutput+3) = ((b1 << 6) & 0x40) + (b2 & 0x3F);  
             break;  
         default:  
             return 0;  
             break;  
     }  
   
     return utfbytes;  
 }  
 // #c---end  
   

6. Unicode与UTF-8之间的转换（lua语言版）

-- unicode_to_utf8
local function unicode_to_utf8(convertStr)

    if type(convertStr)~="string" then
        return convertStr
    end

    local bit = require("bit")
    local resultStr=""
    local i=1
    while true do
        
        local num1=string.byte(convertStr,i)
        local unicode
        
        if num1~=nil and string.sub(convertStr,i,i+1)=="\\u" then
            unicode=tonumber("0x"..string.sub(convertStr,i+2,i+5))
            i=i+6
        elseif num1~=nil then
            unicode=num1
            i=i+1
        else
            break
        end

        if unicode <= 0x007f then
            resultStr=resultStr..string.char(bit.band(unicode,0x7f))
        elseif unicode >= 0x0080 and unicode <= 0x07ff then
            resultStr=resultStr..string.char(bit.bor(0xc0,bit.band(bit.rshift(unicode,6),0x1f)))
            resultStr=resultStr..string.char(bit.bor(0x80,bit.band(unicode,0x3f)))
        elseif unicode >= 0x0800 and unicode <= 0xffff then
            resultStr=resultStr..string.char(bit.bor(0xe0,bit.band(bit.rshift(unicode,12),0x0f)))
            resultStr=resultStr..string.char(bit.bor(0x80,bit.band(bit.rshift(unicode,6),0x3f)))
            resultStr=resultStr..string.char(bit.bor(0x80,bit.band(unicode,0x3f)))
        end
    end
    resultStr=resultStr..'\0'
    return resultStr
end

转载于:https://www.cnblogs.com/lxjshuju/p/6812387.html

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
绘本讲师训练营【24期】8/21阅读原创《独生小孩》 1784e22615e0
24016-孟娟《独生小孩》图片发自App今天我想分享一个蛮特别的绘本，讲的是一个特殊的群体，我也是属于这个群体，80后的独生小孩。这是一本中国绘本，作者郭婧，也是一个80厚。全书一百多页，均为铅笔绘制，虽然为黑白色调，但并不显得沉闷。全书没有文字，犹如“默片”，但并不影响读者对该作品的理解，反而显得神秘，梦幻，給读者留下想象的空间。作者在前蝴蝶页这样写到：“我更希望父母和孩子一起分享这本书，使他
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
2021-08-26 影幽
在生活中，女人与男人的感悟往往有所不同。人生最大的舞台就是生活，大幕随时都可能拉开，关键是你愿不愿意表演都无法躲避。在生活中，遇事不要急躁，不要急于下结论，尤其生气时不要做决断，要学会换位思考，大事化小小事化了，把复杂的事情尽量简单处理，千万不要把简单的事情复杂化。永远不要扭曲，别人善意，无药可救。昨天是张过期的支票，明天是张信用卡，只有今天才是现金，要善加利用！执着的攀登者不必去与别人比较自己的
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓

Unicode与UTF-8互转（c语言和lua语言）

你可能感兴趣的:(Unicode与UTF-8互转（c语言和lua语言）)