SoyaDokio

编码方式与字符集

之前写在GitHub Pages上，发表于2017-02-06。这篇是总结删改了多次得到的，可能之后理解更深会进一步修改吧

编码的前世今生

在人们不仅仅满足于计算机只有计算器功能而想要用其表示世界万物的时候，有一群人决定用8个可以表示两种状态的晶体管组合到一起以表示256（2^8=256）种不同的状态，每种状态表示一个信息的话，这些状态就可以用来描述世界上的万物。至于为何会选用8个一组而不是1,2,3,4,5,……呢？因为CPU的硬件原理（这里不讨论物理）决定了选用2的次方比较利于计算机的运算，所以选择只剩下2,4,8,16,32,……而选用7个作为一组的话就有128（2^7=128）种不同的组合，已经完全够表示所有的文字和符号（碍于当时的各种局限性，美国人只考虑了拉丁文26个字母的大小写、数字和一些（可显示）符号，以及一些控制符（比如回车））了，于是就近选择了8个作为一组。这样的8个一组的组合被他们强制规定称为字节。而这128个不同的组合表达了哪些不同的字节，这就是ASCII码所规定的内容了。

ASCII编码的由来

这群人把这128种状态按前后顺序编了个号，又规定从编号0开始到编号31的总共32种状态分别表示一种特殊用途，一但终端、打印机等遇上这些约定好的字节被传过来时，就要做一些约定的动作。比如遇上0x10（0x后接十六进制数是十六进制表示法，这里的0x10表示编号为16的字节）, 终端就换行；遇上0x07, 终端的蜂鸣器就滴滴滴的叫；遇上0x1b, 打印机就打印反色的文字（就是交换前景色背景色后打印），或者终端就用彩色显示文字。这些规定用了一段时间后发觉挺好使，于是这规定就正式确立下来，并把这些0x20以下的字节（编号0~31）称为控制码/控制符号。

他们又把所有的空格、标点符号、数字、大小写字母分别用连续的字节状态表示，一直编到了第127号（共128个），这样计算机就可以用不同字节来表示英语这种语言的文字了。以上规定经使用后反响很好，于是大家都把这个方案确定下来，并称之为美国国家标准学会（American National Standards Institute,ANSI）的美国信息互换标准代码（American Standard Code for Information Interchange,ASCII），也就是俗称的ASCII编码。当时世界上几乎所有的计算机都用这样的ASCII编码方案来保存英文文字。

ASCII编码的扩展

计算机的运算、电子信息存储等优势展现出来以后，世界各地的都开始使用计算机，但是很多国家用的不是英文，他们的文字里有许多是ASCII编码表里没有的，为了可以在计算机保存他们的文字，他们决定采用127号（第128个）之后到255号（第256个）之间没有使用的空位来表示自己母语需要的字母、符号，同时还加入了很多画表格时需要用到的横线、竖线、交叉等形状的符号，一直把序号编到了最后一个字节——第255号。从128到255这一部分的字符集被称扩展字符集。

中国人自己的编码：国标（GB）

等到计算机起步较晚的中国人得到计算机时，已经没有可以利用的字节来表示汉字，况且常用汉字一再精简也仍有6000多个需要保存，哪怕256种字节全给咱也完全不够使。但是这难不倒智慧的中国人，咱们不客气地把那些127号之后的各种标准的符号们直接取消掉，并规定：一个小于127的字符的意义与原来相同，但两个大于127的字符连在一起时，就表示一个汉字，前面的一个字节（他称之为高字节）从0xB0（即十进制的176）到0xF7（即十进制的247）共72个，后面一个字节（低字节）从0xA1（即十进制的161）到0xFE（即十进制的254）共94个，这样就可以组合出6768（72*94=6768）个字节了（其中有5个空位是D7FA-D7FE），差不多常用简体汉字都够了。在这些编码里，我们还把数学符号、罗马希腊的字母、日文的假名们都编进去了，连在ASCII里本来就有的数字、标点、字母都统统重新编了两个字节长的编码，这就是常说的全角字符，而原来在127号以下的那些就叫半角字符了。

这套标准中国人用起来很不错，于是就确立了这种编码方式，并称之为GB2312。GB2312可以说是对ASCII的中文扩展。

但是中国的汉字太多了，我们很快就就发现有许多人的人名没有办法在这套标准里打出来。于是我们不得不继续把GB2312没有用到的码位找出来老实不客气地用上。但后来还是不够用，于是干脆不再要求低字节一定是127号之后的内码，只要求第一个字节是大于127号就表示这是一个汉字的开始，不管后面跟的是不是扩展字符集里的内容（不管后面跟的是不是大于127号）。结果扩展之后的编码方案被称为GBK编码（GuoBiaoKuozhan，“国标、扩展”）标准，GBK是在GB2312-80标准基础上的内码扩展规范，使用了双字节编码方案，其编码范围从8140至FEFE（剔除xx7F），共23940个码位，共收录了21003个汉字（包括繁体字）和一些符号。值得一提的是GBK与当时的国际标准UCS（ISO 10646）完全兼容，至于什么是UCS后文细说。
后来少数民族也要用电脑了，于是我们再扩展，又加了几千个新的少数民族的字，GBK扩成了GB18030。从此之后，中华民族的文化就可以在计算机时代中传承了。中国的编码工作者们看到这一系列汉字编码的标准很好使，于是通称其叫做DBCS（Double Byte Charecter Set，双字节字符集）。在DBCS系列标准里，最大的特点是两字节长的汉字字符和一字节长的英文字符并存于同一套编码方案里，因此他们写的程序为了支持中文处理，必须要注意字串里的每一个字节的值，如果这个值是大于127的，那么就认为一个双字节字符集里的字符出现了。于是就有了早期的一个著名说法一个汉字算两个英文字符，一个汉字算两个英文字符。

全球信息交换需求的与日俱增与全球统一编码——UNICODE的出现

在那个信息急需电子化的时代，由于没有统一的标准（其实是没有人认识到各自为政的弊端而不买统一标准的账），各个国家都像中国这样搞出一套自己的编码标准，结果各个语系名族谁也不懂谁的编码，谁也不支持别人的编码，连大陆和台湾这样只相隔了150海里，使用着同一种语言的兄弟地区，也分别采用了不同的DBCS编码方案：当时的大陆人想让电脑显示大陆的简体汉字，就必须装上一个“汉字系统”（其实就是改变编码），专门用来处理简体汉字的显示、输入的问题；而台湾人想要显示台湾的繁体汉字就必须改装另一套支持BIG5编码的什么“倚天汉字系统”（其实又是改变编码）才可以用。装错了字符系统，显示就会乱了套！这怎么办？而且世界民族之林中还有那些暂时还没用上电脑的穷苦人民，他们的文字将来电子化又该怎么办？正在这时，一个叫ISO（International Organization for Standardization，国际标谁化组织）的国际组织宣布决定着手解决这个问题（其实想搞国际统一标准的有好几个组织，争到中期还剩两家，最后又争了一段时间两家合作决定让ISO领头搞），他们采用的方法很简单：废了所有的地区性编码方案，重新搞一个包括了地球上所有文化、所有字母和符号的编码！他们打算管它叫Universal Multiple-Octet Coded Character Set（一说叫Universal Coded Character Set），简称UCS，俗称UNICODE。

UNICODE开始制订时，计算机的存储器容量极大地发展了（想当年能用钱买到的民用最大存储空间的硬盘不过29MB），存储空间再也不是重要瓶颈了。于是ISO就直接规定必须用两个字节，也就是16位来统一表示所有的字符，对于ASCII里的那些“半角”字符，UNICODE保持其原编码不变，只是将其长度由原来的8位扩展为16位，而其他文化和语言的字符则全部重新统一编码。由于“半角”英文符号只需要用到低8位，所以其高8位永远是0，因此这种“大气”的方案在保存英文文本时会多浪费一倍的存储空间！

这时候，从旧社会里走过来的程序员开始发现一个奇怪的现象：他们的strlen函数靠不住了，一个汉字不再是相当于两个字符了，而是一个！是的，从UNICODE开始，无论是半角的英文字母，还是全角的汉字，它们都是统一的一个字符，同时，也都是统一的两个字节！请注意“字符”和“字节”两个术语的不同，“字节”是一个8位的物理存贮单元，而“字符”则是一个文化相关的符号最小单位。在UNICODE中，一个字符就是两个字节。一个汉字算两个英文字符的时代已经快过去了。

从前多种字符集存在时，那些做多语言软件的公司遇上过很大麻烦，他们为了在不同的国家销售同一套软件，就不得不在区域化软件时也增加对应地区的双字节字符集，不仅要处处小心不要搞错，还要把软件中的文字在不同的字符集中转来转去。更麻烦的是需要多语言工作环境的人就需要不停地在各种地区性内码表之间切换（DOS命令：chcp）。UNICODE对于他们来说是一个很好的一揽子解决方案，于是从Windows NT开始，MS趁机把它们的操作系统改了一遍，把所有的核心代码都改成了用UNICODE方式工作的版本，从这时开始，WINDOWS系统终于无需要加装各种区域化语言系统，就可以显示全世界上所有文化的字符了。

但是，UNICODE在制订时没有考虑与任何一种现有的编码方案保持兼容，比如对于GBK，这使得GBK与UNICODE在汉字的内码编排上完全是不一样的，没有一种简单的算术方法可以把文本内容从UNICODE编码和另一种编码进行转换，这种转换必须通过查表来进行。再加上前面提到的UNICODE字符集在保存英文文本时会多浪费一倍的存储空间，这不太能令人接受，尤其是后来计算机不再仅限于单机使用，而是需要信息交换的联网工作，但限于当时硬件制造技术水平的瓶颈，网线的传输速率很低，那么多用了一倍的存储空间就意味着至少（须知数据传输领域有个词叫“丢包”）多出一倍的传输时间，这是在传输速率低下的当时的人们绝对不能容忍的，于是大家都知道UNICODE前景很好，但是大家都不用它，UNICODE也就得不到推广。

UNICODE的春天

如前所述，UNICODE是用两个字节来表示为一个字符，他总共可以组合出65536个不同的字符，这大概已经可以覆盖世界上所有文化的符号。如果还不够也没有关系，ISO已经准备了UCS-4方案（其实之前的方案不仅可以叫做UCS，也可以称之为UCS-2），说简单点就是四个字节来表示一个字符，这样我们就可以组合出21亿个不同的字符出来（最高位有其它用途），这大概可以用到外星人来地球拜年的那一天吧！

前文说了，UNICODE限于浪费存储空间，UNICODE如何在网络上高效传输是一个必须解决的问题，于是面向传输的众多UTF（UCS Transformation Format）标准出现了。顾名思义，UTF-8就是每次8个位传输数据，而UTF-16就是每次16个位传输数据。只不过为了传输时的可靠性，从UNICODE到UTF时并不是直接的对应，而是先要通过一些简单的规则来进行转换。在UTF-8中，0-127号的字符用1个字节来表示，使用与ASCII相同的编码。这意味着1980年代写的文档用UTF-8打开一点问题都没有。只有128号及以上的字符才用2个，3个或者4个字节来表示。因此，UTF-8被称作可变长度编码。它非常完美的解决了UNICODE一统世界标准却不便于传输的问题，于是UNICODE立刻遍地开花，春光灿烂。

低字节序与高字节序和BOM

学习过网络编程的程序猿们都知道，在网络里传递信息时有一个很重要的问题，就是对于数据高低位的解读方式，即字节序问题。一些计算机是采用低位字节被存在前面的方式，称之为低字节序（Little Endian），例如Intel架构的微处理器；而另一些是采用高位字节被存在前面的方式，称之为高字节序（Big Endian），例如Motorola架构的微处理器。在网络中数据交换时，为了核对双方对于高低位的规则是否是一致的，采用了一种很简便的方法——文本流前添加BOM（Byte Order Mark，字节顺序标记），就是在文本流的开始时添加一个标志符来表示该文本的字节序。具体规则是如果该文本是高字节序，BOM就为FEFF，反之，则为FFFE。

BOM尽管很有用，但并不是很简洁。还有一个类似的概念，称作「魔术字」(Magic Byte)，很多年来一直被用来表明文件的格式。BOM和魔术字间的关系一直没有被清楚的定义过，因此有的解释器会搞混它们。

“联通拼不赢移动”？

讲到这里，顺便说说一个很著名的奇怪现象：当在Windows的记事本里新建一个文件，输入联通两个字，保存关闭后再次打开，会发现这两个字已经消失了，代之的是几个乱码！

其实这是因为GB2312编码与UTF8编码产生了编码冲撞的原因。

UNICODE转UTF-8的规则

上文提到，从UNICODE到UTF-8时并不是直接的对应，而是先要通过一些简单的规则来进行转换，那么这时候就必须要说说这个规则了。

从网上引来一段从UNICODE到UTF8的转换规则：

UNICODE字符集范围	UTF-8编码规则
0000 0000 ~ 0000 007F	0xxxxxxx
0000 0080 ~ 0000 07FF	110xxxxx 10xxxxxx
0000 0800 ~ 0000 FFFF	1110xxxx 10xxxxxx 10xxxxxx
0001 0000 ~ 0010 FFFF	11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

例如”汉”字的UNICODE编码是6C49（没有原因，就是规定，后文会详细解释UNICODE）。6C49在0000 0800 ~ 0000 FFFF这个区间里，所以要用3字节模板：1110xxxx 10xxxxxx 10xxxxxx。将6C49写成二进制是0110 1100 0100 1001（为便于阅读去掉了前导0），将这个比特流按三字节模板的分段方法分为0110 110001 001001，依次代替模板中的x，得到1110-0110 10-110001 10-001001，再转为十六进制即E6 B1 89，这就是其对应的UTF-8编码。而当在Windows中新建一个文本文件时，记事本的编码默认是ANSI，如果你在ANSI的编码下输入汉字，那么他实际就是DBCS里的GB系列的编码方式，在这种编码下，”联通”的内码是C1 AA CD A8，换算成二进制即1100 0001 1010 1010 1100 1101 1010 1000，观察发现第一二个字节、第三四个字节的起始部分的都是110和10，正好与UTF-8规则里的第二个模板规则，即两字节模板是一致的，于是再次打开记事本时，而记事本默认会先判断它是不是UTF，如果不是再用ANSI编码。而第一步一判断发现其与UTF-8的第二个模板规则，即二字节模板吻合，于是就认为这是一个UTF-8编码的文件。让我们把这个长得像却不是UTF-8的数据当做UTF-8解读一下：把第一个字节的110和第二个字节的10去掉，我们就得到了---0 0001 --10 1010，再把各个比特位对齐，补上前导的0，就得到了0000 0000 0110 1010，换算成十六进制就是006A，最后拿UNICODE字符集一对照，U+006A是小写的字母j，而之后的两字节用UTF-8解码之后是0368，U+0368这个字符什么也不是，就会变成乱码。这就是只有”联通”两个字的文本没有办法在记事本里正常显示的原因。

而如果你在联通之后多输入几个字，其他的字的编码不见得又恰好是110和10开始的字节，这样再次打开时由于第一步判断不满足，于是记事本就不会坚持认为这是一个UTF-8编码的文件，而会用ANSI的方式解读，这时乱码又不出现了。

如果你要测试”abc汉字”这个串的长度，在没有n前缀的数据类型里，这个字串是7个字符的长度，因为一个汉字相当于两个字符。而在有n前缀的数据类型里，同样的测试串长度的函数将会告诉你是5个字符，因为一个汉字就是一个字符。

UNICODE的一大误区——字符集与编码的区别

UNICODE并不涉及字符是怎么在字节中表示的，它仅仅指定了字符对应的数字，仅此而已。

关于UNICODE的其它误解包括：UNICODE支持的字符上限是65536个，UNICODE字符必须占两个字节。告诉你这些的人应该去换换脑子了。

UNICODE只是一个用来映射字符和数字的标准。它对支持字符的数量没有限制，也不要求字符必须占两个、三个或者其它任意数量的字节。

UNICODE字符是怎样被编码成内存中的字节这是另外的话题，它是被UTF(UNICODE Transformation Formats)定义的。

总结：UNICODE只是一个字符与数字的映射关系，官方术语是码位(Code Point)，总是用U+开头，如字母A是U+0061。即UNICODE（不是编码方案）是字符集，UTF-8、UTF-16等才是编码方案。

总结

这个世界上从来没有纯文本这回事，如果你想读出一个字符串，你必须知道它的编码。
UNICODE是一个简单的标准，用来把字符映射到数字上。UNICODE协会的人会帮你处理所有幕后的问题，包括为新字符指定编码。
UNICODE并不告诉你字符是怎么编码成字节的。这是被编码方案决定的，通过UTF来指定。
永远记得通过Content-Type或者meta标签的charset属性来显式指定你的文档的编码。这样浏览器就不需要猜测你使用的编码了，他们会准确的使用你指定的编码来渲染文档。

参考：
学点编码知识又不会死：Unicode的流言终结者和编码大揭秘

ExpRe[25] bash外的其它shell：zsh和fish tritone ExpRe bash linux ubuntu shell
文章目录zsh基础配置实用特性插件`autojump`语法高亮自动补全fish优点缺点时效性本篇撰写时间为2021.12.15，由于计算机技术日新月异，博客中所有内容都有时效和版本限制，具体做法不一定总行得通，链接可能改动失效，各种软件的用法可能有修改。但是其中透露的思想往往是值得学习的。本篇前置：ExpRe[10]Ubuntu[2]准备神秘软件、备份恢复软件https://www.cnblogs
安徽省这个湖,比西湖大8倍,称是安徽的北戴河, 合肥的后花园旅游小号角
旅游爱好者都知道，安徽省是一个旅游资源十分丰富的省份，且不说黄山、九华山、天柱山这三大名山，单说湖泊就不比其它省份少，今天我们一起走遍世界将为大家说说一个号称安徽北戴河，合肥后花园的湖泊，看看到底是哪个湖泊？话说，这个湖泊位于安徽省六安市舒城县境内，东距合肥50千米，大约一个小时左右的车程，它号称是合肥的后花园，安徽的北戴河。相传，湖畔石壁之上有一奇石神似观音临湖，湖中漂动众多小岛栩栩如佛子，宛若
自由职业态 2017/12/15 jojovicky
比较适合我个人成长与发展期。为什么这么说，从小，家庭给予我相对自由的成长空间，长大后在学业与职业上也是给予自由。除了商科专业是家长提供建议外，其它专业是建立在个人兴趣与需要基础上。这是自己成为自由职业态与心态的由来。在各专业中不仅结识了同学朋友甚至成为今天的合作小伙伴。这也是奠定了自由职业态的基石。曾经为了平衡家庭孩子以及工作，我选择了进入学校当一名老师，特此感谢我的老板（伯乐）和先生以及家人给予
scanf占位符的一些用法阿玉的屋檐 c语言初学者算法数据结构 c语言青少年编程学习
1.限制输入数据的长度intmain(){inta=123456;scanf("%3d",&a);printf("%d",a);return0;}如果输入的值大于3位则最多读取输入的只读取前3位数据。2.匹配特定字符charss[6];scanf("%[abcd]",ss);%[abcd]表示只读取字符abcd，遇到其它的字符就读取结束，如果abcd字符在字符串的中间部分那么就不能正常读取字符。如
现在做自媒体还赚钱吗，普通人怎样做自媒体赚钱？氧惠好物
短视频平台很多，但真正能赚到钱的不多，选好阵地盆满钵满，选错阵地颗粒无收也可以做氧惠APP分享赚钱，2023新型淘客平台，收益还不错氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，注册送V8等级，欢迎各位团队长体验！也期待你的加入。氧惠邀请码166666，注册就帮你推广，一起做到百万团队！氧惠怎么使用1复制淘宝（其它平台）商品链接，淘口令，标
夏日随笔日记夏天的夜住在城里的庄户孩子
浅聊微信朋友圈及其它文/王立虎（一）又是一个深夜了，夏天的夜显得有些浮躁有些闷热，透过窗户外面街道上街灯依旧明亮，照着匆忙的车与人回家。关上电脑，打开，还是先完成日更，一直坚持着努力着写着，虽没有什么优秀的大作出现，但有时候还是佩服自己对文学的执着和爱好，佩服自己的自律。写点吧，在这夜深人静的时候，独处着，习惯着，随笔写下自己一天的心情，有感悟，有事件，有温度，我想写下总是好的。也有人喜欢这个点来
golang学习笔记--MPG模型 xxzed golang #学习笔记学习笔记 golang
MPG模式：M（Machine）：操作系统的主线程P（Processor）：协程执行需要的资源（上下文context），可以看作一个局部的调度器，使go代码在一个线程上跑，他是实现从N：1到N：M映射的关键G（Goroutine）：协程，有自己的栈。包含指令指针（instructionpointer）和其它信息（正在等待的channel等等），用于调度。一个P下面可以有多个G1、当前程序有三个M,
元宵节活动湘子_5b16
2019-2-19号深圳新东方烹饪学校组织了一场非常有意义的元宵节活动～即每人发30块代金券，用于购买其它班级元宵节展出的食品。听起来好诱人啊，我们可以买中餐班的泡椒凤爪，烧烤，火锅，东北夹馍饼，西餐的西式烩饭，BBQ烤全翅，三明治，法式烤土豆，香煎墨鱼丸，炸鸡米花，海草寿丝，鱼仔酱寿丝，西点班的小点心，奶茶，饼干，蛋糕，居然还有北京的冰糖胡芦…看到这么多花样多，品种多，又美味的东西，怎能不叫人垂
拼多多返利app叫什么名字?拼多多返利靠前的5个软件大全小小编007
拼多多返利app指的是拼多多购物平台的返现或折扣应用。这些应用通过提供优惠券、折扣、返现等方式吸引消费者，增加购物体验的实惠性。在拼多多平台上，有很多返利软件，其中排名前五的软件分别是：1.果冻宝盒果冻宝盒是一个综合导购返利软件，覆盖了淘宝，拼多多、京东、抖音等各大电商平台的商品优惠券和返利服务。还有话费充值，汽车加油，电影票，外卖红包，视频会员充值等各种低折扣生活娱乐权益。果冻宝盒相比其它同行，
致即将逝去的2020年斯丹钰
婚姻生活没有想象中那么完美…有时候特别痛恨小时候受的那些教育为什么要被灌输：结婚就好了结婚根本不是那么一件容易的事情…结婚是一种全新生活方式的开始是每一个人学习的新课程很讨厌传统思想中：女人的价值不就是为了生儿育女的吗！我觉得女人哪怕你不是想走所谓的事业型但是你一定要拥有一技之长无论你身在职场，还是想退隐江湖哪天再回来…至少你能在这个时代和这个社会生存下去那时候再来谈你的精神你要的所有其它的东西不
To：一凡 fullofyou
一凡，你是一个文静的姑娘。不过，你有些过于安静了，对于所有东西都不争不抢。你从不抱怨，也从不炫耀。有时候安静的让人心疼。图片发自App虽然你很文静，但是和同学相处的不错。为了让你更融入班级，我决定让你书写每天的3+1。你真的很认真负责，从来没有让我操心，需要更换时，你会问我或者看其它班级的内容。这一点你真的很棒！图片发自App姑娘，以后的路还很长，该争取的时候也要争取哦！过于文静，会让别人忽略了你
《用七年改变人生》第531天/共2556天，2022.6.15，存钱和失控七星录
成功日记今天发了工资，再次存了一万块钱。每个月存钱已经成了习惯，财富的积累目前保持稳定。没有其它收入只能一直保持在这个水平上。反思日记最近几天不知道是因为工作上的事情，还是自己没有休息好。还是因为自己的欲望太高了，所以了导致自己不能控制住自己的情绪。总是处在失控的边缘。只要每次想要的更多一些，就会特别的烦躁。是因为想要的多了，心中的欲望就多，就会失控。这一次自己竟然犯了这个重复在犯的错误。少则得，
xp系统打开计算机硬盘分区,详解WindowsXP硬盘分区步骤随缘惜情 xp系统打开计算机硬盘分区
有许多游戏玩家对经典的WinXP系统非常忠实，即使重新购买了一台超强配置的电脑，依然选择安装WinXP系统，因为WinXP对很多老游戏兼容性更强，游戏玩家也对硬盘的分配非常讲究，因为每一款好玩的游戏容量都是非常庞大，而如果硬盘容量太小的话就装不了几款游戏了，所以许多用户喜欢将其它硬盘容量都分配到一个比较大的分区内，若是Win7就可以非常直观的自动分配，而在WinXP系统下该如何实现呢?下面一起来认
无线耳机什么牌子的好？质量好性价比高？无线耳机品牌最好排名前十名？日常购物小技巧
今天我们就来说下：无线耳机什么牌子的好？质量好性价比高？无线耳机品牌最好排名前十名？大家好！我是花桃平台最大团队&联合创始人大同导师。相较于其它返利app，花桃佣金更高，模式更好，终端用户不流失！无线耳机什么牌子好？随着科技的不断发展，人们的生活方式和消费习惯也在不断变化。无线耳机成为了现代人出行、运动、听音乐的必备之物。但是市面上品牌种类繁多，价格也参差不齐。那么，无线耳机什么牌子好呢？华为Fr
unocss 一直热更新打印[vite] hot updated: /__uno.css 柳雾青烟紫燕穿 css css3 vue
控制台持续打印了几千条这条信息，页面逐渐卡死client.ts:450[vite]hotupdated:/__uno.css找出的原因是：依赖出问题了，重新安装unocss，执行命令npmiunocss后修复。但奇怪的是，删除node_modules重新全部安装依赖却不能修复，tmd。还有一种解决方法是切换分支，切去其它分支，再切回来，也不会再打印了。一开始还怀疑了是哪里的unocss类名一直在监
编程小技巧风的低语
40条真言，希望对进阶中的程序朋友有所帮助。1、重构是程序员的主力技能。2、工作日志能提升脑容量。3、先用profiler调查，才有脸谈优化。4、注释贵精不贵多。杜绝大姨妈般的“例注”。漫山遍野的碎碎念注释，实际就是背景噪音。5、普通程序员+google=超级程序员。6、单元测试总是合算的。7、不要先写框架再写实现。最好反过来，从原型中提炼框架。8、代码结构清晰，其它问题都不算事儿。9、好的项目作
健康小知识植物神经紊乱
早睡帮助你很好地理清思维，早起之后你的思路会变得更加清晰。晚上熬夜只会让你的血压和胆固醇含量升高，只会给自己的身体带来压力。这样的生活节奏会让你感染癌症或者其它心脏类疾病。所以要早睡让你的血压保持在正常水平。早餐对一天的开始非常重要，而大多时候我们因为起晚了而不吃早餐。为了能吃上早餐所以早晨要早起（早睡才能早起），10点之前吃完早餐非常重要。
会表达，才快乐程景轩
图片发自App每每孩子之间出现问题，或者孩子与大人出现问题时，往往都有这种情况。说话的一方只为对方好，但是在表达时，就是直接说出对方做的不好。用意是好的，想让对方得以纠正自己的不到之处。当女儿看到弟弟在卫生间玩水时，就大声的呵斥：“不许玩。”弟弟听了这话会怎么样呢？正常情况下是置若罔闻，继续玩自己的，除非姐姐再会发出其它的招儿。姐姐是不想让弟弟浪费水，所以一看到自己制止，初心当然没得说。这样的表达
source insight4.0中文乱码解决方法鹿屿二向箔 c语言 stm32 keil mdk
Sourceinsight是强大、顺手的代码编辑器，它几乎支持所有的语言，包括：C，C++，C#，HTML等等，能够自动创建并维护它自己高性能的符号数据库，包括函数、全局变量、结构、类和工程源文件里定义的其它类型的符号，对于大工程的源码阅读非常方便。但是因为是国外软件，对中文支持不是很好，很多电脑安装使用都会出现注释乱码问题，很让人抓狂。网上很多人遇到类似的问题，也有很多解决方式，也有很多“终极解
累雪枝儿
从早上八点开始干活一直干到现在，有时真觉得累，吃饭都是筷子一放下立马干活，紧赶紧赶的，到现在都不想动，也不想洗。想想在家带小孩的想出来干活，外面干活地又羡慕在家带小孩地，都是看着别人好啊。而且像我还没有人问候一下，真是。没事的，自已多关心下下自已，多疼疼自已，不要想那些不如意地，多想好的，多想其它，我也能干的很好。不疼你的人不要想，不好的话不要记。向生话问好，今天晚安明天继续努力，加油。
Linux tar.gz、tar、bz2、zip 等解压缩、压缩命令详解虫儿飞.. LINUX操作系统 linux 运维服务器
tar最常用的打包命令是tar，使用tar程序打出来的包我们常称为tar包，tar包文件的命令通常都是以.tar结尾的。生成tar包后，就可以用其它的程序来进行压缩了，所以首先就来讲讲tar命令的基本用法。tar命令的选项有很多(用mantar可以查看到)，但常用的就那么几个选项，下面来举例说明一下：#tar-cfall.tar*.jpg这条命令是将所有.jpg的文件打成一个名为all.tar的包
高省的官方邀请码是多少高省要邀请码2022年的想想! 凌风导师
相对其它平台来说升级才能得到高佣金，对使用者来说太不友好了，如果你要返利高还要拉人头，拉人多麻烦？还要麻烦自己亲戚朋友。所以高省APP普通用户佣金更高，是非常人性的。那么对于创业的人而言高省该怎么做呢？使用过其他返利app比如花生日记，高省-各大应用商城下载即可-购物领劵返利高，邀请码切记填999777，凌风高省邀请码999777，全网唯一教你技术的老师码填对码直送2皇冠总裁等级，《凌风导师V:1
React Native动画的锚点anchorPoint 沉默的依恋 React Native
在RN动画开发的过程中,有需求让图片绕中心点以外的其它点旋转,本以为是一个简单的问题,猜想Facebook应该有提供类似的API.然而在官网找了一圈没有anchorPoint这个API,后来想了想,RN与H5非常像,应该有transformOrigin这个属性,然而,还是没有,在github的issues中有人提问过什么时候更新这个属性,但是官网仍旧没有计划;为了达到这种效果,其实有一种间接的方法
Java读取csv文件里面的内容小小代码研究 java 开发语言
目录一，Java简介二、CSV文件简介2.1.CSV文件介绍逗号分隔值（Comma-SeparatedValues，CSV，有时也称为字符分隔值，因为分隔字符也可以不是逗号），其文件以纯文本形式存储表格数据（数字和文本）。纯文本意味着该文件是一个字符序列，不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成，记录间以某种换行符分隔；每条记录由字段组成，字段间的分隔符是其它字符或字符
2018年3月17日、天气晴、星期六孙子开
今天忙碌了一天，到晚上快十点了才回家，这一天没陪孩子，孩子作业也没做，我会让他补上的。无论干什么一定要坚持。顽皮的孩子不让人省心，连续3天往家里带东西，就一次说是李钊毅给的，其它的都是摔倒了捡的，我说；“你说实话，只要你诚实守信就是好孩子，”他说；“这都是李钊毅送的”。我跟孩子说：“你让他把从头到尾的事情地经过详细地写出来，”他答应了。我回来家检查，他一字也没写。不能把一些小细节忽略了，孩子的点点
推客佣金联盟返利APP正规靠谱好用吗?推客佣金联盟app怎么赚钱?它能赚钱吗? 日常购物小技巧
今天我们就来说下：推客佣金联盟返利APP正规靠谱好用吗?推客佣金联盟app怎么赚钱?它能赚钱吗?大家好！我是花桃平台最大团队&联合创始人柚子导师。相较于其它返利app，花桃佣金更高，模式更好，终端用户不流失！“推客佣金联盟是河南葱姜蒜商贸有限公司创立的一款可以领取淘宝天猫优惠券的手机软件！包含服装，数码，鞋包等热门优惠商品与京东，淘宝，天猫，拼多多等商城优惠券。简单说，推客佣金联盟是一个全领域的、
call/apply 的实现原理是什么？ 65649e6a691f
call和apply的功能相同，都是改变this的执行，并立即执行函数。区别在于传参方式不同。func.call(thisArg,arg1,arg2,...)：第一个参数是this指向的对象，其它参数依次传入。func.apply(thisArg,[argsArray])：第一个参数是this指向的对象，第二个参数是数组或类数组。一起思考一下，如何模拟实现call？首先，我们知道，函数都可以调用c
springboot整合Logback 星空下夜猫子 spring boot logback 后端
Logback介绍描述Logback是由log4j创始人设计的另外一种开源日志组件，性能比log4j要好。相对是一个可靠、通用、快速而又灵活的Java日志框架。Logback主要分三个模块1、logback-core：其他两个模块的基础模块2、logback-classic：它是log4j的一个改良版本，同时它完整实现了slf4j。API，可以很方便地更换成其它日志系统，如log4j或JDK14L
git 压栈存储当前分支修改，出栈使用保存星叔 git git
当你在修改当前分支时。突然有个更紧急的任务，或者需要将当前分支保存到其它分支，这个时候就能用到这个命令gitstash。本章只记录存储一次修改的操作，其它拓展命令可以在git文档中检索gitstash。当当前文档修改完成$gitbranch-a查看当前远程仓库有几个分支mainremotes/origin/Dev分支$gitstash保存当前分支的修改Savedworkingdirectoryan
不可不知的写作底层逻辑—助你写作步步高升有花无叶_彼岸花
“写作的定义是什么？”“写作的方法是怎样的？”“写作可以怎样变现？”“什么是文笔？怎样提升自己的文笔水平？”“好的文笔需要具备哪些能力？”……当这些以及其它类似的问题向我迎面袭来的时候，我完全招架不住，毫无任何抵御能力。此时，我才了解到——为什么我的写作水平总是无法提高，即便看了很多相关的书籍和介绍，依然无从下手。原因就在于：我不了解事物的本质，连底层逻辑和原理都还没有搞清楚。一幢还没开始打地基的
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =