字符编码（1）-- 基本概念

在开发过程中，字符的编码问题经常让我们这些程序猿头疼不已，例如臭名昭著的“中文乱码”问题，我相信我不是唯一一个曾经“深受过其害”的人，因此我准备用几篇文章来总结一下字符编码相关方面的内容，力图做到通俗易懂，并以此希望能够给正处于水深火热中的XDJM们提供一点帮助。

首先是第一篇基本概念。本篇仅仅是粗略地讲解，因为字符编码这个话题很大，可以说它涉及到开发过程中的方方面面，要想细致深入是不可能的。幸运的是对于这次讨论的主题来说，我的目的是用一根绳子将字符编码所涉及到的知识点串起来，重点在原理上，至于繁枝末节的细节不会过多深入。

一、字符编码、字符集、字符传输编码

用一种特定的形式来表示字符的方法，就是字符编码。例如ASCII用0~127之间的整数来表示字符；Unicode将这个范围极大地扩展了，因此Unicode可以表示更多字符；还有莫斯码，这是一种使用“点”（dot）和“划”（dash）来表示字符或词组的编码，曾被广泛用于电报等无线电传输中。

在计算机中，字符通常用整数进行编码，根据不同的要求，一个字符可能需要一个或多个字节来表示。

字符集，或称字符编码集，是一个集合，其中的字符按照相同方式进行编码。例如ASCII、Unicode、莫斯码，等等。相同的编码在不同字符集中可能表示不同的字符。

字符传输编码也是一种字符的编码，主要是为了满足字符的传输、存储等实际应用的需要。字符传输编码基于某种字符集编码，但针对传输、存储等进行了优化，使其能够更好地满足实际应用。最常见到的字符传输编码可能要数UTF了，而UTF中最著名的又非UTF-8莫属。

二、设计一种字符编码的要点

字符编码的设计看似简单，好像只需将一堆字符按整数依次进行编号就完事了。但实际却完全相反，设计一个好的字符编码涉及到的和需要考虑的问题非常之多，绝不是简单的排列与组合。ASCII的专家组前后用了3年时间才出了第一个版本，第一个主要版本更是花费了7年时间。下面列举了一些在ASCII的设计过程中必须考虑的问题。

要包含哪些字符

第一个要考虑的问题是ASCII要包含哪些字符。这个问题主要是权衡编码长度与字符总数之间的平衡——尽可能用最少的码位包含尽可能多的常用字符。开始时，专家组想将ASCII设计为6位编码，可以包含64个字符，后来增加到了7位。8位的方案也考虑过，但最终被否决了。
变长还是定长

可变长度编码的优点是能够按照优先级（或使用频率）来安排字符，从而将最常用的字符以较短的长度进行编码，不常用的字符则使用较多的位来编码，从而达到总体最优。莫斯码和UTF-8都是变长编码。

但变长编码的最大缺点是发生错误时会产生连带性，即一处发生了错误很可能会影响到其后多个甚至所有的位。这是由于变长编码需要在前面的位中包含一种标志，以指示其后面是否还有更多的位。如果标志位出错，会导致对后续多个位的解释都会发生错误。

在ASCII的设计过程中，专家组关于是否要使用“换档键”（Shift Key，也称为上档键）产生过争论。如果当时使用换档键，现在的ASCII就是变长编码了。简单地说，换档键的作用就是改变对后续字符的解释，将一个字符变为另一个字符，例如在小写字母a前加上换档键时，需要将a解释为大写的A。

如果使用换档键，ASCII可能只需要6位（但需要包含一个换档键的编码），但专家们权衡再三，最终没有采用这种方案，因此ASCII需要至少7位编码。
兼容性

很少有发明和创造是孤立的，创造一种新的事物时总是需要考虑那些人们已经习惯了的旧的事物。一个有名的幽默小故事叫做“马屁股决定航天飞机的尺寸”（其真实性不得而知），说的是虽然马屁股与航天飞机两者在表面上完全看不出联系，但在人类逐渐发展和创造的过程中，从马屁股时代留来的影响却一直存在，甚至间接地决定了今天航天飞机的尺寸。

当时存在于电气、电话和电报等行业的主流编码标准包括CCITT、ITA2、EBCDIC等，在设计ASCII时如何兼容这些编码是必须考虑的事情。
其他细节

还有很多问题需要考虑，比如下面列举的一些ASCII的决策和方案（仅仅是所有细节中极小的一部分）。

ASCII按照类别来组织字符，控制字符、图形字符、特殊字符、字母数字字符等都尽量集中并连续编码；

为了排序上的方便，空格键被安排在图形字符前，因此其所在位置为0x20（十进制的32）；

与空格键一样，很多特殊字符也按照不同目的被安排在特定位置；

专家们还考虑了使ASCII能够很容易地“降格”到6位编码，以适应特定需求；

类似地，为了在使用ASCII时可以方便地使用其中的小写字母或大写字母的子字符集，ASCII没有将小写字母和大写字母交叉放置（aAbB这样）；（举个例子，如果你了解正则表达式，就会知道可以使用[a-z]、[A-Z]来分别引用全部小写字母或大写字母，如果ASCII当时选择将大小写字母交叉放置，那么我们今天想单纯地判断小写字母集合或大写字母集合就会变得困难得多了）

大写字母和小写字母的编码值相差16，因此相同的字母的大写和小写编码仅有一位不同，无论是比较还是计算都非常方便；

数字0~9的ASCII编码值是48~57（十六进制的0x30~0x39），所以将编码值减去0x30，或者直接取字节的低4位（编码的二进制形式中7位的高3位都是011）就能得到字符的实际值。

等等……

尽管在设计时需要考虑和权衡的细节如此之多，但令人惊讶的是，专家们当年的决策几乎都是最优的，直到今天，无数人直接或间接地从ASCII的简单、高效、方便等特点中获益。所以不得不感慨当年专家们的高瞻远瞩啊！

三、为什么需要字符传输编码

有多种原因使得一种字符集的原始编码不能很好地应用于传输、存储等过程中。这不只是技术或设计的原因。因此很多时候，还需要为某个字符集设计一套用于实际传输的编码方式。

为了提高传输效率

现在谈到ASCII，可能我们都认为这是一种8位编码，即每个字符为一个字节。确实是这样。但在早期，ASCII码却是7位编码，所有字符的编码集中在0~127之间，因此每个字符的最高位总是0。因为在那个时候什么都贵，内存、网络、甚至硬盘（其实那时候还没有硬盘，只有纸带或软盘，存储容量非常有限），这些硬件的限制使得人们不得不最大限度地节约每一个字节，甚至每一位。所以虽然在设计上，ASCII是8位编码，但早期的很多系统和应用中都使用7位来传输，然后再通过程序对接收到的字节进行分割，每7位为一个字符，这样就能同时提高传输效率和节约存储空间。

另一个例子是UTF-8。UTF-8是可变长度的编码，每个Unicode字符被映射为1~4个字节的编码，其中前128个字符与ASCII完全相同，而每个汉字被编码为3个字节。UTF-8的这种特点使得它很适合编码英文字符占多数的内容，此时它的效率接近单字节编码，但如果通篇都是汉字，可能UTF-8并不是最佳的选择，此时它比原始的Unicode效率还要低。

为了适应传输要求

    字符集对其中的每个字符都指定了一个编码，但却不会规定应该如何用其进行传输或存储。因为这是与实际应用相关的，无法强制规定。最常见也是最著名的一个例子就是大小端问题或称字节序问题。简单来说，字节序问题就是当需要一次处理多个字节时，规定哪个字节在先哪个在后。

    例如当程序读到“FF FE”时（16进制），如果按照读取时的先后顺序进行解释，这个数就是“FFFE”，如果以相反的顺序解释就成了“FEFF”。在这里，前一种方式就是大端，后一种是小端。不要在意细节，只需明白不同的解释会得到完全不同的结果。

    我们熟知的X86及其兼容指令集系统采用小端方式，PowerPC处理器采用大端方式，包括TCP/IP在内的多数网络协议也是大端方式。

    例如，采用UTF-16编码（一种双字节编码）的文本文件，其开头两个字节通常是“FF”和“FE”。在Unicode中，“FFFE”或“FEFF”都不代表任何有意义的字符，因此如果一个程序接收到或读取到了来自另一个程序或流中的字符序列时，发现开头是“FFFE”或“FEFF”，就知道这是一个采用UTF编码，并且采用了某种字节序——具体来说，如果开头是“FFFE”就是大端，另一种是小端（见前面的例子）。在文本文件或字符流中，像这种仅用于标记字节序的字符称为“BOM”，即Byte Order Mark。

    注意：单字节编码没有大小端问题，只有多字节编码才可能会有此问题，因为单字节编码（例如ASCII和UTF-8）一次只需处理一个字节。

四、Unicode、UCS及UTF

这几个词容易让人迷惑，现在是时候来解释这个问题了。

Unicode是一种字符集，UTF是Unicode的一种具体的传输格式，这个前面已经讨论过了。

UCS在不同的场合下有多种意思：

首先是作为术语“通用字符集”来讲。此时可以认为它是一种想法，或一种提法，其目标是设计一个通用的字符集来囊括世界上所有的书写系统字符。Unicode和下面要谈到的ISO UCS是它的两种实现。
作为一种标准或实现来理解。它是大名鼎鼎的国际标准化组织ISO所制定的“ISO/IEC 10646”标准，该标准类似于Unicode。上世纪90年代，人们认识到同时存在2种具有相同目标但实现不一致的的标准会带来麻烦，因此这两种标准最终走到了一起。现在ISO和Unicode已基本一致了。

作为一种传输编码。和UTF是Unicode的传输编码一样，UCS传输编码实现了ISO UCS标准。它们包括3种具体实现：UTF-1、UCS-2和UCS-4。这里的数字后缀表示的是字节数，而不是像UTF中的那样表示位数。目前，UTF-1（确实是UTF-1而非UCS-1）已经被UTF-8所取代，UCS-2和UCS-4也逐渐地被UTF-16和UTF-32所取代，而这也说明了ISO UCS标准和Unicode确实在逐渐变得一致。

在非严格的场合，人们通常会将ISO UCS标准和Unicode混为一谈，统称为Unicode，这也是UCS标准没有Unicode出名的原因。对于第一种情况，作为一个术语来讲时，也可以用Unicode来代表。所以一般情况下，用Unicode（或UTF）来代替UCS不会引起什么问题。

五、Windows中的代码页和ANSI编码

Windows中的代码页（Code Page）与其他系统的“字符编码”是一个意思，Windows用代码页来设置系统的默认编码（即本地化编码，Locale）。例如代码页936表示简体中文。代码页最早是IBM发明的，而不是微软。其实很多系统都有使用代码页，只是Windows中的最为人所熟知。

代码页使用数字来代表某种编码，例如在Windows中，代码页936即GBK（或GB2312）编码，65001代表UTF-8。

在Windows中我们会经常用到系统自带的记事本，当使用记事本的保存功能时，在编码一栏中通常默认的编码是“ANSI”。ANSI编码实际上就是当前代码页指定的编码，因此设置的代码页不同，ANSI代表的编码也不同。

六、为什么人们不能统一用一种编码呢，比如Unicode

当然这是一种美好的愿景，人们也正在努力地去实现。但目前还有很多问题没有解决。

历史遗留问题

在Unicode这样的统一字符集出现之前和之后，很多系统、程序、文件，甚至硬件中，都使用不同的字符集。大多数情况下，修改它们使其支持Unicode是不现实的。

根深蒂固的思想

对于英语国家的多数人来说，让其放弃使用ASCII这样的简单而高效，并且能够很好地满足他们的需求的编码而转用Unicode可能有些困难。即使是非英语国家，为了最大程度地实现与其他系统的兼容，尤其是那些已运转多年的老系统（这似乎又回到了上一条），人们可能还是会优先选择本地化的字符集。

固有的困难

Unicode只能解决编码问题，但实际应用中还有很多问题存在。例如字体，大部分字体只支持有限的字符，例如中文字体通常不会包含日文、俄文或已经消失的文字字符（而且通常也没有必要）。实际上，有成千上万种字体，但能够包含大多数Unicode字符的字体寥寥可数。

但并不是只有坏消息，好消息也是有的。比如人们也正变得越来越容易接受并习惯Unicode；并且越来越多的新系统、新技术、新标准都采用了Unicode。例如Windows、Linux、还有Java等等，W3C也在新的标准中鼓励人们使用Unicode。

七、总结

不要将思维局限在计算机中。广义上讲，在信息传递的过程中，编码是必须的，并且是无处不在的，例如语言、文字、音乐、绘画，都是编码。实际上，你说的话、写的字，其实质都是为了表达你的想法，因此它们都是对你的想法的不同形式的编码。

接下来的内容计划包含以下几个部分：

第2篇讨论编码中的一些细节，以及编码之间的转换和产生乱码问题的原因

第3篇：TODO

HTTP 请求处理的完整流程到Servlet流程图烟雨国度 http servlet 流程图
HTTP请求处理的完整流程。从TCP三次握手开始，一直到Servlet处理请求并返回响应。首先，让我解释一下response.setContentType("text/html;charset=UTF-8");这行代码：这行代码设置了HTTP响应的Content-Type头。它告诉浏览器：响应的内容类型是HTML(text/html)字符编码是UTF-8(charset=UTF-8)这样浏览器就知
HTML添加文字若无心_. HTML html5
一、创建HTML5文档基本标签//定义文档类型//定义HTML文档//定义关于文档的信息文档标题//定义文档的标题//定义文档的字符编码//定义文档的主体二、文字相关标签1.标题文字-标签可定义标题。定义最大的标题。定义最小的标题。Document这是标题1这是标题2这是标题3这是标题4这是标题5这是标题62.文本段落Document这次会晤的主题是“金砖国家在非洲：在第四次工业革命中共谋包容增长
Unicode字符编码过好每一天的女胖子 Windows c++windows
1、简介Unicode是ASCII（美国信息交换标准码）字符编码的一个扩展。ASCII中每个字符用7位表示，计算机上每个字符8位。Unicode使用全16为字符编码，因此Unicode能表示世界上所有能用于计算机通讯的符号。Unicode最初是作为ASCII的补充。ASCII最终有26个小写/大写字母、10个数字、32个符号、33个控制代码和一个空格，共128个代码。1、优点大小写字符的代码是连续
python字串节对象Bytes 局外人LZ python python
一、简介字节串（bytes）是二进制数据的一种表示形式。它由一系列的字节组成，每个字节都是一个范围为0-255的整数。字节串可以用来表示二进制数据，例如图像、音频、视频、网络数据等。字节串与字符串（str）类型不同，字符串是由Unicode字符组成的文本数据。而字节串是原始的二进制数据，它不具备字符编码的概念，而是将数据以字节的形式进行存储和处理。在处理二进制数据时，字节串是非常有用的数据类型。它
浅谈gbase与oracle 字符集差异 gbase_lmax java 前端开发语言
字符集字符集（CharacterSet）：按照一定的字符编码方案，将特定的符号集编码为计算机能够处理的数值的集合。常见字符集名称：ASCII字符集、Unicode字符集、GB2312字符集、BIG5字符集、GB18030字符集等。字符编码字符编码（CharacterEncoding）：是一套规则，对字符集进行编码的方案。如，Unicode是字符集，UTF-8、UTF-16、UTF-32是三种字符编
字符编码方案：Unicode flying jiang 快速开发 java 前端开发语言
摘要：Unicode（统一码、万国码、单一码）是一种在计算机上广泛使用的字符编码，旨在解决传统字符编码方案的局限，为每种语言中的每个字符设定了统一且唯一的二进制编码，以满足跨语言、跨平台进行文本转换和处理的需求。以下是关于Unicode编码的详细解析：一、历史背景起源与发展：Unicode编码的历史可以追溯到20世纪60年代，当时计算机科学家们意识到不同计算机系统使用不同的字符编码方式，导致文本和
latex学习笔记（三）——中文处理办法 richybai
1.准备工作①，在选项->设置->构建->默认编辑器的下拉菜单中选择XeLaTeX②，在选项->设置->编辑器->默认字体编码的下拉菜单中选择UTF-8③，在软件右下角确定字符编码为UTF-8，如下图所示设置为UTF-82.开始编写中文①，首先导入ctex宏包:\usepackage{ctex}②，将title改为中文内容\title{\heiti学习笔记}%\heiti使中文显示为黑体\auth
MobaXterm设置自动保存日志 Tassel_YUE Linux #Shell 运维
目录需求操作需求想让MobaXterm设置日志自动保存，可以有效追踪过去操作。操作点击Setting按照下图设置：logtype选项卡中三个选项的区别：printableoutput：正常的日志导出outputallsession：类似第一个，不会可能出现字符编码问题printableoutputwithtimestamps：每一行日志都带上时间戳logfilename可以根据自己的需求自定义文件
C语言文件 Qi妙代码 c语言开发语言
1.文件流1.1.文件流概念C语言把文件看作是一个字符的序列，即文件是由一个一个字符组成的字符流，因此c语言将文件也称之为文件流。当读写一个文件时，可以不必关心文件的格式或结构1.2.文件类型1.2.1.文件分类计算机的存储，物理上是二进制的。文本文件是基于字符编码的文件，常见的编码有ASCII编码，二进制文件是基于值编码的文件文本文件：以ASCII码形式存放，一个字节存放一个字符存放每一个ASC
书写HTML的规范恶心_3da6
文章目录1.1通用约定标签Class与ID属性顺序引号嵌套语义嵌套约束严格嵌套约束布尔值属性1.2语义化常见标签语义示例1.3HEAD文档类型语言属性字符编码IE兼容模式SEO优化viewportiOS图标favicon完整的HEAD模板1.1通用约定标签自闭合（self-closing）标签，无需闭合(例如：imginputbrhr等)；可选的闭合标签（closingtag），需闭合(例如：或)
6 字符编码 collman Java基础 android java 跨平台文档编程平台
----------------------android培训、java培训、期待与您交流！----------------------字符编码l计算机里只有数字，计算机软件里的一切都是用数字来表示的，屏幕上显示的一个个字符也不例外。l字符a对应数字97，字符b对应98等，这种字符与数字对应的编码规则被称为ASCII（美国标准信息交换码）。ASCII的最高bit位为0，也就是说这些数字在0到127
Eclipse设置全局UTF-8 小白羊MM
如果要使插件开发应用能有更好的国际化支持，能够最大程度的支持中文输出，则最好使Java文件使用UTF-8编码。然而，Eclipse工作空间(workspace)的缺省字符编码是操作系统缺省的编码。在使用Eclipse时，若要使新建的工程全局都直接使用UTF-8编码而不需要一个个文件去设置，则可以按以下步骤去设置：1、打开“窗口->首选项->常规->工作空间”，将“文本文件编码”设置为UTF-8。那
linux的locale选择小胖_20c7
关于locale的基本概念1名称：对外的接口，用来建立（语系+字符集）的映射关系2语系：决定了该语言包括哪些字符（unicode的字符序号来定义的，字符序号和字符编码不是一回事，字符序号是统一的），以及这些字符的表现格式等3字符集：用于该语系的字符编码4字体用于把字符集的编码转换成屏幕上的字体显示locale涉及到的配置1/etc/sysconfig/i18n：设置默认的语系名称（缺省设置，每个登
换行、回车、字符编码的理解 O-0-O 零散文章
问题描述在20190727当天投产时遇到了一个问题，容器中有字段A及相应的值，但数据入库时该字段为空。对比投产前后的日志情况，发现投产后的SQL多了换行。无其它区别。猜测可能是换行导致的。问题排查（应用采用的入库的方式：1.将SQL配置到数据库中，字段列或条件列以","分隔2.执行INSERT时，将字段或条件以","分隔成列表，进行一一对应。问题即出现在这里）投产之前的sql：a,b,c,d,e,
SpringBoot 笔记 duanmy0687 springboot
时代背景：微服务分布式云原生：docker、kubernetes自动配置原理依赖管理父项目负责依赖管理导入starter场景启动器无需关注版本号，自动版本仲裁自动配置自动配好Tomcat自动配好SpringMVC自动配好Web常见功能，如：字符编码问题组件添加@Configuration@Bean@Component@Controller@Service@Repository@ComponentS
UTF-8 编码简介星河繁开发语言
UTF-8（8位元Unicode转换格式）是一种针对Unicode字符集设计的可变长度字符编码方案。其主要特点如下：可变长度：UTF-8使用1到4个字节来表示Unicode字符，根据字符在Unicode中的位置决定所需的字节数量。ASCII字符集中7位的字符仅用一个字节存储，与ASCII编码完全兼容。编码规则：对于ASCII字符（U+0000至U+007F），UTF-8编码与ASCII编码相同，即
GBK与UTF-8的区别，如何将GBK的文本转UTF-8，将UTF-8编码的文本转GBK kfhj 预编码算法
GBK与UTF-8是两种不同的字符编码方式，它们的主要区别体现在以下几个方面：字符集范围：GBK编码主要支持中文字符和日韩字符，而UTF-8编码则支持全球范围内的字符，包括各种语言和符号。编码方式：GBK编码采用双字节编码，即每个字符都占用两个字节的空间。而UTF-8编码则采用变长编码，根据字符的不同，一个字符的编码长度可以是1到4个字节。这种特性使得UTF-8在编码英文等字符时只需一个字节，从而
Python chardet.detect 字符编码检测 in_tsz python 开发语言
chardet.detect是Python的一个库，用于检测给定字节串的字符编码。其检测原理基于统计学方法。具体来说，chardet.detect使用了一种叫做统计字符n-gram（通常为n=1或n=2）的方法。它会统计字节串中每个字符或字符对出现的频率，并将这些统计结果与预先训练好的字符编码模型进行比较。这些模型包含了不同字符编码所特有的字符频率分布信息。当给定一个字节串时，chardet.de
文件显示命令LS和目录切换命令cd 好名字都被缑取了
ls（选项）（参数）选项-a：显示所有档案及目录（ls内定将档案名或目录名称为“.”的视为影藏，不会列出）；-A：显示除影藏文件“.”和“..”以外的所有文件列表；-C：多列显示输出结果。这是默认选项；-b：将文件中的不可输出的字符以反斜线“”加字符编码的方式输出；-c：与“-lt”选项连用时，按照文件状态时间排序输出目录内容，排序的依据是文件的索引节点中的ctime字段。与“-l”选项连用时，则
文本解码器（TextDecoder）详解爱蹦跶的大A阿 JavaScript保姆级教程前端 javascript
‍个人主页：《爱蹦跶的大A阿》当前正在更新专栏：《VUE》、《JavaScript保姆级教程》、《krpano》、《krpano中文文档》✨前言随着互联网技术的飞速发展，文本数据的传输和处理变得越来越普遍。在不同的计算机系统之间传输文本数据时，需要将文本编码为字节数组，以便在不同的字符编码环境下正确显示。文本解码器（TextDecoder）是JavaScript中一个重要的API，用于将字节数组解
Servlet之乱码问题处理 Gambler_Tu servlet servlet
文章目录乱码问题1.判断字符串的编码格式2.获取GET请求中的数据，打印乱码3.获取POST请求中的数据，打印乱码4.中文字符串，输出到页面显示乱码5.setContentType和setCharacterEncoding乱码问题1.判断字符串的编码格式注意，由于存在重码现象，以下方案并不严谨。//由于字符编码存在重叠区，所以一个字符/字符串有多种编码可能，是完全正常合理的。publicstati
解决Tomcat启动时控制台中文乱码问题马佳乐
代码运行输出正常，下面控制台出现中文乱码：而且明明文本编码格式也都修改为了UTF-8，但依旧解决不了这个问题。该问题产生的原因：因为windows系统中，其命令行窗口在解码字节数组时，默认使用本地字符集（对于我们就是GBK），而Tomcat默认输出的启动信息是通过UTF-8进行编码的，这就导致编码与解码所使用字符集的不一致，从而出现了乱码情况！解决方法:操作：只需要将Tomcat的默认字符编码UT
ascii码，unicode编码集和utf编码方式可爱的小小小狼杂项开发语言
ASCII码ASCII码使用7位二进制数表示一个字符，共定义了128个字符，包括基本的拉丁字母、数字、标点符号和一些控制字符。每个字符都被赋予一个唯一的数值，这个数值在0到127之间。Unicode编码集Unicode是一个字符编码标准，它为世界上几乎所有的字符分配了唯一的标识符。Unicode字符集包括了各种语言、符号、标点符号、数学符号、技术符号、图形符号等，总计超过130,000个字符。un
字符编码肥猫想要飞
为什么写这篇文章字符编码的问题一直以来困然着我，每次遇到相关问题需要解决，都要重新去搜索学习。但是，网上的一些文章往往也是自相矛盾的半成品，再加上windows的奇怪命名，导致我对这些概念似懂非懂，所以想借此机会重新理顺这些概念顺带学习。相关概念字符集(characterset) 为每一个「字符」分配一个唯一的ID（学名为码位/码点/CodePoint）。ASCII，ISO-8859-1：英
HTML5学习（二）学习不止，掉发不停 html html5 学习前端
目录1.字符集characterset2.标题标签3.段落和换行标签4.文本格式化标签5.和标签6.图像标签7.路径8.超链接标签9.锚点链接10.注释标签11.特殊字符1.字符集characterset字符集是多个字符的集合，在标签内，可以通过标签的charset属性来规定HTML文件用那种字符编码。UTF-8是万国码，基本包含所有国家需要用到的字符，这个一定要写，防止乱码情况。2.标题标签一共
html header设置语言,HTML header weixin_39632057 html header设置语言
前言：这一片小文是说明header之中的常用标签以及相关的JS的使用的内容。正文：1、meta标签：定义当前页面的某些解析属性和SEO优化使用的内容。html内容：我们常常看到页面上面有许多的meta标签，他们具体是什么作用的呢。我们先来了解一下meta标签之中的属性。--charset：H5之中会有charset这个属性的设置。这一属性的是H5之后才可单独使用的，表示当前文件内容字符编码格式。一
CC工具箱使用指南：【汉字转为Unicode】规划GIS会 CC工具箱使用帮助 arcgis pro sdk c#二次开发 arcgis arcgis pro
一、简介Unicode又叫统一码，是计算机科学领域里的一项业界标准，包括字符集、编码方案等。Unicode是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求。这个工具要实现的功能是将汉字转为Unicode。二、工具参数介绍点击【小工具】组里的【汉字转为Unicode】工具：即可打开下面的工具框界面：1、进
如何在 Python 中处理 Unicode 张无忌打怪兽 Python python 网络开发语言
介绍Unicode是世界上大多数计算机的标准字符编码。它确保文本（包括字母、符号、表情符号，甚至控制字符）在不同设备、平台和数字文档中显示一致，无论使用的操作系统或软件是什么。它是互联网和计算机行业的重要组成部分，没有它，互联网将会更加混乱和难以使用。Unicode本身不是编码，而更像是地球上几乎所有可能字符的数据库。Unicode包含一个代码点，用于标识其数据库中的每个字符，其值范围从0到110
关于html meta标签设置前端_小冲
META标签分两大部分：HTTP标题信息(http-equiv)和页面描述信息(name)。http-equivhttp-equiv类似于HTTP的头部协议，它回应给浏览器一些有用的信息，以帮助正确和精确地显示网页内容。设置页面编码charsetUTF-8是世界性通用编码，也完美的支持中文编码GB2312属于中文编码，针对国内用户使用，国外用户访问GB2312编码的网站就会变乱码。设置字符编码设置
R语言从拍摄照片生成色卡用于统计图 youmigo
ok.pngex_2021-04-29_02-10-25.pngex_2021-04-29_02-13-55.png图片1.jpg微信图片_20210429013555.jpg#ThuApr2901:37:232021-#字符编码：UTF-8#R版本：Rx644.0.5forwindow10#[email protected]#个人笔记不负责任，拎了个梨.rs.restartR()requir
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

字符编码（1）-- 基本概念

你可能感兴趣的:(字符编码)