小鲁蛋儿

UTF-8 与 UTF-16编码详解

一、UTF-8编码

1、UTF-8介绍

2、UTF-8是如何编码的？

3、上述Unicode码点值范围中十进制值127、2047、65535、2097151这几个临界值是怎么来的呢？

二、UTF-16编码

1、UTF-16介绍

2、UTF-16编码方式

1）设计思路

2）具体编码方式

3）字节顺序问题

3、BOM

三、两者比较

1、存储容量

2、存储效率

3、字节序

一、UTF-8编码

1、UTF-8介绍

UTF-8编码是Unicode字符集的一种编码方式(CEF)，其特点是使用变长字节数(即变长码元序列、变宽码元序列)来编码。一般是1到4个字节，当然，也可以更长。

为什么要设计为变长字节数？

可以理解为按需分配，比如一个字节足以容纳所有的ASCII字符，那何必补一堆0用更多的字节来存储呢？

变长编码的优势与劣势

优势是节省空间、自动纠错性能好、利于传输、扩展性强，劣势是不利于程序内部处理，比如正则表达式检索；而UTF-32这样等长码元序列(即等宽码元序列)的编码方式就比较适合程序处理，当然，缺点是比较耗费存储空间。

2、UTF-8是如何编码的？

UTF-8编码最短的为一个字节、最长的目前为四个字节，从首字节就可以判断一个UTF-8编码有几个字节：

如果首字节以0开头，肯定是单字节编码(即单个单字节码元)；
如果首字节以110开头，肯定是双字节编码(即由两个单字节码元所组成的双码元序列)；
如果首字节以1110开头，肯定是三字节编码(即由三个单字节码元所组成的三码元序列)，以此类推。

另外，UTF-8编码中，除了单字节编码外，由多个单字节码元所组成的多字节编码其首字节以外的后续字节均以10开头(以区别于单字节编码以及多字节编码的首字节)。

0、110、1110以及10相当于UTF-8编码中各个字节的前缀，因此称之为前缀码。其中，前缀码110、1110及10中的0，是前缀码中的终结标志。

UTF-8编码中的前缀码起到了很好的区分和标识的作用——当解码程序读取到一个字节的首位为0，表示这是一个单字节编码的ASCII字符；当读取到一个字节的首位为1，表示这是一个非ASCII字符的多字节编码字符中的某个字节(可能是首字节，也可能是后续字节)，接下来若继续读取到一个1，则确定为首字节，再继续读取直到遇见终结标志0为止，读取了几个1，就表示该字符为几个字节的编码；当读取到一个字节的首位为1，紧接着读取到一个终结标志0，则该字节显然是非ASCII字符的后续字节(即非首字节)。

所以，1～4字节的UTF-8编码看起来分别是这样的：

单字节可编码的Unicode码点值范围十六进制为0x0000 ~ 0x007F，十进制为0 ~ 127；
双字节可编码的Unicode码点值范围十六进制为0x0080 ~ 0x07FF，十进制为128 ~ 2047；
三字节可编码的Unicode码点值范围十六进制为0x0800 ~ 0xFFFF，十进制为2048 ~ 65535；
四字节可编码的Unicode码点值范围十六进制为0x10000 ~ 0x1FFFFF，十进制为65536 ~ 2097151

目前Unicode字符集码点编号的最大值为0x10FFFF，实际尚未编号到0x1FFFFF；这说明作为变长字节数的UTF-8编码其未来扩展性非常强，即便目前的四字节编码也还有大量编码空间未被使用，更不论还可扩展为五字节、六字节…...。

3、上述Unicode码点值范围中十进制值127、2047、65535、2097151这几个临界值是怎么来的呢？

因为UTF-8编码中的每个字节中都含有起到区分和标识之用的前缀码0、110、1110以及10之一，所以1～4个字节的UTF-8编码其实际有效位数分别为8-1=7位（2^7-1=127）、16-5=11位（2^11-1=2047）、24-8=16位（2^16-1=65535）、32-11=21位（2^21-1=2097151），如下表所示：

注：上图中的Unicode range即Unicode码点值范围(也就是Unicode码点编号范围)，Hex为16进制，Binary为二进制；Encoded bytes即UTF-8编码中各字节的编码方式(即编码算法)，其中，x代表Unicode二进制码点值的单字节或低字节中的低7位或8位、y代表两字节码点值的高字节中的低3位或8位以及三字节码点值的中字节中的8位、z代表三字节码点值的高字节中的低5位。

因此，UTF-8编码的算法简单地用一句话来概括就是：首先确定UTF-8编码中各个字节的前缀码；之后再将UTF-8编码中各个字节除了前缀码所占用之外的位，依次分配给Unicode字符码点值二进制中各个位的值，换言之，就是用Unicode字符码点值二进制中各个位的值，依次填充UTF-8编码中的各个字节除了前缀码所占用之外的位。

参考文章：刨根究底字符编码之十二——UTF-8究竟是怎么编码的 - 腾讯云开发者社区-腾讯云 (tencent.com)

二、UTF-16编码

1、UTF-16介绍

UTF-16是Unicode字符编码五层次模型的第三层：字符编码表（Character Encoding Form，也称为 "storage format"）的一种实现方式。即把Unicode字符集的抽象码位映射为16位长的整数（即码元，长度为2 Byte）的序列，用于数据存储或传递。Unicode字符的码位，需要1个或者2个16位长的码元来表示，因此这是一个变长表示。

引用维基百科中对于UTF-16编码的解释我们可以知道，UTF-16最少也会用2 Byte来表示一个字符，因此没有办法兼容ASCII编码（ASCII编码使用1 Byte来进行存储）。

2、UTF-16编码方式

1）设计思路

我们知道Unicode的范围为0x0~0x10FFFF，首先是0x0~0xFFFF这段区间，正好16位就可以表示，那么超过这个区间的怎么办呢？也就是0xFFFF~0x10FFFF这段，我们先看这段区间有多少个码位，0x10FFFF-0xFFFF=0x100000,那么这个十六进制表示的十进制也就是：1048576个码位

我们既然16位存不下，那肯定就是32位存咯，将32位分开前16位和后16位，每个16位各存一半，那么每一半存的就是1024（由来：1024*1024=1048576）,1024代表的是2的10次幂，也就是10位二进制数。

32位二进制数字中，前后16位中各存10位就够用了，但是剩余的6位用来干什么呢？和UTF-8的设计一样，为了让识别字符串变得容易（从文本的任意位置开始，均能区分一个字符的起始）。

我们通过前6位来区分数据，那么前6位就是2^6=64，也就是开头数字的区间。我们设定如下：
54开头的为32位的前16位，55开头的为32位的后16位，其他开头的为单16位，这样我们就能区分开这三个16位了，在读取文档中的任意位置，都能随意区分出间隔咯。

那么54开头的数据区间是多少呢，就是1101 10xx xxxx xxxx，区间就是D800~DBFF
那么55开头的数据区间是多少呢，就是1101 11xx xxxx xxxx，区间就是DC00~DFFF

为了配合UTF-16，Unicode中也将这两个区间屏蔽掉，不允许分配任何字符，这个区间就是代理区。

2）具体编码方式

在UTF-16中，我们将Unicode分为了两个范围，分别通过不同的方式进行存储。具体表示见下图。

Unicode范围	UTF-16编码方式
U+000~U+FFFF	2 Byte存储，编码后等于Unicode值
U+10000~U+10FFFF	4 Byte存储，现将Unicode值减去（0x10000），得到20bit长的值。再将Unicode分为高10位和低10位。UTF-16编码的高位是2 Byte，高10位Unicode范围为0-0x3FF，将Unicode值加上0XD800，得到高位代理（或称为前导代理，存储高位）；低位也是2 Byte，低十位Unicode范围一样为0~0x3FF，将Unicode值加上0xDC00,得到低位代理（或称为后尾代理，存储低位）

Unicode范围

UTF-16编码方式

U+000~U+FFFF

2 Byte存储，编码后等于Unicode值

U+10000~U+10FFFF

4 Byte存储，现将Unicode值减去（0x10000），得到20bit长的值。再将Unicode分为高10位和低10位。UTF-16编码的高位是2 Byte，高10位Unicode范围为0-0x3FF，将Unicode值加上0XD800，得到高位代理（或称为前导代理，存储高位）；低位也是2 Byte，低十位Unicode范围一样为0~0x3FF，将Unicode值加上0xDC00,得到低位代理（或称为后尾代理，存储低位）

0x3FF --> 0011 1111 1111
0xD800 --> 1101 1000 0000 0000
0xDC00 --> 1101 1100 0000 0000

3）字节顺序问题

由于一开始的Unicode只需要两个字节，所以UTF-16虽然也是变长编码方式，但是在最初却可以当做定长编码方式使用。UTF-16每个字符都直接使用两个字节存储，所以就有字节顺序的问题，同一字节流可能会被解释为不同内容。如某字符为十六进制编码4E59，按两个字节拆分为4E和59，在Mac中和Windows中会解析如下：

-	读取顺序	显示字符
Windows	4E 59	奎
Mac	59 4E	乙

在Mac上从低字节开始和在Windows上从高字节开始读取显示不同，从而导致在同一编码下的乱码问题。为了解决这个问题便引入了字节顺序标记（英语：byte-order mark，BOM）来标记是大端序还是小端序。

3、BOM

字节顺序标记（英语：byte-order mark，BOM）是一个有特殊含义的统一码字符，码点为U+FEFF。当以UTF-16或UTF-32来将UCS/统一码字符所组成的字符串编码时，这个字符被用来标示其字节序。经常被用于区分是否为UTF编码。

字符U+FEFF如果出现在字节流的开头，则用来标识该字节流的字节序，是高位在前还是低位在前。如果它出现在字节流的中间，则表达零宽度非换行空格的意义，用户看起来就是一个空格。从Unicode3.2开始，U+FEFF只能出现在字节流的开头，只能用于标识字节序，就如它的名称——字节序标记——所表示的一样；除此以外的用法已被舍弃。取而代之的是，使用U+2060来表达零宽度无断空白。

UTF-8以字节为编码单元，没有字节序的问题。但是某些操作系统也会使用带BOM的UTF-8，叫做UTF-8 with BOM。Python中叫utf-8-sig。Unicode规范中说明UTF-8不必也不推荐使用BOM。多数时候UTF-8都是不带BOM的，但是微软公司的某些软件（如Excel）打开某些不带BOM的utf8文件（如cvs文件）会乱码，需要转换成带BOM的utf8编码才能正常显示。

所以Java中获取以UTF-16编码的字符串字节个数时，总是会比实际含有字符的字节个数多2。不过目前已经有很多主流的文本编辑器支持不带BOM的UTF编码了，通过后缀（LE和BE）区分是小端还是大端。

参考文章：UTF-16编码详解 - 知乎 (zhihu.com)

Unicode中UTF-8与UTF-16编码详解 - 腾讯云开发者社区-腾讯云 (tencent.com)

三、两者比较

1、存储容量

先说UTF-16，由于每个码位都使用2到4个字节来存储，对于含有大量中文或者其他二字节长的字符流来说，UTF-16可以节省大量的存储空间。因为UTF-16并不需要像UTF-8那样通过牺牲很多标记位来标识一个字节表示的是什么，它只需一个字符来表示是大端序和小端序。

但是对于有大量西文字符的字符流来说UTF-8的优势就变得十分明显：UTF-8只需要一个字节就能存储西文字符，这是UTF-16做不到的。所以在混合存储，或者是源代码、字节码文件等大量西文字符的文件，更倾向于UTF-8。

UTF-8存储中文比UTF-16要多出50%，不推荐要大量显示中文的程序使用。—— 知乎轮子哥

而由于UTF-8的兼容性和对西文的支持，所以西方都提倡统一使用UTF-8作为字符编码，这样也的确可以彻底根除乱码问题。目前基本上所有的开发环境和源代码文件也基本上是统一UTF-8。

2、存储效率

这里只从UTF-8和UTF-16两个编码来简单阐述下效率问题。

因为每个字符使用不同数量的字节编码，所以UTF-8编码的字符串，寻找串中第N个字符是一个O(N)复杂度的操作。即串越长，则需要更多的时间来定位特定的字符。同时，还需要位变换来把字符编码成字节，把字节解码成字符。

而从UTF-16编码规则来看，仅仅将字符的高位和地位进行拆分变成两个字节。规则非常简单，编码效率很高，单字节O(1)的查找效率也非常好。

不过值得一提的是，这种时间效率问题正在随着内存和CPU的发展而减小，现在已经不会作为主要考虑的问题了。

3、字节序

UTF-8最大的优势是，没有字节序的概念。所以特别适合用于字符串的网络数据传输，不用考虑大小端问题。对于非英文网页（对于我们而言，简单说东亚文字网页），能够避免各种乱码问题。

UTF-16编码字符串的网络传输，要考虑大小端的问题。另外网络传输中如果一个字节信息丢失，剩下的字符串都无法正确解析，读取混乱，统统乱码，而UTF-8只会影响局部，因为有标识端，后面的数据可以正常读取。

参考文章：字符、编码和Java中的编码 - 简书 (jianshu.com)

为什么VS编译UTF-8格式源代码, 代码中字符串却是ANSI编码?如何快速获取字符串的UTF-8或UTF-16编码二进制数据?Java .class文件编码和JVM运行期内存编码？字符串默认编码？
目录为什么VS编译UTF-8格式源代码,代码中字符串却是ANSI编码?如何快速获取字符串的UTF-8或UTF-16编码二进制数据?Java.class文件编码和JVM运行期内存编码字符串默认编码Swift字符串默认编码VS如何编译没有BOM头的UTF-8源代码?为什么中文字符串会报出错误"C2001:常量中有换行符"?为什么VS编译UTF-8格式源代码,代码中字符串却是ANSI编码?说到底，问题的
Java 基础核心面试题 AI饲养员 java 面试 java 面试
Java基础核心面试题本文件旨在提供一系列Java基础核心面试题，重点考察候选人对Java语言底层原理和核心API的掌握程度。1.Java核心概念==vsequals():请解释==和equals()方法的根本区别。特别是对于包装类型（如Integer），请解释以下代码的输出，并说明原因。Integera=100;Integerb=100;Integerc=200;Integerd=200;Sys
Java基础系列：深入解析反射机制与代理模式及避坑指南 JouJz java 代理模式开发语言
目录一、反射机制：动态操控类的艺术1.反射核心原理2.反射操作全流程3.五大经典陷阱陷阱1：泛型检查绕过陷阱2：性能黑洞陷阱3：破坏单例模式陷阱4：模块系统限制（Java9+）陷阱5：错误处理缺失二、代理模式：控制访问的智慧1.静态代理实现2.JDK动态代理3.CGLIB动态代理4.四大核心陷阱陷阱1：错误处理导致异常丢失陷阱2：循环调用问题陷阱3：equals/hashCode处理陷阱4：CGL
Java从入门到入土（发展方向）
目录目录引言：每一章节都会慢慢的更新，可以随时查看是否更新JDK的下载及使用IDEA的下载Java基础语法1.数据类型2.流程控制3.数组4.面向对象5.抽象类6.接口7.枚举8.常用类9.集合类10.泛型11.注解12.异常处理13.多线程14.IO流15.反射Java基础语法非常重要（花很长时间学习java语法个人认为是很值得的）MySQL数据库介绍目标开发框架JavaWebXMLJSONSe
Java基础学习笔记2 qichi333 学习笔记 java eclipse
今天是Java基础学习第二天，加油！！！下面是我今天记的一些笔记。（有点懒惰了，爬虫今天没学，因为赖床了(bushi)，但我会勤奋起来的^_^，一定一定！明天不能偷懒了天！！）一、运算符例子：inta=10;intb=20;intc=a+b;其中，“+”是运算符，且是算术运算符；“a+b”是表达式，且是算术表达式。1.算术运算符例1：publicclassdemo3{publicstaticvoi
【Java基础】Java线程创建方式大揭秘 JosieBook #Java全栈 java 开发语言
文章目录一、引言二、继承Thread类三、实现Runnable接口四、实现Callable接口五、使用线程池六、使用匿名内部类七、使用Lambda表达式（Java8及以上）八、总结一、引言在Java编程中，线程是实现并发编程的重要基础。通过创建多个线程，程序可以同时执行多个任务，从而提高程序的效率和响应性。今天，就让我们一起来深入探讨Java中创建线程的各种方式，了解它们的特点和适用场景。二、继承
Java零基础之自定义异常类！菜鸟不学编程 Java从入门到放弃 java 开发语言
你好，欢迎来到我的博客！我是【菜鸟不学编程】我是一个正在奋斗中的职场码农，步入职场多年，正在从“小码农”慢慢成长为有深度、有思考的技术人。在这条不断进阶的路上，我决定记录下自己的学习与成长过程，也希望通过博客结识更多志同道合的朋友。 ️主要方向包括Java基础、Spring全家桶、数据库优化、项目实战等，也会分享一些踩坑经历与面试复盘，希望能为还在迷茫中的你提供一些参考。我相信：写作
互联网大厂Java面试指南：从基础到高阶技术栈与业务场景实战
互联网大厂Java面试指南：从基础到高阶技术栈与业务场景实战第一轮：Java基础与Spring生态问题1：请解释Java中的多线程实现方式及其适用场景。解析：核心概念：Java多线程可通过继承Thread类或实现Runnable接口实现，推荐后者以避免单继承限制。ExecutorService是更高级的线程池管理工具。适用场景：高并发任务如电商秒杀、实时数据处理。底层机制：JVM线程模型基于操作系
【Java基础篇】Unicode、进制转换 public static void m Java基础进制互相转换 unicode
一、unicode先说一下unicode是什么？最开始美国人搞出了ASCII这个东西，什么意思呢？首先一个字节，我们都知道是8个bit位，总共能表示256种状态，然后我们就把这256种状态每种状态都对应一个字符。这种对应关系就是ASCII。ASCII中一共定义了128个字符，例如：00110000，也就是48，对应字符'0'。对于英语来说，128个字符来编码是完全足够的。但是汉字有那么多，256个
从入门到精通，超详细的程序员Java学习路线指南憨小萌 java 数据库编程语言软件开发人工智能
说明最近也有很多人来向我"请教"，他们大都是一些刚入门的新手，还不了解这个行业，也不知道从何学起，开始的时候非常迷茫，实在是每天回复很多人也很麻烦，所以在这里统一作个回复吧。Java学习路线当然，这里我只是说Java学习路线，因为自己就是学Java的，对Java理当很熟悉，对于其它方面，我也不是很了解。基础阶段首先是基础阶段，在基础阶段，我们必须掌握Java基础，Mysql数据库，Oracle数据
java枚举数字_java 枚举
Java中枚举的线程安全性及序列化问题--枚举是如何保证线程安全的要想看源码，首先得有一个类吧，那么枚举类型到底是什么类呢？是enum吗？答案很明显不是，enum就和class一样，只是一个关键字，他并不是一个类，那么枚举是由什么类维护的呢，我们简单的写一个枚举：然后我们使用反编译，看看这段代码到底是怎么实现的，反编...文章java填坑路2018-08-051238浏览量Java基础15：深入剖
【Java基础】Java集合遍历方式
前言在Java编程中，集合（Collection）是存储和操作对象的核心工具。遍历集合是开发者最频繁的操作之一，但不同场景下选择合适的遍历方式至关重要。一、基础遍历方式1.基本for循环适用场景：仅适用于List等有序集合（如ArrayList、LinkedList）。核心思路：通过索引直接访问元素。特点：优点：索引操作灵活，适合需频繁访问索引的场景（如修改元素位置）。缺点：代码冗余，无法遍历Se
2025年Java后端开发岗面试的高频项目场景题 + 八股文（100w字）小凡敲代码 java java面试 java八股文 Java场景题程序员计算机 Java面试题
一、Java八股文高频面试题1.Java基础HashMapvsConcurrentHashMapHashMap：非线程安全，JDK1.8后采用数组+链表/红黑树，扩容时可能死循环（JDK1.7）。ConcurrentHashMap：JDK1.7用分段锁，JDK1.8改用CAS+synchronized优化锁粒度。synchronizedvsReentrantLocksynchronized：JVM
Java基础：循环结构（while，do-while，for）及“鸡兔同笼”问题、计算阶乘 Y小树 Java学习 java 开发语言
目录while结构（次数不固定的循环优先选用）do-while结构（必须先执行后判断的循环优先使用）fori结构（次数固定的循环优先选用）1.鸡兔同笼问题2.计算阶乘循环结构是为了解决生活中重复发生的场景。循环结构由三个要素组成，分别为循环变量、循环体和循环终止条件。循环结构：也称为重复结构，程序中反复执行的一组指令或程序段循环体：被反复执行的程序段循环变量：用来控制循环是否继续进行的变量常见的循
Java基础字符串类 String StringBuffer 和StringBuilder 骑牛小道士 java 基础 java 开发语言
字符串核心对比表String：不可变字符串StringBuffer：线程安全的可变字符串扩容机制：StringBuilder：线程不安全的高效可变字符串使用场景决策树1.String：不可变字符串，任何修改都会创建新的字符串对象。2.StringBuffer：可变字符串，线程安全（方法使用synchronized修饰），适合多线程环境3.StringBuilder：可变字符串，非线程安全（没有同步
Java基础集合框架队列架构阻塞队列BlockingQueue架构骑牛小道士集合框架之队列 java 架构开发语言
阻塞队列BlockingQueueBlockingQueue接口方法介绍BlockingQueue主要实现类ArrayBlockingQueue:数组有界队列ArrayBlockingQueue构造方法ArrayBlockingQueue内部数据结构及管理机制ArrayBlockingQueue关键方法ArrayBlockingQueue核心特性ArrayBlockingQueue总结ArrayB
Java 中的成员变量与成员方法 —— 一次讲清！菜鸟不学编程 Java从入门到放弃 java 开发语言
你好，欢迎来到我的博客！我是【菜鸟不学编程】我是一个正在奋斗中的职场码农，步入职场多年，正在从“小码农”慢慢成长为有深度、有思考的技术人。在这条不断进阶的路上，我决定记录下自己的学习与成长过程，也希望通过博客结识更多志同道合的朋友。 ️主要方向包括Java基础、Spring全家桶、数据库优化、项目实战等，也会分享一些踩坑经历与面试复盘，希望能为还在迷茫中的你提供一些参考。我相信：写作
包装类是废物？还是背后藏着的 Java 设计良心？
你好，欢迎来到我的博客！我是【菜鸟不学编程】我是一个正在奋斗中的职场码农，步入职场多年，正在从“小码农”慢慢成长为有深度、有思考的技术人。在这条不断进阶的路上，我决定记录下自己的学习与成长过程，也希望通过博客结识更多志同道合的朋友。 ️主要方向包括Java基础、Spring全家桶、数据库优化、项目实战等，也会分享一些踩坑经历与面试复盘，希望能为还在迷茫中的你提供一些参考。我相信：写作
你还在用单线程处理请求？这年头还不会写多线程服务器，真的不慌吗？菜鸟不学编程 Java从入门到放弃 java 开发语言
你好，欢迎来到我的博客！我是【菜鸟不学编程】我是一个正在奋斗中的职场码农，步入职场多年，正在从“小码农”慢慢成长为有深度、有思考的技术人。在这条不断进阶的路上，我决定记录下自己的学习与成长过程，也希望通过博客结识更多志同道合的朋友。 ️主要方向包括Java基础、Spring全家桶、数据库优化、项目实战等，也会分享一些踩坑经历与面试复盘，希望能为还在迷茫中的你提供一些参考。我相信：写作
Java面试题木鱼时刻软件开发 java 开发语言
说明本文档是Java技术面试问题与答案集合，涵盖Java基础知识、集合框架、并发编程、Spring框架、数据库、消息队列、系统设计等核心技术领域。模板使用指南难度分级：L1：低难度，适合初级开发者，基础概念和原理L2：中难度，适合中级开发者，实际问题解决和系统设计L3：高难度，适合高级开发者，复杂系统架构和深度技术挑战问题结构：每个问题按「类别-序号-具体问题」格式组织使用Markdown链接连接
Java基础：Java运行原理 1024de小shen Java基础 java
文章目录一、Java运行原理二、Java虚拟机2.1JVM概念2.2JVM体系结构2.2.1ClassLoader：类装载器2.2.2执行引擎2.2.3运行时数据区三、Java线程四、Java方法调用五、Java字节码执行一、Java运行原理我们都知道，机器只能识别0和1，那么程序是如何在机器上运行的呢？当我们在IDEA等开发工具上编写Java代码，经过构建（javac.exe编译）后，会生成字节
Java基础流程控制习题练习示例含代码 InnovatorX #Java基础进阶 java 开发语言 intellij-idea 算法
1、【嵌套循环】使用双层for循环，在控制台打印出一个四行五列的长方形，效果如下：@@@@@@@@@@@@@@@@@@@@publicclassDemo1{publicstaticvoidmain(String[]args){for(inti=0;i1500?"可以":"不可以";System.out.println("李雷"+want+"以旧换新");}}6、【三元运算符】让用户依次录入三个整数
学习java基础：java开发常用技术 molihuaya 学习java java开发技术
基础部分1.线程和进程的区别线程三个基本状态：就绪、执行、阻塞线程五个基本操作：创建、就绪、运行、阻塞、终止进程四种形式：主从式、会话式、消息或邮箱机制、共享存储区方式进程是具有一定功能的程序关于某次数据集合上的一次运行活动，是系统进行资源分配和调度的一个独立单位。一个进程包含多个线程。线程是进程的一个实体，是CPU调度和分配的基本单元。2.JSP四大域对象和九大内置对象四大域对象：PageCon
八股文——JAVA基础：什么是反射？反射的优点和缺点都有哪些？反射的原理是什么？ Hellyc java 开发语言
简单来说，反射是一种可以让jvm在动态运行时拿到类的信息的一种方法。在编程时可以通过类对象来获取该类中基本信息，包括类方法、继承关系等。反射的优点在于使得代码的编写更加灵活，比如配置文件的加载，只需要在配置文件中进行修改，而不需要修改代码。反射的最大优势就在于反射是框架编写的基石，比如使用的spring框架、AOP面向切面编程等都是使用到了反射。缺点在于安全性不足，因为使用反射可以绕过java的语
八股文——JAVA基础：常量折叠是什么？ Hellyc java 开发语言
常量折叠是jvm在底层进行常量的基本运算，比如Strings="hello"+"world";//编译时直接折成"helloworld"再比如：publicclassC{publicstaticfinalStringA="he";publicstaticfinalStringB="llo";publicstaticfinalStringC=A+B;//也会在编译时折成"hello"}而String
Java基础集合框架队列架构阻塞双端队列BlockingDeque架构
BlockingDequeBlockingDeque核心特性BlockingDeque核心方法唯一标准实现：LinkedBlockingDequeLinkedBlockingDeque构造方法LinkedBlockingDeque数据结构及管理逻辑LinkedBlockingDeque核心特性LinkedBlockingDeque核心操作方法逻辑LinkedBlockingDeque总结Linke
【Java基础】一次编译，随处运行的简单原理秃然想通了 java基础入门 java 开发语言
【Java基础】一次编译，随处运行的简单原理一句话解释：Java程序就像一个多变的机器人，能根据不同的环境变换外形，但核心始终不变！在Windows上变成.exe在Mac上变成.app在手机上变成.apk但无论它的外形如何变化，它的核心始终是同一个机器人！在我们的计算机中，存在着多种操作系统（如：Windows、Linux、MacOS等）。为了让Java程序能够在不同的操作系统上运行，Java内置
Java面试题100道及答案编程大全面试题 java 开发语言
一、Java基础Java17中的sealed类和record类的作用和区别？答案：sealed类：限制继承关系，通过permits指定允许的子类。示例代码：publicsealedclassShapepermitsCircle,Square{...}；record类：不可变数据类，自动生成equals()、hashCode()和toString()。示例代码：publicrecordUser(St
Java基础集合框架队列架构双端队列 Deque 骑牛小道士集合框架之队列 java 开发语言
双端队列DequeDeque方法简介Deque核心特点Deque实现类ArrayDequeArrayDeque构造方法ArrayDeque的数据结构及实现原理ArrayDeque方法介绍ArrayDeque核心特性ArrayDeque总结ArrayDeque使用样例代码Deque实现类LinkedListDeque实现类ConcurrentLinkedDeque(非阻塞线程安全)Concurren
Java基础集合框架之Set框架之TreeSet 骑牛小道士集合框架之Set java 开发语言
TreeSetTreeSet数据结构及实现原理TreeSet的构造方法TreeSet核心特性有序性(`排序大小输出`)自然排序定制排序唯一性底层数据结构:红黑树导航方法(特色核心优势)基础导航方法范围视图（不修改原集合）提取和删除元素逆序视图不允许null元素TreeSet线程不安全TreeSet线程不安全体现解决方案TreeSet优缺点TreeSet应用场景类结构传承去区别于HashSet实现了
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb

UTF-8 与 UTF-16编码详解

一、UTF-8编码

1、UTF-8介绍

2、UTF-8是如何编码的？

3、上述Unicode码点值范围中十进制值127、2047、65535、2097151这几个临界值是怎么来的呢？

二、UTF-16编码

1、UTF-16介绍

2、UTF-16编码方式

1）设计思路

2）具体编码方式

3）字节顺序问题

3、BOM

三、两者比较

1、存储容量

2、存储效率

3、字节序

你可能感兴趣的:(Java基础,UTF-16)