有且仅有

Java中char和String 的深入理解 - 字符编码1

开篇

我们并不是在写代码，我们只是将自己的思想通过代码表达出来！

1 将思维变现成为一行代码，是从抽象思维到具体代码的编码过程；继而计算机再将我们的代码再解码为计算机能处理的形式--2进制数字。

2 当计算机需要向你展示数据时它还需要将2进制数字参照一定的规则（码表）编码为人所能理解的格式。

如果不能清楚的理解编码和解码的原理和规则，我想作为程序猿的你是一定会善罢甘休的吧。哈哈，请随我的思路一起，让我们知其所以然吧！

我们这里只讨论狭义的计算机字符编码问题，以下论述都是基于此条件之下，才疏学浅，如有错误请同学们不吝赐教哦。

字符编码

1 总论

What/定义：编码是信息从一种形式或格式转换为另一种形式的过程，而解码是其逆过程。

Why/为什么需要编码：见开篇。

How/怎么编码：人们发明了很多码表，编码和解码实际上就是在查不同的码表（好像字典）的过程。

2 码表

2.1 祖宗：ASCII（American Standard Code for Information Interchange，美国标准信息交换代码），这是个单字节编码表，它能最多能表示256个字符（但实际上只用了7bit，128个。ISO8859-1使用8bit来表示，能表示256）。

（引用百度百科的图片，侵删）

2.2 Unicode

Unicode/UCS 是及其重要，以至于我要启用最大的标题来描述它！

1 历史到今天

1 随着时间的发展，其它语言的人民也需要使用计算机，也需要编码自己的语言，很多国家和地区就各自使用了2个字节来表示自己的文字编码，如GBK、BIG5等。这种方式当然会造成不同语言编码和解码的混乱和错误，人们意识到需要一个统一的码表来囊括世界上所有的字符，从而实现编码的统一。

2 九十年代左右有两个组织分别做了两个码表要做统一，ISO的UCS 10646（Universal Character Set,UCS）和统一码联盟的Unicode。
但我们不需要两个不兼容的统一字符集，在1991年前后，他们终于联合起来共同维护一个标准了（他们还是各自发展，但字符集统一），从Unicode2.0开始，采用与ISO10646-1相同的字库和字码。两者目前兼容发展着。

3 UCS和Unicode使用最大32bit来表示字符，可以表示42亿个字符(4,294,967,296)，目前只使用了1,114,112个码位，从0x0~0x10FFFF。
它们为了和不同的区域性字符集相互兼容，把其首256字符使用ISO8859-1所定义的字符，并把大量字符重复编到不同的字符码位置，从而使得旧有的纷繁复杂的编码方式得以和Unicode编码直接互相转换，而不会丢失任何信息。

（摘抄自其它资料，这点我存疑：事实上我发现它只向下兼容8859-1，并且只有使用UTF-8转换格式时才行，直接使用Unicode==UTF-16还是错误结果。错误原因在下边UTF那有描述）

4 UCS-4为4字节，它根据最高位为0的最高那1个字节，表示出2的7次方128个group，然后每个group根据此高字节分为256个plane，每个plane根据根据第3个字节分为256个row，每row有256个cell。group 0的plane 0 称为BMP（Basic Multilingual Plane）。
如果UCS-4的前2个字节全零（也就是用了plane 0），那么将UCS-4的BMP去掉前两个0字节就得到了UCS-2.

128group  256plane   256 row   256 cell
0000 0000,0000 0000,0000 0000,0000 0000

5 Unicode计划使用17个平面，一共有17*65535=1,114,112个码位。在Unicode5.0中，已定义的码位只有238,605个，分布在plane0,1,2,14,15,16中。15,16只是定义了65534个码位专用区（Private Use Area），分别是0xF0000~0xFFFFD和0x100000~0x10FFFD。专用区PUA：留给大家放自定义字符的区域。
plane 0也有一个专用区：0xE000~0xF8FF，共6400个码位。它还有代理区（Surrogate）0xD800~0xDFFF（55296~57343），共2048个码位。代理区的目的是：用两个UTF-16字符表示BMP之外的字符。
238605-65535*2-6400-2048=99,089。这9万多个字符定义在plane 0(52080),1(3419),2(43253),14(337)上。有71,226个汉字，plane 2的43253都是汉字，plane0上定义了27973个汉字。

6 Unicode3.1开始使用辅助plane，2015年6月17号Unicode发布8.0

Unicode Version 8.0 Released (2015.06.17)

目前的Unicode码表区段

  0000..007F;   Basic   Latin  
  0080..00FF;   Latin-1   Supplement  
  0100..017F;   Latin   Extended-A  
  0180..024F;   Latin   Extended-B  
  0250..02AF;   IPA   Extensions  
  02B0..02FF;   Spacing   Modifier   Letters  
  0300..036F;   Combining   Diacritical   Marks  
  0370..03FF;   Greek  
  0400..04FF;   Cyrillic  
  0530..058F;   Armenian  
  0590..05FF;   Hebrew  
  0600..06FF;   Arabic  
  0700..074F;   Syriac      
  0780..07BF;   Thaana  
  0900..097F;   Devanagari  
  0980..09FF;   Bengali  
  0A00..0A7F;   Gurmukhi  
  0A80..0AFF;   Gujarati  
  0B00..0B7F;   Oriya  
  0B80..0BFF;   Tamil  
  0C00..0C7F;   Telugu  
  0C80..0CFF;   Kannada  
  0D00..0D7F;   Malayalam  
  0D80..0DFF;   Sinhala  
  0E00..0E7F;   Thai  
  0E80..0EFF;   Lao  
  0F00..0FFF;   Tibetan  
  1000..109F;   Myanmar    
  10A0..10FF;   Georgian  
  1100..11FF;   Hangul   Jamo  
  1200..137F;   Ethiopic  
  13A0..13FF;   Cherokee  
  1400..167F;   Unified   Canadian   Aboriginal   Syllabics  
  1680..169F;   Ogham  
  16A0..16FF;   Runic  
  1780..17FF;   Khmer  
  1800..18AF;   Mongolian  
  1E00..1EFF;   Latin   Extended   Additional  
  1F00..1FFF;   Greek   Extended  
  2000..206F;   General   Punctuation  
  2070..209F;   Superscripts   and   Subscripts  
  20A0..20CF;   Currency   Symbols  
  20D0..20FF;   Combining   Marks   for   Symbols  
  2100..214F;   Letterlike   Symbols  
  2150..218F;   Number   Forms  
  2190..21FF;   Arrows  
  2200..22FF;   Mathematical   Operators  
  2300..23FF;   Miscellaneous   Technical  
  2400..243F;   Control   Pictures  
  2440..245F;   Optical   Character   Recognition  
  2460..24FF;   Enclosed   Alphanumerics  
  2500..257F;   Box   Drawing  
  2580..259F;   Block   Elements  
  25A0..25FF;   Geometric   Shapes  
  2600..26FF;   Miscellaneous   Symbols  
  2700..27BF;   Dingbats  
  2800..28FF;   Braille   Patterns  
  2E80..2EFF;   CJK   Radicals   Supplement  
  2F00..2FDF;   Kangxi   Radicals  
  2FF0..2FFF;   Ideographic   Description   Characters  
  3000..303F;   CJK   Symbols   and   Punctuation  
  3040..309F;   Hiragana(日文平假名)
  30A0..30FF;   Katakana(日文片假名)
  3100..312F;   Bopomofo  
  3130..318F;   Hangul   Compatibility   Jamo  
  3190..319F;   Kanbun  
  31A0..31BF;   Bopomofo   Extended  
  3200..32FF;   Enclosed   CJK   Letters   and   Months  
  3300..33FF;   CJK   Compatibility  
  3400..4DB5;   CJK   Unified   Ideographs   Extension   A  
  4E00..9FFF;   CJK   Unified   Ideographs  
  A000..A48F;   Yi   Syllables  
  A490..A4CF;   Yi   Radicals  
  AC00..D7A3;   Hangul   Syllables  
  D800..DB7F;   High   Surrogates  
  DB80..DBFF;   High   Private   Use   Surrogates  
  DC00..DFFF;   Low   Surrogates  
  E000..F8FF;   Private   Use  
  F900..FAFF;   CJK   Compatibility   Ideographs  
  FB00..FB4F;   Alphabetic   Presentation   Forms  
  FB50..FDFF;   Arabic   Presentation   Forms-A  
  FE20..FE2F;   Combining   Half   Marks  
  FE30..FE4F;   CJK   Compatibility   Forms  
  FE50..FE6F;   Small   Form   Variants  
  FE70..FEFE;   Arabic   Presentation   Forms-B  
  FEFF..FEFF;   Specials  
  FF00..FFEF;   Halfwidth   and   Fullwidth   Forms  
  FFF0..FFFD;   Specials 
  10300..1032F;   Old   Italic 10330..1034F;   Gothic  
  10400..1044F;   Deseret  
  1D000..1D0FF;   Byzantine   Musical   Symbols  
  1D100..1D1FF;   Musical   Symbols  
  1D400..1D7FF;   Mathematical   Alphanumeric   Symbols  
  20000..2A6D6;   CJK   Unified   Ideographs   Extension   B  
  2F800..2FA1F;   CJK   Compatibility   Ideographs   Supplement  
  E0000..E007F;   Tags  
  F0000..FFFFD;   Private   Use  
  100000..10FFFD;   Private   Use

最常用的CJK（Chinese Japanese Korean 中日韩文）区间段是4E00~9FFF，但9FA6~9FFF还是空的，所以实际有值得是4E00~9FA5，这也是大部分人判断中文所用的区段。但大家要知道，其实CJK大部分是描述的中文，日文和韩文还有相应的区间。上表中带有CJK的、平假名Hiragana、片假名Katakana、朝鲜文Hangul的都是中日韩文可能的字符区间：

  CJK   Unified   Ideographs

只是常用的区间，全部CJK区间应该是：

2E80..2EFF(11904-12031): CJK   Radicals   Supplement  
3000..303F(12288-12351): CJK   Symbols   and   Punctuation
3040..309F(12352-12447): Hiragana(日文平假名)
30A0..30FF(12448-12543): Katakana(日文片假名)
3130..318F(12592-12687): Hangul Compatibility Jamo(朝鲜文兼容字母)
31F0..31FF(12784-12799): Katakana Phonetic Extensions(日文片假名语音括展)
3200..32FF(12800-13055): Enclosed CJK Letters and Months 
3300..33FF(13056-13311): CJK Compatibility 
3400..4DB5(13312-19893): CJK Unified Ideographs Extension A 
4E00..9FFF(19968-40959): CJK Unified Ideographs
AC00..D7AF(44032-55215): Hangul Syllables(朝鲜文音节)   
F900..FAFF(63744-64255): CJK Compatibility Ideographs 
FE30..FE4F(65072-65103): CJK Compatibility Forms 
20000..2A6D6(131072-173782): CJK Unified Ideographs Extension B 
2F800..2FA1F(194560-195103): CJK Compatibility Ideographs Supplement

Unicode/UCS总结：

也就是说它用2~4个字节的空间描述了已知的接近全部的字符（并且仍在更新，还会把笑脸之类的字符也放入其中），而通常使用的plane 0也就是UCS-2，使用2个字节描述了比较常用的字符，包括大量的CJK文字，所以大家平常能用到的字符大体都在UCS-2中包括了。

2 UTF

1 UTF（UCS/Unicode/Universal Transformation Format）有多种transform方式，常见的有UTF-8/UTF-16/UTF-32。出现原因：

a：事实证明，对可以使用ASCII表示的字符使用Unicode并不高效，因为Unicode使用2个字节。为了解决这个问题，出现了一些中间格式字符集，被称为通用转换格式。可以这么说Unicode是编码方式，它规定了编码（即哪个字符在什么码位），而UTF-8等是Unicode的实现方式，它出于节省空间或其它目的来对Unicode所占空间进行转换。

b：另外我目前的理解是：Unicode码原生不支持与任何码表兼容，包括ASCII。

举例：UCS-2以2字节为单位而ASCII以1个字节为单位，试想英文a，0110,0001和0000,0000 0110,0001计算机是不会认为他们是一样的。而如果使用UTF-8那么，编码就会相同为1个字节0110,0001。

2 UTF-8（将8bit看作一个单位）：使用1~4个字节来编码，如，当时用UTF-8存储ASCII字符时就只用1个字节，相似其它字符按一定算法转换为1~4个字节。算法如下

UCS-2编码(16进制) UTF-8 字节流(二进制) 
0000 - 007F 0xxxxxxx 
0080 - 07FF 110xxxxx 10xxxxxx 
0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx

比如“汉”字的Unicode是6C49，那么就需要使用3字节的格式，写出来是1110 0110,1011 0001,1000 1001，也即E6 B1 89。4字节算法没写。

3 UTF-16

3.1 将16bit看作一个单位。设计之初为固定宽度的16bit（2byte）编码格式（可以表示plane 0所有），随着时间发展为了支持增补字符（其它plane）设置了代理对机制（surrogate pair）；把范围U+10,0000~U+10,FFFF内的字符使用一对（2个）16bit来表示。

算法如下：对于的UCS码的小于0x10000的部分(plane 0中的)，UTF-16编码==UCS-2对应的16位无符号整数。不小于0x10000的部分使用代理对（具体怎么代理不探究了）。

3.2 UCS-2是一个编码方案，而UTF-16是一个实际使用的转换格式。因为UTF-16一个单元是16bit，但计算机只能表示8bit为单位，所以分解（解析显示时）这个单元时这两个8bit谁先谁后就也有说法了（即一个单位中2个字节的字节顺序问题），高字节到低字节称为大尾big-endian，反之称为小尾little-endian。UTF-32也需要考虑这个问题，而UTF-8已8bit为单位，故而没有在单位中排字节顺序的需要。

例如：已知“乙”的Unicode编码是4E 59，当我们收到一个“奎”的Unicode编码59 4E时，我们是该翻译为奎还是乙呢？

解决方案：

使用Unicode的推荐字节顺序标记方法BOM（Byte Order Mark）。
它的方法是：UCS中有个字符叫"ZERO WIDTH NO-BREAK SPACE"，它编码为FE FF，还有个字符FF FE在UCS中不存在。
UCS规范建议我们在传输字节流最前，先传输字符FE FF表明字节流是Big-Endian；传输FF FE表明字节流是Little-Endian。

UTF-8不需要用BOM来表明字节顺序，但是可以用BOM来表明编码方式。字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8编码是EF BB BF。如果接受到已此开头的字节流，那么好了，你知道它是UTF-8编码的。

“你好”的Unicode编码：4F 60 , 59 7D

下图是用UTF-8编码的文本：“你好”两个字的编码。

使用UTF-16 Big-endian的“你好”

3.3 比起UTF-8，16的好处在于大部分字符都是用固定长度(2byte)存储（如果长度固定是你的要求的话）。

2.3 中国

GB GB2312 GBK 是国标以及其扩展码表。占用双字节。

BIG5是台湾/香港使用的繁体字符集。

GBK总体范围为：0x8140~0xFEFE，首字母在0x81~0xFE之间，尾字节在0x40~0xFE之间，剔除0x**7F一条线，总计23940个码位，收入21886个汉字(21003)和图形符号(883)。

实际应用

1 所有浏览器或客户端使用http协议请求一个资源时，资源的响应一般都会有个Content-Type来表示服务器资源的类型，浏览器/客户端根据此来对照相应码表解码显示。注意：有时候服务器不返回这个字段，那么大部分浏览器会相应的规则去自己算应该用哪个编码来显示(我并不清楚，大概是有BOM就按照使用对应UTF格式，无BOM使用ISO-8859-1吧？)。

2 考虑到国际化的软件发展趋势，建议不要使用GB家族的编码。

3 传输UTF编码字节流时，使用BOM；

JAVA

好了，我是Java程序员，我只为了理解《Tinking in java》中的一句话才搞了一天时间来研究这个问题的，好在还是有点成果！！

“java中有个基本类型char，它占用固定的2byte空间来表示字符，又因为java设计之初就采用了Unicode编码，所以char能表示所有字符包括中文。”

看到满世界这样的答案，我就不相信了！2字节最多只能标识65536个字符，它是怎么能囊括那么多字符的呢？？仅所有汉字就不止6万吧！！！！

好了，不管你看没看完上边的文章，我告诉你结论就好！

结论

1. char

java中的char确实使用2Byte空间，它实际使用的是UCS-2 也就是plane 0，只能表述65536个字符，对于超出其范围的其它plane内容，请看下图：

一旦你使用了大于UCS-2的字符，那么编译器会直接报错！

其实也就是说char使用的是UTF-16格式。有个建议是尽量别用char类型，因为它会导致一些隐蔽的错误。比如，当你在用String时你定义了一个“虫”，你想当然的认为一个char就能盛放String中的一个字符（毕竟char是字符，而String就是描述的char数组），但是你会发现其实这个String的length()是2而不是1，因为它超出了UCS-2，String用两个char的位置（4字节）来表示了这个char，而String本该用一个char的位置来表示它才对。

2. String

首先，String能够支持的字符与你写代码时选择的编码方式有关，当你选择UTF编码时，你可以随便使用Unicode字符，用没脚”虫“当变量名都随你。使用GB*时，没脚虫”虫“不被支持（GBK收录的少一些吧或者这是日本字吧？）

其次，String在Java中是被定义为char数组来组织的，所以你定义的String最终要被转换成char来存放，但是，不要认为超出char的65536就不能存了，如果超出了它会用2个char来存放

在这里我想用两种方向来说1个String占用的空间

1. 在Java中实际使用的空间

这与使用的编码有关

UTF-8：2/4byte，其实就是1个char或者2个char；

GB*：2byte，就是1个char；

2. 如果对其编码，所需要的空间(String.getBytes())

UTF-8：1~4byte，ASCII用1Byte，汉字大部分用3Byte，其它字符参照上边UTF2.2的算法，超出UCS-2的部分比如那个“虫”就会是4Byte；

GB*：ASCII使用1Byte，其它中文2Byte；

3. 额外的部分---从java到class文件

无论.java文件你用GBK或者UTF-8来编码，编译器在将其编译为.class文件后，如果其中有字符串，会使用UTF-8来编码存储字节，占用1-4Byte。详细来说，就是在.class文件的常量池部分，这种字符串数据使用的数据结构是CONSTANT_Utf8_info，代表UTF-8编码的字符串。

最后吐槽一下！！！我打了3遍才把发布好这最后一段，一旦我打了那个少一腿的”虫“字，我后边的东西就被吃了，是保存到数据库时直接给我后边的忽视了吗？？？

Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
Java 重写(Override)与重载(Overload) 叨唧唧的
Java重写(Override)与重载(Overload)重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。即外壳不变，核心重写！重写的好处在于子类可以根据需要，定义特定于自己的行为。也就是说子类能够根据需要实现父类的方法。重写方法不能抛出新的检查异常或者比被重写方法申明更加宽泛的异常。例如：父类的一个方法申明了一个检查异常IOExceptio
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
白骑士的Java教学基础篇 2.5 控制流语句白骑士所长 Java 教学 java 开发语言
欢迎继续学习Java编程的基础篇！在前面的章节中，我们了解了Java的变量、数据类型和运算符。接下来，我们将探讨Java中的控制流语句。控制流语句用于控制程序的执行顺序，使我们能够根据特定条件执行不同的代码块，或重复执行某段代码。这是编写复杂程序的基础。通过学习这一节内容，你将掌握如何使用条件语句和循环语句来编写更加灵活和高效的代码。条件语句条件语句用于根据条件的真假来执行不同的代码块。if语句‘
python语法——三目运算符 HappyRocking python python 三目运算符
在java中，有三目运算符，如：intc=(a>b)?a:b表示c取两者中的较大值。但是在python，不能直接这样使用，估计是因为冒号在python有分行的关键作用。那么在python中，如何实现类似功能呢？可以使用ifelse语句，也是一行可以完成，格式为：aifbelsec表示如果b为True，则表达式等于a，否则等于c。如：c=(aif(a>b)elseb)同样是完成了取最大值的功能。
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
python怎么将png转为tif_png转tif weixin_39977276
发国外的文章要求图片是tif，cmyk色彩空间的。大小尺寸还有要求。比如网上大神多，找到了一段代码，感谢！https://www.jianshu.com/p/ec2af4311f56https://github.com/KevinZc007/image2Tifimportjava.awt.image.BufferedImage;importjava.io.File;importjava.io.Fi
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
00. 这里整理了最全的爬虫框架（Java + Python）有一只柴犬爬虫系列爬虫 java python
目录1、前言2、什么是网络爬虫3、常见的爬虫框架3.1、java框架3.1.1、WebMagic3.1.2、Jsoup3.1.3、HttpClient3.1.4、Crawler4j3.1.5、HtmlUnit3.1.6、Selenium3.2、Python框架3.2.1、Scrapy3.2.2、BeautifulSoup+Requests3.2.3、Selenium3.2.4、PyQuery3.2
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
JavaScript `Map` 和 `WeakMap`详细解释跳房子的前端 JavaScript 原生方法 javascript 前端开发语言
在JavaScript中，Map和WeakMap都是用于存储键值对的数据结构，但它们有一些关键的不同之处。MapMap是一种可以存储任意类型的键值对的集合。它保持了键值对的插入顺序，并且可以通过键快速查找对应的值。Map提供了一些非常有用的方法和属性来操作这些数据对：set(key,value):将一个键值对添加到Map中。如果键已经存在，则更新其对应的值。get(key):获取指定键的值。如果键
切换淘宝最新npm镜像源是 hai40587 npm 前端 node.js
切换淘宝最新npm镜像源是一个相对简单的过程，但首先需要明确当前淘宝npm镜像源的状态和最新的镜像地址。由于网络环境和服务更新，镜像源的具体地址可能会发生变化，因此，我将基于当前可获取的信息，提供一个通用的切换步骤，并附上最新的镜像地址（截至回答时）。一、了解npm镜像源npm（NodePackageManager）是JavaScript的包管理器，用于安装、更新和管理项目依赖。由于npm官方仓库
【Java】已解决：java.util.concurrent.CompletionException 屿小夏 java 开发语言
文章目录一、分析问题背景出现问题的场景代码片段二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项已解决：java.util.concurrent.CompletionException一、分析问题背景在Java并发编程中，java.util.concurrent.CompletionException是一种常见的运行时异常，通常在使用CompletableFuture进行异步计算时出现
设计模式之建造者模式(通俗易懂--代码辅助理解【Java版】） ok!ko 设计模式设计模式建造者模式 java
文章目录设计模式概述1、建造者模式2、建造者模式使用场景3、优点4、缺点5、主要角色6、代码示例：1）实现要求2）UML图3)实现步骤：1）创建一个表示食物条目和食物包装的接口2）创建实现Packing接口的实体类3）创建实现Item接口的抽象类，该类提供了默认的功能4）创建扩展了Burger和ColdDrink的实体类5）创建一个Meal类，带有上面定义的Item对象6）创建一个MealBuil
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息

Java中char和String 的深入理解 - 字符编码1

你可能感兴趣的:(Java)