problc

C++ STL IO流与 Unicode (UTF-16 UTF-8) 的协同工作

http://blog.csdn.net/bookish_2010_prj/archive/2010/04/06/5454771.aspx

凡用到文件读写，输入输出，就得和编码、Unicode 打交道。这系列实验来测试一下 C++ STL 的 IO流对 ANSI 编码、Unicode 编码的支持特性，看能否找到一个自动识别编码，自动转码的解决方案。从基础开始，一步一步来：

平台 Win32 XP sp3 + VS2008. (+ Boost 1.36.0)

实验 01:

#include<string>

#include<iostream>

#include<locale>

using namespace std;

locale prevloc;

locale loc("chs");

string str1("string class");

string str2("汉字与字符");

wstring wstr1(L"wstring class"); //去掉L前缀则编译错误

wstring wstr2(L"汉字与字符");

prevloc = cout.imbue(locale(""));

cout<<"Default Locale: "<<prevloc.name()<<endl;

cout<<"System Locale: "<<locale("").name()<<endl;

cout<<"C风格字符串/n"<<L"w-string/n"<<str1<<'/n'<<str2<<'/n'<<endl;

prevloc = wcout.imbue(loc); //若去掉此句，则wstr2无法正常输出

wcout<<"Default Locale: "<<prevloc.name().c_str()<<endl; //若不加 .c_str() 则编译错误

wcout<<"chs Locale Name: "<<loc.name().c_str()<<endl;

wcout<<"C-string/n"<<"C风格字符串/n"<<L"宽字符串/n"<<wstr1<<'/n'<<wstr2<<'/n'<<endl;

结论：

1.cout 与 string 配合使用，wcout 与 wstring 配合使用，交错则编译错误(类型问题)

2.wstring 初始化时需用 L"xxx" 的宽字符形式，同样 string 初始化时不能加 L 前缀

3.默认locale ("C")下 cout 可以正常输出 C风格字符串与std::string类型，包括汉字也能正常显示

但对 L"xxx" 宽字符串无能为力

默认locale ("C")下 wcout 不能输出中文，包括C风格字符串、宽字符串与std::wstring

设定系统 locale ("chs")后，正常输出宽字符串与std::wstring，但 C风格字符串中的汉字无法显示

总之，string cout "C-style 字符串" 自成体系

wstring wcout L"宽字符串" 自成体系，但 wcout 要选择 locale 后才能正常输出中文。

实验 02:

cout.imbue(locale(""));

wcout.imbue(locale(""));

string str3 ( "abc汉字");

wstring wstr3(L"abc汉字");

cout<<"str1 length: "<<str1.length()<<'/n'; // 12

cout<<"str2 length: "<<str2.length()<<'/n'; // 10

cout<<"str3 length: "<<str3.length()<<'/n'; // 7

cout<<str2[0]<<' '<<str2[1]<<'/n'; // 输出：?

cout<<endl;

wcout<<L"wstr1 length: "<<wstr1.length()<<'/n'; // 13

wcout<<L"wstr2 length: "<<wstr2.length()<<'/n'; // 5

wcout<<L"wstr3 length: "<<wstr3.length()<<'/n'; // 5

wcout<<wstr2[0]<<' '<<wstr2[1]<<'/n'; // 输出：汉字

结论：

4.std::string 内部以 char 类型储存字符，当有汉字时以双字节存储，此时 length() 给出

字符串所占字节数而不是字符数

std::wstring 内部以 wchar_t 类型存储字符，字母汉字统一都是双字节，此时 length()

给出是正确的字符数。

5.当std::string中有汉字存在时，通过下标访问不能得到正确的字符。这是显而易见的，

一方面字符宽度不统一无法随机访问，另一方面 std::string[] 返回 char 类型。std::wstring

不存在此问题。

实验 03:

// test.txt 为 ANSI 编码(GB2312)，内容为以上 str1 ~ str3 的3行。

#include<fstream>

string str;

wstring wstr;

ifstream fin("test.txt");

//fin.imbue(locale(""));

while(fin>>str)

cout<<str<<'/n';

fin.close();

wifstream wfin("test.txt");

//wfin.imbue(locale(""));

//wfin.imbue(locale(".936"));

while(wfin>>wstr)

wcout<<wstr<<'/n';

wfin.close();

结论：

6.std::ifstream 读取 ANSI 编码正常，std::wifstream 读取 ANSI 编码错误...默认 locale("C") 不能识别中文字符

std::wifstream 设置 imbue(locale("")) 或 locale(".936") 后正常读取。936 为 GB2312 的代码页。

实验 04:

test.txt 为 Shift-JIS 编码，内容为

うみねこのなく頃に

程序代码同实验3

ifstream 输出为

偆傒偹偙偺側偔崰偵

wifstream 设定 imbue(locale("")) 后输出相同

结论：

7.显而易见的，其他地区的编码无法正确识别。这也是很多日本游戏和文本文件运行

或读取时产生乱码的原因。

实验 05:

test.txt 为 Shift-JIS 编码，内容同上

ifstream 与 wifstream 都添加 imbue(locale("jpn")) 或 locale(".932")

932 为 Shift-JIS 的代码页

输出为：

偆傒偹偙偺側偔崰偵

うみねこのなく頃に

结论：

8.这里可以看出一个显著性差异。wifstream 在读取时按照 Shift-JIS 编码将其转换为

Unicode 储存，在 wcout 输出时又按照 ANSI (GB2312) 转换，其结果是 —— 正确显示

了其他地区编码的字符。而 ifstream 与 cout 则缺少那两步转换，结果与上例相同

以后的实验将不再考虑 ifstream 而只实验 wifstream。

实验 06:

test.txt 存为 UTF-16 编码(Win32 默认的 little endian)，内容同上。

wifstream 设定为 imbue(locale(".1200"))

1200 为 UTF-16 的 code page

结果，运行出错...发现是 imbue(locale(".1200")); 这句的问题

试着将 ".1200" 改为 ".936" 则运行正常，输出乱码。(936是 GB2312 的代码页)

翻 MSDN 时在 Code Page 那页1200 UTF-16 后面发现一行小字：

"available only to managed applications"...郁闷

看来用 locale 转Unicode的想法到此结束了？记得 STL 书中貌似说过，locale 的名

字在各平台上是不统一的，因为关系到各平台的支持问题。这样的话，要么自己写

代码，要么就只好用 API 显式转换了：MultiByteToWideChar

另外，在 setlocale 函数说明中也写到，UTF-8 和 UTF-7 等每字符有可能大于2字节

的编码不被支持，所以 UTF-8 也只能用 MultiByteToWideChar 转咯...

目前大概只能得出结论 C++ STL locale 在 Win32 平台上支持不完善吧

实验 07: 用 API 重写读文件部分代码

#include<windows.h>

HANDLE hFile;

if(INVALID_HANDLE_VALUE != (hFile = CreateFileW(L"test.txt",

GENERIC_READ, FILE_SHARE_READ, NULL, OPEN_EXISTING, 0, NULL))){

int iFileLength, iUniTest, i;

iFileLength = GetFileSize(hFile,NULL);

char *pBuffer, *pText;

pBuffer = new char[iFileLength+2];

DWORD dwBytesRead;

ReadFile(hFile,pBuffer,iFileLength,&dwBytesRead,NULL);

CloseHandle(hFile);

pBuffer[iFileLength] = '/0';

pBuffer[iFileLength + 1] = '/0';

iUniTest = IS_TEXT_UNICODE_SIGNATURE | IS_TEXT_UNICODE_REVERSE_SIGNATURE;

if(IsTextUnicode(pBuffer,iFileLength,&iUniTest)){

pText = pBuffer + 2;

iFileLength -= 2;

if(iUniTest & IS_TEXT_UNICODE_REVERSE_SIGNATURE){

for(i = 0;i < iFileLength; i+=2)

swap(pText[i],pText[i+1]);

}

wstr = (wchar_t*)(pBuffer+2);

}

delete [] pBuffer;

wcout<<wstr<<'/n';

}

输出正确。以上程序段自动识别 Unicode 编码文件开头的 0xFFFE 标记判断是 Little Endian 还是

Big Endian 并做相应转换。但是代码量较大，且与 C++ 的 IO流很不搭调...

结论：

9.可以看到，只是把输入内容去掉UTF-16开头的0xFFFE，直接把内存指针改为

wchar_t* 后 std::wstring 即可正确识别，说明程序中的宽字符存储格式实际上用的就是

UTF-16 little endian

实验 08:

不死心又去翻了 boost 库，发现 codecvt_null 这个好东西，看下实现是把文件存储内容

按照 wchar_t 为单位直接读入内存不做任何转换。这其实不正好是 UTF-16 需要做的么

以下把 test.txt 存为 UTF-16 little endian 再次实验

#include<boost/archive/codecvt_null.hpp>

wifstream wfin(L"test.txt");

locale utf16(loc, new boost::archive::codecvt_null<wchar_t>);

wfin.imbue(utf16);

while(wfin>>wstr){

wcout<<wstr<<endl;

}

wfin.close();

输出正确。

结论：

10. 看来可以把 codecvt_null 作为 UTF-16 的 codecvt_facet 读入 locale

来使用，避免使用类似上面 API 那么多代码。

实验 09:

将 test.txt 存为 UTF-16 Big Endian ,内容不变。程序不变

无法输出任何内容。

结论：

11. wcout 不认识 big endian 的 wchar_t ...

看来想读取 UTF-16 Big Endian，仅靠 codecvt_null 还不够。稍微翻了一下

《C++ 输入输出流与本地化》这本书，现在可以考虑写一个自己的 codecvt_facet

了。有了 codecvt_null 的代码，稍作改动即可用于 UTF-16 big endian。虽说有了

现在的知识自己写个 utf-16 的codecvt_facet 也可以，但效率大概比不上 boost 里的。

代码准备：用类似的方法写出了自己的 codecvt_utf16 和 codecvt_utf16_reverse 两个

codecvt_facet...然后继续实验。自己写的内容放入咱自己的头文件吧：codecvt_utf.h，

内容加入自己的 namespace : tvt

实验 10: 用 codecvt_utf.h 代替 codecvt_null.hpp。用 codecvt_utf16 和

codecvt_utf16_reverse 实现 little endian 与 big endian 的输入。

wifstream wfin(L"test.txt");

locale utf16(loc,new tvt::codecvt_utf16<wchar_t>);

wfin.imbue(utf16);

while(wfin>>wstr){

wcout<<wstr<<endl;

}

wfin.close();

///////////////////////////////////////

wifstream wfin(L"test.txt");

locale utf16(loc,new tvt::codecvt_utf16_reverse<wchar_t>);

wfin.imbue(utf16);

while(wfin>>wstr){

wcout<<wstr<<endl;

}

wfin.close();

第一段程序读取 UTF-16 little endian 编码的 text.txt 正确输出

第二段程序读取 UTF-16 big endian 编码的 text.txt 正确输出

UTF-16 的转码顺利完成。下面考虑 UTF-8 ，写法类似。在 boost 库中继续寻找，发现

这个东东 boost/detail/utf8_codecvt_facet.hpp 。看下说明，不支持直接使用此文件，这文件

是专门提供其他 boost 组件使用的。仅 include 它的话编译出问题。再寻找到同名的 cpp 文件

后即可看到 do_in do_out 这两个转码关键的虚函数。有了上面 UTF-16 的基础，我们类似可写

出 UTF-8 的转码 codecvt_facet。我给他起名为 codecvt_utf8, 依然加入 codecvt_utf.h 文件。

现在此文件有一两百行了。经试验可正确输入 UTF-8 编码。

对应编码有了处理方法后，下一个问题是编码识别。

实验 11:

wchar_t wc;

wchar_t buf[2];

wifstream wfin(L"text.txt");

wfin.read(&wc,1);

wfin.read(&buf[0],2);

将 wc 和 buf 的内容按2进制或16进制输出。

结论：

12. wistream.read(buffer,count) 操作每次读入 count 个字节，但将每个字节存入一个

wchar_t 类型的 buffer[i] 中。其实 buffer 中每个 wchar_t 的高位都字节是 0 ...

实验 12:

加入判断条件，在 wfin 中自动加入合适的 utf16 facet，使得自动识别并读取

little endian 和 big endian 编码的文件：

wchar_t buf[2];

wifstream wfin(L"test.txt");

wfin.read(buf,2);

if(buf[0] == wchar_t(0xFF) && buf[1] == wchar_t(0xFE)){

cout<<"little endian"<<endl;

wfin.imbue(locale(loc,new tvt::codecvt_utf16<wchar_t>));

}

else if(buf[0] == wchar_t(0xFE) && buf[1] == wchar_t(0xFF)){

cout<<"big endian"<<endl;

wfin.imbue(locale(loc,new tvt::codecvt_utf16_reverse<wchar_t>));

}

while(wfin>>wstr){

wcout<<wstr<<endl;

}

对于两种编码的 text.txt 都实现了自动识别并正确读取。输出正确！

结论：

13.UFT-16在传输时几乎都会加上 0xFFFE 等传输标志很容易判断，即使没有， Win32 下

也有 IsTextUnicode 这 API 用专门方法判断。UTF-8 就很麻烦了，开头不一定都有 BOM 标

记，与各地区字符集一样都可以用一个或多字节表示一个字符，编码长度不固定，如果是

很长一段 ASCII 字符，那么用 UTF-8 和 GB2312 编码出来结果一样，就很难分辨

代码准备：经过一段时间思考，打算用这种算法。先读取前3字节，若是 BOM 头标记最好。若

不是则排除 UTF-16 ，下面集中力量分辨 UTF-8 与 ANSI 。从头开始寻找第一个 >127 的字节

若此字节内容 < 0xC0 或 >0xEF 则可判断不是 UTF-8 。否则，根据 UTF-8 的规则，在后面1 或

2 字节中看开头两位是不是 10 。若不是则断定不是 UTF-8 ，否则就算得到一个 UTF-8 字符。

如果能够找到 10个满足条件的 UTF-8 字符就判断为 UTF-8 编码。若未到 10 个即遇到文件结

尾，那么找到 UTF-8 字符数大于 1 即断定为 UTF-8 否则断定为 ANSI ...

用这种方式选择对应转码 facet:

wistrm.imbue(std::locale(wistrm.getloc(), new codecvt_utf8));

按以上想法写成函数 int IsStreamUnicode(std::wistream &wistrm); UTF-16 LE 返回1，BE 返回2，

UTF-8 返回3，否则返回 0 (判断为ANSI)

实验 13:

std::wifstream wfin(L"test.txt");

if(!tvt::IsStreamUnicode(wfin))

wfin.imbue(loc);

while(wfin>>wstr)

wcout<<wstr<<endl;

在我试验的各种情况下，均能自动识别 UTF-16 LE UTF-16 BE UTF-8 与 ANSI 编码

并正确设定转码 locale .

-------------------------------------------------------------------------------------

8小时后，关于后续实验的补充：

使用中发现某些情况下 UTF-16 的读写出现问题，特别是有换行符或某字节中编码刚好

等于控制符时。经过反复测试认定是读写mode 问题。在读写 Unicode 文件时，

wifstream 与 wofstream 都设定为 ios_base::binary 模式即可。后来又补充了一个添加

BOM 头的小东西。为了使用简便把 utf_16 的 template 也去掉了。最终情形使用起来

像这个样子：

#include<iostream>

#include<fstream>

#include<codecvt_utf.h>

using namespace std;

wstring wstr;

wcout.imbue(locale(""));

// Open the Input and Output Files:

std::wifstream wfin(L"test.txt", ios_base::binary);

std::wofstream wfout(L"testout.txt", ios_base::binary);

// Set Output Format and Write BOM tag:

wfout.imbue(locale(locale(""), new tvt::codecvt_utf16));

wfout<<tvt::utf_bom;

// Detect the Format of the Input File

if(!tvt::IsStreamUnicode(wfin))

wfin.imbue(locale(""));

// Read and Write

//while(wfin>>wstr){

// wcout<<wstr<<endl;

// wfout<<wstr<<endl;

//}

// Another way:

while(getline(wfin,wstr)){

wcout<<wstr<<endl;

wfout<<wstr<<endl;

}

// Close Files:

wfin.close();

wfout.close();

读写测试全部通过！

感谢记事本、EditPlus 和 HxDen 的大力支持...

至此，关于 Unicode 编码和 C++ STL IO流的协作算是大功告成了吧，呵呵。以后有需要再

在实践中改进

花了整整一天时间 + 8 小时 = = 还算有价值吧，因为在网上看到很多人都在问且没有结果

你可能感兴趣的:(C++ STL IO流与 Unicode (UTF-16 UTF-8) 的协同工作)

2025年网络安全全景解析：十大趋势、攻防演练与未来挑战（附实战资源） emmm形成中网络安全网络网络安全
2025年网络安全全景解析：十大趋势、攻防演练与未来挑战（附实战资源）摘要：2025年网络安全领域面临前所未有的挑战与机遇。本文从十大技术趋势、攻防演练实战方案、AI驱动的威胁与防御等角度深度剖析当前网络安全格局，并附赠零基础到精通的网安学习资源，助你掌握最新技术动态与防御策略。[推荐收藏]一、2025年网络安全十大核心趋势1.人工智能全面赋能攻防两端攻击侧：黑客利用生成式AI制作深度伪造内容（如
python win32gui通过窗口类名获取句柄行若 python 开发语言
使用Python的win32gui模块通过窗口类名获取句柄在Windows操作系统中，每一个窗口都有一个唯一的句柄（Handle），用于标识和管理该窗口。对于应用程序开发者而言，有时我们需要通过窗口的类名获取到对应的窗口句柄，以便执行一些特定的操作，如模拟用户输入、调整窗口位置或大小等。Python提供了win32gui模块，使得这一过程变得简单。本文将介绍如何通过窗口类名获取窗口句柄，并提供代码
量子计算：开启信息时代新纪元的钥匙 Evaporator Core 人工智能 #深度学习量子计算
一、量子计算的基本原理：颠覆经典的计算范式1.1从比特到量子比特的革命传统计算机使用比特作为信息基本单位，每个比特只能表示0或1。而量子计算机使用量子比特(Qubit)，它能够同时处于0和1的叠加态：#经典比特vs量子比特表示classClassicalBit:def__init__(self,state):assertstatein
【家政平台开发(2)】解锁家政平台多分店运营：需求剖析与未来蓝图奔跑吧邓邓子家政平台开发家政平台开发多分店经营
本【家政平台开发】专栏聚焦家政平台从0到1的全流程打造。从前期需求分析，剖析家政行业现状、挖掘用户需求与梳理功能要点，到系统设计阶段的架构选型、数据库构建，再到开发阶段各模块逐一实现。涵盖移动与PC端设计、接口开发及性能优化，测试阶段多维度保障平台质量，部署发布阶段确保平稳上线。还深入探讨运营策略、技术创新应用及未来发展方向，为家政平台开发提供全面且实用的知识体系与实践指南。目录一、分店独立运营需
【家政平台开发(3)】解锁家政平台新体验：移动与PC端需求大揭秘奔跑吧邓邓子家政平台开发家政平台开发移动端和PC端用户体验 uniapp Element Plus
本【家政平台开发】专栏聚焦家政平台从0到1的全流程打造。从前期需求分析，剖析家政行业现状、挖掘用户需求与梳理功能要点，到系统设计阶段的架构选型、数据库构建，再到开发阶段各模块逐一实现。涵盖移动与PC端设计、接口开发及性能优化，测试阶段多维度保障平台质量，部署发布阶段确保平稳上线。还深入探讨运营策略、技术创新应用及未来发展方向，为家政平台开发提供全面且实用的知识体系与实践指南。目录一、移动前端（un
网络安全风险扫描原理及工具使用七七powerful web安全网络安全
课程目标1.熟悉常见网络安全风险扫描工具2.了解网络安全风险扫描原理3.掌握扫描工具使用方法为什么要做网络安全风险扫描？什么是网络安全风险扫描？通过一定的技术手段发现系统和软件存在的安全漏洞、弱口令网络安全风险扫描的目的：网络安全风险扫描是一种主动的防范措施，可以及时有效发现网络安全漏洞、弱口令；在攻击发生之前进行防范，做到防患于未然；保证业务顺利的开展，维护企业、行业、国家信息资产安全。网络安全
从零开始：用Python搭建你的第一个机器学习模型 Blossom.118 分布式系统与高性能计算领域 python 机器学习开发语言人工智能深度优先深度学习命令模式
在当今数字化时代，机器学习已经渗透到我们生活的方方面面，从推荐系统、语音识别到自动驾驶，它正在改变着世界的运行方式。对于初学者来说，进入这个领域可能会感到有些迷茫。本文将带你从零开始，使用Python搭建一个简单的机器学习模型，帮助你迈出进入人工智能世界的第一步。一、机器学习简介机器学习是一种人工智能技术，它使计算机能够从数据中学习并做出预测或决策。它主要分为三类：监督学习、无监督学习和强化学习。
人工智能在自然语言处理中的应用：从理论到实践的探索 Blossom.118 分布式系统与高性能计算领域人工智能自然语言处理样本学习学习 Transformer架构系统架构硬件架构
自然语言处理（NaturalLanguageProcessing，NLP）一直是人工智能领域的重要研究方向。随着深度学习技术的飞速发展，NLP在近年来取得了突破性进展，从文本生成到机器翻译，从情感分析到智能问答，自然语言处理正在深刻改变我们与机器交互的方式，并为众多行业带来新的机遇。本文将深入探讨人工智能在自然语言处理中的应用，分析其技术原理、实践案例以及未来的发展趋势。一、自然语言处理的发展历程
Java 语法核心入门：数据类型、运算符与流程控制 Mikey_n java python 开发语言
一、引言Java作为一门广泛应用的编程语言，其语法核心是我们学习Java的基石。这部分主要包括数据类型、运算符和流程控制。掌握这些内容，能让你在Java的编程世界里迈出坚实的第一步。接下来，我们就详细探讨这些知识点。二、数据类型2.1基本数据类型Java有8种基本数据类型，可分为4大类：整数类型、浮点类型、字符类型和布尔类型。2.1.1整数类型byte：占用1个字节，取值范围是-128到127。常
基于回溯思想的小游戏Knight‘s tour 骑士巡游 52Hertz861 回溯算法算法
骑士巡游是指在棋盘上，骑士的一系列移动，使得骑士恰好访问棋盘上的每一个方格一次。如果骑士最终停在一个与起始方格相隔一个“马步”（象棋）的方格上（这样它就可以立即沿着相同的路径再次巡游棋盘），那么这个周游是“闭合的”；否则，它就是“开放的”。下面进入代码部分讲解：1.头文件和命名空间#include#includenamespacebacktracking{namespaceknight_tour{
在VS code 中部署C#和avalonia开发环境 yufei-coder c#vscode
要在Mac的VSCode中配置C#和Avalonia的开发环境，您可以按照以下步骤进行：1.安装.NETSDK下载.NETSDK：访问.NET下载页面。选择适用于macOS的最新稳定版本的.NETSDK，并下载安装程序。安装.NETSDK：运行下载的安装程序，按照提示完成安装。验证安装：打开“终端”应用程序。输入dotnet--version，如果显示版本号，则说明安装成功。2.安装VisualS
C# Windows 窗体开发基础 yufei-coder C#c#microsoft visual studio vscode
WindowsForms（WinForms）是C#中用于开发桌面应用程序的框架。它提供了丰富的UI控件，可以快速构建桌面应用程序的用户界面。本文将介绍Windows窗体开发的基本概念，包括窗体和控件、事件处理、界面布局与设计，以及消息循环与窗体生命周期。1.窗体及控件介绍窗体是WindowsForms应用程序的基本构件，作为用户界面的容器。C#的Form类提供了创建窗体的基本功能，而控件则是窗体上
创建Python虚拟环境详解 qq_39605374 python 开发语言 linux
创建Python虚拟环境详解Python虚拟环境是Python开发中必不可少的一部分，它允许我们在同一台机器上使用多个python版本并且避免了依赖包之间的冲突。在这篇文章中，我们将学习如何创建Python虚拟环境。安装virtualenv首先，我们需要安装virtualenv，这个工具可以帮助我们创建Python虚拟环境。在命令行中输入以下命令来安装：pipinstallvirtualenv创建
HttpComponents使用纪要何人听我楚狂声 java java
概览本文原载于我的博客，地址：https://blog.guoziyang.top/archives/15/HttpComponents是Apache基金会开发和维护的一组底层HTTP及其它协议相关的Java套件包。HttpComponents的前身是ApacheCommons包下的HttpClient包，在3.1版本后，独立成了单独的一组套件，包全名为org.apache.httpcompone
15 LRU缓存枪兵自古幸运e leetCode100刷题数据结构算法
146.LRU缓存-力扣（LeetCode）这道题采用双向链表加哈希表；哈希表是为了随机访问，双向链表是为了能够确定位置这里面注意的是我们需要一个哨兵节点来辅助，需要让哨兵节点的prev.next以及next.next指向自己，即这里是一个双向循环链表，并且我们每次头插节点的时候都是头插在哨兵节点之后classLRUCache{//这里put和get想实现O1那么就需要使用哈希表，但是哈希表是没有
技术驱动型公司的管理之道：Lepton AI的组织结构 AI智能涌现深度研究 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
技术驱动型公司,组织结构,LeptonAI,扁平化管理,跨职能团队,数据驱动决策,持续学习,创新文化1.背景介绍在当今科技飞速发展的时代，技术驱动型公司已成为经济增长的重要引擎。这些公司以技术创新为核心，以数据为驱动，以人才为本，不断突破技术边界，创造新的价值。然而，技术驱动型公司的管理模式也面临着独特的挑战。传统的管理模式往往过于僵化，难以适应快速变化的技术环境和激烈的市场竞争。因此，如何构建高
第98节使用首选项存储数据川石课堂软件测试华为鸿蒙鸿蒙系统 harmonyos 华为云
在HarmonyOS中，ArkTS语言提供了一种便捷的方式来管理应用的偏好设置（preferences），这些设置通常用于存储应用的配置信息、用户偏好等轻量级数据。preferences.getPreferencesSync是一个同步方法，用于从偏好设置中检索数据。下面，我将通过一个详细的示例来展示如何在ArkTS中使用preferences.getPreferencesSync方法。示例背景假设
hyperlane：Rust HTTP 服务器开发的不二之选 LTPP rust http 服务器安全前端开发语言后端
hyperlane：RustHTTP服务器开发的不二之选在如今这个数字化飞速发展的时代，web开发领域日新月异，各种框架层出不穷。然而，对于追求高性能、高效率的开发者来说，hyperlane框架无疑是Rust语言中的一颗璀璨明珠，正逐渐成为web开发领域的热门选择。性能卓越，傲视群雄hyperlane框架在性能方面展现出了无与伦比的优势。根据实际测试数据，在开启keep-alive的情况下，hyp
低空经济一周动态（20250330）有辕有辙_智能网联 eVtol 低空经济无人机
产业政策1、3月26日，商务部印发《关于支持国际消费中心城市培育建设的若干措施》。该措施提出：探索在具备安全条件的地区开通低空物流航线、开发低空旅游项目，拓展低空消费场景。2、3月24日，广东省政府办公厅印发《广东省交通运输高质量发展三年行动方案（2025—2027年）》（文末附下载）。《方案》明确，打造低空交通运输示范城市，加快完善全省低空飞行服务保障体系，建设省级综合飞行服务站和广州、深圳、珠
低空经济招标项目一周速览（20250330）有辕有辙_智能网联 eVtol 低空经济无人机
企业1、3月29日，国能大渡河大数据服务有限公司发布山地光伏多功能无人机关键技术研究及设备采购公开招标项目招标公告，项目内容包括综合多功能无人机选型设计及改造升级、自动管控平台研制等。2、3月29日，中国融通集团第六十研究所发布基于无人机的某行为特征采集设备采购比质比价公告。3、3月28日，南方电网电力科技股份有限公司发布一体式无人机防御系统协助开发及样机试制招标公告，预算217万元。4、3月28
Python 爬虫详解与操作示例 kdayjj966 python 爬虫开发语言
Python爬虫是一项非常实用的技术，可以帮助我们自动化获取网页中的数据。以下内容将从理论到实践，逐步展示如何构建一个完整的Python爬虫，并结合实际操作过程说明。1.爬虫的基本概念1.1什么是爬虫？爬虫（WebCrawler）是一种能够自动访问网页并提取数据的程序。简单来说，爬虫的核心工作是：模拟用户访问网页。获取网页内容（例如HTML）。从内容中提取目标数据。1.2爬虫的工作流程确定目标：明
一周速递|全球车联网产业动态（2024年7月28日）有辕有辙_智能网联汽车物联网人工智能大数据
政策法规1、7月26日，苏州市工信局近日印发《关于开展2024年苏州市智能车联网典型示范应用场景遴选工作的通知》，将围绕公共管理、示范运营、公共服务等方面，包括但不限于智慧公交、智慧乘用车(自动驾驶出租车)、智慧物流、智慧环卫、智慧配送、智慧巡逻以及停车场自动泊车等重点领域，遴选一批智能车联网典型示范应用场景，单个项目最高补助100万元。2、7月25日，《广州市智能网联汽车创新发展条例（草案修改稿
一周速递|全球车联网产业动态（2025年3月16日）有辕有辙_智能网联智能网联汽车汽车车联网
政策法规1、3月13日，国家数据局近日函复同意天津市、河北省（雄安新区）、上海市、江苏省、浙江省、广东省、四川省等7个地方开展国家数字经济创新发展试验区建设工作。下一步，各试验区将聚焦制约数字经济高质量发展的关键环节和突出问题，围绕推进数据要素市场化配置改革、优化数据基础设施建设布局、突破关键核心数字技术、纵深推进数字化转型、推进适数化改革等5个方面重点任务。行业动向1、3月13日，智能网联汽车“
React Query 4 核心技术解析：从自动缓存到无限滚动优化前端极客探险家 react.js 缓存前端
文章目录一、自动缓存策略升级二、并发查询优化三、突变请求管理四、无限滚动支持五、服务端状态同步六、性能监控与调试一、自动缓存策略升级ReactQuery4通过QueryCache实现了智能缓存管理，自动跟踪请求状态并优化更新策略。当组件卸载时，查询结果会被自动保留，重新挂载时直接从缓存读取。结合useQuery的staleTime参数，可灵活控制数据新鲜度。//智能缓存示例const{data}=
华为有类似 docker之类的神器吗 hxsln11 c语言和c加加运维华为 docker 容器
1.华为在容器技术领域提供了多种解决方案，其中部分产品与Docker有相似的功能，但更注重企业级应用、云原生集成及安全性。以下是华为主要的容器相关产品及其特点：1.华为云容器引擎（CCE，CloudContainerEngine）定位：类似DockerSwarm或Kubernetes的容器编排平台，但更侧重企业级Kubernetes服务。功能：支持Kubernetes集群管理，自动化部署、扩缩容。
探索Wapty：一款开源的Web应用渗透测试工具邹澜鹤Gardener
探索Wapty：一款开源的Web应用渗透测试工具去发现同类优质开源项目:https://gitcode.com/在网络安全日益重要的今天，开发和维护一套高效、可靠的Web应用渗透测试工具显得尤为重要。虽然【Wapty（WebApplicationPenetrationTestingSuite）】是一个暂时不再更新的项目，但它在过去的日子里为安全研究者提供了不少帮助，是探索Web安全世界的值得一试的
什么是项目可行性研究中的辅助（功能）研究？ dushky PMP 项目管理
项目可行性研究中的辅助（功能）研究是针对项目可行性分析过程中需要深入探讨的特定领域或关键问题进行的专项研究。其目的是为初步可行性研究或详细可行性研究提供支持，帮助决策者更全面地评估项目的可行性和风险。以下是其核心要点：1.辅助（功能）研究的定义与特点针对性：辅助研究聚焦于项目的某一或几个关键方面，而非全面覆盖所有内容。例如，可能单独研究市场需求、技术可行性、环境影响或法律合规性等。支持性作用：它通
塔能科技：用精准节能撬动社会效益的行业杠杆塔能物联运维人工智能
在全球积极践行可持续发展理念的当下，能源高效利用与节能减排，已然成为各行各业实现高质量发展绕不开的关键命题。对企业来说，节能早已不是一道可做可不做的选择题，而是关乎生存与发展、社会责任与竞争力的必答题。塔能科技推出的精准节能方案，宛如一把“万能钥匙”，为企业解锁的效益远超降低电费这一简单成果，在经济、环境、社会三大维度全面发力，带来深远且持久的积极影响。一、经济效益：降本增效，投资回报可观塔能科技
量子计算：下一次科技革命的引擎 _烟雨_ 量子计算科技
量子计算：下一次科技革命的引擎量子计算作为一项颠覆性的技术，正在迅速从理论研究转向实际应用。尽管目前它仍处于早期阶段，但量子计算有望在未来几年内彻底改变计算机科学、材料科学、医药研发等多个领域。本文将探讨量子计算的原理、应用前景以及面临的挑战。1.量子计算的基本原理量子计算基于量子力学的基本原理，如叠加态和纠缠态。传统计算机使用二进制（0和1）进行计算，而量子计算机使用量子比特（qubits），它
python venv虚拟环境设置 blackhole33 python 开发语言
venv模块venv是Python标准库的一部分，从Python3.3版本开始引入。它是创建虚拟环境的官方推荐方式。一、创建虚拟环境打开终端（在Windows上是命令提示符或PowerShell，在MacOS或Linux上是终端）导航到你想创建虚拟环境的目录。运行以下命令来创建虚拟环境：python-mvenv.venv二、激活虚拟环境1.Windows系统，在虚拟环境的目录运行以下命令来激活虚拟
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

C++ STL IO流 与 Unicode (UTF-16 UTF-8) 的协同工作

你可能感兴趣的:(C++ STL IO流 与 Unicode (UTF-16 UTF-8) 的协同工作)

C++ STL IO流与 Unicode (UTF-16 UTF-8) 的协同工作

你可能感兴趣的:(C++ STL IO流与 Unicode (UTF-16 UTF-8) 的协同工作)