vanwaals

C++ STL IO流与 Unicode (UTF-16 UTF-8) 的协同工作

凡用到文件读写，输入输出，就得和编码、Unicode 打交道。这系列实验来测试一下 C++ STL 的 IO流对 ANSI 编码、Unicode 编码的支持特性，看能否找到一个自动识别编码，自动转码的解决方案。从基础开始，一步一步来：

平台 Win32 XP sp3 + VS2008. (+ Boost 1.36.0)

实验 01:

#include<string>
#include<iostream>
#include<locale>

using namespace std;

locale prevloc;
locale loc("chs");

string str1("string class");
string str2("汉字与字符");
wstring wstr1(L"wstring class"); //去掉L前缀则编译错误
wstring wstr2(L"汉字与字符");

prevloc = cout.imbue(locale(""));
cout<<"Default Locale: "<<prevloc.name()<<endl;
cout<<"System Locale: "<<locale("").name()<<endl;
cout<<"C风格字符串/n"<<L"w-string/n"<<str1<<'/n'<<str2<<'/n'<<endl;

prevloc = wcout.imbue(loc); //若去掉此句，则wstr2无法正常输出
wcout<<"Default Locale: "<<prevloc.name().c_str()<<endl; //若不加 .c_str() 则编译错误
wcout<<"chs Locale Name: "<<loc.name().c_str()<<endl;
wcout<<"C-string/n"<<"C风格字符串/n"<<L"宽字符串/n"<<wstr1<<'/n'<<wstr2<<'/n'<<endl;

结论：

        1.cout 与 string 配合使用，wcout 与 wstring 配合使用，交错则编译错误(类型问题)
        2.wstring 初始化时需用 L"xxx" 的宽字符形式，同样 string 初始化时不能加 L 前缀
        3.默认locale ("C")下 cout 可以正常输出 C风格字符串与std::string类型，包括汉字也能正常显示
    但对 L"xxx" 宽字符串无能为力
          默认locale ("C")下 wcout 不能输出中文，包括C风格字符串、宽字符串与std::wstring
    设定系统 locale ("chs")后，正常输出宽字符串与std::wstring，但 C风格字符串中的汉字无法显示

总之，string cout "C-style 字符串" 自成体系

wstring wcout L"宽字符串" 自成体系，但 wcout 要选择 locale 后才能正常输出中文。

实验 02:

cout.imbue(locale(""));
wcout.imbue(locale(""));

string str3 ( "abc汉字");
wstring wstr3(L"abc汉字");

cout<<"str1 length: "<<str1.length()<<'/n'; // 12
cout<<"str2 length: "<<str2.length()<<'/n'; // 10
cout<<"str3 length: "<<str3.length()<<'/n'; // 7
cout<<str2[0]<<' '<<str2[1]<<'/n'; // 输出：?
cout<<endl;

wcout<<L"wstr1 length: "<<wstr1.length()<<'/n'; // 13
wcout<<L"wstr2 length: "<<wstr2.length()<<'/n'; // 5
wcout<<L"wstr3 length: "<<wstr3.length()<<'/n'; // 5
wcout<<wstr2[0]<<' '<<wstr2[1]<<'/n'; // 输出：汉字

结论：

        4.std::string 内部以 char 类型储存字符，当有汉字时以双字节存储，此时 length() 给出
    字符串所占字节数而不是字符数
          std::wstring 内部以 wchar_t 类型存储字符，字母汉字统一都是双字节，此时 length()
    给出是正确的字符数。
        5.当std::string中有汉字存在时，通过下标访问不能得到正确的字符。这是显而易见的，
    一方面字符宽度不统一无法随机访问，另一方面 std::string[] 返回 char 类型。std::wstring

不存在此问题。

实验 03:

// test.txt 为 ANSI 编码(GB2312)，内容为以上 str1 ~ str3 的3行。

#include <fstream>

string str;
wstring wstr;

ifstream fin("test.txt");
//fin.imbue(locale(""));
while(fin>>str)
cout<<str<<'/n';
fin.close();

wifstream wfin("test.txt");
//wfin.imbue(locale(""));

//wfin.imbue(locale(".936"));
while(wfin>>wstr)
wcout<<wstr<<'/n';
wfin.close();

结论：

6.std::ifstream 读取 ANSI 编码正常，std::wifstream 读取 ANSI 编码错误...默认 locale("C") 不能识别中文字符
std::wifstream 设置 imbue(locale("")) 或 locale(".936") 后正常读取。936 为 GB2312 的代码页。

实验 04:
test.txt 为 Shift-JIS 编码，内容为
うみねこのなく頃に

程序代码同实验3

ifstream 输出为
偆傒偹偙偺側偔崰偵
wifstream 设定 imbue(locale("")) 后输出相同

结论：

7.显而易见的，其他地区的编码无法正确识别。这也是很多日本游戏和文本文件运行
或读取时产生乱码的原因。

实验 05:
test.txt 为 Shift-JIS 编码，内容同上
ifstream 与 wifstream 都添加 imbue(locale("jpn")) 或 locale(".932")

932 为 Shift-JIS 的代码页
输出为：

偆傒偹偙偺側偔崰偵
うみねこのなく頃に

结论：

8.这里可以看出一个显著性差异。wifstream 在读取时按照 Shift-JIS 编码将其转换为
Unicode 储存，在 wcout 输出时又按照 ANSI (GB2312) 转换，其结果是 —— 正确显示

了其他地区编码的字符。而 ifstream 与 cout 则缺少那两步转换，结果与上例相同

以后的实验将不再考虑 ifstream 而只实验 wifstream。

实验 06:
test.txt 存为 UTF-16 编码(Win32 默认的 little endian)，内容同上。
wifstream 设定为 imbue(locale(".1200"))
1200 为 UTF-16 的 code page

结果，运行出错...发现是 imbue(locale(".1200")); 这句的问题
试着将 ".1200" 改为 ".936" 则运行正常，输出乱码。(936是 GB2312 的代码页)
翻 MSDN 时在 Code Page 那页1200 UTF-16 后面发现一行小字：
"available only to managed applications"...郁闷
看来用 locale 转Unicode的想法到此结束了？记得 STL 书中貌似说过，locale 的名
字在各平台上是不统一的，因为关系到各平台的支持问题。这样的话，要么自己写
代码，要么就只好用 API 显式转换了：MultiByteToWideChar

另外，在 setlocale 函数说明中也写到，UTF-8 和 UTF-7 等每字符有可能大于2字节
的编码不被支持，所以 UTF-8 也只能用 MultiByteToWideChar 转咯...
目前大概只能得出结论 C++ STL locale 在 Win32 平台上支持不完善吧

实验 07: 用 API 重写读文件部分代码

#include <windows.h>

HANDLE hFile;
if(INVALID_HANDLE_VALUE != (hFile = CreateFileW(L"test.txt",
GENERIC_READ, FILE_SHARE_READ, NULL, OPEN_EXISTING, 0, NULL))){

    int iFileLength, iUniTest, i;
    iFileLength = GetFileSize(hFile,NULL);
    char *pBuffer, *pText;
    pBuffer = new char[iFileLength+2];
    DWORD dwBytesRead;

    ReadFile(hFile,pBuffer,iFileLength,&dwBytesRead,NULL);
    CloseHandle(hFile);
    pBuffer[iFileLength] = '/0';
    pBuffer[iFileLength + 1] = '/0';

    iUniTest = IS_TEXT_UNICODE_SIGNATURE | IS_TEXT_UNICODE_REVERSE_SIGNATURE;
    if(IsTextUnicode(pBuffer,iFileLength,&iUniTest)){
        pText = pBuffer + 2;
        iFileLength -= 2;
        if(iUniTest & IS_TEXT_UNICODE_REVERSE_SIGNATURE){
            for(i = 0;i < iFileLength; i+=2)
                swap(pText[i],pText[i+1]);
        }
        wstr = (wchar_t*)(pBuffer+2);
    }
    delete [] pBuffer;

wcout<<wstr<<'/n';
}

输出正确。以上程序段自动识别 Unicode 编码文件开头的 0xFFFE 标记判断是 Little Endian 还是

Big Endian 并做相应转换。但是代码量较大，且与 C++ 的 IO流很不搭调...

结论：

      9.可以看到，只是把输入内容去掉UTF-16开头的0xFFFE，直接把内存指针改为
    wchar_t* 后 std::wstring 即可正确识别，说明程序中的宽字符存储格式实际上用的就是
    UTF-16 little endian

实验 08:
不死心又去翻了 boost 库，发现 codecvt_null 这个好东西，看下实现是把文件存储内容
按照 wchar_t 为单位直接读入内存不做任何转换。这其实不正好是 UTF-16 需要做的么
以下把 test.txt 存为 UTF-16 little endian 再次实验

#include <boost/archive/codecvt_null.hpp>

wifstream wfin( L"test.txt");
locale utf16(loc, new boost::archive::codecvt_null< wchar_t>);
wfin.imbue(utf16);
while(wfin>>wstr){
wcout<<wstr<<endl;

}
wfin.close();

输出正确。

结论：

10. 看来可以把 codecvt_null 作为 UTF-16 的 codecvt_facet 读入 locale
来使用，避免使用类似上面 API 那么多代码。

实验 09:
将 test.txt 存为 UTF-16 Big Endian ,内容不变。程序不变

无法输出任何内容。

结论：

11. wcout 不认识 big endian 的 wchar_t ...

看来想读取 UTF-16 Big Endian，仅靠 codecvt_null 还不够。稍微翻了一下

《C++ 输入输出流与本地化》这本书，现在可以考虑写一个自己的 codecvt_facet

了。有了 codecvt_null 的代码，稍作改动即可用于 UTF-16 big endian。虽说有了

现在的知识自己写个 utf-16 的codecvt_facet 也可以，但效率大概比不上 boost 里的。

代码准备：用类似的方法写出了自己的 codecvt_utf16 和 codecvt_utf16_reverse 两个

codecvt_facet...然后继续实验。自己写的内容放入咱自己的头文件吧：codecvt_utf.h，

内容加入自己的 namespace : tvt

实验 10: 用 codecvt_utf.h 代替 codecvt_null.hpp。用 codecvt_utf16 和
codecvt_utf16_reverse 实现 little endian 与 big endian 的输入。

wifstream wfin(L"test.txt");
locale utf16(loc,new tvt::codecvt_utf16<wchar_t>);
wfin.imbue(utf16);
while(wfin>>wstr){
wcout<<wstr<<endl;

}
wfin.close();

///////////////////////////////////////

wifstream wfin(L"test.txt");
locale utf16(loc,new tvt::codecvt_utf16_reverse<wchar_t>);
wfin.imbue(utf16);
while(wfin>>wstr){
wcout<<wstr<<endl;

}
wfin.close();

第一段程序读取 UTF-16 little endian 编码的 text.txt 正确输出

第二段程序读取 UTF-16 big endian 编码的 text.txt 正确输出

UTF-16 的转码顺利完成。下面考虑 UTF-8 ，写法类似。在 boost 库中继续寻找，发现

这个东东 boost/detail/utf8_codecvt_facet.hpp 。看下说明，不支持直接使用此文件，这文件

是专门提供其他 boost 组件使用的。仅 include 它的话编译出问题。再寻找到同名的 cpp 文件

后即可看到 do_in do_out 这两个转码关键的虚函数。有了上面 UTF-16 的基础，我们类似可写

出 UTF-8 的转码 codecvt_facet。我给他起名为 codecvt_utf8, 依然加入 codecvt_utf.h 文件。

现在此文件有一两百行了。经试验可正确输入 UTF-8 编码。

对应编码有了处理方法后，下一个问题是编码识别。

实验 11:

wchar_t wc;

wchar_t buf[2];

wifstream wfin(L"text.txt");

wfin.read(&wc,1);

wfin.read(&buf[0],2);

将 wc 和 buf 的内容按2进制或16进制输出。

结论：

12. wistream.read(buffer,count) 操作每次读入 count 个字节，但将每个字节存入一个
wchar_t 类型的 buffer[i] 中。其实 buffer 中每个 wchar_t 的高位都字节是 0 ...

实验 12:
加入判断条件，在 wfin 中自动加入合适的 utf16 facet，使得自动识别并读取
little endian 和 big endian 编码的文件：

wchar_t buf[2];
wifstream wfin(L"test.txt");
wfin.read(buf,2);

if(buf[0] == wchar_t(0xFF) && buf[1] == wchar_t(0xFE)){
    cout<<"little endian"<<endl;
    wfin.imbue(locale(loc,new tvt::codecvt_utf16<wchar_t>));
}
else if(buf[0] == wchar_t(0xFE) && buf[1] == wchar_t(0xFF)){
    cout<<"big endian"<<endl;
    wfin.imbue(locale(loc,new tvt::codecvt_utf16_reverse<wchar_t>));
}
while(wfin>>wstr){
    wcout<<wstr<<endl;
}

对于两种编码的 text.txt 都实现了自动识别并正确读取。输出正确！

结论：

13.UFT-16在传输时几乎都会加上 0xFFFE 等传输标志很容易判断，即使没有， Win32 下
也有 IsTextUnicode 这 API 用专门方法判断。UTF-8 就很麻烦了，开头不一定都有 BOM 标

记，与各地区字符集一样都可以用一个或多字节表示一个字符，编码长度不固定，如果是

很长一段 ASCII 字符，那么用 UTF-8 和 GB2312 编码出来结果一样，就很难分辨

代码准备：经过一段时间思考，打算用这种算法。先读取前3字节，若是 BOM 头标记最好。若

不是则排除 UTF-16 ，下面集中力量分辨 UTF-8 与 ANSI 。从头开始寻找第一个 >127 的字节

若此字节内容 < 0xC0 或 >0xEF 则可判断不是 UTF-8 。否则，根据 UTF-8 的规则，在后面1 或

2 字节中看开头两位是不是 10 。若不是则断定不是 UTF-8 ，否则就算得到一个 UTF-8 字符。

如果能够找到 10个满足条件的 UTF-8 字符就判断为 UTF-8 编码。若未到 10 个即遇到文件结

尾，那么找到 UTF-8 字符数大于 1 即断定为 UTF-8 否则断定为 ANSI ...

用这种方式选择对应转码 facet:

wistrm.imbue(std::locale(wistrm.getloc(), new codecvt_utf8));

按以上想法写成函数 int IsStreamUnicode(std::wistream &wistrm); UTF-16 LE 返回1，BE 返回2，

UTF-8 返回3，否则返回 0 (判断为ANSI)

实验 13:

std::wifstream wfin(L"test.txt");
if(!tvt::IsStreamUnicode(wfin))
wfin.imbue(loc);
while(wfin>>wstr)
wcout<<wstr<<endl;

在我试验的各种情况下，均能自动识别 UTF-16 LE UTF-16 BE UTF-8 与 ANSI 编码
并正确设定转码 locale .

-------------------------------------------------------------------------------------

8小时后，关于后续实验的补充：

使用中发现某些情况下 UTF-16 的读写出现问题，特别是有换行符或某字节中编码刚好

等于控制符时。经过反复测试认定是读写mode 问题。在读写 Unicode 文件时，

wifstream 与 wofstream 都设定为 ios_base::binary 模式即可。后来又补充了一个添加

BOM 头的小东西。为了使用简便把 utf_16 的 template 也去掉了。最终情形使用起来

像这个样子：

#include<iostream>

#include<fstream>

#include<codecvt_utf.h>

using namespace std;

wstring wstr;

wcout.imbue(locale(""));

// Open the Input and Output Files:

std::wifstream wfin(L"test.txt", ios_base::binary);
std::wofstream wfout(L"testout.txt", ios_base::binary);

// Set Output Format and Write BOM tag:
wfout.imbue(locale(locale(""), new tvt::codecvt_utf16));

wfout<<tvt::utf_bom;

// Detect the Format of the Input File

if(!tvt::IsStreamUnicode(wfin))
wfin.imbue(locale(""));

// Read and Write

//while(wfin>>wstr){
// wcout<<wstr<<endl;
// wfout<<wstr<<endl;
//}

// Another way:

while(getline(wfin,wstr)){
wcout<<wstr<<endl;
wfout<<wstr<<endl;
}

// Close Files:

wfin.close();
wfout.close();

读写测试全部通过！

感谢记事本、EditPlus 和 HxDen 的大力支持...

至此，关于 Unicode 编码和 C++ STL IO流的协作算是大功告成了吧，呵呵。以后有需要再

在实践中改进

花了整整一天时间 + 8 小时 = = 还算有价值吧，因为在网上看到很多人都在问且没有结果

===========分隔线============

再加一点关于 locale 的使用总结

另附：现在来看用 c++ 的 IO stream locale 系列实现转码并不是一个经济的选择，如果用 STLport 的话还好些，用 VC STL 则存在较严重的效率问题：

File I/O 效率 C vs C++ (一)

2025年网络安全全景解析：十大趋势、攻防演练与未来挑战（附实战资源） emmm形成中网络安全网络网络安全
2025年网络安全全景解析：十大趋势、攻防演练与未来挑战（附实战资源）摘要：2025年网络安全领域面临前所未有的挑战与机遇。本文从十大技术趋势、攻防演练实战方案、AI驱动的威胁与防御等角度深度剖析当前网络安全格局，并附赠零基础到精通的网安学习资源，助你掌握最新技术动态与防御策略。[推荐收藏]一、2025年网络安全十大核心趋势1.人工智能全面赋能攻防两端攻击侧：黑客利用生成式AI制作深度伪造内容（如
python win32gui通过窗口类名获取句柄行若 python 开发语言
使用Python的win32gui模块通过窗口类名获取句柄在Windows操作系统中，每一个窗口都有一个唯一的句柄（Handle），用于标识和管理该窗口。对于应用程序开发者而言，有时我们需要通过窗口的类名获取到对应的窗口句柄，以便执行一些特定的操作，如模拟用户输入、调整窗口位置或大小等。Python提供了win32gui模块，使得这一过程变得简单。本文将介绍如何通过窗口类名获取窗口句柄，并提供代码
量子计算：开启信息时代新纪元的钥匙 Evaporator Core 人工智能 #深度学习量子计算
一、量子计算的基本原理：颠覆经典的计算范式1.1从比特到量子比特的革命传统计算机使用比特作为信息基本单位，每个比特只能表示0或1。而量子计算机使用量子比特(Qubit)，它能够同时处于0和1的叠加态：#经典比特vs量子比特表示classClassicalBit:def__init__(self,state):assertstatein
【家政平台开发(2)】解锁家政平台多分店运营：需求剖析与未来蓝图奔跑吧邓邓子家政平台开发家政平台开发多分店经营
本【家政平台开发】专栏聚焦家政平台从0到1的全流程打造。从前期需求分析，剖析家政行业现状、挖掘用户需求与梳理功能要点，到系统设计阶段的架构选型、数据库构建，再到开发阶段各模块逐一实现。涵盖移动与PC端设计、接口开发及性能优化，测试阶段多维度保障平台质量，部署发布阶段确保平稳上线。还深入探讨运营策略、技术创新应用及未来发展方向，为家政平台开发提供全面且实用的知识体系与实践指南。目录一、分店独立运营需
【家政平台开发(3)】解锁家政平台新体验：移动与PC端需求大揭秘奔跑吧邓邓子家政平台开发家政平台开发移动端和PC端用户体验 uniapp Element Plus
本【家政平台开发】专栏聚焦家政平台从0到1的全流程打造。从前期需求分析，剖析家政行业现状、挖掘用户需求与梳理功能要点，到系统设计阶段的架构选型、数据库构建，再到开发阶段各模块逐一实现。涵盖移动与PC端设计、接口开发及性能优化，测试阶段多维度保障平台质量，部署发布阶段确保平稳上线。还深入探讨运营策略、技术创新应用及未来发展方向，为家政平台开发提供全面且实用的知识体系与实践指南。目录一、移动前端（un
网络安全风险扫描原理及工具使用七七powerful web安全网络安全
课程目标1.熟悉常见网络安全风险扫描工具2.了解网络安全风险扫描原理3.掌握扫描工具使用方法为什么要做网络安全风险扫描？什么是网络安全风险扫描？通过一定的技术手段发现系统和软件存在的安全漏洞、弱口令网络安全风险扫描的目的：网络安全风险扫描是一种主动的防范措施，可以及时有效发现网络安全漏洞、弱口令；在攻击发生之前进行防范，做到防患于未然；保证业务顺利的开展，维护企业、行业、国家信息资产安全。网络安全
从零开始：用Python搭建你的第一个机器学习模型 Blossom.118 分布式系统与高性能计算领域 python 机器学习开发语言人工智能深度优先深度学习命令模式
在当今数字化时代，机器学习已经渗透到我们生活的方方面面，从推荐系统、语音识别到自动驾驶，它正在改变着世界的运行方式。对于初学者来说，进入这个领域可能会感到有些迷茫。本文将带你从零开始，使用Python搭建一个简单的机器学习模型，帮助你迈出进入人工智能世界的第一步。一、机器学习简介机器学习是一种人工智能技术，它使计算机能够从数据中学习并做出预测或决策。它主要分为三类：监督学习、无监督学习和强化学习。
人工智能在自然语言处理中的应用：从理论到实践的探索 Blossom.118 分布式系统与高性能计算领域人工智能自然语言处理样本学习学习 Transformer架构系统架构硬件架构
自然语言处理（NaturalLanguageProcessing，NLP）一直是人工智能领域的重要研究方向。随着深度学习技术的飞速发展，NLP在近年来取得了突破性进展，从文本生成到机器翻译，从情感分析到智能问答，自然语言处理正在深刻改变我们与机器交互的方式，并为众多行业带来新的机遇。本文将深入探讨人工智能在自然语言处理中的应用，分析其技术原理、实践案例以及未来的发展趋势。一、自然语言处理的发展历程
Java 语法核心入门：数据类型、运算符与流程控制 Mikey_n java python 开发语言
一、引言Java作为一门广泛应用的编程语言，其语法核心是我们学习Java的基石。这部分主要包括数据类型、运算符和流程控制。掌握这些内容，能让你在Java的编程世界里迈出坚实的第一步。接下来，我们就详细探讨这些知识点。二、数据类型2.1基本数据类型Java有8种基本数据类型，可分为4大类：整数类型、浮点类型、字符类型和布尔类型。2.1.1整数类型byte：占用1个字节，取值范围是-128到127。常
基于回溯思想的小游戏Knight‘s tour 骑士巡游 52Hertz861 回溯算法算法
骑士巡游是指在棋盘上，骑士的一系列移动，使得骑士恰好访问棋盘上的每一个方格一次。如果骑士最终停在一个与起始方格相隔一个“马步”（象棋）的方格上（这样它就可以立即沿着相同的路径再次巡游棋盘），那么这个周游是“闭合的”；否则，它就是“开放的”。下面进入代码部分讲解：1.头文件和命名空间#include#includenamespacebacktracking{namespaceknight_tour{
在VS code 中部署C#和avalonia开发环境 yufei-coder c#vscode
要在Mac的VSCode中配置C#和Avalonia的开发环境，您可以按照以下步骤进行：1.安装.NETSDK下载.NETSDK：访问.NET下载页面。选择适用于macOS的最新稳定版本的.NETSDK，并下载安装程序。安装.NETSDK：运行下载的安装程序，按照提示完成安装。验证安装：打开“终端”应用程序。输入dotnet--version，如果显示版本号，则说明安装成功。2.安装VisualS
C# Windows 窗体开发基础 yufei-coder C#c#microsoft visual studio vscode
WindowsForms（WinForms）是C#中用于开发桌面应用程序的框架。它提供了丰富的UI控件，可以快速构建桌面应用程序的用户界面。本文将介绍Windows窗体开发的基本概念，包括窗体和控件、事件处理、界面布局与设计，以及消息循环与窗体生命周期。1.窗体及控件介绍窗体是WindowsForms应用程序的基本构件，作为用户界面的容器。C#的Form类提供了创建窗体的基本功能，而控件则是窗体上
创建Python虚拟环境详解 qq_39605374 python 开发语言 linux
创建Python虚拟环境详解Python虚拟环境是Python开发中必不可少的一部分，它允许我们在同一台机器上使用多个python版本并且避免了依赖包之间的冲突。在这篇文章中，我们将学习如何创建Python虚拟环境。安装virtualenv首先，我们需要安装virtualenv，这个工具可以帮助我们创建Python虚拟环境。在命令行中输入以下命令来安装：pipinstallvirtualenv创建
HttpComponents使用纪要何人听我楚狂声 java java
概览本文原载于我的博客，地址：https://blog.guoziyang.top/archives/15/HttpComponents是Apache基金会开发和维护的一组底层HTTP及其它协议相关的Java套件包。HttpComponents的前身是ApacheCommons包下的HttpClient包，在3.1版本后，独立成了单独的一组套件，包全名为org.apache.httpcompone
15 LRU缓存枪兵自古幸运e leetCode100刷题数据结构算法
146.LRU缓存-力扣（LeetCode）这道题采用双向链表加哈希表；哈希表是为了随机访问，双向链表是为了能够确定位置这里面注意的是我们需要一个哨兵节点来辅助，需要让哨兵节点的prev.next以及next.next指向自己，即这里是一个双向循环链表，并且我们每次头插节点的时候都是头插在哨兵节点之后classLRUCache{//这里put和get想实现O1那么就需要使用哈希表，但是哈希表是没有
技术驱动型公司的管理之道：Lepton AI的组织结构 AI智能涌现深度研究 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
技术驱动型公司,组织结构,LeptonAI,扁平化管理,跨职能团队,数据驱动决策,持续学习,创新文化1.背景介绍在当今科技飞速发展的时代，技术驱动型公司已成为经济增长的重要引擎。这些公司以技术创新为核心，以数据为驱动，以人才为本，不断突破技术边界，创造新的价值。然而，技术驱动型公司的管理模式也面临着独特的挑战。传统的管理模式往往过于僵化，难以适应快速变化的技术环境和激烈的市场竞争。因此，如何构建高
第98节使用首选项存储数据川石课堂软件测试华为鸿蒙鸿蒙系统 harmonyos 华为云
在HarmonyOS中，ArkTS语言提供了一种便捷的方式来管理应用的偏好设置（preferences），这些设置通常用于存储应用的配置信息、用户偏好等轻量级数据。preferences.getPreferencesSync是一个同步方法，用于从偏好设置中检索数据。下面，我将通过一个详细的示例来展示如何在ArkTS中使用preferences.getPreferencesSync方法。示例背景假设
hyperlane：Rust HTTP 服务器开发的不二之选 LTPP rust http 服务器安全前端开发语言后端
hyperlane：RustHTTP服务器开发的不二之选在如今这个数字化飞速发展的时代，web开发领域日新月异，各种框架层出不穷。然而，对于追求高性能、高效率的开发者来说，hyperlane框架无疑是Rust语言中的一颗璀璨明珠，正逐渐成为web开发领域的热门选择。性能卓越，傲视群雄hyperlane框架在性能方面展现出了无与伦比的优势。根据实际测试数据，在开启keep-alive的情况下，hyp
低空经济一周动态（20250330）有辕有辙_智能网联 eVtol 低空经济无人机
产业政策1、3月26日，商务部印发《关于支持国际消费中心城市培育建设的若干措施》。该措施提出：探索在具备安全条件的地区开通低空物流航线、开发低空旅游项目，拓展低空消费场景。2、3月24日，广东省政府办公厅印发《广东省交通运输高质量发展三年行动方案（2025—2027年）》（文末附下载）。《方案》明确，打造低空交通运输示范城市，加快完善全省低空飞行服务保障体系，建设省级综合飞行服务站和广州、深圳、珠
低空经济招标项目一周速览（20250330）有辕有辙_智能网联 eVtol 低空经济无人机
企业1、3月29日，国能大渡河大数据服务有限公司发布山地光伏多功能无人机关键技术研究及设备采购公开招标项目招标公告，项目内容包括综合多功能无人机选型设计及改造升级、自动管控平台研制等。2、3月29日，中国融通集团第六十研究所发布基于无人机的某行为特征采集设备采购比质比价公告。3、3月28日，南方电网电力科技股份有限公司发布一体式无人机防御系统协助开发及样机试制招标公告，预算217万元。4、3月28
Python 爬虫详解与操作示例 kdayjj966 python 爬虫开发语言
Python爬虫是一项非常实用的技术，可以帮助我们自动化获取网页中的数据。以下内容将从理论到实践，逐步展示如何构建一个完整的Python爬虫，并结合实际操作过程说明。1.爬虫的基本概念1.1什么是爬虫？爬虫（WebCrawler）是一种能够自动访问网页并提取数据的程序。简单来说，爬虫的核心工作是：模拟用户访问网页。获取网页内容（例如HTML）。从内容中提取目标数据。1.2爬虫的工作流程确定目标：明
一周速递|全球车联网产业动态（2024年7月28日）有辕有辙_智能网联汽车物联网人工智能大数据
政策法规1、7月26日，苏州市工信局近日印发《关于开展2024年苏州市智能车联网典型示范应用场景遴选工作的通知》，将围绕公共管理、示范运营、公共服务等方面，包括但不限于智慧公交、智慧乘用车(自动驾驶出租车)、智慧物流、智慧环卫、智慧配送、智慧巡逻以及停车场自动泊车等重点领域，遴选一批智能车联网典型示范应用场景，单个项目最高补助100万元。2、7月25日，《广州市智能网联汽车创新发展条例（草案修改稿
一周速递|全球车联网产业动态（2025年3月16日）有辕有辙_智能网联智能网联汽车汽车车联网
政策法规1、3月13日，国家数据局近日函复同意天津市、河北省（雄安新区）、上海市、江苏省、浙江省、广东省、四川省等7个地方开展国家数字经济创新发展试验区建设工作。下一步，各试验区将聚焦制约数字经济高质量发展的关键环节和突出问题，围绕推进数据要素市场化配置改革、优化数据基础设施建设布局、突破关键核心数字技术、纵深推进数字化转型、推进适数化改革等5个方面重点任务。行业动向1、3月13日，智能网联汽车“
React Query 4 核心技术解析：从自动缓存到无限滚动优化前端极客探险家 react.js 缓存前端
文章目录一、自动缓存策略升级二、并发查询优化三、突变请求管理四、无限滚动支持五、服务端状态同步六、性能监控与调试一、自动缓存策略升级ReactQuery4通过QueryCache实现了智能缓存管理，自动跟踪请求状态并优化更新策略。当组件卸载时，查询结果会被自动保留，重新挂载时直接从缓存读取。结合useQuery的staleTime参数，可灵活控制数据新鲜度。//智能缓存示例const{data}=
华为有类似 docker之类的神器吗 hxsln11 c语言和c加加运维华为 docker 容器
1.华为在容器技术领域提供了多种解决方案，其中部分产品与Docker有相似的功能，但更注重企业级应用、云原生集成及安全性。以下是华为主要的容器相关产品及其特点：1.华为云容器引擎（CCE，CloudContainerEngine）定位：类似DockerSwarm或Kubernetes的容器编排平台，但更侧重企业级Kubernetes服务。功能：支持Kubernetes集群管理，自动化部署、扩缩容。
探索Wapty：一款开源的Web应用渗透测试工具邹澜鹤Gardener
探索Wapty：一款开源的Web应用渗透测试工具去发现同类优质开源项目:https://gitcode.com/在网络安全日益重要的今天，开发和维护一套高效、可靠的Web应用渗透测试工具显得尤为重要。虽然【Wapty（WebApplicationPenetrationTestingSuite）】是一个暂时不再更新的项目，但它在过去的日子里为安全研究者提供了不少帮助，是探索Web安全世界的值得一试的
什么是项目可行性研究中的辅助（功能）研究？ dushky PMP 项目管理
项目可行性研究中的辅助（功能）研究是针对项目可行性分析过程中需要深入探讨的特定领域或关键问题进行的专项研究。其目的是为初步可行性研究或详细可行性研究提供支持，帮助决策者更全面地评估项目的可行性和风险。以下是其核心要点：1.辅助（功能）研究的定义与特点针对性：辅助研究聚焦于项目的某一或几个关键方面，而非全面覆盖所有内容。例如，可能单独研究市场需求、技术可行性、环境影响或法律合规性等。支持性作用：它通
塔能科技：用精准节能撬动社会效益的行业杠杆塔能物联运维人工智能
在全球积极践行可持续发展理念的当下，能源高效利用与节能减排，已然成为各行各业实现高质量发展绕不开的关键命题。对企业来说，节能早已不是一道可做可不做的选择题，而是关乎生存与发展、社会责任与竞争力的必答题。塔能科技推出的精准节能方案，宛如一把“万能钥匙”，为企业解锁的效益远超降低电费这一简单成果，在经济、环境、社会三大维度全面发力，带来深远且持久的积极影响。一、经济效益：降本增效，投资回报可观塔能科技
量子计算：下一次科技革命的引擎 _烟雨_ 量子计算科技
量子计算：下一次科技革命的引擎量子计算作为一项颠覆性的技术，正在迅速从理论研究转向实际应用。尽管目前它仍处于早期阶段，但量子计算有望在未来几年内彻底改变计算机科学、材料科学、医药研发等多个领域。本文将探讨量子计算的原理、应用前景以及面临的挑战。1.量子计算的基本原理量子计算基于量子力学的基本原理，如叠加态和纠缠态。传统计算机使用二进制（0和1）进行计算，而量子计算机使用量子比特（qubits），它
python venv虚拟环境设置 blackhole33 python 开发语言
venv模块venv是Python标准库的一部分，从Python3.3版本开始引入。它是创建虚拟环境的官方推荐方式。一、创建虚拟环境打开终端（在Windows上是命令提示符或PowerShell，在MacOS或Linux上是终端）导航到你想创建虚拟环境的目录。运行以下命令来创建虚拟环境：python-mvenv.venv二、激活虚拟环境1.Windows系统，在虚拟环境的目录运行以下命令来激活虚拟
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb

C++ STL IO流 与 Unicode (UTF-16 UTF-8) 的协同工作

你可能感兴趣的:(C++ STL IO流 与 Unicode (UTF-16 UTF-8) 的协同工作)

C++ STL IO流与 Unicode (UTF-16 UTF-8) 的协同工作

你可能感兴趣的:(C++ STL IO流与 Unicode (UTF-16 UTF-8) 的协同工作)