MidoQ

C++学习笔记（一）：中文字符的处理——批量读取和修改文件夹下文件名，以及wchar_t/wstring与char/string不得不说的故事

前几天在网上下载了一堆教程，但是名字是用中文数字命名的，在windows文件管理下无法按数字顺序进行排序，这让强迫症的我很不爽，所以就想写个程序批量修改一下。

作为C++小白的我，花了好长时间，终于大致搞明白了。因为路径名和文件名都涉及到中文字符，所以花了很长时间，走了很多弯路，于是想写篇博客记录一下心路历程。

以后可能会经常写博客来记录一些学习心得（希望能坚持下来），也方便以后查阅。

本篇文章主要介绍用C++读取和修改文件名的方法，提供将中文数字修改为两位阿拉伯数字的算法，并介绍C++中对于中文字符(串)的处理。

第一次写，如有错误不当之处，敬请批评指正。

概述

C++中使用_findfirst、_findnext、_findclose这几个函数来读取文件名，并将文件名等信息存储在_finddata_t结构体中。而修改文件名使用的是rename函数。
但是，由于路径名和文件名都涉及到中文字符，所以单纯使用这几个函数会出现乱码等问题，为了方便，统一使用宽字符wchar_t、宽字符串wstring，以及宽字符下的_wfindfirst、_wfindnext、_wfindclose函数。
这些数据类型和普通类型功能都是一样的，唯一不同的是底层的存储。为了方便，在读取和修改文件名部分使用普通类型来说明。

读取和修改文件名

先声明一个结构体_finddata_t，用来存储文件信息，但无需初始化。然后可以使用三个函数来读取文件名。注意需要包含头文件< io.h >

结构体_finddata_t定义如下：

struct _finddata64i32_t {
        unsigned    attrib;
        __time64_t  time_create;    /* -1 for FAT file systems */
        __time64_t  time_access;    /* -1 for FAT file systems */
        __time64_t  time_write;
        _fsize_t    size;
        char        name[260];
};

其中attrib指的是文件属性（attribute），有以下六种：

_A_ARCH（存档）
_A_HIDDEN（隐藏）
_A_NORMAL（正常）
_A_RDONLY（只读）
_A_SUBDIR（文件夹）
_A_SYSTEM（系统）

三个函数的使用方法如下：

intptr_t _findfirst( char *filespec, struct _finddata_t *fileinfo )；
返回值：
如果查找成功的话，将返回一个intptr_t型的唯一的查找用的句柄，实际上相当于int。这个句柄将在_findnext函数中被使用。若失败，则返回-1。
参数：
filespec：标明文件的字符串，可支持通配符。比如：*.c，则表示当前文件夹下的所有后缀为C的文件。这个字符串要包括完整的路径名。
fileinfo ：这里就是用来存放文件信息的结构体的指针。已经说过，这个结构体必须在调用此函数前声明。
函数成功后，函数会把找到的文件的信息放入这个结构体中。

注意：如果将返回值赋给long型变量，有时可能会出现编译不通过的问题，因为这个函数的返回值实际上是intptr_t而不是long，可能会造成类型不兼容。这时候把定义的long型变量改为intptr_t即可。

int _findnext( intptr_t handle, struct _finddata_t *fileinfo );
返回值：
若成功返回0，否则返回-1。
参数：
handle：即由_findfirst函数返回回来的句柄。
fileinfo：文件信息结构体的指针。找到文件后，函数将该文件信息放入此结构体中。

int _findclose( long handle );
返回值：成功返回0，失败返回-1。
参数： handle ：_findfirst函数返回回来的句柄。
读取完毕后，用该函数关闭文件结束查找。

为了解决中文路径的问题，实际使用的是兼容中文字符的_wfinddata_t结构体，以及_wfindfirst、_wfindnext、_wfindclose三个函数，与不带w的几个函数功能完全相同，只是路径名参数也必须使用宽字符以兼容。

而修改文件名，使用的是rename函数，使用方法如下：
int rename( char const* OldFileName, char const* NewFileName );
返回值：
成功返回0；失败（如遇到同一文件夹下文件重名）返回-1。
参数：
OldFileName是原文件名字符串的指针，NewFileName是新文件名字符串的指针。

注意：此函数不支持宽字符类型的重载，因此中文在使用时还要转换为普通字符串。

wchar_t与wstring

一开始在网上找过一份批量改名的源码，虽然是用C++写的但是C风格特别浓重（分配内存用的是malloc/free且大量使用C风格字符串），这让我一个没有系统学习过C的人看着比较难受，所以又大改了一下，基本全部改为了使用string类（实际上是wstring类）的方法。

注意使用string类、wstring类需要包含头文件< string >。

C/C++中对于字符串处理的常用函数有：

char *strcat( char *str1, const char *str2 );
功能：函数将字符串str2 连接到str1的末端，并返回指针str1。

char *strchr( const char *str, int ch );
功能：函数返回一个指向str 中ch 首次出现的位置，当没有在str 中找ch到返回NULL。

char *strcpy( char *to, const char *from );
功能：复制字符串from 中的字符到字符串to，包括空值结束符。返回值为指针to。

size_t strlen( char *str );
功能：函数返回字符串str 的长度( 即空值结束符之前字符数目)。

int strcmp( const char *str1, const char *str2 );
功能：比较字符串str1 and str2, 返回负值说明str1比str2短，返回正值说明str1比str2长，返回0说明str1与str2一样长。

而在C++的string类中，可以用重载的+、=实现字符串连接和复制的功能，且有常用的几个成员函数：

函数名称	功能
append()	在字符串的末尾添加文本
at()	按给定索引值返回字符
c_str()	将字符串以C字符数组的形式返回
substr()	返回某个子字符串
insert()	替换字符
erase()	删除字符
replace()	替换字符
length()	返回字符串的长度
size()	返回字符串中字符的数量

这里只列出了修改文件名可能用到的一些函数，string类包含的成员函数远不止这么多，具体可以查阅手册。

对于中文字符的处理其实十分简单，只需要把char改为wchar_t类型，string改为wstring类型即可，二者的功能几乎是完全一样的，只需要注意以下不同：

1、C语言是不支持宽字符类型的，C风格字符串的strcat、strcpy等函数在使用宽字符时，只需把str改为wcs，即函数名写成wcscat、wcscpy等即可。

2、若要在控制台输出宽字符/宽字符串，必须使用宽字节流对象wcin、wcout，并且要绑定为中文地区语言。
在使用前加入以下代码即可（一次即可）：

//使用宽字节流对象，绑定为中文
    locale china("chs");//use china character
    wcin.imbue(china);//use locale object
    wcout.imbue(china);

3、对于string、wstring类各自来说，成员函数length()、size()以及C风格的strlen()功能是完全相同的，都是返回该字符串除结束符外的字符数量。但是对于string类（每个字符是char）来说，英文和数字是占1个字节，算作一个字符，汉字是占两个字节，算作两个字符。而对于wstring类（每个字符是wchar_t），无论中文、英文、数字，都是占两个字节，算作一个字符。

如以下代码：

string stra = "CPPstring";
    cout << stra << endl;
    cout << "测试string.size: " << stra.size() << endl;
    cout << "测试string.length: " << stra.length() << endl;
    cout << "测试strlen(string.c_str()): " << strlen(stra.c_str()) << endl;
    cout << endl;

    string strb = "我是一个字符串abc123";      //string中英文和数字视为一个字符，汉字视为两个字符
    cout << strb << endl;
    cout << "测试string.size: " << strb.size() << endl;
    cout << "测试string.length: " << strb.length() << endl;
    cout << "测试strlen(string.c_str()): " << strlen(strb.c_str()) << endl;
    cout << endl;

    wstring strc = L"我是一个宽字符串abc123";   //wstring中无论中英文，一个字视为一个字符
    wcout << strc << endl;
    cout << "测试wstring.size: " << strc.size() << endl;
    cout << "测试wstring.length: " << strc.length() << endl;
    cout << "测试wcslen(wstring.c_str()): " << wcslen(strc.c_str()) << endl;
    cout << endl;

在控制台输出结果为：

这里顺带一提sizeof操作符。相比较strlen()等，sizeof更像一种特殊的编译预处理而非函数，因为它的值是在编译阶段就确定的。如果对一个字符串str使用sizeof，是计算其指针所占的字节数，而字符串本身所占的空间是在堆内存分配的。在vs2017下编译，sizeof(string)和sizeof(wstring)的值都是28（这一点对于不同的库可能有所不同），而sizeof(string.c_str())和sizeof(wstring.c_str())的值都是4。

更多关于char、wchar_t的不同，如二者在底层的编码方式，以及关于ASCII、Unicode等问题，可以参考这篇文章：
c++汉字字符处理

宽字符与普通类型的转换

由于rename函数不支持宽字节作为参数，所以还要考虑二者相互转换的问题。关于这部分这篇文章讲的很详细：
C/C++多字节与宽字符串的相互转换
此处限于篇幅不再赘述。

将中文数字转换为阿拉伯数字

最后提供将中文转换为阿拉伯数字的思路。由于我下载的文件全都是一百以内的编号，所以写的时候是全部转换为两位数字，而一位数如5命名为05，算法比较简单。具体的思路就是，先找到字符十，如果没有就依次寻找一~九，找到了看前后有无数字，然后决定十字是改为1还是直接删除。如果都没有，函数返回0。

完整代码如下，VS2017环境下编译：

#include "stdafx.h"
//"stdafx.h"中包含的头文件有

using namespace std;

bool ModifyNumber(wstring & wstr);  //中文数字替换为两位的阿拉伯数字字符串，成功返回1，未找到数字返回0
string ws2s(const wstring & ws);    //宽字符串转换为普通字符串

wchar_t ChsNum[11] = { L'零', L'一', L'二', L'三', L'四', L'五', L'六', L'七', L'八', L'九', L'十' };
wchar_t ArbNum[10] = { L'0', L'1', L'2', L'3', L'4', L'5', L'6', L'7', L'8', L'9' };

int main()
{
    //使用宽字节流对象，绑定为中文
    locale china("chs");//use china character
    wcin.imbue(china);//use locale object
    wcout.imbue(china);

    wstring dirpath = L"F:\\测试\\"; //注意宽字符或宽字符串在初始化时要加前缀L

    _wfinddata_t file;  //使用宽字节的_wfinddata_t对象而非_finddata_t
    long lf;    //是否遍历完毕的标志位

    wchar_t suffixs[] = L"*.txt";   //要寻找的文件类型后缀，也统一使用宽字符串
    vector fileNameList;   //文件夹下该类型文件的名字向量表
    wchar_t *p;
    int psize = dirpath.size() + 6; //后面要把后缀加上，为了防止数组越界需要多开一点空间，6个正好
    p = new wchar_t[psize];
    wcscpy(p, dirpath.c_str());

    //获取文件名,存入向量表
    if ((lf = _wfindfirst(wcscat(p, suffixs), &file)) == -1l)
    {
        cout << "文件没有找到!\n";
    }
    else
    {
        cout << "\n文件列表:\n";
        do {
            wcout << file.name << endl;
            wstring str(file.name);
            fileNameList.push_back(str);
            cout << endl;
        } while (_wfindnext(lf, &file) == 0);
    }
    _findclose(lf); //使用完毕后要关闭文件
    delete[] p;

    //遍历文件名向量表，并进行修改
    cout << "\n开始修改文件名：" << endl;
    for (vector::iterator iter = fileNameList.begin(); iter != fileNameList.end(); ++iter)
    {
        wstring oldName = dirpath + *iter;
        wstring newName = oldName;

        //找到需要修改处并修改
        bool foundNum = ModifyNumber(newName);
        cout << "foundNum=" << foundNum << endl;

        wcout << "oldName:" << oldName << endl;
        wcout << "newName:" << newName << endl;

        wcout << "oldName size = " << oldName.size() << endl;
        wcout << "newName size = " << newName.size() << endl;

        //为了使用rename函数还要先转换回普通字符串
        string str_oldName = ws2s(oldName);
        string str_newName = ws2s(newName);

        //进行重命名
        if (foundNum)
        {
            rename(str_oldName.c_str(), str_newName.c_str());
        }
        cout << endl;
    }
    system("pause");
    return 0;
}

/*中文数字替换为两位的阿拉伯数字字符串，成功返回1，未找到数字返回0*/
bool ModifyNumber(wstring & wstr)
{
    unsigned int locTen = wstr.find(ChsNum[10]);
    if (locTen == wstring::npos)    //找不到字符十,1~9
    {
        int i = 1;
        unsigned int locUnit;
        for (i = 1; i <= 9; ++i)
        {
            locUnit = wstr.find(ChsNum[i]);
            if (locUnit != wstring::npos)
            {
                wstr.replace(locUnit, 1, 1, ArbNum[i]);
                wstr.insert(locUnit, 1, ArbNum[0]);
                break;
            }
        }
        if (locUnit == wstring::npos && i == 10)    //未找到数字
            return 0;
    }
    else    //能找到字符十,组合前后的数
    {
        wchar_t beforeten = L'零';
        int _isfrom10to20 = 1;
        if (locTen > 0) //考虑到可能字符串开头就是十
        {
            beforeten = wstr.at(locTen - 1);
            for (int count = 1; count <= 9; count++)
            {
                if (beforeten == ChsNum[count])
                {
                    _isfrom10to20 = 0;
                    break;
                }
            }
        }

        if (locTen == 0 || _isfrom10to20 == 1)
        {
            int i = 1;
            wstr.replace(locTen, 1, 1, ArbNum[1]);
            wchar_t afterten = wstr.at(locTen + 1);
            for (i = 1; i <= 9; ++i)
            {
                if (afterten == ChsNum[i])  //11~19
                {
                    wstr.replace(locTen + 1, 1, 1, ArbNum[i]);
                    break;
                }
            }
            if (i == 10)    //10
                wstr.insert(locTen + 1, 1, ArbNum[0]);
        }
        else   //21-99
        {
            int i = 1, j = 1;
            wchar_t afterten = wstr.at(locTen + 1);
            for (i = 1; i <= 9; ++i)
            {
                if (beforeten == ChsNum[i])
                {
                    wstr.replace(locTen - 1, 1, 1, ArbNum[i]);
                    break;
                }
            }
            for (j = 1; j <= 9; ++j)
            {
                if (afterten == ChsNum[j])  //非整十
                {
                    wstr.replace(locTen + 1, 1, 1, ArbNum[j]);
                    wstr.erase(locTen, 1);
                    break;
                }
            }
            if (j == 10)    //整十
            {
                wstr.replace(locTen, 1, 1, ArbNum[0]);
            }
        }
    }
    return 1;
}

/*宽字符串转换为普通字符串*/
string ws2s(const wstring & ws)
{
    string curLocale = setlocale(LC_ALL, NULL);     //curLocale="C"
    setlocale(LC_ALL, "chs");
    const wchar_t* wcs = ws.c_str();
    size_t dByteNum = sizeof(wchar_t)*ws.size() + 1;
    cout << "ws.size():" << ws.size() << endl;

    char* dest = new char[dByteNum];
    wcstombs_s(NULL, dest, dByteNum, wcs, _TRUNCATE);
    string result = dest;
    delete[] dest;
    setlocale(LC_ALL, curLocale.c_str());
    return result;
}

关于更完善的数字转换算法，可以参考这个代码，不过是用Java写的：
java实现中文数字与阿拉伯数字互相转换

参考资料：

https://blog.csdn.net/xiexu911/article/details/79990774
https://blog.csdn.net/orz_3399/article/details/53415987
https://blog.csdn.net/k346k346/article/details/50082705
https://blog.csdn.net/rentian1/article/details/78498975

6-7 统计某类完全平方数 TXHNY ATP习题算法
本题要求实现一个函数，判断任一给定整数N是否满足条件：它是完全平方数，又至少有两位数字相同，如144、676等。函数接口定义：intIsTheNumber(constintN);其中N是用户传入的参数。如果N满足条件，则该函数必须返回1，否则返回0。裁判测试程序样例：#include#includeintIsTheNumber(constintN);intmain(){ intn1,n2,i,c
两个单链表元素交叉合并 TXHNY 数据结构链表数据结构
设带头结点的线性单链表A={a1,a2,…,am}，B={b1,b2,…,bn}。试编写算法按下列规则合并A、B为线性单链表C，使得C={a1,b1,a2,b2,...am,bm,...,bn},mn函数接口定义：LinkListCombineList(LinkListLa,LinkListLb);其中La和Lb都是用户传入的参数，分别为待合并单链表的头指针。函数须返回合并后的单链表的头指针。裁判
二维数组每列排序 TXHNY C语言习题
一个4×5的整型二维数组，从键盘输入数据，并对该数组的每一列按从小到大的顺序排列后输出。输入格式:输入4行5列的矩阵，每行第一个数前没有空格，每行的每个数之间各有一个空格。输出格式:输出4行5列的矩阵，每行第一个数前没有空格，每个数输出占4列列宽。输入样例:51142123458452175364输出样例:11121523427434485565#includeintmain(void){inta
Matlab修改缓存目录位置（Temp） Ndmzi matlab 开发语言
这是MATLAB从系统环境变量中找到的设置。也可以使用MATLAB中的SETENV和GETENV函数设置或查询环境变量。请参阅下面的系统级别设置。对于Linux/MAC：MATLAB将从系统中检查环境变量'TMPDIR'（getenv（'TMP'）），如果它为空，MATLAB将检查环境变量'TMP'如果它为空，MATLAB将使用'/tmp/'作为临时目录。您可以将'TMP'环境变量设置为其他目录，
【面试场景题-你知道readTimeOutException，会引发oom异常吗】 F_windy java 面试
今天面试，我讲一个oom的场景。大致是这样：因为我们有一个需要调用第三方接口的http请求，然后因为线程池配置不合理，并且超时时间设置过长，导致线程堆积，最终oom异常。我觉得这个很好理解，然后，面试官一直问，我好像没有讲很清楚。他也有点呆，问我进阻塞队列的线程会运行吗？怎么就oom了？我说，大哥，线程创建出来就要占用内存了呀。他好像还是不懂。然后总结了一下。当系统出现readtimeout异常时
IsaacLab开发随记fixedTendon & spatialTendon Calm_dw 人工智能机器人
记一下最近用到的fixedtendon和spatialtendon，感觉还是理解的不太透彻，这部分主要是isaacsim的内容，文档链接：Articulations—OmniverseExtensionsFixedTendonSpatialTendon
IsaacLab最新2025教程(3)-搭建训练场景 Calm_dw 机器人人工智能 AI编程 python visual studio code 深度学习
前言本文将详细介绍如何使用IsaacLab进行场景搭建与物理仿真，为后续的训练打下基础。文章以IsaacLab官方tutorial为基础，从环境搭建开始，逐步实现一个包含多种物体的仿真场景，并分享开发过程中的经验。官方连接：Tutorials—IsaacLabDocumentation开发环境IsaacLab/IsaacSim4.5.0(Ubuntu22.04)代码解析这篇文章包含了前三个tuto
Matlab S-Function模块简谈 Captain cool290 matlab
1.单个输出形式的m脚本文件如何编写functiony=fcn()y=u;最简单的例子：就是输出等于输入点一下标题栏：gotodiagram就可以回到模型界面；EditData可以修改数据类型2.多个输出形式的m脚本如何编写function[y1,y2]=fcn(u1,u2)y1=u1+u2;y2=u2-u1;这样就可以多个输入和输出了。mamatlab3.注意点：S-Function中的变量u是
2024下半年——【寒假】自学黑客计划（网络安全）网安CILLE web安全网络安全 linux 网络安全密码学 ddos
CSDN大礼包：基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包前言什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客
Redhat7.6下安装Ruby on Rails环境后青春期的诗go 经验分享 ruby on rails 后端
一、前置准备操作系统说明RedHatEnterpriseLinux(RHEL)7.6带GUI安装（勾选开发工具），配置好网络下载与配置yum源相关安装包下载：wgethttp://mirrors.163.com/centos-vault/7.6.1810/os/x86_64/Packages/rpm-4.11.3-35.el7.x86_64.rpmwgethttp://mirrors.163.co
openSUSE操作系统搭建使用记录后青春期的诗go 服务器操作系统实战资料 linux 运维 php
操作系统版本：openSUSE-LEAP-15.0-x86-64一、常规操作基本操作1.查看IP信息ipa2.安装命令格式zypperinstallXXX3.安装使用ifconfig命令zypperinstallnet-tools-deprecated4.开启sshd服务/查看服务状态/设为开机启动systemctlstartsshd/systemctlstatussshd/systemctlen
pear-admin-boot开发框架使用记录（三）后青春期的诗go 经验分享 java spring boot spring log4j mybatis
一、实现部门选择操作用于从组织架构里选择出部门的操作，如开发日志管理模块，创建人新增日志时可以通过选择框选择相应共享的部门。数据库表调整在数据表添加2个字段：sharedeptid共享部门idvarcharsharedeptname共享部门名称varchar前端html页面调整页面添加如下代码：共享部门前端JS调整添加如下代码：letdtree=layui.dtree;dtree.renderSe
LAMP环境搭建（基于Fedora系统）后青春期的诗go 服务器操作系统实战资料服务器 linux 运维
一、环境说明操作系统Fedora-Server-x86-64-29LAMP集成安装包bitnami-lampstack-7.1.25-0-linux-x64-installer.run二、LAMP安装配置1.将bitnami-lampstack-7.1.25-0-linux-x64-installer.run上传至系统2.给与安装程序执行权限，chmodu+xbitnami-lampstack-7
基于koajsAdmin+mongodb的后台管理快速开发框架安装运行记录后青春期的诗go 经验分享 mongodb 数据库 node.js vue.js elementui
前置操作下载源码源码地址：https://gitee.com/zhoushuigui/koajs-admin安装mongodb数据库并连接安装yarnnpminstallyarn-g安装nodemonnpminstallnodemon-g前端运行安装依赖进入项目根目录，在命令行执行如下命令安装依赖：yarn--registry=https://registry.npmmirror.com启动服务y
GitHub在push推送到远程仓库的时候显示Logon failed登录失败奕雨. Git github Git
具体问题描述git.exepush--progress"origin"master:masterLogonfailed,usectrl+ctocancelbasiccredentialprompt.remote:SupportforpasswordauthenticationwasremovedonAugust13,2021.这是因为Git推送失败的原因是GitHub已经不支持密码认证，你需要使用
【无标题】 gs80140 AI 人工智能
KVCache在自回归生成中的作用及显存优化1.什么是KVCache？在大语言模型（LLM）进行自回归（autoregressive）文本生成时，每次生成新token，都需要基于过去的上下文重新计算self-attention机制中的Key（K）和值（V）。KVCache（键值缓存）是一种优化策略，它缓存先前计算的K/V张量，避免重复计算，从而提高生成速度并降低计算成本。2.KVCache在自回归
使用LLM自动化生成微电网Simulink模型 MC数据局自动化运维
使用LLM自动化生成微电网Simulink模型！⚡在构建微电网仿真模型时，我们通常需要手动拖拽模块、设置参数，耗费大量时间。现在，通过结合LLM（如GPT-4）与MATLAB脚本，我们可以自动生成完整的微电网Simulink模型！微电网模型核心功能：光伏功率生成：通过正弦波模拟白天和夜晚光伏输出的动态变化。电池管理系统（BMS）：基于净功率实现电池的充放电控制，动态更新SOC（电池状态）。⚡负载建
python构造函数 yimaoyingbi python学习 python 构造函数
classEmployee:def__init__(self,name,age):self.name=nameself.__age=ageprint("您好")def__work(self):print("疫情严重，在家学习")print("年龄：{0}".format(self.__age))e=Employee("gaoqi",18)e._Employee__work()构造函数和普通函数的区
chatgpt赋能python：Python构造函数详解 www_xuhss_com ChatGpt chatgpt 计算机
Python构造函数详解在Python中，构造函数是一种特殊的函数，用于创建类的实例并初始化其属性。Python构造函数的名称为__init__，它在创建类的实例时自动调用。本篇文章将全面介绍Python构造函数的重要性及其使用方法。为什么需要构造函数？当我们创建一个类的实例时，通常需要初始化它的一些属性。如果没有构造函数，我们必须手动初始化每一个属性变量，这显然会很麻烦，并且容易出现错误。所以，
Redis 详解 z小天才b Redis redis 数据库缓存
1.NoSQL的核心概念和应用场景核心概念NoSQL（NotOnlySQL）：一类非关系型数据库的统称，专为处理大规模数据存储而设计特点：高扩展性、高性能、灵活的数据模型、分布式架构CAP理论：一致性(Consistency)、可用性(Availability)、分区容错性(Partitiontolerance)，NoSQL通常优先保证AP或CP主要类型键值存储：Redis,Memcached文档
Git常用指令 Bruce_Ling git
目录前言1、gitcommit-m"writeyourdescription"2、gitcommit--amend3、gitpush-f4、gitpushoriginmaster前言在学校从来没使用过git版本管理，只会简单的把代码从github上拉下来，或者简单的把本地的代码push到自己github账号的仓库里面，但实际工作中需要十分熟练的掌握Git的一系列命令，常用的其实也不多。1、gitc
python中的构造函数 weixin_30770495 python
python中构造函数可以这样写classclassname（）：def——init——（self）：#构造函数函数体转载于:https://www.cnblogs.com/begoogatprogram/p/4649076.html
python类重载构造函数_Python：重载构造方法炒锅电解氯化钠 python类重载构造函数
对于使用过C++的人来说，构造函数与析构函数不会陌生。构造函数在对象创建时被调用，析构函数在对象被销毁时被调用。而Python中也有类似的特殊函数：__new__，__init__，__del__。其中__new__与__init__共同构成了C++中的构造函数，__del__为析构函数。__new__在对象被创建时被调用，而__init__在对象被初始化时被调用。__new__的第一个参数是对象
高性能计算:GPU加速与分布式训练 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着人工智能技术的飞速发展，深度学习模型的规模和复杂度不断提升，对计算能力的需求也越来越高。传统的CPU架构已经难以满足深度学习模型训练的需求，因此，GPU加速和分布式训练成为了高性能计算领域的研究热点。1.1.深度学习与计算挑战深度学习模型通常包含数百万甚至数十亿个参数，训练过程需要进行大量的矩阵运算和梯度更新，对计算资源的需求非常高。传统的CPU架构虽然具有较强的通用性，但其并行计
【GPT入门】第26课掌握langchain LCEL 链式调用的三种方法 *星星之火* 大模型 gpt langchain
【GPT入门】第26课掌握langchainLCEL链式调用的三种方法1.使用`__call__`语法（直接调用链对象）2.使用`invoke`方法3.使用`apply`方法（针对批量输入）总结在LangChain里，链式调用构建完成后有多种调用方式，invoke方法就是其中之一，下面为你详细介绍常见的调用方法。1.使用__call__语法（直接调用链对象）这是最常用且直观的调用方式，就像调用普通
LLM(7)：文本分词 token 化 CS创新实验室大模型人工智能深度学习 LLM
下面讨论如何将输入文本分割成独立的token，这是为LLM创建嵌入所需的预处理步骤。这些tokens要么是单独的词语，要么是特殊字符，包括标点符号，如图2.4所示。图2.4显示了在LLM背景下文本处理步骤的视图。这里，我们将输入文本分割成独立的token，这些tokens要么是词语，要么是特殊字符，如标点符号。此处用于训练LLM的文本是伊迪斯·沃顿的短篇小说《TheVerdict》，该作品已进入公
HBuilderX的下载、安装听海边涛声 HBuilderX
HBuilderX简称HX，是一款轻量级的、免费的IDE。它具有强大的语法提示和vue支持。访问HBuilderX的官网：https://www.dcloud.io/hbuilderx.html选择要下载的版本，我下载的是v4.08版本：将压缩包下拉以后解压到某个目录下就可以了，不需要安装过程，例如，我解压到D:\HBuilderX目录下面：双击HBuilderX.exe，就可以运行了：注意：HB
FDTD：基于Python的电磁场模拟开源库教程邱进斌Olivia
FDTD：基于Python的电磁场模拟开源库教程项目地址:https://gitcode.com/gh_mirrors/fd/fdtd项目介绍FDTD（Finite-DifferenceTime-Domain）是一个致力于电磁场仿真的开源项目，由flaport维护。此项目基于Python语言，提供了一套灵活且强大的工具集，用于解决各种电磁学问题，包括但不限于光学、射频以及微波工程中的传播、散射等问
FastGPT-Admin 用户管理系统搭建与配置指南张栋涓Kerwin
FastGPT-Admin用户管理系统搭建与配置指南项目地址:https://gitcode.com/gh_mirrors/fa/fastgpt-admin项目简介FastGPT-Admin是一个专为FastGPT平台设计的后台用户管理系统，支持FastGPT的特定版本（例如4.8.3），提供了基本的用户管理功能，包括增加、删除、编辑和查询用户。该系统通过现代Web技术堆栈构建，易于部署，并且支持
汇编常用指令速查爱吃饼干的熊猫汇编使用总结汇编 dos null basic command 测试
一、汇编速查MOVAA,BB将BB放到AA里CALL调用子程序(相当于BASIC的GOSUB)RET与RETF返回程序(相当于BASIC的RETURN)CMPXX,YY比较XX与YYJZ若相等则转移JNZ若不相等则转移JB若小于则转移JG若大于则转移JMP无条件转移J???(各种转移指令)LOOP循环直到CX为0INTXX类似CALL的中断涵数PUSH推入栈（STACK）ESP：PUSHAXPOP
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，