加油_向未来

如何判断文本的编码格式以及编码格式转换

0 前话

我相信不少程序员遇到过这样的问题：在程序里写了一段代码读文件里面的文本内容，一运行显示出来却是乱码。

为什么会乱码？
这是因为那个文件的编码格式和代码里处理文本时认为的编码格式不一样。比如，你新建了一个MFC工程，把Character Set设置为了Use Unicode Caracter Set（MFC工程默认为这个设置），然后你写了一段代码去读一个文本文档，这个时候MFC直接认为你这个文本文档就是unicode编码格式，当你的文本文档不是unicode编码时就会出现乱码。
这个道理其实很简单。假如你只懂中文，而且只会用中文去处理你看到的文档信息，有一天，你看到一篇英文文档，你把英文当成中文拼音看，你的解读就会和原文有很大出入，有的英文单词可能刚好和某个拼音对应，比如“he”英文的意思是“他”而按拼音来你可以理解为“呵”“河”“喝”之类的，但你绝对不会认为是“他”的意思。有的英文单词并不能构成完整的拼音，这个时候你就会心里嘀咕“麻蛋，这啥玩意儿？！”，于是你就一团乱麻了。当你用中文去解读日文时，看到那些奇形怪状的符号你肯定会更加一团乱麻，因为用拼音都无法解读。

那么，什么是编码格式？有哪些编码格式？如何判断从文本文档读取的文本内容是什么编码格式的？如何转换编码格式？
本文就以上几个问题展开讨论，并尝试给出解决方案。其实本人也是小白，有什么说的不对的地方请各位指正，谢谢！

本文内容及代码参考了网上其他网友写的一些文章，参考链接会在本文适当地方或文末给出，如有侵权，请联系我。
如果要转载本文，请以链接形式注明出处。

1 字符集和字符编码

1.1 字符集

字符集（Charcater Set或Charset）是一个系统支持的所有抽象字符的集合，也就是一系列字符的集合。字符是各种文字和符号的总称，包括各国家文字、标点符号、图形符号、数字等。常见的字符集有：ASCII字符集、GB2312字符集(主要用于处理中文汉字)、GBK字符集(主要用于处理中文汉字)、Unicode字符集等。

1.2 字符编码

字符编码（Character Encoding）是一套法则，使用该法则能够对自然语言的字符的一个字符集（如字母表或音节表），与计算机能识别的二进制数字进行配对。即它能在符号集合与数字系统之间建立对应关系，是信息处理的一项基本技术。通常人们用符号集合（一般情况下就是文字）来表达信息，而计算机的信息处理系统则是以二进制的数字来存储和处理信息的。字符编码就是将符号转换为计算机能识别的二进制编码。

1.3 字符集和字符编码的关系

一般一个字符集等同于一个编码方式，ANSI体系(ANSI是一种字符代码，为使计算机支持更多语言，通常使用 0x80~0xFF 范围的 2 个字节来表示 1 个字符)的字符集如ASCII、ISO 8859-1、GB2312、GBK等等都是如此。一般我们说一种编码都是针对某一特定的字符集。
一个字符集上也可以有多种编码方式，例如UCS字符集(也是Unicode使用的字符集)上有UTF-8、UTF-16、UTF-32等编码方式。

1.4 字符编码的发展历史

从计算机字符编码的发展历史角度来看，大概经历了三个阶段：

第一个阶段：ASCII字符集和ASCII编码。
计算机刚开始只支持英语(即拉丁字符)，其它语言不能够在计算机上存储和显示。ASCII用一个字节(Byte)的7位(bit)表示一个字符，第一位置0。后来为了表示更多的欧洲常用字符又对ASCII进行了扩展，又有了EASCII，EASCII用8位表示一个字符，使它能多表示128个字符，支持了部分西欧字符。

第二个阶段:ANSI编码（本地化）
为使计算机支持更多语言，通常使用 0x80~0xFF 范围的 2 个字节来表示 1 个字符。比如：汉字 ‘中’ 在中文操作系统中，使用 [0xD6,0xD0] 这两个字节存储。
不同的国家和地区制定了不同的标准，由此产生了 GB2312, BIG5, JIS 等各自的编码标准。这些使用 2 个字节来代表一个字符的各种汉字延伸编码方式，称为 ANSI 编码。在简体中文系统下，ANSI 编码代表 GB2312 编码，在日文操作系统下，ANSI 编码代表 JIS 编码。
不同 ANSI 编码之间互不兼容，当信息在国际间交流时，无法将属于两种语言的文字，存储在同一段 ANSI 编码的文本中。

第三个阶段：UNICODE（国际化）
为了使国际间信息交流更加方便，国际组织制定了 UNICODE 字符集，为各种语言中的每一个字符设定了统一并且唯一的数字编号，以满足跨语言、跨平台进行文本转换、处理的要求。UNICODE 常见的有三种编码方式:UTF-8(1个字节表示)、UTF-16((2个字节表示))、UTF-32(4个字节表示)。

1.5 Big Endian和Little Endian

big endian和little endian是CPU处理多字节数的不同方式。例如“汉”字的Unicode编码是6C49。那么写到文件里时，究竟是将6C写在前面，还是将49写在前面？如果将6C写在前面，就是big endian。如果将49写在前面，就是little endian。

2 检测文本的编码格式

下面对notepad中几种常见的编码格式（ANSI、UTF-8、UTF-8 无BOM、UCS-2 Big Endian、UCS-2 Little Endian）进行讲解。

2.1 原理

Unicode规范中推荐的标记字节顺序的方法是BOM。BOM不是“Bill Of Material”的BOM表，而是Byte Order Mark。BOM是一个有点小聪明的想法：

在UCS编码中有一个叫做”ZERO WIDTH NO-BREAK SPACE”的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符”ZERO WIDTH NO-BREAK SPACE”。

这样如果接收者收到FEFF，就表明这个字节流是Big-Endian的；如果收到FFFE，就表明这个字节流是Little-Endian的。因此字符”ZERO WIDTH NO-BREAK SPACE”又被称作BOM。

UTF-8不需要BOM来表明字节顺序，但可以用BOM来表明编码方式。字符”ZERO WIDTH NO-BREAK SPACE”的UTF-8编码是EF BB BF（读者可以用我们前面介绍的编码方法验证一下）。所以如果接收者收到以EF BB BF开头的字节流，就知道这是UTF-8编码了。

Windows就是使用BOM来标记文本文件的编码方式的。

2.2 检测策略

根据2.1节所述，可以得到以下检测策略：
1. 如果2个字节是0xFF 0xFE,则以Unicode（LE）的方式读取
2. 如果2个字节是0xFE 0xFF,则以Unicode BE的方式读取
3. 如果前2个字节是0xEF 0xBB，那么判断第3个字节是不是0xBF，如果是的话就以UTF-8的方式进行读取。
4. 判断是否符合UTF-8的编码规范，如果符合就以UTF-8的方式进行读取
如果以上都不是，则以ANSI的方式进行读取。

2.2 代码实现

下面用C语言实现检测文本的编码格式。

// 枚举编码格式
enum EncodingType {
    ENCODINGTYPE_ANSI = 0,    // ANSI
    ENCODINGTYPE_ULE,         // UCS Little Endian
    ENCODINGTYPE_UBE,         // UCS Big Endian
    ENCODINGTYPE_UTF8,        // UTF-8
    ENCODINGTYPE_UTF8_NOBOM,  // UTF-8 No BOM
}

// 检测是否为UTF-8无BOM格式编码
// src为文本内容，len为文本的长度
BOOL CheckUTF8NoBOM(const void* pBuffer, long size)
{     
    bool IsUTF8 = true;     
    unsigned char* start = (unsigned char*)pBuffer;     
    unsigned char* end = (unsigned char*)pBuffer + size;     
    while (start < end)     
    {     
        if (*start < 0x80) {   
            // (10000000): 值小于0x80的为ASCII字符  
            start++;     
        } else if (*start < (0xC0)) {
            // (11000000): 值介于0x80与0xC0之间的为无效UTF-8字符
            IsUTF8 = false;     
            break;     
        } else if (*start < (0xE0)) {     
            // (11100000): 此范围内为2字节UTF-8字符
            if (start >= end - 1) break;     
            if ((start[1] & (0xC0)) != 0x80) {     
                IsUTF8 = false;     
                break;     
            }     
            start += 2;     
        } else if (*start < (0xF0)) {
            // (11110000): 此范围内为3字节UTF-8字符
            if (start >= end - 2) break;     
            if ((start[1] & (0xC0)) != 0x80 || (start[2] & (0xC0)) != 0x80) {     
                IsUTF8 = false;     
                break;     
            }     
            start += 3;     
        } else {     
            IsUTF8 = false;     
            break;     
        }     
    }     
    return IsUTF8;     
}

// 从文本中获取编码格式
// src为文本内容，len为文本的长度
EncodingType GetEncodingTypeFromStr(const TCHAR *src, long len)
{
    const PBYTE pBuffer = (const PBYTE)src;
    if (pBuffer[0] == 0xFF && pBuffer[1] == 0xFE)
        return ENCODINGTYPE_ULE;
    if (pBuffer[0] == 0xFE && pBuffer[1] == 0xFF)
        return ENCODINGTYPE_UBE;
    if (pBuffer[0] == 0xEF && pBuffer[1] == 0xBB && pBuffer[2] == 0xBF)
        return ENCODINGTYPE_UTF8;
    if (CheckUTF8NoBOM(src, len))
        return ENCODINGTYPE_UTF8_NOBOM;
    else return ENCODINGTYPE_ANSI;
}

3 编码格式转换

下面给出几种常见的编码格式的转换的C语言实现。

wstring StrToWstr( UINT CodePage,const string& str )
{
    int len = str.length();
    wstring  wStr = L"";
    if(len <= 0) return wStr;

    int  unicodeLen = ::MultiByteToWideChar( CodePage,0,str.c_str(),-1,NULL,0 );

    wchar_t *  pUnicode;
    pUnicode = new  wchar_t[unicodeLen+1];
    memset(pUnicode,0,(unicodeLen+1)*sizeof(wchar_t));
    ::MultiByteToWideChar( CodePage,0,str.c_str(),-1,(LPWSTR)pUnicode,unicodeLen );

    wStr = ( wchar_t* )pUnicode;
    delete  pUnicode;
    return  wStr;
}

string WstrToStr(UINT CodePage, const wstring& wStr )
{
    int len = wStr.length();
    string  str = "";
    if(len <= 0) return str;

    char*     pElementText;
    int    iTextLen;

    iTextLen = WideCharToMultiByte( CodePage,0,wStr.c_str(),-1,NULL,0,NULL,NULL );

    pElementText = new char[iTextLen + 1];
    memset( ( void* )pElementText, 0, sizeof( char ) * ( iTextLen + 1 ) );
    ::WideCharToMultiByte( CodePage,0,wStr.c_str(),-1,pElementText,iTextLen,NULL,NULL );

    str = pElementText;
    delete[] pElementText;

    return str;
}

wstring ANSIToUnicode( const string& strANSI )
{
    return StrToWstr( CP_ACP,strANSI );
}
wstring UTF8ToUnicode( const string& strUTF8 )
{
    return StrToWstr( CP_UTF8,strUTF8 );
}
string UnicodeToANSI( const wstring& strUnicode )
{
    return  WstrToStr(CP_ACP, strUnicode );
}
string UnicodeToUTF8( const wstring& strUnicode )
{
    return  WstrToStr(CP_UTF8, strUnicode );
}

4 参考文章

http://blog.csdn.net/luoweifu/article/details/49382969
http://www.fmddlmyy.cn/text6.html
http://www.cnblogs.com/lkpp/p/encoding_detection.html
http://blog.csdn.net/apple_8180/article/details/7007114
http://blog.csdn.net/turingo/article/details/8136644
http://blog.csdn.net/bladeandmaster88/article/details/54767487

你可能感兴趣的:(编程基础)

网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
如何自学软件编程？零基础自学编程入门指南 _pangzi
前言零基础自学编程的动力是什么?在开启学习编程之路的时候必须搞清楚自己为什么要学编程?是因为工资高?还是对编程有浓厚的兴趣？还有自己有一定的编程基础想要继续提升自己？其实对于这个问题需要具体分析，如果是单纯看到程序员工资高，而自己本身并没有什么兴趣，那我不建议自学，可以选择参加培训或者不要进入编程领域不然自己学不会没有获得高薪，反而浪费了大把的时间，如果方法不对，反而会打击自信心。下面小编针对学习
【Python基础】Python迭代器与生成器（两种强大工具）姑苏老陈 Python编程入门 python 开发语言 python迭代器与生成器
本文收录于《Python编程入门》专栏，从零基础开始，分享一些Python编程基础知识，欢迎关注，谢谢！文章目录一、前言二、迭代器2.1创建迭代器2.2自定义迭代器2.3处理大型文件三、生成器四、生成器表达式五、实际应用案例5.1数据库查询5.2网络数据流处理六、总结一、前言在Python中，迭代器与生成器是两种非常强大的工具，它们可以帮助我们有效地处理大量数据，特别是在需要逐个访问元素的情况下。
1.6编程基础之一维数组伶俐角少儿编程 C++入门篇算法 c++数据结构
文章目录01:与指定数字相同的数的个数02:陶陶摘苹果03:计算书费04:数组逆序重放05:年龄与疾病06:校门外的树07:有趣的跳跃08:石头剪刀布09:向量点积计算10:大整数加法11:大整数减法12:计算2的N次方13:大整数的因子14:求10000以内n的阶乘15:阶乘和01:与指定数字相同的数的个数总时间限制:1000ms内存限制:65536kB描述输出一个整数序列中与指定数字相同的数的
2023年09月中国电子学会青少年软件编程（Python）等级考试试卷（一级）答案 + 解析伶俐角少儿编程 python 青少年编程中国电子学会等级考试中国电子学会少儿编程
青少年软件编程（Python）等级考试试卷（一级）一、单选题(共25题，共50分)1.下列Python语句能够正确输出"学而时习之"五个字的是？（）A.print"学而时习之"B.print"(学而时习之)"C.print("学而时习之")D.print(学而时习之)正确答案：C答案解析：本题考察的Python编程基础，print
Scratch中秋节贺卡——福满中秋小虎鲸scratch scratch节日主题 scratch教学案例少儿编程作品学习节日青少年编程
小虎鲸Scratch资源站-免费少儿编程Scratch作品源码,素材,教程分享网站!中秋佳节即将到来，小虎鲸Scratch资源站为大家特别准备了一款精美的《Scratch中秋节贺卡——福满中秋》作品，带您轻松制作属于自己的节日贺卡，为亲朋好友送上最真挚的节日祝福！这款作品不仅寓意团圆美满，还充满了趣味与创意。以下是该作品的亮点：简单易用：无需编程基础，轻松上手，跟随教程几步即可完成独具特色的中秋节
FPGA 编程基础, 赋值操作符, 运算符使用, 条件表达式, 信号操作方法行者.................. fpga开发
1.**赋值符号**：-**"="**：阻塞赋值，即在`always`模块中该语句会被立即执行。-**""**：大于，如果A>B则结果为TRUE，否则为FALSE。-**">="**：大于等于，如果A>=B则结果为TRUE，否则为FALSE。-**"=="**：等于，如果A==B则结果为TRUE，否则为FALSE。-**"!="**：不等于，如果A!=B则结果为TRUE，否则为FALSE。4.**
【C语言】词法陷阱与缺陷之二：字符和字符串表示详解 byte轻骑兵编程语言精要 #C语言深度解析坊 c语言开发语言
在C语言中，字符和字符串的表示是编程基础中的关键部分，但同时也是容易引发词法陷阱和缺陷的地方。以下是对字符和字符串表示的详细解析。一、字符的表示1.1.基本概念在C语言中，字符被视为整数，其值对应于字符集中的位置。对于采用ASCII字符集的编译器而言，字符'a'的整数值为97（十进制）或0141（八进制）。字符用单引号'括起来，如'a'、'1'、'\n'等。1.2.多字符常量某些C编译器允许在一个
Python办公自动化所需要掌握的Python基础知识苏卡不列-python Python python 开发语言数据分析自动化办公自动化
掌握基本语法是熟练使用Python语言进行自动化办公的必要前提。本文主要介绍要用到的Python编程基础知识，主要涉及Python的数据类型、变量、程序流程控制、函数、类、模块和包等内容。很多人为了图快，在学习Python语言时一上来就学习数据分析、机器学习。其实这些技术的基石是Python语言中最简单的基础知识。所以要老老实实打牢基础，这样才能看得懂那些深奥而复杂的源代码，在以后学习Python
信号和槽介绍、使用方式无_欲 Qt qt c++
一、信号与槽的简介信号与槽是Qt的编程基础，是Qt编程的核心特性，也是Qt区别与其它C++开发框架的重要特性。信号：是在特定情况下被发射的通知，例如QPushButton较常见的信号就是点击时发射的clicked()信号。GUI程序设计的主要工作就是对界面上各组件的信号进行响应，只需要知道什么时候发射哪些信号，合理的去响应和处理这些信号就可以了。槽(slot)是对信号进行响应的函数。槽就是函数，所
【QT教程】QT6对话框编程 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 c++QT教程
QT6对话框编程使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与源码分析视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个QT技术视频免费QT视频课程QT统计图和QT数据可视化视频免费看免费QT视频课程QT性能优化视频免费看免费QT视频课程QT界面美化视频免费看1QT6对话框编程基础1.1QT6对话框简介1.1.1QT6对话框简介QT6对话框简介
CTF 竞赛密码学方向学习路径规划 David Max CTF 学习笔记密码学 ctf 信息安全
目录计算机科学基础计算机科学概念的引入、兴趣的引导开发环境的配置与常用工具的安装WattToolkit（Steam++）、机场代理Scoop（Windows用户可选）常用Python库SageMathLinux小工具yafuOpenSSLMarkdown编程基础Python其他编程语言、算法与数据结构（可选）数学基础离散数学与抽象代数复杂性分析密码学的正式学习兴趣的培养做题小技巧系统学习需要了解并
客户端绑定本地端口与服务器建立连接的详细实现醉心编码通信软件 c/c++技术类服务器 TCP 数据结构网络
客户端绑定本地端口与服务器建立连接的详细实现一、网络编程基础1.1TCP/IP协议1.2套接字（Socket）1.3客户端与服务器模型二、客户端程序的设计2.1需求分析2.2流程设计三、具体代码实现3.1伪代码3.2C代码实现四、代码详解4.1初始化套接字库4.2创建套接字4.3绑定本地端口4.4准备服务器地址和端口信息：4.5连接到服务器**：在网络编程中，客户端与服务器之间的通信是一个非常重要
设计模式 - 桥接模式菜鸟小码设计模式设计模式桥接模式 java
首先，欢迎各位来到我的博客！本文深入理解设计模式原理、应用技巧、强调实战操作，提供代码示例和解决方案，适合有一定编程基础并希望提升设计能力的开发者，帮助读者快速掌握并灵活运用设计模式。如有需要请大家订阅我的专栏【设计模式】哟！我会定期更新相关系列的文章文章目录引言一、桥接模式的基本概念二、桥接模式的实现1.定义实现者接口2.定义具体实现者类3.定义抽象类4.定义具体抽象类5.客户端代码三、桥接模式
【Python基础】Python推导式姑苏老陈 Python编程入门 python 开发语言 python推导式
本文收录于《Python编程入门》专栏，从零基础开始，分享一些Python编程基础知识，欢迎关注，谢谢！文章目录一、前言二、列表推导式三、元组推导式（生成器表达式）四、字典推导式五、集合推导式六、总结一、前言Python推导式（Comprehensions）是Python语言中一种独特且强大的语法特性，用于从已有的可迭代对象（如列表、元组、字典、集合）快速创建新的可迭代对象。推导式不仅提高了代码的
ASP.NET Core 入门教学十五异步编程充值内卷 asp.net 后端
在ASP.NETCore中，异步编程是一种非常重要的技术，它可以提高应用程序的性能和响应能力。本教程将介绍如何在ASP.NETCore中使用异步编程。1.异步编程基础异步编程允许程序在等待某些操作（如I/O操作）完成时继续执行其他任务，而不是阻塞整个线程。这可以显著提高应用程序的性能，特别是在处理大量并发请求时。2.使用async和await在C#中，async和await关键字用于实现异步编程。
HiveSQL一本通 - 案例实操，2024年最新大数据开发编程基础班疯狂的石头。程序员大数据
count(stu_id)stu_countfromscore_infogroupbycourse_idhavingstu_count>=15;（3）查询结果。course_idstu_count0119021903196.3.4查询结果排序和分组指定条件1.查询学生的总成绩并按照总成绩降序排序（1）思路分析。本题主要考查分组聚合和orderby关键字的使用。（2）查询语句。hive>select
webGIS后端程序员学习路线听忆. 日常开发学习
webGIS后端程序员学习路线1.GIS基础知识学习要点：学习资源：2.后端编程基础学习要点：学习资源：3.地理数据库（SpatialDatabase）学习要点：学习资源：4.空间数据处理与分析学习要点：学习资源：5.WebGIS服务器与Web服务学习要点：学习资源：6.缓存与优化学习要点：学习资源：7.前后端交互学习要点：学习资源：8.项目实战总结学习路线边走、边悟迟早会好WebGIS（WebG
2022年最新阿里Java高级岗200+面试题，掌握80%进阿里没问题繁华哟面试学习路线阿里巴巴 android 前端后端
2022年更新的阿里集团Java岗JD标准，信息来源于阿里集团的招聘专场，包括天猫、蚂蚁金服、中间件团队的高级Java、技术专家岗位。文末随附BATJTMD等一线互联网企业的Java高级研发岗位的面试题目及答案。以下面试题能答出百分之八十你就可以去试试01阿里集团各大事业部Java岗JD标准阿里巴巴天猫1.高级JAVA工程师要求3年以上JEE开发经验；2.扎实的Java编程基础，熟悉各种设计模式3
Golang 教程7——切片、映射小吴同学（wlx） golang
Golang教程6——切片、映射注意，该文档只适合有编程基础的同学，这里的go教程只给出有区别的知识点1、数组有特定的用处，但是有些呆板（数组的长度固定不变），所以在Go语言的代码里不是特别常见。相对的，切片随处可见，切片是一种建立在数组类型之上的抽象，它构建在数组之上并且提供强大的能力和便捷。2、切片（slice）是对数组一个连续片段的引用，所以切片是一个引用类型。这个片段可以是整个数组，或者是
shell脚本编程-进阶部分运维小白。。运维学习 linux
接上一部分shell脚本编程基础使用read命令来接受输入使用read来把输入值分配给一个或多个shell变量，read从标准输入中读取值，给每个单词分配一个变量，所有剩余单词都被分配给最后一个变量，如果变量名没有指定，默认标准输入的值赋值给系统内置变量REPLYread[options][name...]#常见选项-p#指定要显示的提示-s#静默输入，一般用于密码-nN#指定输入的字符长度N-d
学习运维第七天:bash shell 脚本编程运维小白。。学习运维 bash
编程基础程序组成程序一组计算机能识别和执行的指令，运行于电子计算机上，满足人们某种需求的信息化工具。它以某些程序设计语言编写，运行于某种目标结构体系上。算法算法是指解题方案的准确而完整的描述，是一系列解决问题的清晰指令，代表着用系统的方法描述解决问题的策略机制。数据结构数据结构是计算机存储、组织数据的方式。数据结构是指相互之间存在一种或多种特定关系的数据元素的集合。通常情况下，精心选择的数据结构可
Java基础---面向对象编程基础部分傻虎贼头贼脑 Java java 开发语言 idea
1.什么是面向过程的编程？开发一个又一个的方法，有数据要处理，我们就调方法来处理。2.什么是面向对象的编程？开发一个一个的对象来处理数据，把数据交给对象，再调用对象的方法来完成对数据的处理。3.什么是对象？对象本质上是一种特殊的数据结构。4.对象是怎么来的？应用class来创建对象，class就是类，也称为对象的设计图（或者对象的模板）5.类和对象的一些注意事项类名建议用英文单词，首字母大写，满足
前后端交互-Ajax编程基础 Imkata
一.Ajax基础1-传统网站中存在的问题传统网站应用指的就是我们在node课程中做的应用，如果用户想要获取网页的最新数据，只能刷新浏览器，这样就导致：网速慢的情况下，页面加载时间长，用户只能等待表单提交后，如果一项内容不合格，需要重新填写所有表单内容页面跳转，重新加载页面，造成资源浪费，增加用户等待时间2-Ajax概述Ajax：标准读音[ˈeɪˌdʒæks]，全称：AsynchronousJava
Linux之shell脚本的if分支小橞 linux 运维服务器
if分支介绍shell脚本中的if分支语句，有编程基础的同学会感觉十分简单(其实就是想水一篇，周末一定补一篇高质量的)。if单分支格式if条件;then执行。。fiif双分支格式if条件;then执行。。else。。。。fivim自动缩进配置文件～/.vimrcif多分支if条件测试1;then命令序列1elif条件测试2;then命令序列2else命令序列nfi条件测试可以放命令，只要是可以分对
Java源码学习之高并发编程基础——AQS源码剖析之阻塞队列（下）永往不庭 java 学习后端性能优化
1.前言&目录前言：在上一篇文章AQS源码剖析之阻塞队列（上）中介绍了以独占锁模式下AQS的基本原理，AQS仅仅起到了一个“维持线程等待秩序”的作用，那么本篇文章继续讲解共享锁模式下的特点。AQS不操纵锁的获取或者释放，仅仅提供一个由双向链表组成的队列，让抢不到锁的线程进入队列排队并阻塞起来、持有锁的线程释放锁后“通知”（即从阻塞态中唤醒）排名最靠前的有效（非CANCELLED状态）节点去重新竞争
OpenJudge题解——1.5编程基础之循环控制十二 Openjudge题解 c++
目录：01:求平均年龄02:财务管理03:均值04:求整数的和与均值05:最高的分数06:整数序列的元素最大跨度值07:奥运奖牌计数08:多边形内角和09:奇数求和10:满足条件的数累加11:整数的个数12:与指定数字相同的数的个数13:乘方计算14:人口增长问题15:银行利息16:买房子17:菲波那契数列18:鸡尾酒疗法19:救援20:球弹跳高度的计算21:角谷猜想22:津津的储蓄计划23:药房
1.5 编程基础之循环控制 45 金币方法二（python3实现） dllglvzhenfeng CSP-J CSP-S NOIP历年真题计算机考研机试程序猿的数学算法人工智能 python 蓝桥杯 CSP-J
OpenJudge-45:金币信息学奥赛一本通（C++版）在线评测系统[NOIP2015普及组]金币-洛谷1.5编程基础之循环控制_45金币https://blog.csdn.net/dllglvzhenfeng/article/details/1219932361.5编程基础之循环控制45金币（python3实现一）https://blog.csdn.net/dllglvzhenfeng/art
NOI / 1.5编程基础之循环控制 45:金币 Black Watchman c语言 c++算法
描述国王将金币作为工资，发放给忠诚的骑士。第一天，骑士收到一枚金币；之后两天（第二天和第三天）里，每天收到两枚金币；之后三天（第四、五、六天）里，每天收到三枚金币；之后四天（第七、八、九、十天）里，每天收到四枚金币……这种工资发放模式会一直这样延续下去：当连续N天每天收到N枚金币后，骑士会在之后的连续N+1天里，每天收到N+1枚金币（N为任意正整数）。你需要编写一个程序，确定从第一天开始的给定天数
1.5编程基础之循环控制01:求平均年龄来吗？？？ c++算法开发语言
班上有学生若干名，给出每名学生的年龄（整数），求班上所有学生的平均年龄，保留到小数点后两位。、#include//头文件usingnamespacestd;//不用说intmain(){intn,s,sum=0;//创建变量，n表示输入几次，s是重复出入的变量，sum是把所有年龄加起来的变量cin>>n;//输入for(inti=0;i>s;//每次输入年龄sum+=s;//输入的年龄加在sum里
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他