御查监史

Windows字符串深入详解

本文围绕Windows来讲解字符串处理。任何一本讲编程语言的书籍都会有涉及到字符串处理，C里面用于字符串处理的一般是一些库函数strlen、strcmp、strcat等等，C++用于字符串处理的是string类。用这些函数或者类，一般就能达到我们的字符串处理需求。当开始涉及windows编程的时候，又出现了更多跟字符串相关的类型、宏和类，这不禁让很多新手一头雾水。本文将从C/C++字符处理开始，进而深入讨论各种字符编码，再到windows的字符串处理，让读者由浅入深了解字符串处理的各个细节。

一、C/C++字符串处理

C++用于保存字符的类型是char，从数据类型来看，char同short、int相比，仅仅是长度不一样，表示的数据范围不一样，没有其它什么差别。我们知道，当给char变量赋值一个字符时，实际上char变量保存的是该字符的ASCII码，既然short比char表示的数据范围大，字符能赋给char变量，当然也就能赋给short变量。因此，下面的语句都是没问题的。

char ch1 = 'a';
short ch2 = 'a';
int ch3 = 'a';

既然上面3条语句都没问题，为什么平时都是用第一种，而不是后面的两种呢？因为对于ASCII字符来说，只用一个字节的长度就能够编码，用下面的两种方式都存在存储空间的浪费。C++的各种I/O类也就只对char定义了不一样的<<操作符。下面的几条语句效果就不一样了

cout << ch1 << endl;
cout << ch2 << endl;
cout << ch3 << endl;

对于char类型，cout会将其输出为对应的ASCII字符，short和int型变量则只是输出它们内部存储的字符的ASCII码，这取决于iostream是如何对这3种类型重载<<操作符。

同理，我们在对char指针指向的字符串和short指针指向的字符串进行输出时，前者可以正确输出字符串的内容，后者只是输出指针的值。

二、字符串编码

2.1 GB2312

一开始计算机只在美国使用，用一个字节存储的ASCII字符已经够用了。但是后来，世界各地都开始使用计算机了，而且他们国家使用的不是英文，他们的字符在ASCII里面是没有的，为了可以在计算机保存他们的文字，它们决定采用127号之后的空位来表示这些新的字符，还加入了很多画表格时需要用下到的横线、竖线、交叉等形状，一直把序号编到了最后一个状态255。从128到255这段范围的字符称为“扩展字符集”。

等到中国人开始使用计算机时，已经没有多余的字节状态来表示汉字了。于是中国人想出了一套新的编码方案，将127号之后的符号都取消，重新规定：
一个小于127的字符的意义与原来相同，但两个大于127的字符连在一起时，就表示一个汉字，前面的一个字节（他称之为高节）从0xA1用到 0xF7，后面一个字节（低字节）从0xA1到0xFE，这样我们就可以组合出大约7000多个简体汉字了。在这些编码里，我们还把数学符号、罗马希腊的字母、日文的假名们都编进去了，连在 ASCII 里本来就有的数字、标点、字母都统统重新编了两个字节长的编码，这就是常说的”全角”字符，而原来在127号以下的那些就叫”半角”字符了。这种汉字方案叫做“GB2312”。unicode,ansi,utf-8,unicode big endian编码的区别

之所以要有半角和全角之分，是因为英文字符的宽度比汉字要窄很多，这样的英文字符和汉字放在一起会显得不协调。因此重新定义了字符的宽距版本，以便符合汉字的宽度。

2.2 GBK

但是中国的汉字太多了，很快就发现很多人的人名没办法打出来。于是干脆不再要求低字节一定是127号之后的内码，只要第一个字节是大于127就固定表示这是一个汉字的开始，不管后面跟的是不是扩展字符集里的内容。结果扩展之后的编码方案被称为 GBK 标准。

2.3 GB18060

前面两种编码方案，对于原有的ASCII字符还是使用一个字节编码，对于我们新增加的字符使用两个字节。这就是变长多字节字符集。GB18060是我国目前最新的变长多字节字符集，兼容GB2312、GBK以及Unicode3.1。每个字符可以由1个、2个或4个字节组成，支持国内少数民族文字，包含繁体汉字以及日韩汉字。它包括单字节的ASCII、双字节的GBK、以及用于填补所有Unicode码位的四字节UTF区段。

2.4 ANSI

不同的国家和地区制定了不同的编码标准，使用1至4个字节来表示各种字符延伸编码方式，由此产生了GB2312、GBK、Shift_JSI等编码方式，这些统称为ANSI编码。在简体中文Windows操作系统中，ANSI编码代表GB2312编码；在日文Windows操作系统中，ANSI编码代表Shift_JIS编码。不同ANSI编码之间互不兼容，当信息在国际间交流时，无法将属于两种语言的文字，存储在同一段 ANSI 编码的文本中。

2.5 Unicode

随着计算机科学和互联网的不断发展，软件国际化逐渐成为了必然的趋势。在此背景下，一种包含了世界各地绝大部分文字字符的通用字符集就应运而生了-Unicode字符集。它为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求。Unicode的最新版本包括136755个字符。

Unicode中的每一个编码称为代码点，所有的代码点构成代码空间。Unicode的代码空间被分成17个平面，编号从0到16，每个平面包含的范围是0000-FFFF。平面0包含的字符又称为BMP（Basic Multilingual Plane）。要指定一个代码点，通常在十六进制表示的代码点前面添加”U+”。对于BMP内的代码点，使用4个数字表示（如U+0058表示“X”）。https://en.wikipedia.org/wiki/Unicode

至少需要21位才能表示所有Unicode代码点，如果只针对BMP，由于其高5位（指明位于哪一个平面）为0，用2个字节就可以表示。BMP中属于原ASCII字符的部分，高字节都是0。在网络间传输的字符大部分都是英文字符，如果直接传输Unicode字符，有一半的空间都是0，这对于寸土寸金的带宽资源是一种极大的浪费。因此出现了几种用于传输的实现方式，目前主要有UTF-8、UTF-16、UTF-32。UTF-8是使用的最为广泛的一种。Unicode的编码方式是唯一的，UTF是Unicode的不同实现方式。直接将Unicode的编码方式作为实现方式的，称为UCS，主要有UCS-2和UCS-4。Unicode实现方式中的每个编码称为代码单元。

2.5.1 UCS-2

UCS-2是以2个字节位单位的实现方式，只包含BMP部分的Unicode字符，不能包含全部Unicode字符，因此被Unicode委员会认定位应当遗弃。由于BMP字符基本能涵盖日常中用到的所有字符，所以UCS-2依然在被广泛地使用。

2.5.1 UTF-8

UTF-8是以一个字节为单位的实现方式。BMP的字符在UTF-8中可以是1、2、4个字节，BMP以外的字符是4个字节，原有的ASCII字符占用一个字节。所以用UTF-8传输文本既不会造成传输带宽的浪费，又能表示所有的Unicode字符。

2.5.2 UTF-16

UCS-2是UTF-16的子集，对于BMP部分字符，UCS-2与UTF-16是一样的，同时UTF-16还包含BMP以外的字符。UTF-16将Unicode代码空间分为3部分：https://en.wikipedia.org/wiki/UTF-16

U+0000至U+D7FF和U+E000至U+FFFF

这区间的代码点和代码单元数值是一样的
U+10000至U+10FFFF
来自于BMP以外（补充平面）的这部分代码点被编码为两个16位的代码单元，称为surrogate pairs。其实现方案为：
1. 代码点数值减去0x010000，剩下区间为0x000000至0x0FFFFF的20位数。
2. 高10位（范围为0x0000至0x03FF）加上0xD800作为第一个16位的代码单元（high surrogate），范围在0xD800至0xDBFF。
3. 低10位（范围位0x0000至0x03FF）加上0xDC00最为第二个16位的代码单元（low surrogate），范围在0xDC00至0xDFFF。
U+D800至U+DFFF

Unicode标准暂时将这区间的代码点保留用于区分UTF-16的high surrogate和low surrogate。

2.5.3 UTF-32

不像其它UTF使用变长编码方式，UTF-32的每个代码单元都是4个字节，代码单元和Unicode的代码点的数值是一样的。由于UTF-32有更多的空间浪费，因此使用的比较少。

2.5.4 UCS-4

UCS-4和UTF-32是一样的。

三、C++和Unicode

3.1 C++处理Unicode

Unicode作为一种能够覆盖所有国家文字的编码方式，被大力推从，我们平时在写程序的时候也应该养成使用Unicode的习惯，如果所有人都使用Unicode，那么在世界范围内传输字符串就不会有不兼容的情况。

由于我们平时使用的字符几乎都是BMP部分的字符，而这部分字符用两个字节就可以表示，在C++中的wchar_t类型就是用来存储Unicode字符的，也叫宽字符。为了支持Unicode，C++中跟字符相关的函数都有两个版本，分别针对ANSI字符和Unicode字符。如string和wstring，fstream和wfstream。C库函数也有两个版本，如strlen和wcslen。由于ANSI字符的编码长度可变，因此也叫多字节（MBCS）字符，对于最长编码长度只有2个字节的字符集也可以叫做双字节（DBCS）字符。

在给wchar_t变量赋值字符时，需要在字符前面加上L，以表示该字符要以Unicode编码，否则会是默认的ANSI编码，编译器会报错不能把char型字符赋给wchar_t变量。

wchar_t str[15] = L"This is test.";

在Windows环境下，输入的字符都是用的本地编码方式，我们平常用的简体中文系统就是GB2312，当我们在VS中敲入中文字符串的时候，内存中存放的就是中文的GB2312编码。

char str[15] = "中国Chinese";

上面的语句执行后，str中的内容是“D6 D0 B9 FA 43 68 69 6E 65 73 65”。其中D6D0是“中”的GB2312编码，B9FA是“国”的GB2312编码。剩余的英文字符，GB2312的编码和ASCII码是一样的。

虽然使用char数组可以保存ANSI字符的编码，但是当我们想知道数组里面保存有多少字符时却有问题了。用strlen来求str的长度时，得到的结果是11，而我们的str的字符是9个。由于一个汉字包含两个字节，strlen将其当做2个字符。

一个ANSI字符的第一个字节称为“lead byte”，最后一个字节称为“trail byte”。在Windows下，我们可以借助函数IsDBCSLeadByte来判断一个字节是不是lead byte。如果是lead byte，那么当前字节和下一个字节构成一个字符，否则当前字节就是一个字符。

char str[15] = "中国Chinese";
int len = 0;
for (int i = 0; i < strlen(str);)
{
    if (!IsDBCSLeadByte(str[i]))
    {
        len++;
        i += 1;
    }
    else
    {
        i += 2;
    }
}

上面的程序执行后可以计算出该段字符的长度是7。

wchar_t str[15] = L"中国Chinese";

上面的语句执行后，str中的内容时“2D4E FD56 4300 6800 6900 6E00 6500 7300 6500”。因为Unicode的每个字符都是2个字节，所以str中每个字符都对应2个字节的编码。

3.2 用同一份代码处理ANSI和Unicode字符

当然，使用Unicode也有缺点，其中最重要的是程序中的每一个英文字符会占用两倍的空间。上面的UTF-8对于英文字符是一个字节，但是它是用于传输的，在计算机内部表示都是Unicode。有时我们可能希望创建两个版本的程序，一个使用ASCII字符串而另一个使用Unicode字符串。最好的办法是维护一个单一的源码文件，但可以编译成ASCI或Unicode。

但这是有问题的，因为运行库函数具有不同名称，字符变量的定义也不同，还有Unicode字符串前面还必须加L。一个答案是使用Microsoft Visual C++中的TCHAR.H头文件，其中的每一个函数和宏都有一个下划线前缀。TCHAR.H为那些需要字符串参数的普通库函数提供了一系列的替代名称，它们可以指Unicode或非Unicode版本的函数。

如果一个名为_UNICODE的标识符被定义了，_tcslen就被定义为wcslen，如果_UNICODE没有别定义，那么_tcslen就被定义为strlen。

#define _tcslen strlen

以此类推，所有的函数都有这样的一个通用版本。对于两个字符类型，如果_UNICODE被定义了，TCHAR就是wchar_t，否则的话TCHAR就是char。

对于字符串文字中L这一问题，如果_UNICODE被定义了，一个叫_T的宏是如下定义的：

#define _T(x) L##x

在ANSI C标准的C预处理器中，那一对“#”被称为令牌粘贴，使得字母L和宏参数拼接在一起，因此，如果宏参数是“Hello”，那么L##x就是L”Hello”。如果_UNICODE没有被定义，_T宏就简单地如下定义：

#define _T(x) x

_TEXT(x)也是同样的定义的。通过TCHAR.H中提供的这些宏，就可以写出同时兼容ANSI和Unicode的代码了，只需要定义或者不定义_UNICODE就可以完成两个版本的转换，而不用分别写两份代码。

四、Windows对Unicode的支持

4.1 Windows中的字符类型

Windows中所有的函数都有ANSI和宽字符两种版本。接触过Windows编程的读者会发现涉及到字符串参数的函数，其参数都是LPCTSTR。其中的P表示是一个指针类型，C表示指向常量，STR表示指向的是字符串，T表示是一个通用类型，可以表示ANSI或Unicode版本，因此这就是一个指向常量字符串的指针。如果定义了UNICODE（注意不是_UNICODE），它就是LPCSTR，而LPCTSTR是：

typedef const char *LPCSTR;

如果没有定义UNICODE，它就是LPCWSTR，而LPCWSTR是：

typedef const wchar_t *LPCWSTR;

Windows中还定义了很多这种类似的字符串指针，下面是截的一张这些定义的图，总之它们就是指向字符串的指针。不要被这一大堆的字符串类型给吓到。因此在需要LPCSTR参数的地方，我们传一个TCHAR指针就行。

4.2 Windows中的字符函数

Windows也定义了一组字符串函数，这些函数与C运行库中对应的函数功能是相同的，并且都是通用版本的。

ILength = lstrlen(pString);
pString = lstrcpy(pString1, pString2);
pString = lstrcpyn(pString1, pString2, iCount);
pString = lstrcat(pString1, pString2);
iComp = lstrcmpi(pString1, pString2);

4.3 Visual Studio的字符集选项

在Visual Studio的Property->Configuration Properties->Character Set中可以设置使用ANSI还是Unicode版本的字符。Multi-Byte类型就是ANSI版本。这个设置项的本质就是是否定义UNICODE，因此使用哪个版本的字符可以在这里设置。

4.4 CString类

CString类是MFC中的字符串类，比直接使用字符串指针要方便很多。这个类也是一个通用版本，在不同情况下分别是CStringA和CStringW的宏定义。在需要用到LPCTSTR参数的地方，我们都可以传递CString的对象，这是为什么呢？

CString的基类CSimpleStringT定义了一个类型转换运算符CSimpleStringT::operator PCXSTR，在需要PCXSTR的地方该类都会返回一个指向内部字符串缓存的指针，而PCXSTR就是LPCTSTR的typedef。在返回LPCTSTR地方，我们也可以用CString对象类接收，因为CString有针对LPCTSTR的构造函数。

4.5 ANSI与Unicode字符之间的相互转换

根据上面的知识，我们知道ANSI字符与Unicode字符是不兼容的，不能将ANSI字符赋给wchar_t变量，反之亦然。但有时我们得到的字符是其中一个版本，而我们对字符处理的函数又是另一个版本（比如从一个ANSI编码的文件读取的字符串，而我们的程序又是针对Unicode编写的），那我们就没法处理了吗？Windows提供了两个函数分别执行两个方向的转换：WideCharToMultiByte

int MultiByteToWideChar(UINT CodePage, DWORD dwFlags,
LPCSTR lpMultiByteStr, int cbMultiByte, LPWSTR lpWideCharStr, int cchWideChar);
int WideCharToMultiByte(UINT CodePage, DWORD dwFlags,
LPWSTR lpWideCharStr, int cchWideChar, LPCSTR lpMultiByteStr, int cbMultiByte);

这两个函数中比较关键的是第一个参数，代码页用来指定转换的时候使用哪种编码方式，Windows支持的编码方式都在这里。

char str[15] = "中国Chinese";
    int len  = MultiByteToWideChar(936, 0, str, strlen(str), NULL, 0);
    wchar_t *wstr = new wchar_t[len];
    wstr[len] = L'\0';
    MultiByteToWideChar(936, 0, str, strlen(str), wstr, len);

上面的代码可以将ANSI版本的“中国Chinese”转换为Unicode版本，其中第一个调用MultiByteToWideChar的时候，将最后一个参数设置为0，该函数会返回为了保存转换后的字符所需要的空间，第二次调用将转换后的字符保存在了相应的缓存中。936是GB2312的代码页编号。

可能有的读者会说，上面这两个函数的使用方式也太麻烦了吧？就不能简单一点吗？确实，微软在ATL中提供了几个更方便的宏和类来进行转换，它们的命名规则是：C SourceType 2 DestinationType

SourceType/DestinationType	Description
A	ANSI字符
W	Unicode字符
T	通用字符（根据_UNICODE是否定义而不同）

根据这个命名规则，CA2W的作用是将ANSI字符转换位Unicode字符。因此下面的代码完成的功能跟上面的一样。

char str[15] = "中国Chinese";
CStringW wstr = CA2W(str, 936);

第一次写博客，有哪里写得有误的地方，欢迎各位大佬不吝赐教！

ATT&CK权限提升-Linux提权总结 black guest丶 ATT&CK权限提升 linux 运维服务器
ATT&CK权限提升-Linux提权总结介绍MITREATT&CK®是一个全球可访问的基于真实世界观察的对手战术和技术知识库，本文根据MITREATT&CK框架总结了Linux系统下的权限提升技术，并且特指由普通用户提升到root权限的技术。一、滥用权限控制机制首先了解一下Linux下的权限控制机制http://c.biancheng.net/linux_tutorial/70/，Linux所有文
Stages—研发过程可视化建模和管理平台经纬恒润 Stages
产品概述Stages是美国ULSolutions旗下ULMethodParkGmbH的产品，用于帮助企业定义、管理、发布、控制、优化其研发过程，同时使其研发过程符合CMMI、ASPICE、ISO26262等标准。Stages的核心理念是把过程理论和实际项目进行有机结合。Stages聚焦于研发过程的用户体验，允许用户集中访问过程描述信息、项目文档、模板、实践或者技术知识库。在Stages中定义好的过
ATT&CK框架入门总结方寸明光红队笔记安全渗透测试系统安全
ATT&CK是一个描述对抗行为的知识库，其中的战术和技术定义了攻击声明周期内的对抗行为，其将技术都抽象成为了一个个行为，让阅读者可以直接通过技术的名称了解技术背后对应的行为目的。ATT&CK的设计目的ATT&CK是在2013年MITRE公司为了解决防守方的困境，基于现实中发生的真实攻击事件，创建的一个，对抗战术与技术知识库，其主要特点有：1、以攻击者视角，对ATT&CK中的战术与技术进行介绍2、所
ATT&CK v13版本战术介绍——凭证访问（三） SECISLAND安全官 ATTCK 网络安全 java 网络数据库
一、引言在前几期文章中我们介绍了ATT&CK中侦察、资源开发、初始访问、执行、持久化、提权、防御规避战术，本期我们为大家介绍ATT&CK14项战术中凭证访问战术第13-17种子技术，后续会介绍凭证访问其他子技术，敬请关注。二、ATT&CKv13简介MITREATT&CK是一个全球可访问的基于现实世界观察的攻防战术和技术知识库。ATT&CK知识库被用作在私营部门、政府以及网络安全产品和服务社区中开发
ATT&CK v13版本战术介绍——凭证访问（一） SECISLAND安全官网络安全 ATTCK 系统安全网络安全数据安全安全架构服务器
一、引言在前几期文章中我们介绍了ATT&CK中侦察、资源开发、初始访问、执行、持久化、提权、防御规避战术，本期我们为大家介绍ATT&CK14项战术中凭证访问战术第1-6种子技术，后续会介绍凭证访问其他子技术，敬请关注。二、ATT&CKv13简介MITREATT&CK是一个全球可访问的基于现实世界观察的攻防战术和技术知识库。ATT&CK知识库被用作在私营部门、政府以及网络安全产品和服务社区中开发特定
ATT&CK v10版本战术介绍-初始访问 SECISLAND安全官网络安全网络安全数据安全系统安全大数据运维
一、引言在前几期文章中我们介绍了ATT&CK中侦察及资源开发战术理论知识及实战研究，通过实战场景验证行之有效的检测规则、防御措施，本期我们为大家介绍ATT&CK14项战术中初始访问战术，后续会陆续介绍其他战术内容，敬请关注。二、ATT&CKv10简介MITREATT&CK是一个全球可访问的基于现实世界观察的对手战术和技术知识库。ATT&CK知识库被用作在私营部门、政府以及网络安全产品和服务社区中开
ATT&CK v13版本战术介绍——防御规避（六） SECISLAND安全官网络安全 ATTCK 网络安全数据安全系统安全企业安全 web安全
一、引言在前几期文章中我们介绍了ATT&CK中侦察、资源开发、初始访问、执行、持久化、提权战术理论知识及实战研究、部分防御规避战术，本期我们为大家介绍ATT&CK14项战术中防御规避战术第31-36种子技术，后续会介绍防御规避其他子技术，敬请关注。二、ATT&CKv13简介MITREATT&CK是一个全球可访问的基于现实世界观察的攻防战术和技术知识库。ATT&CK知识库被用作在私营部门、政府以及网
ATT&CK v13版本战术介绍——防御规避（七） SECISLAND安全官 ATTCK 网络安全网络安全数据安全系统安全数据库网络
一、引言在前几期文章中我们介绍了ATT&CK中侦察、资源开发、初始访问、执行、持久化、提权战术理论知识及实战研究、部分防御规避战术，本期我们为大家介绍ATT&CK14项战术中防御规避战术第37-42种子技术，后续会介绍其他技术，敬请关注。二、ATT&CKv13简介MITREATT&CK是一个全球可访问的基于现实世界观察的攻防战术和技术知识库。ATT&CK知识库被用作在私营部门、政府以及网络安全产品
ATT&CK v10版本战术介绍—资源开发 SECISLAND安全官网络安全网络安全运维运维开发数据安全大数据
一、引言在前两期文章中我们介绍了ATT&CK中侦察战术理论知识及实战研究，通过实战场景验证行之有效的检测规则、防御措施，本期我们为大家介绍ATT&CK14项战术中资源开发战术，后续会陆续介绍其他战术内容，敬请关注。二、ATT&CKv10简介MITREATT&CK是一个全球可访问的基于现实世界观察的对手战术和技术知识库。ATT&CK知识库被用作在私营部门、政府以及网络安全产品和服务社区中开发特定威胁
ATT&CK v10版本战术介绍—侦察 SECISLAND安全官网络安全网络安全大数据数据安全运维运维开发
一、引言在上一篇文章《2021ATT&CKv10版本更新指南》中我们整体介绍了什么是ATT&CK、ATT&CK发展历史、应用场景、v10版本更新说明等内容，本期我们为大家介绍ATT&CK14项战术中开篇侦察战术，后续会陆续介绍其他的战术内容，敬请关注。二、ATT&CKv10简介MITREATT&CK是一个全球可访问的基于现实世界观察的对手战术和技术知识库。ATT&CK知识库被用作在私营部门、政府以
ATT&CK v13版本战术介绍——凭证访问（二） SECISLAND安全官网络安全 ATTCK 网络安全系统安全 web安全
一、引言在前几期文章中我们介绍了ATT&CK中侦察、资源开发、初始访问、执行、持久化、提权、防御规避战术，本期我们为大家介绍ATT&CK14项战术中凭证访问战术第7-12种子技术，后续会介绍凭证访问其他子技术，敬请关注。二、ATT&CKv13简介MITREATT&CK是一个全球可访问的基于现实世界观察的攻防战术和技术知识库。ATT&CK知识库被用作在私营部门、政府以及网络安全产品和服务社区中开发特
ATT&CK v12版本战术介绍——提权（一） SECISLAND安全官 ATTCK 网络数据库网络安全数据安全运维
一、引言在前几期文章中我们介绍了ATT&CK中侦察、资源开发、初始访问、执行、持久化战术理论知识及实战研究，通过实战场景验证行之有效的检测规则、防御措施，本期我们为大家介绍ATT&CK14项战术中提权战术（一），包括提权前6项子技术，后续会介绍提权其他子技术，敬请关注。二、ATT&CKv12简介MITREATT&CK是一个全球可访问的基于现实世界观察的对手战术和技术知识库。ATT&CK知识库被用作
《大数据技术从零开始》自学知识库(2022年整理) DataChat.Club 大数据 java linux
文章目录计算机组成原理操作系统数据结构与算法计算机网络Linux系统JavaScalaPythonMySQL分布式系统NettyHadoopHDFSMapReduceYarnZookeeperHiveSparkKafkaFlink数据仓库数据治理数据中台大数据相关的岗位近年来增长不少，有不少朋友都在转这个方向，下面是最近整理的大数据技术知识库，供大家参考：计算机组成原理虽然很多人只要会写SQL就能
技术知识库——C1见习能力认证（应用软件开发的基础知识）云原生工程师能力认证 c1 java r语言
C站软件工程师能力认证对标大厂招聘标准，练好本领，直通大厂拿高薪。了解详情点击：C站（CSDN）软件工程师能力认证C站能力认证包含C1见习能力认证、C4专项能力认证、C5全栈能力认证，对应各项能力认证的知识模块，我们精选了优质文章供大家学习参考。这篇文章我们整理了针对C1见习能力认证相关技术的文章。C1认证含信息/编码、IP/组网、程序逻辑、Web基础4大板块，帮助你掌握计算机科学技术中的应用软件
第1篇-Easy搞定Golang设计模式-提纲刘丹冰Aceld
第一篇视频教学版https://www.bilibili.com/video/BV1Eg411m7rV《Easy搞定Golang设计模式》合集目录：https://www.jianshu.com/nb/53250177提纲课程要求原创作品刘丹冰Aceld技术知识库https://www.yuque.com/aceld《Golang修养之路》《8小时转职Golang工程师》《zinx-Golang轻
【温故知新】Java项目能力、数据安全、网络通信...本周都学了哪些知识点？高校俱乐部
1、技术知识库：《Java项目能力精选文章集合500篇》小编在这里根据知识图谱整理了CSDN站内的优质文章500篇，帮助Java工程提升项目能力、实现系统化学习！Java工程师项目能力文章500篇大合集包含：【NoSQL】Redis34篇、MongoDB33篇、Elasticsearch42篇、HBase41篇；【消息列队】RabbitMQ39篇、RocketMQ39篇、Kafka49篇；【大数据
Windows Server 2003 AD应用程序目录分区深入了解 ----------------江小帅 weixin_34167043
江小帅的作品我很喜欢，大家可以读一下，很有名气！他目前在WINITPRO工作，之前有幸跟他本人通过电话！希望他会继续出更好的文章，这是文章是他N年前发的不过还是不会过时！WindowsServer2003AD应用程序目录分区深入了解作者：江小帅微软的技术知识库实在是太庞大了，以至一些新的功能我们在彻底熟悉的时候会花费太多的时间，没办法，这是由于产品的复杂性决定的。面对OS或服务组件及AD我们应该经
重新定义公司谷歌是如何运营的-读书笔记 Kindlers
1.学习的知识，只有融会贯通，才算真正学到手。2.如果你不能时常传达你的目标，不能通过奖励巩固你的目标，那么，你的愿景还不如打印愿景的纸有价值。3.你的头衔可以让你成为管理者，但让你成为领导者的，是你的员工。4.风险投资家应永远遵守投团队而不投计划的准则。既然计划会错，那么人就得对。成功的团队懂得如何发现计划中的瑕疵并及时做出调整。5.无论你从事什么业务，你所在的行业都潜在着一个巨大的技术知识库。
UNIX网络编程学习 xinghuiwei
unix网络编程学习最近抽时间学习UNIX网络编程，通过网络和书中的知识将以前落下的内容尽量补上来，因为以前基本上做windows相关开发，用到的网络方便的技术比较少，也没有进行深入研究，linux和网络编程这块是个短板，看书然后写一下例子程序，这期间一定会遇到各种问题，问题涉及环境搭建、网络编程、编译器、操作系统等不同方面，力求通过解决这些问题来建立起自己的“技术知识库”。1.环境的搭建.在执行
十大ATT&CK***技战术小几斤 ATT`CK 网络***网络安全
MITREATT&CK是基于实战的，全球可访问的网络安全***战术和技术知识库，也是近几年网络安全领域最热门的工具和话题之一。如今ATT&CK知识库已经成为私营部门、政府和网络安全产品服务社区开发特定威胁模型和方法的基础工具。ATT&CK包含200多种独特的技术(也称为TTP)，每两年更新一次，是一个非常详细的库，包含各种***战术或类别，以及可以利用的常规系统管理员行为。在ATT&CK框架的帮助
CSDN已推出30多个知识库你所关注的技术领域在其中吗？陈秋歌
CSDN知识库自上线以来，已推出30多个技术知识库，收录优质内容已达数万篇。所有技术知识库均包含了专家精心绘制的知识图谱，及由特邀编辑（领域专家）从海量数据中层层筛选出的精华内容和资源（学习视频、实践Demo、图书）。知识图谱可以帮助开发者全局把控该技术领域，而精选内容更能让开发者从技术细节加深了解该领域的每个核心技术点。下面我们共同看看目前已推出了哪些知识库，名称及链接请见下。热门/新兴技术领域
Windows Server 2003 AD应用程序目录分区深入了解 weixin_33979203
作者：江小帅微软的技术知识库实在是太庞大了，以至一些新的功能我们在彻底熟悉的时候会花费太多的时间，没办法，这是由于产品的复杂性决定的。面对OS或服务组件及AD我们应该经常问的是：默认为什么会出现这个？为什么要有这样的功能？这个功能如何实现？这个功能有什么限制？拿此文做例子，可能一些人认为不去了解活动目录的应用程序目录分区或DNS区域中随DC增加而带来的新记录的变化，网络环境也一样运行。呵呵！那就大
技术知识库数字视频矩阵（作者：礼攀） weixin_34050519
安防全新概念－数字视频矩阵摘要：本文介绍了视频矩阵的基本概念和分类，对数字视频矩阵相对于模拟视频矩阵的优势做了重点分析了，并详细描述了基于DS4002MD矩阵解码卡的数字视频矩阵解码方案。关键字：视频矩阵数字视频矩阵DVRDS4002MD矩阵解码卡随着数字技术的高速发展，软硬件水平的提高，不断有高性能的DSP和高速的总线得到应用，使基于数字技术的视频矩阵方案能够得以实现。海康威视近期将在板卡产品线
3月19日在线研讨会预热 | Stages — 研发过程可视化建模和管理平台 Hirain1234 研发工具新闻
Stages可用于帮助企业定义、管理、发布、控制、优化其研发过程，同时使其研发过程符合CMMI、ASPICE、ISO26262等标准。Stages的核心理念是把过程理论和实际项目进行有机结合。Stages聚焦于研发过程的用户体验，允许用户集中访问过程描述信息、项目文档、模板、应用案例或者技术知识库。在Stages中定义好的过程，可以直接用于项目管理或者配置管理系统，如ClearCase、SVN、R
Stages — 研发过程可视化建模和管理平台 Hirain1234 研发工具
Stages可用于帮助企业定义、管理、发布、控制、优化其研发过程，同时使其研发过程符合CMMI、ASPICE、ISO26262等标准。Stages的核心理念是把过程理论和实际项目进行有机结合。Stages聚焦于研发过程的用户体验，允许用户集中访问过程描述信息、项目文档、模板、应用案例或者技术知识库。在Stages中定义好的过程，可以直接用于项目管理或者配置管理系统，如ClearCase、SVN、R
H264视频通过RTMP直播（神文） STN_LCD libRTMP开源项目推流
http://blog.csdn.net/firehood_/article/details/8783589H264视频通过RTMP直播2013-04-1023:2920999人阅读评论(45)收藏举报本文章已收录于：直播技术知识库版权声明：本文为博主原创文章，未经博主允许不得转载。前面的文章中提到了通过RTSP（RealTimeStreamingProtocol）的方式来实现视频的直播，但RTS
Stages — 研发过程可视化建模和管理平台 hirain123 Stages
Stages可用于帮助企业定义、管理、发布、控制、优化其研发过程，同时使其研发过程符合CMMI、ASPICE、ISO26262等标准。Stages的核心理念是把过程理论和实际项目进行有机结合。Stages聚焦于研发过程的用户体验，允许用户集中访问过程描述信息、项目文档、模板、应用案例或者技术知识库。在Stages中定义好的过程，可以直接用于项目管理或者配置管理系统，如ClearCase、SVN、R
3月19日在线研讨会预热 | Stages — 研发过程可视化建模和管理平台 hirain123 Stages
Stages可用于帮助企业定义、管理、发布、控制、优化其研发过程，同时使其研发过程符合CMMI、ASPICE、ISO26262等标准。Stages的核心理念是把过程理论和实际项目进行有机结合。Stages聚焦于研发过程的用户体验，允许用户集中访问过程描述信息、项目文档、模板、应用案例或者技术知识库。在Stages中定义好的过程，可以直接用于项目管理或者配置管理系统，如ClearCase、SVN、R
使用markdown+gitlab管理团队知识库小胖0_0
使用markdown+gitlab管理团队知识库作者：艾志谋时间：2017/09/16版本：1.0我们公司目前的技术知识库是用word编写，然后统一用公司的gitlab管理。这样做的优点是可以统一管理所有人的知识文档，并实现对内开放，对外封闭。但是缺点也很明显：word不适合做技术文档的编写。因为技术文档中有大量的代码片段，word中很难控制代码的格式，并且不能实现代码高亮，代码可读性大大下降。微
Stages — 研发过程可视化建模和管理平台 hirain123 汽车电子研发工具
Stages是德国Methodpark公司的产品，用于帮助企业定义、管理、发布、控制、优化其研发过程，同时使其研发过程符合CMMI、ASPICE、ISO26262等标准。Stages的核心理念是把过程理论和实际项目进行有机结合。Stages聚焦于研发过程的用户体验，允许用户集中访问过程描述信息、项目文档、模板、工程应用或者技术知识库。在Stages中定义好的过程，可以直接用于项目管理或者配置管理系
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。

Windows字符串深入详解

Windows字符串深入详解

一、C/C++字符串处理

二、字符串编码

2.1 GB2312

2.2 GBK

2.3 GB18060

2.4 ANSI

2.5 Unicode

2.5.1 UCS-2

2.5.1 UTF-8

2.5.2 UTF-16

2.5.3 UTF-32

2.5.4 UCS-4

三、C++和Unicode

3.1 C++处理Unicode

3.2 用同一份代码处理ANSI和Unicode字符

四、Windows对Unicode的支持

4.1 Windows中的字符类型

4.2 Windows中的字符函数

4.3 Visual Studio的字符集选项

4.4 CString类

4.5 ANSI与Unicode字符之间的相互转换

你可能感兴趣的:(技术知识库)