zyl910

[C] 跨平台使用TCHAR——让Linux等平台也支持tchar.h，解决跨平台时的格式控制字符问题，多国语言的同时显示（兼容vc/gcc/bcb，支持Windows/Linux/Mac）

作者：zyl910

　　将Windows程序移植到Linux等平台时，经常会遇到tchar.h问题与字符串的格式控制字符问题（char串、wchar_t串、TCHAR串混合输出）。本文探讨如何解决这些问题。

一、背景

1.1 历史

　　传统的C程序使用char字符串，采用ANSI+DBCS方案来支持当地语言，不能实现多国语言同时显示。

　　当年微软在设计Windows NT时考虑到国际化，决定内核支持Unicode，对应wchar_t类型。那时的Unicode只有16位，于是Windows中的wchar_t是16位的。
　　为了兼容老程序，与字符串有关的API一般有两套——A结尾的表示是ANSI版，使用char字符串；W结尾的是Unicode版，使用wchar_t字符串。
　　两套API用起来不方便，于是微软设计了tchar.h，定义了TCHAR类型，使用宏来切换。只需编写一份代码，就可分别编译为ANSI版与Unicode版，分别兼容老系统（win9X）和新系统（winNT）。

　　Linux等平台较晚才支持Unicode，那时已经有成熟的UTF-8编码方案，兼容传统的char类型。于是Linux等平台将UTF-8作为默认编码，这样不仅支持Unicode多国语言，而且传统的C标准库、POSIX等API均能正常工作。两全其美，不再需要搞两套API，自然也不需要tchar.h。
　　UTF-8是变长编码，一个字符可能是1至4字节，处理起来不太方便。于是Linux等平台也提供了wchar_t类型，只不过它是32位的。

　　为什么是32位的的呢，这与Unicode的发展有关。由于Unicode需要收录的东西太多，16位早就不够用了。
　　UCS-4 提倡31位的编码空间，并提出了UTF-32和6字节UTF-8等编码方案。可是该方案的成本很高。
　　进过折衷考虑，Unicode组织将编码空间由16位的0至FFFF，升级至21位的0至10FFFF。将传统16位Unicode编码称为UTF-16，并提供代理对（surrogate）方案，用两个UTF-16字符单元来编码超过16位的字符。
　　也就是说，如果wchar_t类型是16位的话，那它实际上代表UTF-16编码——对于在U+0000至U+FFFF之间的字符，每个字符占1个wchar_t；对于在U+10000至U+10FFFF之间的字符，每个字符占2个wchar_t。
　　为了确保每个字符都只占1个wchar_t，那就得将wchar_t定义为32位。这也就是UTF-32编码。

　　虽然UTF-8编码方案本身能表达很大的编码空间（例如6字节UTF-8可编码31位），但为了规范化，RFC 3629规定UTF-8最长为4字节，即最高21位编码，超过10FFFF的编码点是无效的。

1.2 为什么需要让Linux等平台也支持tchar.h？

　　很多人认为Linux等平台没必要支持tchar.h，这主要是因为wchar_t的一些问题——
1. UTF-8编码的char类型能满足Unicode国际化需求。
2. char类型更容易跨平台。而wchar_t是C95修订中加入的，到C99标准才有比较完善的支持，故某些旧编译器对wchar_t支持性不佳、甚至完全不支持。
3. wchar_t的位数不固定。在Windows平台中它是16位，而在Linux等平台中它是32位的。C99标准并没有严格规定wchar_t的位数。
4. wchar_t版函数与char版函数不对称。在C99的C标准库中，只有部分字符串函数有wchar_t版。虽然Windows平台上有A、W两套对称的API，但其他平台只有一套API。

　　以前我也赞同上述观点，但是现在我觉得有一个tchar.h会方便很多，理由有——
1. 方便Windows程序移植。很多控制台程序只进行了一些很简单的字符串操作，不会遇到wchar_t的缺陷。如果仅因缺少tchar.h问题而改动代码的话，那就成本太高了。
2. 无副作用。对于Linux等只有一套API的平台，可以取消UNICODE宏，这样tchar.h会将TCHAR映射为char，使用传统的窄字符串版函数。
3. 避免printf/wprintf混用时的Bug。printf与wprintf内部使用的是不同的缓冲区，混用会造成Bug。统一使用TCHAR能避免该bug。

1.3 字符串的格式控制字符问题

　　除了tchar.h问题外，在跨平台操作字符串时还会遇到格式控制问题。例如这些问题——
1. 在printf中使用哪种格式控制字符来输出 char字符/字符串？
2. 在printf中使用哪种格式控制字符来输出 wchar_t字符/字符串？
3. 在printf中使用哪种格式控制字符来输出 TCHAR字符/字符串？
4. 在wprintf中使用哪种格式控制字符来输出 char字符/字符串？
5. 在wprintf中使用哪种格式控制字符来输出 wchar_t字符/字符串？
6. 在wprintf中使用哪种格式控制字符来输出 TCHAR字符/字符串？

　　C99标准比较保守，不能完全解决上述问题。C99标准中对c、s仅存在“l”长度修正——没“l”的是char字符串，有“l”的是wchar_t字符串。详见C99标准的“7.24.2.1 The fwprintf function”。

　　VC++因为需要处理两套字符串API，所以它对该问题的支持非常完善。VC++中上述6个问题的答案是——
1. hc/hs。
2. lc/ls。
3. c/s。
4. hc/hs。
5. lc/ls。
6. c/s。

　　对于BCB、MingGW等Windows平台上的编译器，它们也兼容VC++的做法，支持这些格式控制字符。

　　而对于Linux等平台的gcc，它紧跟C99标准，不支持那么多格式控制字符。

　　我以前做过测试，详见——
http://www.cnblogs.com/zyl910/archive/2012/07/30/wcharfmt.html
[C] wchar_t的格式控制字符（VC、BCB、GCC、C99标准）》

1.4 _tmain入口函数问题

　　标准C使用main函数作为程序入口，其格式为——
int main(int argc, char* argv[])

　　VC++考虑到到TCHAR类型的命令行参数，于是又定义_tmain程序入口，其格式为——
int _tmain(int argc, TCHAR* argv[])

　　目前VC++对_tmain的支持较好，而MinGW等编译器对_tmain较差，有些只支持C标准的main。

二、解决方案

2.1 auto_tchar.h：使各种编译器兼容tchar.h

　　我编写了auto_tchar.h，它根据编译预处理判断该编译器是否支持tchar.h。若支持，便包含编译器的tchar.h；若不支持，则自己实现tchar.h，参考了 MinGW 的 tchar.h.http://www.mingw.org/。

　　在测试时发现，BCB6的tchar.h中没有定义TCHAR，只定义了_TCHAR。TCHAR是在winnt.h中定义的。于是做了如下修正——

	// 修正BCB6的tchar.h只有_TCHAR却没有TCHAR的问题.
	#if defined(__BORLANDC__) && !defined(_TCHAR_DEFINED)
		typedef _TCHAR	TCHAR, *PTCHAR;
		typedef _TCHAR	TBYTE, *PTBYTE;
		#define _TCHAR_DEFINED
	#endif	// #if defined(__BORLANDC__) && !defined(_TCHAR_DEFINED)

　　使用方法——
1. 将“auto_tchar.h”放在项目的include目录中。
2. 将原来的“#include <tchar.h>”改为“#include "auto_tchar.h"”。

2.2 prichar.h：解决字符串的格式控制字符问题

　　怎么解决各个编译器对格式控制字符的差异呢？
　　我从C99标准的inttypes.h找到了灵感。inttypes.h定义了一系列PRI开头的宏，解决了各种整数的格式控制字符问题。
　　我们也可以这样做，编写一个头文件，里面定义了一系列字符串的PRI宏。同时利用编译预处理判断各种编译器，定义合适的常量。

　　我编写了prichar.h，定义了这些宏——
SCNcA
SCNsA
SCNcW
SCNsW
SCNcT
SCNsT
PRIcA
PRIsA
PRIcW
PRIsW
PRIcT
PRIsT

　　前缀含义——
PRI: print, 输出.
SCN: scan, 输入.

　　中缀含义——
c: char, 字符.
s: string, 字符串.

　　后缀含义——
A: char, 窄字符版.
W: wchar_t, 宽字符版.
T: TCHAR, TCHAR版.

　　使用方法——
1. 将“prichar.h”放在项目的include目录中。
2. 包含该头文件（#include "prichar.h"）。
3. 代码示例——

char* psa = "A汉字ABC_Welcome_歡迎_ようこそ_환영.";
wchar_t* psw = L"W汉字ABC_Welcome_歡迎_ようこそ_환영.";
TCHAR* pst = _T("T汉字ABC_Welcome_歡迎_ようこそ_환영.");

	_tprintf(_T("%")_T(PRIsA)_T("\n"), psa);	// 输出窄字符串.
	_tprintf(_T("%")_T(PRIsW)_T("\n"), psw);	// 输出宽字符串.
	_tprintf(_T("%")_T(PRIsT)_T("\n"), pst);	// 输出TCHAR字符串.

　　注：必须多次使用“_T”宏，不能省略。如果将格式字符串写成“_T("%"PRIsA"\n")”，在编译Unicode版时，编译器将其会展开为“L"%" "hs" "\n"”，然后报告宽字符串不能与窄字符串串联错误（例如VC++报告“error C2308: 串联不匹配的字符串”）。

2.3 auto_tmain.h：解决_tmain入口函数问题

　　根据编译预处理判断该编译器是否支持_tmain。若支持，便不做额外处理；若不支持，则做一些处理使其支持_tmain。
　　参考了 https://github.com/coderforlife/mingw-unicode-main/blob/master/mingw-unicode.c

　　使用方法——
1. 将“auto_tmain.h”放在项目的include目录中。
2. 在主源文件包含该头文件（#include "auto_tmain.h"）。
3. 现在_tmain能正常使用了（int _tmain(int argc, TCHAR* argv[])）。

三、模块源码

3.1 auto_tchar.h

　　全部代码——
（略）

3.2 prichar.h

　　全部代码——
（略）

3.3 auto_tmain.h

　　全部代码——
（略）

四、UTF-8编码下的测试

4.1 说明

　　为了保证代码的可移植性，推荐使用UTF-8编码来保存代码文件。
　　因现在Linux等类UNIX平台默认使用UTF-8编码，gcc等编译器也是默认使用UTF-8编码。而且它们既支持“不带BOM的UTF-8”（byte order mark，字节序标记），又支持“带BOM的UTF-8”。
　　VC++ 2003（或更高）开始支持“带BOM的UTF-8”编码的代码文件。但不支持“不带BOM的UTF-8”编码的代码文件，会被误认为系统默认编码（如简体中文平台上会误认为GBK编码）。

　　为了保证代码文件能兼容更多的编译器，我建议这样做——
1. 对于源文件（c、cpp），使用“带BOM的UTF-8”编码，这样能保证VC++、gcc等编译器均能正确编译。如果你确定程序中的字符串常量均在ASCII码范围内，也可尝试“不带BOM的UTF-8”编码。
2. 对于头文件（h、hpp），使用“不带BOM的UTF-8”编码。因为头文件会在预处理阶段包含到源代码中，多余的BOM字符可能会造成编译失败。

　　在VC++中，若想改变代码文件的编码，便点击菜单“文件”->“高级保存选项”，然后在“编码”复选框中选择所需编码，再点击“确定”。

4.2 测试代码

　　文件清单——
auto_tchar.h
auto_tmain.h
makefile
prichar.h
Release
tcharall.c
tcharall_2003.sln
tcharall_2003.vcproj
tcharall_2005.sln
tcharall_2005.vcproj
tcharall_2008.sln
tcharall_2008.vcproj
tcharall_2010.sln
tcharall_2010.vcxproj
tcharall_2010.vcxproj.filters
tcharall_2010.vcxproj.user
tcharall_2012.sln
tcharall_2012.vcxproj
tcharall_2012.vcxproj.filters

　　其中tcharall.c使用“带BOM的UTF-8”编码，而3个头文件使用“不带BOM的UTF-8”编码。

　　tcharall.c——

////////////////////////////////////////////////////////////
/*
tcharall.c : 测试各种编译器使用tchar（UTF-8编码）.
Author: zyl910
Blog: http://www.cnblogs.com/zyl910
URL: http://www.cnblogs.com/zyl910/archive/2013/01/17/tcharall.html
Version: V1.00
Updata: 2013-01-17


Update
~~~~~~

[2013-01-17] V1.00
* V1.0发布.

[2012-11-08] V0.01
* 初步完成.

*/
////////////////////////////////////////////////////////////

#include <stdio.h>
#include <locale.h>
#include <wchar.h>

#include "auto_tchar.h"

#include "prichar.h"
#include "auto_tmain.h"



// Compiler name
#define MACTOSTR(x)	#x
#define MACROVALUESTR(x)	MACTOSTR(x)
#if defined(__ICL)	// Intel C++
#  if defined(__VERSION__)
#    define COMPILER_NAME	"Intel C++ " __VERSION__
#  elif defined(__INTEL_COMPILER_BUILD_DATE)
#    define COMPILER_NAME	"Intel C++ (" MACROVALUESTR(__INTEL_COMPILER_BUILD_DATE) ")"
#  else
#    define COMPILER_NAME	"Intel C++"
#  endif	// #  if defined(__VERSION__)
#elif defined(_MSC_VER)	// Microsoft VC++
#  if defined(_MSC_FULL_VER)
#    define COMPILER_NAME	"Microsoft VC++ (" MACROVALUESTR(_MSC_FULL_VER) ")"
#  elif defined(_MSC_VER)
#    define COMPILER_NAME	"Microsoft VC++ (" MACROVALUESTR(_MSC_VER) ")"
#  else
#    define COMPILER_NAME	"Microsoft VC++"
#  endif	// #  if defined(_MSC_FULL_VER)
#elif defined(__GNUC__)	// GCC
#  if defined(__CYGWIN__)
#    define COMPILER_NAME	"GCC(Cygmin) " __VERSION__
#  elif defined(__MINGW32__)
#    define COMPILER_NAME	"GCC(MinGW) " __VERSION__
#  else
#    define COMPILER_NAME	"GCC " __VERSION__
#  endif	// #  if defined(__CYGWIN__)
#elif defined(__TURBOC__)	// Borland C++
#  if defined(__BCPLUSPLUS__)
#    define COMPILER_NAME	"Borland C++ (" MACROVALUESTR(__BCPLUSPLUS__) ")"
#  elif defined(__BORLANDC__)
#    define COMPILER_NAME	"Borland C (" MACROVALUESTR(__BORLANDC__) ")"
#  else
#    define COMPILER_NAME	"Turbo C (" MACROVALUESTR(__TURBOC__) ")"
#  endif	// #  if defined(_MSC_FULL_VER)
#else
#  define COMPILER_NAME	"Unknown Compiler"
#endif	// #if defined(__ICL)	// Intel C++


char* psa = "A汉字ABC_Welcome_歡迎_ようこそ_환영.";	// 后半段分别包含了 繁体中文、日文、韩文的“欢迎”.
wchar_t* psw = L"W汉字ABC_Welcome_歡迎_ようこそ_환영.";
TCHAR* pst = _T("T汉字ABC_Welcome_歡迎_ようこそ_환영.");


int _tmain(int argc, TCHAR* argv[])
{
	// init.
	setlocale(LC_ALL, "");	// 使用客户环境的缺省locale.

	// title.
	_tprintf(_T("tcharall v1.00 (%dbit)\n"), (int)(8*sizeof(int*)));
	_tprintf(_T("Compiler: %")_T(PRIsA)_T("\n"), COMPILER_NAME);
	_tprintf(_T("\n"));

	// show
	_tprintf(_T("%")_T(PRIsA)_T("\n"), psa);	// 输出窄字符串.
	_tprintf(_T("%")_T(PRIsW)_T("\n"), psw);	// 输出宽字符串.
	_tprintf(_T("%")_T(PRIsT)_T("\n"), pst);	// 输出TCHAR字符串.
	

	return 0;
}

　　makefile——

# flags
CC = gcc
CFS = -Wall

# args
RELEASE =0
UNICODE =0
BITS =
CFLAGS =

# [args] 生成模式. 0代表debug模式, 1代表release模式. make RELEASE=1.
ifeq ($(RELEASE),0)
	# debug
	CFS += -g
else
	# release
	CFS += -O3 -DNDEBUG
	//CFS += -O3 -g -DNDEBUG
endif

# [args] UNICODE模式. 0代表ansi模式, 1代表unicode模式. make UNICODE=1.
ifeq ($(UNICODE),0)
	# ansi
	CFS +=
else
	# unicode
	CFS += -D_UNICODE -DUNICODE
endif

# [args] 程序位数. 32代表32位程序, 64代表64位程序, 其他默认. make BITS=32.
ifeq ($(BITS),32)
	CFS += -m32
else
	ifeq ($(BITS),64)
		CFS += -m64
	else
	endif
endif

# [args] 使用 CFLAGS 添加新的参数. make CFLAGS="-mavx".
CFS += $(CFLAGS)


.PHONY : all clean

# files
TARGETS = tcharall
OBJS = tcharall.o

all : $(TARGETS)

tcharall : $(OBJS)
	$(CC) -o $@ $^ $(CFS)


tcharall.o : tcharall.c
	$(CC) -c $< $(CFS)


clean :
	rm -f $(OBJS) $(TARGETS) $(addsuffix .exe,$(TARGETS))

4.3 测试结果

　　在以下编译器中成功编译——
VC2003：x86版。Unicode=0。
VC2005：x86版、x64版。Unicode=1。
VC2008：x86版。Unicode=1。
VC2010：x86版、x64版。Unicode=1。
VC2012：x86版、x64版。Unicode=1。
GCC 4.6.2（MinGW(20120426)）：x86版。Unicode=0、Unicode=1。
GCC 4.7.1（TDM-GCC(MinGW-w64)）：x64版。Unicode=0、Unicode=1。
GCC 4.7.0（Fedora 17 x64）：x86版、x64版。Unicode=0。
llvm-gcc-4.2（Mac OS X Lion 10.7.4, Xcode 4.4.1）：x86版、x64版。Unicode=0。

　　测试结果——

【VC2003，Unicode=0】
tcharall v1.00 (32bit)
Compiler: Microsoft VC++ (13106030)

A姹夊瓧ABC_Welcome_姝¤繋_銈堛亞銇撱仢_頇橃榿.
W汉字ABC_Welcome_歡迎_ようこそ_
T姹夊瓧ABC_Welcome_姝¤繋_銈堛亞銇撱仢_頇橃榿.


【VC2005，Unicode=1】
tcharall v1.00 (32bit)
Compiler: Microsoft VC++ (140050727)

A汉字ABC_Welcome_歡迎_ようこそ_??.
W汉字ABC_Welcome_歡迎_ようこそ_??.
T汉字ABC_Welcome_歡迎_ようこそ_??.


【VC2008，Unicode=1】
tcharall v1.00 (64bit)
Compiler: Microsoft VC++ (160040219)

A汉字ABC_Welcome_歡迎_ようこそ_??.
W汉字ABC_Welcome_歡迎_ようこそ_??.
T汉字ABC_Welcome_歡迎_ようこそ_??.


【VC2010，Unicode=1】
tcharall v1.00 (64bit)
Compiler: Microsoft VC++ (160040219)

A汉字ABC_Welcome_歡迎_ようこそ_??.
W汉字ABC_Welcome_歡迎_ようこそ_??.
T汉字ABC_Welcome_歡迎_ようこそ_??.


【VC2012，Unicode=1】
tcharall v1.00 (64bit)
Compiler: Microsoft VC++ (170051106)

A汉字ABC_Welcome_歡迎_ようこそ_??.
W汉字ABC_Welcome_歡迎_ようこそ_??.
T汉字ABC_Welcome_歡迎_ようこそ_??.


【GCC 4.6.2（MinGW (20120426)），Unicode=0】
tcharall v1.00 (32bit)
Compiler: GCC(MinGW) 4.6.2

A姹夊瓧ABC_Welcome_姝¤繋_銈堛亞銇撱仢_頇橃榿.
W汉字ABC_Welcome_歡迎_ようこそ_
T姹夊瓧ABC_Welcome_姝¤繋_銈堛亞銇撱仢_頇橃榿.


【GCC 4.6.2（MinGW (20120426)），Unicode=1】
tcharall v1.00 (32bit)
Compiler: GCC(MinGW) 4.6.2

A姹夊瓧ABC_Welcome_姝¤繋_銈堛亞銇撱仢_頇橃榿.
W汉字ABC_Welcome_歡迎_ようこそ_	T汉字ABC_Welcome_歡迎_ようこそ_


【GCC 4.7.1（TDM-GCC(MinGW-w64)），Unicode=0】
tcharall v1.00 (64bit)
Compiler: GCC(MinGW) 4.7.1

A姹夊瓧ABC_Welcome_姝¤繋_銈堛亞銇撱仢_頇橃榿.
W汉字ABC_Welcome_歡迎_ようこそ_T姹夊瓧ABC_Welcome_姝¤繋_銈堛亞銇撱仢_頇橃榿.


【GCC 4.7.1（TDM-GCC(MinGW-w64)），Unicode=1】
tcharall v1.00 (64bit)
Compiler: GCC(MinGW) 4.7.1

A姹夊瓧ABC_Welcome_姝¤繋_銈堛亞銇撱仢_頇橃榿.
W汉字ABC_Welcome_歡迎_ようこそ_.
T汉字ABC_Welcome_歡迎_ようこそ_.


【GCC 4.7.0（Fedora 17 x64），Unicode=0】
tcharall v1.00 (64bit)
Compiler: GCC 4.7.0 20120507 (Red Hat 4.7.0-5)

A汉字ABC_Welcome_歡迎_ようこそ_환영.
W汉字ABC_Welcome_歡迎_ようこそ_환영.
T汉字ABC_Welcome_歡迎_ようこそ_환영.


【llvm-gcc-4.2（Mac OS X Lion 10.7.4, Xcode 4.4.1），Unicode=0】
tcharall v1.00 (64bit)
Compiler: GCC 4.2.1 (Based on Apple Inc. build 5658) (LLVM build 2336.11.00)

A汉字ABC_Welcome_歡迎_ようこそ_환영.
W汉字ABC_Welcome_歡迎_ようこそ_환영.
T汉字ABC_Welcome_歡迎_ようこそ_환영.

4.4 测试结果分析

　　VC2003不支持执行字符集（execution character set）转换，对于窄字符串常量，它直接使用源文件中的UTF-8编码的字符串常量，而现在系统默认字符集是GBK（简体中文系统），导致出现“A姹夊瓧ABC_Welcome_姝¤繋_銈堛亞銇撱仢_頇橃榿.”这样的乱码。
　　从VC2005开始支持执行字符集转换，对于窄字符串常量，它会将源文件中的UTF-8编码字符串，转成执行字符集（简体中文系统下是GBK）的字符串常量。于是能正常显示包含中文的窄字符串。
　　由于简体中文Windows平台默认使用GBK编码，韩文“환영”不能转为GBK编码，于是输出“??”。

　　MinGW和MinGW-w64也是存在窄字符串乱码问题，这是因为它的执行字符集默认为UTF-8编码，该问题将在下一节详细讨论。
　　现在主要关注宽字符串的输出。MinGW和MinGW-w64对于能转码为窄字符串的（“W汉字ABC_Welcome_歡迎_ようこそ_”能转为GBK编码），能正常输出；但对于不能转码为窄字符串的（韩文“환영”不能转为GBK编码），会停止输出，这时MinGW与MinGW-w64存在细微差别——
a) 当编译为窄字符版时（不定义UNICODE宏，使用printf等窄字符版函数）：MinGW会停止输出，但能正确换行。而MinGW-w64不仅会停止输出，而且不能正确换行。
b) 当编译为宽字符版时（定义UNICODE宏，使用wprintf等宽字符版函数）：MinGW不仅会停止输出，而且不能正确换行。而MinGW-w64会停止输出，但能正确换行。

　　Linux和Mac平台默认使用UTF-8编码，所以能同时显示英文、中文、日文、韩文，完美的显示了多国语言。具体细节——
a) 对于窄字符串常量。因为现在的代码文件是以UTF-8编码保存的，所以窄字符串常量也是UTF-8编码。程序运行输出窄字符串时，终端也是UTF-8编码，编码匹配正常输出。
b) 对于宽字符串常量。编译器将UTF-8编码变为UTF-32编码，生成宽字符串常量。程序运行输出宽字符串时，因终端是UTF-8编码，C标准库将“UTF-32的宽字符串”转为“UTF-8编码的窄字符串”再输出，编码匹配正常输出。

　　小结——
1. Linux和Mac等Linux平台默认使用UTF-8编码，能在终端中完美显示多国语言。
2. Windows平台的控制台程序默认使用本地编码（简体中文系统下是GBK），所以只能显示本地编码范围内的文字。对于范围外的文字，VC++的库函数选择输出“?”号，而MinGW的库函数选择停止输出。

4.5 解决MinGW窄字符串乱码问题

　　前面提到MinGW和MinGW-w64的执行字符集默认为UTF-8编码，而Windows下系统默认字符集是GBK（简体中文系统），造成输出窄字符串时乱码。
　　该问题有两种解决办法——
1. 修改命令提示符的编码为UTF-8。
2. 让MinGW生成GBK编码的窄字符串。

4.5.1 修改命令提示符的编码为UTF-8

　　打开命令提示符，执行以下命令——
chcp 65001
注：chcp命令用于改变命令提示符的代码页。65001是UTF-8的代码页。

　　设置好编码后，还需要设置字体，这样才能正确显示文字。
　　于是在命令提示符的标题栏上点击鼠标右键，选择快捷菜单中的“属性”，打开命令提示符属性对话框。
　　切换到“字体”页面，选择“Lucida Console”字体。然后点击“确定”保存配置。若会出现对话框，继续点“确定”。

　　自此便设置好了UTF-8编码的命令提示符环境，我们可以运行先前MinGW编译好的可执行文件，测试结果——

tcharall v1.00 (32bit)
Compiler: GCC(MinGW) 4.6.2

A汉字ABC_Welcome_歡迎_ようこそ_환영.
WººؖABC_Welcome_gӭ_¤褦¤³¤½_
T汉字ABC_Welcome_歡迎_ようこそ_환영.

　　可见，窄字符串成功输出全部的字符。只是“Lucida Console”字体不支持韩文而显示为方框。
　　但意外的是，宽字符串却变成了乱码。这时因为C函数库仍将宽字符转为GBK编码的窄字符串，而现在实际上是使用UTF-8编码的窄字符串，造成乱码。深入分析见下一小节。

　　测试完成后，我们应该输入“chcp 936”命令，将命令提示符的代码页改回gbk编码。

4.5.1.1 UTF-8命令提示符乱码问题的深入分析

　　当使用chcp命令改变命令提示符的代码页时，它会调用SetConsoleCP、SetConsoleOutputCP这两个Windows API分别设置命令提示符输入、输出的代码页（65001：UTF-8）。
　　但是，活动代码页（Active Codepage，ACP）并没有发生编码，GetACP的返回值仍是原值（936：简体中文GBK）。

　　当输出宽字符串时，C库函数会将宽字符串转为窄字符串。因为现在调用了“setlocale(LC_ALL, "")”使用客户环境的缺省locale，C库函数会调用WideCharToMultiByte这个Windows API进行编码转换，代码页用的是CP_ACP，即使用GetACP的返回值（936：简体中文GBK）做代码页。于是将宽字符串转为了GBK编码的窄字符串。
　　但是现在命令提示符输入、输出用的是UTF-8编码（GetConsoleCP、GetConsoleOutputCP的返回值是65001）。编码不匹配，造成乱码。

4.5.2 让MinGW生成GBK编码的窄字符串

　　给gcc加上“-fexec-charset=<charset>”参数，能够设置执行字符集。

　　简体中文系统下默认是GBK编码，应该使用“-fexec-charset=GBK”参数。
　　但在实际编译时，gcc报告编译错误——
gcc -c tcharall.c -Wall -g -fexec-charset=GBK
tcharall.c:74:13: error: converting to execution character set: Illegal byte sequence
tcharall.c:76:65: error: converting to execution character set: Illegal byte sequence
make: *** [tcharall.o] Error 1

　　这是因为源码中含有韩文字符，它不在GBK编码范围内，gcc无法转换编码。这时得找一个编码范围更大的编码了。

　　简单介绍一下汉字编码标准——
GB2312：这是最早的国标汉字标准，采用双字节编码，收录了6763个简体汉字。
GB13000.1：此标准等同国际标准ISO/IEC 10646.1:1993《信息技术通用多八位编码字符集（UCS）第一部分：体系结构与基本多文种平面》中的CJK（中日韩统一汉字）子集。该标准专注于汉字的收录，共包含了20902个汉字（简体、繁体、日本、朝鲜常用汉字的统一收录）。
GBK：它是对GB13000.1标准的具体编码实现。它向下兼容GB2312编码，仍是采用双字节编码，但扩大了编码空间，以存放2万多汉字。简体中文Windows系统使用的就是GBK编码，所以能同时使用简体汉字与繁体汉字。
GB18030：这是最新的汉字编码标准。它向下兼容GBK、GB2312编码，除了传统的双字节编码外，还增加四字节编码方案，将编码空间扩展了260万。它又收录了CJK扩充A区、CJK扩充B区等汉字，目前共收录了70244个汉字。它不仅收录了汉字，而且还映射了Unicode中的非汉字字符，例如支持韩文字符。

　　所以我们可以使用GB18030编码，给gcc加上“-fexec-charset=GB18030”参数。
　　测试结果——

　　因简体中文系统下默认是GBK编码，GB18030的四字节编码不能正常显示，变成了“?”号。
　　一般情况下不会超过GBK编码范围，所以该办法是有效的。

五、GBK编码下的测试

5.1 说明

　　某些旧编译器不支持UTF-8编码，这时只能用本地的默认编码了。因我用的是简体中文版的Windows，所以代码文件的默认编码是GBK。

　　当代码文件不是UTF-8时，为了避免乱码，需要正确的配置输入字符集与执行字符集——
输入字符集（input character set）：编译器使用何种编码将源文件中的内容转为Unicode。vc（vc2005或更高版本）根据BOM标记识别输入字符集，若没有BOM标记，就使用本地编码（936：GBK）。gcc默认是UTF-8，使用“-finput-charset=<charset>”参数进行配置。
执行字符集（execution character set）：编译器使用何种编码将Unicode字符串转为窄字符串。vc默认使用本地编码（936：GBK），vc2010（或更高版本）可在源代码中写上“#pragma execution_character_set("utf-8")”进行配置。gcc默认是UTF-8，使用“-fexec-charset=<charset>”参数进行配置。

　　对于VC++，只需将代码文件保存为本地默认编码就行了。这正是VC++保存代码文件时的默认行为。若编码不符，可点击菜单“文件”->“高级保存选项”改变编码。
　　对于gcc，因它的输入字符集、执行字符集都是UTF-8，所以都要设置。即给gcc加上“-finput-charset=gbk -fexec-charset=gbk”参数。

　　注意源文件与头文件都要统一使用同一种编码，否则可能会因编码不一致而无法编译。例如gcc会报告以下错误——
tcharall_gbk.c:22:19: error: failure to convert gbk to UTF-8
tcharall_gbk.c:24:24: error: failure to convert gbk to UTF-8
tcharall_gbk.c:62:1: error: unknown type name 'TCHAR'

　　当使用“\u”转义符时，建议给gcc加上“-std=c99”参数，否则会出现以下警告——
tcharall_gbk.c:61:16: warning: universal character names are only valid in C++ and C99 [enabled by default]

5.2 测试代码

　　文件清单——
auto_tchar.h
auto_tmain.h
makefile
prichar.h
tcharall_gbk.c
tcharall_gbk.dsp
tcharall_gbk.dsw
tcharall_gbk_2003.sln
tcharall_gbk_2003.vcproj
tcharall_gbk_2005.sln
tcharall_gbk_2005.vcproj
tcharall_gbk_bcb6.bpf
tcharall_gbk_bcb6.bpr
tcharall_gbk_bcb6.res

　　其中tcharall_gbk.c和3个头文件使用GBK编码。

　　tcharall_gbk.c（因GBK不支持韩文字符，字符串常量稍有改动）——

////////////////////////////////////////////////////////////
/*
tcharall.c : 测试各种编译器使用tchar（GBK编码）.
Author: zyl910
Blog: http://www.cnblogs.com/zyl910
URL: http://www.cnblogs.com/zyl910/archive/2013/01/17/tcharall.html
Version: V1.00
Updata: 2013-01-17


Update
~~~~~~

[2013-01-17] V1.00
* V1.0发布.

[2012-11-08] V0.01
* 初步完成.

*/
////////////////////////////////////////////////////////////

#include <stdio.h>
#include <locale.h>
#include <wchar.h>

#include "auto_tchar.h"
#include "prichar.h"

#include "auto_tmain.h"


// Compiler name
#define MACTOSTR(x)	#x
#define MACROVALUESTR(x)	MACTOSTR(x)
#if defined(__ICL)	// Intel C++
#  if defined(__VERSION__)
#    define COMPILER_NAME	"Intel C++ " __VERSION__
#  elif defined(__INTEL_COMPILER_BUILD_DATE)
#    define COMPILER_NAME	"Intel C++ (" MACROVALUESTR(__INTEL_COMPILER_BUILD_DATE) ")"
#  else
#    define COMPILER_NAME	"Intel C++"
#  endif	// #  if defined(__VERSION__)
#elif defined(_MSC_VER)	// Microsoft VC++
#  if defined(_MSC_FULL_VER)
#    define COMPILER_NAME	"Microsoft VC++ (" MACROVALUESTR(_MSC_FULL_VER) ")"
#  elif defined(_MSC_VER)
#    define COMPILER_NAME	"Microsoft VC++ (" MACROVALUESTR(_MSC_VER) ")"
#  else
#    define COMPILER_NAME	"Microsoft VC++"
#  endif	// #  if defined(_MSC_FULL_VER)
#elif defined(__GNUC__)	// GCC
#  if defined(__CYGWIN__)
#    define COMPILER_NAME	"GCC(Cygmin) " __VERSION__
#  elif defined(__MINGW32__)
#    define COMPILER_NAME	"GCC(MinGW) " __VERSION__
#  else
#    define COMPILER_NAME	"GCC " __VERSION__
#  endif	// #  if defined(__CYGWIN__)
#elif defined(__TURBOC__)	// Borland C++
#  if defined(__BCPLUSPLUS__)
#    define COMPILER_NAME	"Borland C++ (" MACROVALUESTR(__BCPLUSPLUS__) ")"
#  elif defined(__BORLANDC__)
#    define COMPILER_NAME	"Borland C (" MACROVALUESTR(__BORLANDC__) ")"
#  else
#    define COMPILER_NAME	"Turbo C (" MACROVALUESTR(__TURBOC__) ")"
#  endif	// #  if defined(_MSC_FULL_VER)
#else
#  define COMPILER_NAME	"Unknown Compiler"
#endif	// #if defined(__ICL)	// Intel C++


char* psa = "A汉字ABC_Welcome_歡迎_ようこそ.";
wchar_t* psw = L"W汉字ABC_Welcome_歡迎_ようこそ_\uD658\uC601.";	// \uD658\uC601是韩文欢迎.
TCHAR* pst = _T("T汉字ABC_Welcome_歡迎_ようこそ.");


int _tmain(int argc, TCHAR* argv[])
{
	// init.
	setlocale(LC_ALL, "");	// 使用客户环境的缺省locale.

	_tprintf(_T("tcharall_gbk v1.00 (%dbit)\n"), (int)(8*sizeof(int*)));
	_tprintf(_T("Compiler: %")_T(PRIsA)_T("\n"), COMPILER_NAME);
	_tprintf(_T("\n"));

	// show
	_tprintf(_T("%")_T(PRIsA)_T("\n"), psa);	// 输出窄字符串.
	_tprintf(_T("%")_T(PRIsW)_T("\n"), psw);	// 输出宽字符串.
	_tprintf(_T("%")_T(PRIsT)_T("\n"), pst);	// 输出TCHAR字符串.
	

	return 0;
}

　　makefile——

# flags
CC = gcc
CFS = -Wall -std=c99 -finput-charset=gbk -fexec-charset=gbk

# args
RELEASE =0
UNICODE =0
BITS =
CFLAGS =

# [args] 生成模式. 0代表debug模式, 1代表release模式. make RELEASE=1.
ifeq ($(RELEASE),0)
	# debug
	CFS += -g
else
	# release
	CFS += -static -O3 -DNDEBUG
	//CFS += -O3 -g -DNDEBUG
endif

# [args] UNICODE模式. 0代表ansi模式, 1代表unicode模式. make UNICODE=1.
ifeq ($(UNICODE),0)
	# ansi
	CFS +=
else
	# unicode
	CFS += -D_UNICODE -DUNICODE
endif

# [args] 程序位数. 32代表32位程序, 64代表64位程序, 其他默认. make BITS=32.
ifeq ($(BITS),32)
	CFS += -m32
else
	ifeq ($(BITS),64)
		CFS += -m64
	else
	endif
endif

# [args] 使用 CFLAGS 添加新的参数. make CFLAGS="-mavx".
CFS += $(CFLAGS)


.PHONY : all clean

# files
TARGETS = tcharall_gbk
OBJS = tcharall_gbk.o

all : $(TARGETS)

tcharall_gbk : $(OBJS)
	$(CC) -o $@ $^ $(CFS)


tcharall_gbk.o : tcharall_gbk.c
	$(CC) -c $< $(CFS)


clean :
	rm -f $(OBJS) $(TARGETS) $(addsuffix .exe,$(TARGETS))

5.3 测试结果

　　在以下编译器中成功编译——
VC6：x86版。Unicode=0。
VC2003：x86版。Unicode=0。
VC2005：x86版、x64版。Unicode=1。
BCB6：x86版。Unicode=0。
GCC 4.6.2（MinGW(20120426)）：x86版。Unicode=0、Unicode=1。
GCC 4.7.1（TDM-GCC(MinGW-w64)）：x86版、x64版。Unicode=0、Unicode=1。
GCC 4.7.0（Fedora 17 x64）：x64版。Unicode=0。
llvm-gcc-4.2（Mac OS X Lion 10.7.4, Xcode 4.4.1）：x64版。Unicode=0。

　　测试结果——

【VC6，Unicode=0】
tcharall v1.00 (32bit)
Compiler: Microsoft VC++ (12008804)

A汉字ABC_Welcome_歡迎_ようこそ.
W汉字ABC_Welcome_歡迎_ようこそ_uD658uC601.
T汉字ABC_Welcome_歡迎_ようこそ.


【VC2003，Unicode=0】
tcharall v1.00 (32bit)
Compiler: Microsoft VC++ (13106030)

A汉字ABC_Welcome_歡迎_ようこそ.
W汉字ABC_Welcome_歡迎_ようこそ_
T汉字ABC_Welcome_歡迎_ようこそ.


【VC2005，Unicode=1】
tcharall_gbk v1.00 (32bit)
Compiler: Microsoft VC++ (140050727)

A汉字ABC_Welcome_歡迎_ようこそ.
W汉字ABC_Welcome_歡迎_ようこそ_??.
T汉字ABC_Welcome_歡迎_ようこそ.


【BCB6，Unicode=0】
tcharall_gbk v1.00 (32bit)
Compiler: Borland C (0x0564)

A汉字ABC_Welcome_歡迎_ようこそ.
W汉字ABC_Welcome_歡迎_ようこそ_
T汉字ABC_Welcome_歡迎_ようこそ.


【GCC 4.6.2（MinGW (20120426)），Unicode=0】
tcharall_gbk v1.00 (32bit)
Compiler: GCC(MinGW) 4.6.2

A汉字ABC_Welcome_歡迎_ようこそ.
W汉字ABC_Welcome_歡迎_ようこそ_
T汉字ABC_Welcome_歡迎_ようこそ.


【GCC 4.6.2（MinGW (20120426)），Unicode=1】
tcharall_gbk v1.00 (32bit)
Compiler: GCC(MinGW) 4.6.2

A汉字ABC_Welcome_歡迎_ようこそ.
W汉字ABC_Welcome_歡迎_ようこそ_T汉字ABC_Welcome_歡迎_ようこそ.


【GCC 4.7.1（TDM-GCC(MinGW-w64)），Unicode=0】
tcharall_gbk v1.00 (64bit)
Compiler: GCC(MinGW) 4.7.1

A汉字ABC_Welcome_歡迎_ようこそ.
W汉字ABC_Welcome_歡迎_ようこそ_T汉字ABC_Welcome_歡迎_ようこそ.


【GCC 4.7.1（TDM-GCC(MinGW-w64)），Unicode=1】
tcharall_gbk v1.00 (64bit)
Compiler: GCC(MinGW) 4.7.1

A汉字ABC_Welcome_歡迎_ようこそ.
W汉字ABC_Welcome_歡迎_ようこそ_.
T汉字ABC_Welcome_歡迎_ようこそ.


【GCC 4.7.0（Fedora 17 x64），Unicode=0】
tcharall_gbk v1.00 (64bit)
Compiler: GCC 4.7.0 20120507 (Red Hat 4.7.0-5)

A����ABC_Welcome_�gӭ_�褦����.
W汉字ABC_Welcome_歡迎_ようこそ_환영.
T����ABC_Welcome_�gӭ_�褦����.


【llvm-gcc-4.2（Mac OS X Lion 10.7.4, Xcode 4.4.1），Unicode=0】
tcharall_gbk v1.00 (64bit)
Compiler: GCC 4.2.1 (Based on Apple Inc. build 5658) (LLVM build 2336.11.00)

A????ABC_Welcome_?gӭ_?褦????.
W汉字ABC_Welcome_歡迎_ようこそ_환영.
T????ABC_Welcome_?gӭ_?褦????.

5.4 测试结果分析

　　当使用GBK编码时，Windows平台下的编译器大致能正确的输出字符而不会乱码。VC++ 6.0不支持“\u”转义符。
　　Linux和Mac平台下，因编码不一致窄字符串乱码，但宽字符串仍然能正确输出。

参考文献——
http://www.unicode.org/
《[RFC 3629] UTF-8, a transformation format of ISO 10646》。F. Yergeau，2003-11。http://tools.ietf.org/html/rfc3629
《GB18030-2005 信息技术中文编码字符集》。国家标准化管理委员会。中国标准出版社，2006-05。
《ISO/IEC 9899:1999 (C99)》。ISO/IEC，1999。www.open-std.org/jtc1/sc22/wg14/www/docs/n1124.pdf
《C语言参考手册(原书第5版)》。Samuel P.Harbison Ⅲ,Guy L.Steele。机械工业出版社，2003-08。
《[C/C++] 各种C/C++编译器对UTF-8源码文件的兼容性测试（VC、GCC、BCB）》。http://www.cnblogs.com/zyl910/archive/2012/07/26/cfile_utf8.html
《[C] wchar_t的格式控制字符（VC、BCB、GCC、C99标准）》。http://www.cnblogs.com/zyl910/archive/2012/07/30/wcharfmt.html

源码下载——
http://files.cnblogs.com/zyl910/tcharall.rar

你可能感兴趣的:(c,c,unicode,unicode,unicode,char,char,TCHAR,TCHAR,wchar_t)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
mysql禁用远程登录 igotyback mysql
去mysql库中的user表里，将host都改成localhost之后刷新权限FLUSHPRIVILEGES;
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
html 中如何使用 uniapp 的部分方法某公司摸鱼前端 html uni-app 前端
示例代码：Documentconsole.log(window);效果展示：好了，现在就可以uni.使用相关的方法了
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
水平垂直居中的几种方法（总结） LJ小番茄 CSS_玄学语言 html javascript 前端 css css3
1.使用flexbox的justify-content和align-items.parent{display:flex;justify-content:center;/*水平居中*/align-items:center;/*垂直居中*/height:100vh;/*需要指定高度*/}2.使用grid的place-items:center.parent{display:grid;place-item
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
每日一题——第九十题互联网打工人no1 C语言程序设计每日一练 c语言
题目：判断子串是否与主串匹配#include#include#include//////判断子串是否在主串中匹配//////主串///子串///boolisSubstring(constchar*str,constchar*substr){intlenstr=strlen(str);//计算主串的长度intlenSub=strlen(substr);//计算子串的长度//遍历主字符串，对每个可能得
每日一题——第八十一题互联网打工人no1 C语言程序设计每日一练 c语言
打印如下图案:#includeintmain(){inti,j;charch='A';for(i=1;i<5;i++,ch++){for(j=0;j<5-i;j++){printf("");//控制空格输出}for(j=1;j<2*i;j++)//条件j<2*i{printf("%c",ch);//控制字符输出}printf("\n");}return0;}
每日一题——第八十四题互联网打工人no1 C语言程序设计每日一练 c语言
题目：编写函数1、输入10个职工的姓名和职工号2、按照职工由大到小顺序排列，姓名顺序也随之调整3、要求输入一个职工号，用折半查找法找出该职工的姓名#define_CRT_SECURE_NO_WARNINGS#include#include#defineMAX_EMPLOYEES10typedefstruct{intid;charname[50];}Empolyee;voidinputEmploye
每日一题——第八十二题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将一个控制台输入的字符串中的所有元音字母复制到另一字符串中#include#include#include#include#defineMAX_INPUT1024boolisVowel(charp);intmain(){charinput[MAX_INPUT];charoutput[MAX_INPUT];printf("请输入一串字符串：\n");fgets(input,sizeof(inp
每日一题——第八十三题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将输入的整形数字输出,输出1990，输出"1990"#include#defineMAX_INPUT1024intmain(){intarrr_num[MAX_INPUT];intnum,i=0;printf("请输入一个数字：");scanf_s("%d",&num);while(num!=0){arrr_num[i++]=num%10;num/=10;}printf("\"");for(
C#中使用split分割字符串互联网打工人no1 c#
1、用字符串分隔：usingSystem.Text.RegularExpressions;stringstr="aaajsbbbjsccc";string[]sArray=Regex.Split(str,"js",RegexOptions.IgnoreCase);foreach(stringiinsArray)Response.Write(i.ToString()+"");输出结果：aaabbbc
WPF中的ComboBox控件几种数据绑定的方式互联网打工人no1 wpf c#
一、用字典给ItemsSource赋值（此绑定用的地方很多，建议熟练掌握）在XMAL中：在CS文件中privatevoidBindData(){DictionarydicItem=newDictionary();dicItem.add(1,"北京");dicItem.add(2,"上海");dicItem.add(3,"广州");cmb_list.ItemsSource=dicItem;cmb_l
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring