java实现针对控制台和文本输入,检测输入中的西文符号

针对控制台和文本输入,检测输入中的西文符号。

以下是 unicode 的编码区段。

java实现针对控制台和文本输入,检测输入中的西文符号_第1张图片

0000-001F C0控制符 C0 Controls
0020-007F 基本拉丁文 Basic Latin
0080-009F C1控制符 C1 Controls
00A0-00FF 拉丁文补充-1 Latin-1 Supplement
0100-017F 拉丁文扩展-A Latin Extended-A
0180-024F 拉丁文扩展-B Latin Extended-B
所以想要查找到西文字符只要在 0020-007F和00A0-024F两个编码区段中比对就行了。代码如下:

public void write( String str ) throws IOException {	
	StringBuilder builder = new StringBuilder();
	int index = 0;
	char ch;
	for ( ; index

打开unicode字符集的文本的代码如下:

InputStream in;
in = new FileInputStream(scanner.next());
reader = new BufferedReader(new InputStreamReader(in, "Unicode"));


ps:如何将txt文本保存为unicode字符集? 将文本另存为,在弹出窗口的最下面一行又选择。

如何查看文本的当前字符集? 尝试进入另存为,默认的字符集就是当前字符集。

你可能感兴趣的:(Java)