杭电oj——2030汉字统计

Problem Description

统计给定文本文件中汉字的个数。


Input

输入文件首先包含一个整数n,表示测试实例的个数,然后是n段文本。


Output

对于每一段文本,输出其中的汉字的个数,每个测试实例的输出占一行。

[Hint:]从汉字机内码的特点考虑~


Sample Input

2

WaHaHa! WaHaHa! 今年过节不说话要说只说普通话WaHaHa! WaHaHa!

马上就要期末考试了Are you ready?


Sample Output

14

9


思路分析:原先看这个题目觉得有点难,当时想把英文字母和符号那些ASCII范围找出来,然后除了这些其它字符全算中文。后来搞不定,上网查了下中文字符在机器内的编码。发现中文在机器内存储是2个字节,并且

汉字机内码在计算机的表达方式的描述是,使用二个字节,每个字节最高位一位为1.

计算机中,补码第一位是符号位,1 表示为负数,所以 汉字机内码的每个字节表示的十进制数都是负数

知道了这点代码实现就变简单了,直接创建数组存入。

参考了:https://blog.csdn.net/LOVELX1991/article/details/8530224

题目地址:http://acm.hdu.edu.cn/showproblem.php?pid=2030



源代码(参考):

#pragma warning(disable:4996);

#include

#include

int main()

{

char a[200];

int n, k, i, t;

scanf("%d", &n);

getchar();

while (n–)

{

t = 0;

gets(a);

k = strlen(a);

for (i = 0; i < k; i++)

if (a[i] < 0)

t++;

printf("%d\n", t / 2);

}

return 0;

}

是这位大佬的代码(下面附上链接):

汉字统计--统计给定文本文件中汉字的个数。 - 小小呆的博客 - CSDN博客

总结:

需要补充下计算机底层知识,因为汉子是两个字节所以输出时候(t要除2),并且汉字每个字节表示的十进制数全都是负数,刚好成为if的条件。

你可能感兴趣的:(杭电oj——2030汉字统计)