字符(字母、数字、中文字符)统计示例

本文给出一个字符统计的例子。给定一串字符,统计其中字母、数字、中文字符、空格以及其它字符的个数。

在编写程序之前,需要考虑一下,怎样判断一个字符是一个中文字符呢?

基本的 CJK 汉字的 Unicode 码范围是 U4E00~U9FBF, 虽然是还有扩展,但是一般使用这个范围去判断一个字符是否为中文字符已经足够了。所以判断一个字符是否为中文的方法如下:

public static boolean isChineseCharacter(char c) {

    return c >= '\u4E00' && c <= '\u9FBF';

}

至于判断一个字符是否为字母或者数字,我们只需调用Character类中的isLetterisDigit方法即可。

public class CharacterStatictics {

 

    public static void main(String[] args) {

 

        int chineseCharCount = 0;

        int spaceCount = 0;

        int digitCount = 0;

        int lettersCount = 0;

        int otherChars = 0;

 

        String value = "Hello world! Welcome to Java world! 1234567890 Java 字符统计个数小程序!";

        char[] chars = value.toCharArray();

        for (char c : chars) {

            if (isChineseCharacter(c)) {

                chineseCharCount++;

            } else if (Character.isLetter(c)) {

                lettersCount++;

            } else if (Character.isDigit(c)) {

                digitCount++;

            } else if (' ' == c) {

                spaceCount++;

            } else {

                otherChars++;

            }

        }

 

        System.out.println("中文字符:" + chineseCharCount);

        System.out.println("数字:" + digitCount);

        System.out.println("字母:" + lettersCount);

        System.out.println("空格:" + spaceCount);

        System.out.println("其它字符:" + otherChars);

 

    }

 

    private static boolean isChineseCharacter(char c) {

        return c >= '\u4E00' && c <= '\u9FBF';

    }

 

}

运行结果:



中文字符:9

数字:10

字母:32

空格:8

其它字符:3

 

你可能感兴趣的:(中文)