取得汉语拼音首个字母

 

byte数组转float 以及byte转其他类型时为什么要&0xff

public static float getFloat(byte[] b) {  

      int accum = 0;  

       accum = accum|(b[0] & 0xff) << 0; 

       accum = accum|(b[1] & 0xff) << 8;  

       accum = accum|(b[2] & 0xff) << 16;  

      accum = accum|(b[3] & 0xff) << 24;  

       System.out.println(accum); 

       return Float.intBitsToFloat(accum);  

 

java中byte转换int时为何与0xff进行与运算

 

在剖析该问题前请看如下代码

 public static String bytes2HexString(byte[] b) {

   String ret = "";

   for (int i = 0; i < b.length; i++) {

     String hex = Integer.toHexString(b[i] & 0xFF);

     if (hex.length() == 1) {

       hex = ''0'' + hex;

     }

       ret += hex.toUpperCase();

    }

      return ret;

  }

上面是将byte[]转化十六进制的字符串,注意这里b[i] & 0xFF将一个byte和 0xFF进行了与运算,然后使用Integer.toHexString取得了十六进制字符串,可以看出

b[i] & 0xFF运算后得出的仍然是个int,那么为何要和 0xFF进行与运算呢?直接 Integer.toHexString(b[i]);,将byte强转为int不行吗?答案是不行的.

 

其原因在于:

1.byte的大小为8bits而int的大小为32bits

 2.java的二进制采用的是补码形式

 

在这里先温习下计算机基础理论

 

byte是一个字节保存的,有8个位,即8个0、1。

8位的第一个位是符号位,

也就是说0000 0001代表的是数字1

 1000 0001代表的就是-1

所以正数最大位0111 1111,也就是数字127

负数最大为1111 1111,也就是数字-128

上面说的是二进制原码,但是在java中采用的是补码的形式,下面介绍下什么是补码

 

 

1、反码:

        一个数如果是正,则它的反码与原码相同;

        一个数如果是负,则符号位为1,其余各位是对原码取反;

2、补码:利用溢出,我们可以将减法变成加法

       对于十进制数,从9得到5可用减法:

       9-4=5    因为4+6=10,我们可以将6作为4的补数

       改写为加法:

       9+6=15(去掉高位1,也就是减10)得到5.

       对于十六进制数,从c到5可用减法:

       c-7=5    因为7+9=16 将9作为7的补数

       改写为加法:

       c+9=15(去掉高位1,也就是减16)得到5.

    在计算机中,如果我们用1个字节表示一个数,一个字节有8位,超过8位就进1,在内存中情况为(1 0000 0000),进位1被丢弃。

    ⑴一个数为正,则它的原码、反码、补码相同

    ⑵一个数为负,刚符号位为1,其余各位是对原码取反,然后整个数加1

  - 1的原码为                1000 0001 

  - 1的反码为                1111 1110 

                                                    + 1

  - 1的补码为                1111 1111 

 

  0的原码为                 0000 0000

  0的反码为                 1111 1111(正零和负零的反码相同)

                                          +1

  0的补码为               10000 0000(舍掉打头的1,正零和负零的补码相同)

Integer.toHexString的参数是int,如果不进行&0xff,那么当一个byte会转换成int时,由于int是32位,而byte只有8位这时会进行补位。

例如补码1111 1111的十进制数为-1转换为int时变为11111111111111111111111111111111好多1啊,呵呵!即0xffffffff但是这个数是不对的,这种补位就会造成误差。和0xff相与后,高24比特就会被清0了,结果就对了。

 

了解这个基础后回归正题:

public static String getPinYinHead(char c) {
        String s = String.valueOf(c);

        byte[] b;
        try {
            b = s.getBytes("GBK");
        } catch (UnsupportedEncodingException e) {
            b = s.getBytes();
        }

        if (b.length >= 2) {
            int b1 = b[0] & 0xff;
            int b2 = b[1] & 0xff;

            int value = b1 << 8 | b2;
            if (value >= 0xb0a1 && value <= 0xb0c4) {
                return "A";
            } else if (value >= 0xb0c5 && value <= 0xb2c0) {
                return "B";
            } else if (value >= 0xb2c1 && value <= 0xb4ed) {
                return "C";
            } else if (value >= 0xb4ee && value <= 0xb6e9) {
                return "D";
            } else if (value >= 0xb6ea && value <= 0xb7a1) {
                return "E";
            } else if (value >= 0xb7a2 && value <= 0xb8c0) {
                return "F";
            } else if (value >= 0xb8c1 && value <= 0xb9fd) {
                return "G";
            } else if (value >= 0xb9fe && value <= 0xbbf6) {
                return "H";
            } else if (value >= 0xbbf7 && value <= 0xbfa5) {
                return "J";
            } else if (value >= 0xbfa6 && value <= 0xc0ab) {
                return "K";
            } else if (value >= 0xc0ac && value <= 0xc2e7) {
                return "L";
            } else if (value >= 0xc2e8 && value <= 0xc4c2) {
                return "M";
            } else if (value >= 0xc4c3 && value <= 0xc5b5) {
                return "N";
            } else if (value >= 0xc5b6 && value <= 0xc5bd) {
                return "O";
            } else if (value >= 0xc5be && value <= 0xc6d9) {
                return "P";
            } else if (value >= 0xc6da && value <= 0xc8ba) {
                return "Q";
            } else if (value >= 0xc8bb && value <= 0xc8f5) {
                return "R";
            } else if (value >= 0xc8f6 && value <= 0xcbf9) {
                return "S";
            } else if (value >= 0xcbfa && value <= 0xcdd9) {
                return "T";
            } else if (value >= 0xcdda && value <= 0xcef3) {
                return "W";
            } else if (value >= 0xcef4 && value <= 0xd188) {
                return "X";
            } else if (value >= 0xd1b9 && value <= 0xd4d0) {
                return "Y";
            } else if (value >= 0xd4d1 && value <= 0xd7f9) {
                return "Z";
            }
        }

        return s;
    }

下面只是编码表一部分:

  取得汉语拼音首个字母_第1张图片

你可能感兴趣的:(取得汉语拼音首个字母)