一. Java 的字节
byte (字节) 是 Java 中的基本数据类型,一个 byte 包含8个 bit(位),byte 的取值范围是-128到+127。
byte 跟 Java 其他基本类型的关系:
基本类型 | 所占字节数 | 备注 |
---|---|---|
byte | 1 | |
short | 2 | |
int | 4 | |
long | 8 | |
char | 2 | |
float | 4 | |
double | 8 | |
boolean | 1、4 | 《Java虚拟机规范》给出了4个字节,和boolean数组1个字节的定义,具体还要看虚拟机实现是否按照规范来 |
二. 常用封装
由于工作关系,我封装了一个操作字节的库
github 地址:https://github.com/fengzhizi715/bytekit
2.1 bytekit 的特点:
- 支持多种方式创建 Bytes
- 支持字节数组、ByteBuffer 的操作
- 支持 Immutable 对象:ByteArrayBytes、ByteBufferBytes
- 支持 Transformer: 内置 copy、contact、reverse、xor、and、or、not,也支持自定义 Transformer
- 支持 Hash: 内置 md5、sha1、sha256
- 支持转换成16进制字符串
- 支持 mmap 常用读写操作:readByte/writeByte、readBytes/writeBytes、readInt/writeInt、readLong/writeLong、readDouble/writeDouble、readObject/writeObject
- 支持对象的序列化、反序列化、深拷贝
- 不依赖任何第三方库
Bytes 是一个接口,它有三个实现类:ByteArrayBytes、ByteBufferBytes、MmapBytes。其中,前面两个实现类是 Immutable 对象。
2.2 支持 Immutable 对象
Immutable 对象(不可变对象),即对象一旦被创建它的状态(对象的数据,也即对象属性值)就不能改变。
它的优点:
- 构造、测试和使用都很简单
- 线程安全
- 当用作类的属性时不需要保护性拷贝
- 可以很好的用作Map键值和Set元素
2.3 支持 Hash 加密
对 Bytes 中的 byte[] 进行加密。在 Bytes 接口中,包含下面的默认函数:
/**
* 使用md5加密
* @return
*/
default Bytes md5() {
return transform(new MessageDigestTransformer("MD5"));
}
/**
* 使用sha1加密
* @return
*/
default Bytes sha1() {
return transform(new MessageDigestTransformer("SHA-1"));
}
/**
* 使用sha256加密
* @return
*/
default Bytes sha256() {
return transform(new MessageDigestTransformer("SHA-256"));
}
进行单元测试:
@Test
public void testHash() {
Bytes bytes = ByteArrayBytes.create("hello world");
assertEquals("5eb63bbbe01eeed093cb22bb8f5acdc3", bytes.md5().toHexString());
assertEquals("2aae6c35c94fcfb415dbe95f408b9ce91ee846ed", bytes.sha1().toHexString());
assertEquals("b94d27b9934d3e08a52e52d7da7dabfac484efe37a5380ee9088f7ace2efcde9", bytes.sha256().toHexString());
}
2.4 序列化、反序列化、深拷贝
支持对象的序列化、反序列化以及深拷贝。在 Bytes 接口中,包含下面的静态函数:
/**
* 序列化对象,转换成字节数组
* @param obj
* @return
*/
static byte[] serialize(Object obj) {
byte[] result = null;
ByteArrayOutputStream fos = null;
try {
fos = new ByteArrayOutputStream();
ObjectOutputStream o = new ObjectOutputStream(fos);
o.writeObject(obj);
result = fos.toByteArray();
} catch (IOException e) {
System.err.println(e);
} finally {
IOUtils.closeQuietly(fos);
}
return result;
}
/**
* 反序列化字节数字,转换成对象
* @param bytes
* @return
*/
static Object deserialize(byte[] bytes) {
InputStream fis = null;
try {
fis = new ByteArrayInputStream(bytes);
ObjectInputStream o = new ObjectInputStream(fis);
return o.readObject();
} catch (IOException e) {
System.err.println(e);
} catch (ClassNotFoundException e) {
System.err.println(e);
} finally {
IOUtils.closeQuietly(fis);
}
return null;
}
/**
* 通过序列化/反序列化实现对象的深拷贝
* @param obj
* @param
* @return
*/
static T cloneObject(T obj) {
return (T) deserialize(serialize(obj));
}
进行单元测试:
@Test
public void testSerializeAndDeserialize() {
User u = new User();
u.name = "tony";
u.password = "123456";
byte[] bytes = Bytes.serialize(u);
User newUser = (User)Bytes.deserialize(bytes);
assertEquals(u.name, newUser.name);
assertEquals(u.password,newUser.password);
}
@Test
public void testDeepCopy() {
User u = new User();
u.name = "tony";
u.password = "123456";
User newUser = Bytes.cloneObject(u);
System.out.println(u);
System.out.println(newUser);
assertNotSame(u,newUser);
assertNotSame(u.name,newUser.name);
}
testDeepCopy() 执行后,u 和 newUser 地址的不同,u.name 和 newUser.name 指向的内存地址也不同。
com.safframework.bytekit.domain.User@2b05039f
com.safframework.bytekit.domain.User@17d10166
2.5 copy、contact、reverse
copy、contact、reverse 都是采用 Transformer 的方式。在 AbstractBytes 类中,包含下面的函数:
@Override
public Bytes copy() {
return transform(new CopyTransformer(0, size()));
}
@Override
public Bytes copy(int offset, int length) {
return transform(new CopyTransformer(offset, length));
}
@Override
public Bytes contact(byte[] bytes) {
return transform(new ConcatTransformer(bytes));
}
@Override
public Bytes reverse() {
return transform(new ReverseTransformer());
}
进行单元测试:
@Test
public void testContact() {
Bytes bytes = ByteBufferBytes.create("hello world").contact(" tony".getBytes());
assertEquals(bytes.toString(), "hello world tony");
}
@Test
public void testCopy() {
Bytes bytes = ByteBufferBytes.create("hello world").contact(" tony".getBytes());
assertEquals(bytes.toString(), bytes.copy().toString());
}
@Test
public void testReverse() {
Bytes bytes = ByteBufferBytes.create("hello world").contact(" tony".getBytes());
assertEquals(bytes.toString(), bytes.reverse().reverse().toString());
}
2.6 位操作
xor、and、or、not 也是采用 Transformer 的方式。在 AbstractBytes 类中,包含下面的函数:
@Override
public Bytes xor(byte[] bytes) {
return transform(new BitWiseOperatorTransformer(bytes,BitWiseOperatorTransformer.Mode.XOR));
}
@Override
public Bytes and(byte[] bytes) {
return transform(new BitWiseOperatorTransformer(bytes, BitWiseOperatorTransformer.Mode.AND));
}
@Override
public Bytes or(byte[] bytes) {
return transform(new BitWiseOperatorTransformer(bytes, BitWiseOperatorTransformer.Mode.OR));
}
@Override
public Bytes not(byte[] bytes) {
return transform(new BitWiseOperatorTransformer(bytes, BitWiseOperatorTransformer.Mode.NOT));
}
进行单元测试:
@Test
public void testBitWise() {
ByteBufferBytes bytes = (ByteBufferBytes)ByteBufferBytes.create("hello world").contact(" tony".getBytes());
assertEquals(bytes.toString(), bytes.and(bytes.toByteArray()).or(bytes.toByteArray()).toString());
assertEquals(bytes.toString(), bytes.not(bytes.toByteArray()).not(bytes.toByteArray()).toString());
assertEquals(bytes.toString(), bytes.xor(bytes.toByteArray()).xor(bytes.toByteArray()).toString()); //两次xor 返回本身
}
2.7 Base64 编码、解码
@Test
public void testBase64() {
ByteBufferBytes bytes = (ByteBufferBytes)ByteBufferBytes.create("hello world").contact(" tony".getBytes());
String base64 = new String(bytes.encodeBase64());
assertEquals(bytes.toString(), new String(Bytes.parseBase64(base64)));
}
2.8 Bytes 转换成字节数组
@Test
public void testToByteArray() {
Bytes bytes = ByteBufferBytes.create("hello world").contact(" tony".getBytes());
assertEquals(bytes.toString(), new String(bytes.toByteArray()));
}
三. mmap 的操作
Linux 的 mmap 是一种内存映射文件的方法。
mmap将一个文件或者其它对象映射进内存。文件被映射到多个页上,如果文件的大小不是所有页的大小之和,最后一个页不被使用的空间将会清零。mmap在用户空间映射调用系统中作用很大。 mmap系统调用是将一个打开的文件映射到进程的用户空间,mmap系统调用使得进程之间通过映射同一个普通文件实现共享内存。普通文件被映射到进程地址空间后,进程可以像访问普通内存一样对文件进行访问,不必再调用read()、write()等操作。
import com.safframework.bytekit.domain.User;
import com.safframework.bytekit.jdk.mmap.MmapBytes;
import org.junit.After;
import org.junit.Before;
import org.junit.Test;
import static junit.framework.TestCase.assertEquals;
/**
* Created by tony on 2018-12-24.
*/
public class MmapBytesTest {
private MmapBytes mmapBytes;
private String file;
@Before
public void setUp() {
file = "test";
mmapBytes = new MmapBytes(file, (long) 1024 * 10); // 10M
}
@Test
public void testWriteAndRead() throws Exception {
mmapBytes.writeInt(12);
mmapBytes.writeInt(34);
mmapBytes.writeByte((byte) 5);
mmapBytes.writeBytes(("this is tony").getBytes());
mmapBytes.writeLong(6666L);
mmapBytes.writeDouble(3.14d);
assertEquals(12, mmapBytes.readInt());
assertEquals(34, mmapBytes.readInt());
assertEquals((byte) 5, mmapBytes.readByte());
assertEquals("this is tony", new String(mmapBytes.readBytes(12)));
assertEquals(6666L, mmapBytes.readLong());
assertEquals(3.14d, mmapBytes.readDouble());
}
@Test
public void testObject() throws Exception {
User u = new User();
u.name = "tony";
u.password = "123456";
mmapBytes.writeObject(u);
User temp = (User)mmapBytes.readObject(117);
assertEquals(u.name, temp.name);
assertEquals(u.password, temp.password);
}
@Test
public void testFree() throws Exception {
mmapBytes.writeInt(12);
mmapBytes.writeInt(34);
mmapBytes.writeByte((byte) 5);
mmapBytes.free();
mmapBytes = new MmapBytes(file, (long) 1024 * 10); // 10M
mmapBytes.writeInt(67);
assertEquals(67, mmapBytes.readInt());
}
@After
public void tearDown() {
mmapBytes.free();
}
}
四. 总结
bytekit 是一个操作字节的工具库,不依赖任何第三方库。它封装了字节数组、ByteBuffer 的操作,支持 mmap 常用的读写。
当然,它还可以封装 protobuf 的 ByteString 或者 Android 中的 Parcel,只需实现 Bytes 接口即可。
参考资料:
- 你真的知道Java中boolean类型占用多少个字节吗?