Hadoop入门指南之排序实战

Hadoop系列文章索引

Hadoop入门指南之HDFS介绍

Hadoop入门指南之Linux环境搭建

Hadoop入门指南之Linux软件安装

Hadoop入门指南之Hadoop安装

Hadoop入门指南之hdfs命令行使用.

Hadoop入门指南之MapReduce介绍

Hadoop入门指南之统计库存实战

Hadoop入门指南之分区、规约实战

Hadoop入门指南之排序实战

Hadoop入门指南之分组实战

Hadoop入门指南之表连接操作

Hadoop入门指南之yarn介绍​​​​​​​

排序是指按照自定义的排序规则,对数据进行排序,输出时,数据是按照排序组织的。排序往往还伴随着序列化,序列化指的是把Java对象转化成字节流来传输,到达指定位置再反序列化成Java对象,这样就提升了网络传输的速度,减轻了网络传输的压力。

序列化和反序列化在上一章分区和规约实战中已经介绍了,就是写一个StockBean的JavaBean,然后重写write和readFields方法。

我们还用上一章使用的数据:

p004,2021-01-01,5,2
p003,2021-01-01,8,

你可能感兴趣的:(大数据,hadoop)