Lansonli

女朋友问阿里双十一实时大屏如何实现，我惊呆一会，马上手把手教她背后的大数据技术

女朋友问阿里双十一实时大屏如何实现，不懂技术的她居然好奇问这个，身为程序员的我只能用毕生所学开始跟她讲大数据技术。

全网最详细的大数据文章系列，强烈建议收藏加关注！

目录

历史文章

前言

阿里双十一实时大屏背后的大数据技术

一、大数据相关概念剖析

1、什么是大数据？

2、数据分析基础概念

3、人工智能基础概念

4、人工智能+大数据分析场景案例

5、相亲场景用户画像分析场景案例

二、双十一面临的技术挑战

双11---世界级互联网技术超级工程！

三、阿里双11大数据技术解决方案

1、Flink流批一体护驾双11

2、Flink简单介绍

3、Flink官网介绍：https://flink.apache.org/

四、Flink实现双十一实时大屏

实现代码

五、Flink实现超时订单自动好评

实现代码

六、大数据行业趋势分析

1、新基建和数字化转型助力大数据+AI多场景落地

2、多行业场景大数据应用占比

3、从传统物流到智慧物流演变之旅

4、智慧物流大数据行业级解决方案

5、大数据行业趋势分析

6、大数据技术框架应用

7、大数据开发岗位

七、大数据技术知识体系

历史文章

2021年大数据Hadoop（十七）：MapReduce编程规范及示例编写

2021年大数据Hadoop（十六）：MapReduce计算模型介绍

2021年大数据Hadoop（十五）：Hadoop的联邦机制 Federation

2021年大数据Hadoop（十四）：HDFS的高可用机制

2021年大数据Hadoop（十三）：HDFS意想不到的其他功能

前言

2021年全网最详细的大数据笔记，轻松带你从入门到精通，该栏目每天更新，汇总知识分享

阿里双十一实时大屏背后的大数据技术

一、大数据相关概念剖析

1、什么是大数据？

2、数据分析基础概念

3、人工智能基础概念

4、人工智能+大数据分析场景案例

5、相亲场景用户画像分析场景案例

二、双十一面临的技术挑战

双11---世界级互联网技术超级工程！

阿里双11实时业务量和数据量每年都在大幅增长，去年双11的实时计算峰值达到了创纪录的每秒 40 亿条记录，数据体量也达到了惊人的7 TB 每秒，相当于一秒钟需要读完 500 万本《新华字典》。

可以实事求是的说：阿里的双 11 是一次全球商业、科技、数据、智能的大协同，是一个商业社会的大协同，更是一个技术的大协同，是名副其实的世界级互联网技术的超级工程！

短时间内处理这么大的数据量如何解决：高并发、高吞吐、低延迟、稳定性、安全性等问题？

当然，问题很多，解决方案很复杂，今天主要探讨大数据相关的技术解决方案其他技术方案，可以参考提供的扩展资料！

三、阿里双11大数据技术解决方案

1、Flink流批一体护驾双11

去年的双11，阿里的GMV成交总金额达到了 4982 亿，实时计算处理的流量洪峰创纪录地达到了每秒40亿条的记录，数据体量也达到了惊人的每秒7TB，基于Flink的流批一体数据应用开始在阿里巴巴最核心的数据业务场景崭露头角，并在稳定性、性能和效率方面都经受住了严苛的生产考验。---丝般顺滑

基于 Flink 的阿里巴巴实时计算平台也圆满完成了去年双 11 整体经济体的实时数据任务保障，再次平稳度过全年大考。

2、Flink简单介绍

2009年Flink 诞生于柏林工业大学的一个大数据研究项目 StratoSphere。

2014 年孵化出 Flink捐献给Apache，并成为 Apache 顶级项目，同时 Flink 的主流方向被定位为流式计算并大数据行业内崭露头角。

2015 年阿里巴巴开始使用 Flink 并持续贡献社区(阿里内部还基于Flink做了一套Blink)

2019年1月8日，阿里巴巴以 9000 万欧元(7亿元人民币)收购了创业公司 Data Artisans。从此Flink开始了新一轮的乘风破浪！在国内流行的一发不可收拾！

3、Flink官网介绍：https://flink.apache.org/

四、Flink实现双十一实时大屏

在大数据的实时处理中，实时的大屏展示已经成了一个很重要的展示项，比如最有名的双十一大屏实时销售总价展示。

今天就做一个最简单的模拟电商统计大屏的小例子，需求如下：

1.实时计算出当天零点截止到当前时间的销售总额

2.计算出各个分类的销售top3

3.每秒钟更新一次统计结果

实现代码

package cn.lanson.action;

import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;
import org.apache.commons.lang3.StringUtils;
import org.apache.flink.api.common.functions.AggregateFunction;
import org.apache.flink.api.java.tuple.Tuple;
import org.apache.flink.api.java.tuple.Tuple1;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.functions.source.SourceFunction;
import org.apache.flink.streaming.api.functions.windowing.ProcessWindowFunction;
import org.apache.flink.streaming.api.functions.windowing.WindowFunction;
import org.apache.flink.streaming.api.windowing.assigners.TumblingProcessingTimeWindows;
import org.apache.flink.streaming.api.windowing.time.Time;
import org.apache.flink.streaming.api.windowing.triggers.ContinuousProcessingTimeTrigger;
import org.apache.flink.streaming.api.windowing.windows.TimeWindow;
import org.apache.flink.util.Collector;

import java.math.BigDecimal;
import java.math.RoundingMode;
import java.text.SimpleDateFormat;
import java.util.*;
import java.util.stream.Collectors;

/**
 * Author Lansonli
 * Desc 模拟双十一电商实时大屏显示:
 * 1.实时计算出当天零点截止到当前时间的销售总额
 * 2.计算出各个分类的销售top3
 * 3.每秒钟更新一次统计结果
 */
public class DoubleElevenBigScreem {
    public static void main(String[] args) throws Exception {
        //1.env
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        //2.source
        DataStream> dataStream = env.addSource(new MySource());

        //3.transformation
        DataStream result = dataStream
                .keyBy(0)
                .window(
                        //定义大小为一天的窗口,第二个参数表示中国使用的UTC+08:00时区比UTC时间早8小时
                        TumblingProcessingTimeWindows.of(Time.days(1), Time.hours(-8))
                )
                .trigger(
                        ContinuousProcessingTimeTrigger.of(Time.seconds(1))//定义一个1s的触发器
                )
                .aggregate(new PriceAggregate(), new WindowResult());

        //看一下聚合结果
        //result.print("初步聚合结果");

        //4.使用上面聚合的结果,实现业务需求:
        // * 1.实时计算出当天零点截止到当前时间的销售总额
        // * 2.计算出各个分类的销售top3
        // * 3.每秒钟更新一次统计结果
        result.keyBy("dateTime")
                .window(TumblingProcessingTimeWindows.of(Time.seconds(1)))//每秒钟更新一次统计结果
                .process(new WindowResultProcess());//在ProcessWindowFunction中实现该复杂业务逻辑

        env.execute();
    }

    /**
     * 自定义价格聚合函数,其实就是对price的简单sum操作
     */
    private static class PriceAggregate implements AggregateFunction, Double, Double> {
        @Override
        public Double createAccumulator() {
            return 0D;
        }

        @Override
        public Double add(Tuple2 value, Double accumulator) {
            return accumulator + value.f1;
        }

        @Override
        public Double getResult(Double accumulator) {
            return accumulator;
        }

        @Override
        public Double merge(Double a, Double b) {
            return a + b;
        }
    }

    /**
     * 自定义WindowFunction,实现如何收集窗口结果数据
     */
    private static class WindowResult implements WindowFunction {
        SimpleDateFormat simpleDateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

        @Override
        public void apply(Tuple key, TimeWindow window, Iterable input, Collector out) throws Exception {
            BigDecimal bg = new BigDecimal(input.iterator().next());
            double p = bg.setScale(2, BigDecimal.ROUND_HALF_UP).doubleValue();//四舍五入

            CategoryPojo categoryPojo = new CategoryPojo();
            categoryPojo.setCategory(((Tuple1) key).f0);
            categoryPojo.setTotalPrice(p);
            categoryPojo.setDateTime(simpleDateFormat.format(new Date()));

            out.collect(categoryPojo);
        }
    }

    /**
     * 实现ProcessWindowFunction
     * 在这里我们做最后的结果统计，
     * 把各个分类的总价加起来，就是全站的总销量金额，
     * 然后我们同时使用优先级队列计算出分类销售的Top3，
     * 最后打印出结果，在实际中我们可以把这个结果数据存储到hbase或者redis中，以供前端的实时页面展示。
     */
    private static class WindowResultProcess extends ProcessWindowFunction {
        @Override
        public void process(Tuple tuple, Context context, Iterable elements, Collector