1.FASTCGI--动态网页技术
https://baike.baidu.com/item/fastcgi/10880685
2.uwsgi--Nginx中HttpUwsgiModule的作用是与uWSGI服务器进行交换。WSGI是一种Web服务器网关接口。
https://baike.baidu.com/item/uwsgi/673705?fr=aladdin
3.harpc--HARPC(High Availability RPC)是基于Thrift的跨语言、高可用的RPC框架。
https://blog.csdn.net/hrn1216/article/details/51383544
4.presto--Presto是一个分布式SQL查询引擎,用于查询分布在一个或多个不同数据源中的大数据集。
http://prestodb-china.com/docs/current/index.html
5.kudu--Kudu是Cloudera开源的新型列式存储系统,是Apache Hadoop生态圈的新成员之一(incubating),专门为了对快速变化的数据进行快速的分析,填补了以往Hadoop存储层的空缺
https://www.cnblogs.com/wuxian11/p/6478581.html
6.Parquet--Parquet是Hadoop上的一种支持列式存储文件格式。把嵌套结构存储成扁平格式。
https://blog.csdn.net/zero__007/article/details/79673561
7.Ambari--Ambari是Hortonworks开源的Hadoop平台的管理软件,具备Hadoop组件的安装、管理、运维等基本功能,提供Web UI进行可视化的集群管理,简化了大数据平台的安装、使用难度。
https://blog.csdn.net/u012331758/article/details/78106714
8.tez--Apache Tez是一个针对Hadoop数据处理应用程序的新分布式执行框架。Tez是Apache最新的支持DAG作业的开源计算框架,它可以将多个有依赖的作业转换为一个作业从而大幅提升DAG作业的性能。
https://blog.csdn.net/yamaxifeng_132/article/details/78828038
9.pig--Pig是一种数据流语言(data flow programming langage)。
https://blog.csdn.net/bingduanlbd/article/details/52049683
10.Falcon--Falcon是一个面向Hadoop的、数据处理和管理平台。
https://blog.csdn.net/it_dx/article/details/57564628
11.ZeroMQ--ZeroMQ是一种基于消息队列的多线程网络库,其对套接字类型、连接处理、帧、甚至路由的底层细节进行抽象,提供跨越多种传输协议的套接字。
https://blog.csdn.net/w174504744/article/details/73187697
12.Flume--实时日志收集系统
https://www.cnblogs.com/zhangyinhua/p/7803486.html
13.velocity--velocity与freemaker、jstl并称为java web开发三大标签技术
https://blog.csdn.net/sunny243788557/article/details/52796734
14.zookeeper--ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,它是集群的管理者,监视着集群中各个节点的状态根据节点提交的反馈进行下一步合理操作。
https://www.cnblogs.com/felixzh/p/5869212.html
15.jdk linux安装
https://www.cnblogs.com/Dylansuns/p/6974272.html
16.Logstash一个数据分析软件,主要目的是分析log日志
https://www.cnblogs.com/yincheng/p/logstash.html
17.Kibana一个针对Elasticsearch的开源分析及可视化平台,用来搜索、查看交互存储在Elasticsearch索引中的数据。
https://www.cnblogs.com/zhangs1986/p/7325504.html
18.Filebeat一个日志文件托运工具,服务器上安装客户端后,会监控日志目录或者指定的日志文件,追踪读取这些文件(追踪文件的变化,不停的读),并且转发这些信息到elasticsearch或者logstarsh中存放。
https://www.cnblogs.com/kerwinC/p/6227768.html
19.mariaDB-MariaDB数据库管理系统是MySQL的一个分支,主要由开源社区在维护,采用GPL授权许可 MariaDB的目的是完全兼容MySQL,包括API和命令行,使之能轻松成为MySQL的代替品。
https://www.w3cschool.cn/mariadb/
20.sqoop 是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。
https://blog.csdn.net/jiangsanfeng1111/article/details/53332635
21.HDFS、MR、Kafka、Storm、Spark、Hbase、Redis原理图
https://blog.csdn.net/qq_41455420/article/details/79787093
22.kylin主要是对hive中的数据进行预计算,利用hadoop的mapreduce框架实现
https://www.cnblogs.com/honey01/p/8351145.html
23.Zeppelin是一个基于Web的notebook,提供交互数据分析和可视化。
https://www.cnblogs.com/shenh062326/p/6195064.html
24.TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库
http://www.tensorfly.cn/
25.Caffe是一个深度学习框架
http://hao.jobbole.com/caffe/?utm_source=blog.jobbole.com&utm_medium=sidebar-resources
26.PyTorch
https://www.leiphone.com/news/201708/Npflmddi8OGbnJHi.html
27.GlusterFS是Scale-Out存储解决方案Gluster的核心,它是一个开源的分布式文件系统
https://blog.csdn.net/zonelan/article/details/8468383
28.主流流计算框架
http://developer.51cto.com/art/201603/507444.htm