E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
流式计算Heron
李亚坤:Hadoop YARN在字节跳动的实践
讲师简介:李亚坤,哈工大硕士,目前从事分布式计算资源调度系统YARN的研发支持工作,支撑了包括今日头条、抖音短视频、火山小视频、西瓜视频等一系列产品的离线、
流式计算
任务。
cuizhu6079
·
2020-07-31 11:40
流式计算
领域新霸主Flink的那些事儿
Flink项目是大数据计算领域冉冉升起的一颗新星。大数据计算引擎的发展经历了几个过程,从第1代的MapReduce,到第2代基于有向无环图的Tez,第3代基于内存计算的Spark,再到第4代的Flink。因为Flink可以基于Hadoop进行开发和使用,所以Flink并不会取代Hadoop,而是和Hadoop紧密结合。Flink主要包括DataStreamAPI、DataSetAPI、TableA
过往记忆
·
2020-07-31 10:12
JAVA面试案例-铂涛
笔试实时
流式计算
统计黑名单redis有序集合做排名zset用法https://www.redis.net.cn/tutorial/3512.html排名zincrehttps://www.jianshu.com
「已注销」
·
2020-07-31 10:57
java面试案例
Error: Cannot run program "curl". when submit Topology in
Heron
(Local)
问题描述
Heron
环境:Local单节点配置文件:local默认提交topo时,出现如下错误信息:yitian@
heron
01:~$heronsubmitlocal~/.
heron
/examples/
heron
-api-examples.jarcom.twitter.
heron
.examples.api.WordCountTopologyWordCountTopology
一天_pika
·
2020-07-30 21:06
流式计算Heron
Heron
大数据
流式计算
:关键技术及系统实例
转载自:http://www.jos.org.cn/html/2014/4/4558.htm摘要:大数据计算主要有批量计算和
流式计算
两种形态,目前,关于大数据批量计算系统的研究和讨论相对充分,而如何构建低延迟
公众号:数海星辰
·
2020-07-30 20:52
领域精粹
基于Kafka+Flink+Redis的电商大屏实时计算案例
由于Flink的“真·
流式计算
”这一特点,它比SparkStreaming要更适合大屏应用。本文从笔者的实际工作经验抽象出简单的模型,并简要叙述计算流程(当然大部分都是源码)
大数据技术与架构
·
2020-07-30 20:51
用Spark Streaming+Kafka实现订单数和GMV的实时更新
由于订单数量巨大,不可能每隔一秒就到数据库里进行一次SQL的数据统计,这时候就需要用到
流式计算
。
wangjinming1976
·
2020-07-30 17:47
大数据
Kafka
spark
streaming
Flink读取Kafka数据批量写入ES(elasticsearch)
在
流式计算
中,此场景十分常见。
泛音青年
·
2020-07-30 16:30
flink
storm教程(六):Storm 和kafka的集成
我们知道storm的作用主要是进行
流式计算
,对于源源不断的均匀数据流流入处理是非常有效的,而现实生活中大部分场景并不是均匀的数据流,而是时而多时而少的数据流入,这种情况下显然用批量处理是不合适的,如果使用
大数据技术之路---花火
·
2020-07-30 16:06
hadoop
storm
大数据
Spark-Streaming 和 Kafka 做实时计算需要注意的点
spark到kafka的消息消费--SparkKafkaDriverHAZooKeeperOps
流式计算
中最重要的消息的消费总结
流式计算
中最重要的消息的消费当我们使用spark做准实时计算的时候,很大场景都是和
凌萧子
·
2020-07-30 15:28
流式计算
实时计算
spark
kafka
大数据
【Spark】Spark Streaming的程序运行原理及与Kafka的集成
(2)
流式计算
系统StreamingCompute常用的有三种:ApacheStorm、SparkStreaming和ApacheSamza。这三种实
魏晓蕾
·
2020-07-30 15:26
BigData
BigData
Components
Flink 常用的 DataSet 和 DataStream API
现状在前面的课程中,曾经提到过,Flink很重要的一个特点是“流批一体”,然而事实上Flink并没有完全做到所谓的“流批一体”,即编写一套代码,可以同时支持
流式计算
场景和批量计算的场景。
Platina_Tomato
·
2020-07-30 12:58
Flink个人学习笔记
Hadoop的核心组件——MR
MapReduce(MR)的概述[TOC]###1.MapReduce的介绍-Hadoop的分布式计算框架(MapReduce)-MapReduce是分布式计算框架的一种,适合做离线计算框架;Strom适合做
流式计算
框架
不断前行的菜鸟_
·
2020-07-28 20:36
《数据结构与算法分析(Java语言描述)》读书笔记——1-6章,偏数据结构部分
1、最大子序列和(书2.4.3)联机算法(对已读入的数据,能给出结果)、
流式计算
//数组全负结果为0publicintmaxSubSum(int[]a){intmaxSum=0;intthisSum=0
绕远的偶人
·
2020-07-28 20:19
数据结构与算法
Spark学习(1)——初识spark
Spark包含了大数据领域常见的各种计算框架;比如SparkCore勇于离线计算,SparkSQL用于交互式查询,SparkStreaming用于实时
流式计算
,SparkMLlib用于机器学习,SparkGraphX
Mbappe
·
2020-07-28 15:25
spark学习系列
Spark Streaming初探
SparkStreaming初探SparkStreaming是一个基于Spark核心的
流式计算
的扩展。
OopsOutOfMemory
·
2020-07-28 14:01
spark
Spark Streaming快速入门
SparkStreaming处理的数据可以来源于多种数据源(如:Kafka、Flume、TCP套接字),这些数据流经过
流式计算
的
Mcy2017
·
2020-07-28 08:27
大数据
Twitter发布新的大数据实时分析系统
Heron
昨日,Twitter发布了新开发的数据实时分析平台
Heron
,以下为官方文档摘译:我们每天在Twitter上处理着数十亿的事件。正如你猜测的那样,实时分析这些事件是一个巨大的挑战。
钱曙光
·
2020-07-28 05:42
Twitter开源大数据实时分析系统
Heron
:
Heron
架构
Heron
架构
Heron
是ApacheStorm的一个直接继承者。从架构角度来看,它与Storm截然不同,但是从API的角度看它是完全向后兼容的。
kingzone_2008
·
2020-07-28 01:05
云计算/大数据
使用Spark Streaming SQL基于时间窗口进行数据统计
1.背景介绍
流式计算
一个很常见的场景是基于事件时间进行处理,常用于检测、监控、根据时间进行统计等系统中。
chikuai9995
·
2020-07-27 20:45
spark进阶(五)
SparkStreamingSparkStreaming框架计算流程:SparkStreaming是将
流式计算
分解成一系列短小的批处理作业。
a_victory
·
2020-07-27 18:23
Spark
spark的初步学习知识点
SPARK核心组件spark包括四大组件:SparkStreaming(类似于Storm,进行
流式计算
,处理的是实时数据(流式数据))Spar
a_6_9_z
·
2020-07-27 18:51
Flink编程三大组件(一)——Source
Flink作为一款
流式计算
框架,它可用来做批处理,即处理静态的数据集、历史的数据集;也可以用来做流处理,即实时的处理些实时数据流,实时的产生数据流结果,只要数据源源不断的过来,Flink就能够一直计算下去
DanielMaster
·
2020-07-27 18:04
Flink
flink
字节跳动李本超:一年成为 Committer,我与 Flink 社区的故事
首先简单做个自我介绍,我是李本超,是字节跳动基础架构
流式计算
方向的工程师,主要负责FlinkSQL方向。最近非常有幸受邀成为ApacheFlinkCommitter。
ApacheFlink
·
2020-07-27 17:46
flink
探究 flink1.11 Application 模式
随着
流式计算
的兴起,实时分析成为现代商业的利器。越来越多的平台和公司基于ApacheFlink构建他们的实时计算平台,并saas化。这些平台旨在通过简化应用的提交来降低最终用户的使用负担。
iyacontrol
·
2020-07-27 11:24
kubernetes
flink
Hadoop生态圈(十一):Storm
1.2
流式计算
是什么?1.3Storm是什么?
jiezou12138
·
2020-07-16 01:17
Hadoop
流计算容错
这篇文档描述了Flink的
流式计算
的容错机制IntroductionCheckpointingBarriersStateExactlyOncevs.AtLeastOnceRecovery简介Flink提供容错机制来对应用数据流提供持续的恢复
codemosi
·
2020-07-15 21:07
flink
Hadoop 理解与运用(一)
reduceonyarn)Tezspark3.ImpalaPrestoDrill直接跑在hdfs上pig(脚本方式)hive(SQL语言)跑在map/reduce上hiveontez/sparkSQL4.
流式计算
Blieveinmyself
·
2020-07-15 21:11
Spark译文(三)
·您可以像表达静态数据的批处理计算一样表达
流式计算
。·SparkSQL引擎将负责逐步和连续地运行它,并在流数据继续到达时更新最终结果。·您可以使用Scala,Java,Python或R中的
aeluwl2038
·
2020-07-15 20:04
Flink基本介绍
Flink简介:Flink通过实现GoogleDataflow
流式计算
模型实现了高吞吐、低延迟、高性能兼具实时
流式计算
框架。
TNTZS666
·
2020-07-15 19:23
大数据学习
Streaming System 第一章:Streaming 101
the-world-beyond-batch-streaming-101https://www.oreilly.com/ideas/the-world-beyond-batch-streaming-102其中对
流式计算
的设计理念做了非常透彻的介绍
xxscj
·
2020-07-15 16:56
数据处理
流计算
实时计算
浅谈实时数据开发
(三)流式技术架构目前
流式计算
框架相对成熟,以Storm、SparkStreaming为代表的开源组件也被广泛应用。
木东居士
·
2020-07-15 12:57
Spark与Flink:对比与分析
Flink是可扩展的批处理和流式数据处理的数据处理平台,设计思想主要来源于Hadoop、MPP数据库、
流式计算
系统等,支持增量迭代计算。原理Spark1.4特
xiaomin_____
·
2020-07-15 10:44
分布式计算
Apache Spark Streaming-教案
SparkStreaming流计算定义一般
流式计算
会与批量计算相比较。在
流式计算
模型中,输入是持续的,可以认为在时间上是无界的,也就意味着,永远拿不到全量数据去做计算。
麦田里的守望者·
·
2020-07-15 06:32
Spark内存计算
Savepoints
使用Flink的checkpoint机制来为你的
流式计算
程序创建一个(非自增的)快照,并且将checkpoint数据和元数据写入到外部的文件系统中。
小C菜鸟
·
2020-07-15 01:19
Storm应用场景详解
Storm是一个分布式的、可靠的、容错的数据流处理系统(
流式计算
框架,可以和mapreduce的离线计算框架对比理解)。整个任务被委派给不同的组件,每个组件负责一个简单的特定的处理任务。
Kun_Guan
·
2020-07-15 00:01
数据挖掘分析
storm
流式计算
并行计算
分布式
StructuredStreaming官方文档翻译
您可以以静态数据表示批量计算的方式来表达
流式计算
。SparkSQL引擎将随着流式传输数据持续到达而逐渐持续运行,并更新最终结果。
无尴尬不青春
·
2020-07-14 22:54
spark
【图文详细 】Kafka消息队列——Kafka是什么
1.1、Kafka的概述在
流式计算
中,Kafka一般用于数据的缓存,Storm通过消费Kafka的数据进行计算。
谦卑t
·
2020-07-14 20:01
Kafka
Spark编程
综述Scala语言写成的一套分布式内存计算系统,核心抽象模型是RDD(弹性分布式数据集)在Spark之上还有一些工具:支持用Sql查询的SparkSQL、支持
流式计算
的SparkStreaming、机器学习库
Yuanhui
·
2020-07-14 19:21
大数据基础知识学习-----Storm学习笔记
Storm概述离线计算是什么离线计算:批量获取数据、批量传输数据、周期性批量计算数据、数据展示代表技术:Sqoop批量导入数据、HDFS批量存储数据、MapReduce批量计算数据、Hive批量计算数据
流式计算
是什么
流式计算
四川码匠
·
2020-07-14 17:16
大数据
Storm学习笔记总结
阿里云大数据-ACA考试-笔记(二)
数加产品介绍定位:计算引擎:离线计算:由用户定时触发,批量处理的数据
流式计算
:数据发生变化时能够及时捕捉变化并处理在线计算:要求立刻返回计算结果分析工具应用引擎、人工智能可以通过数据采集或者数据同步将数据传入数据展现工具
didadu
·
2020-07-14 09:59
大数据
learning
diary
数据库的未来 - HTAP,软件、硬件、云生态的融合
标签PostgreSQL,GPU,FPGA,CPU,TPU,PL/language,科研,嵌入式计算,UDF,CUDA,数据库嵌入式编程,
流式计算
,科学计算,软硬一体,PostGIS,点云,开发者生态,
weixin_34217773
·
2020-07-13 18:43
Flink 快速实战开发
Flink可谓是开启了
流式计算
技术的新时代,现在无论大中小公司基本上都对Flink技术有不同程度的尝试,或是已经进行了大量实时计算的改造。
GitChat的博客
·
2020-07-13 16:15
《从0到1学习Flink》—— Data Source 介绍
Flink做为一款
流式计算
框架,它可用来做批处理,即处理静态的数据集、历史的数据集;也可以用来做流处理,即实时的处理些实时数据流,实时的产生数据流结果,只要数据源源不断的过来,Flink就能够一直计算下去
zhisheng_blog
·
2020-07-13 05:06
让天下没有难用的搜索:阿里搜索如何成长为贴心“暖男”?
可以看到,十年双11的考验后,搜索智能化体系逐渐打造成型,已经成为电商平台稳定健康发展的核动力,主要分为四个阶段:自主研发的
流式计算
引擎Pora初
阿里云云栖号
·
2020-07-13 03:34
大数据之Kafka(心得)
(1)在
流式计算
中,Kafka一般用来缓存数据,Spark通过消费Kafka的数据进行计算。(2)Kafka是一个分布式消息队列。
宝宝不哭^_^
·
2020-07-12 13:07
心得体会
流式计算
--实战(日志监控系统)
1.日志监控系统数据的流向:flume+kafka+storm+mysql数据流程如下:应用程序使用log4j产生日志部署flume客户端监控应用程序产生的日志信息,并发送到kafka集群中stormspout拉去kafka的数据进行消费,逐条过滤每条日志的进行规则判断,对符合规则的日志进行邮件告警。最后将告警的信息保存到mysql数据库中,用来进行管理。数据从flume到kafka到storm在
时空恋旅人
·
2020-07-12 10:33
流式计算
【Flink、YARN】架构及工作原理
flink-framwork-introduction/https://blog.csdn.net/bingduanlbd/article/details/51880019Flink架构Flink是一个
流式计算
框架
__syr__
·
2020-07-12 10:22
分布式
并行
大数据
Flink
YARN
Kafka集群部署与shell命令行操作
1、kafka简介在
流式计算
中,Kafka一般用来缓存数据,Storm通过消费Kafka的数据进行计算。
piziyang12138
·
2020-07-12 06:00
大数据技术深度实践
本书内容
Heron
:Twitter的新一代流处理引擎原理篇文/吕能,吴惠君,符茂松本文介绍了流计算的背景和重要概念,并详细分析了Twitter目前的流计算引擎——
Heron
的结构及重要组件,希望能借此为大
GitChat的博客
·
2020-07-12 04:16
大数据
数据库
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他