E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
内存计算
分布式内存文件系统Tachyon
MapReduce就不说了,但像Spark这种
内存计算
框架,为什
stark_summer
·
2015-09-27 16:00
分布式
内存管理
存储系统
数据管理
Tachyon
Spark Streaming 图片处理案例介绍
大多数流式处理架构多采用
内存计算
方式,即当数据到达后直接在内存中计算,只有少量数据会被保存到硬盘,或者干脆不保存数据。
xuguokun1986
·
2015-09-24 16:00
Spark和hadoop的关系
Spark:是一个基于
内存计算
的开源的集群计算系统,目的是让数据分析更加快速,Spark是一种与Hadoop相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使Spark在某些工作负载方面表现得更加优越
李秋
·
2015-09-22 13:00
Spark和hadoop的关系
Spark:是一个基于
内存计算
的开源的集群计算系统,目的是让数据分析更加快速,Spark是一种与Hadoop相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使Spark在某些工作负载方面表现得更加优越
李秋
·
2015-09-22 13:00
Spark和hadoop的关系
Spark:是一个基于
内存计算
的开源的集群计算系统,目的是让数据分析更加快速,Spark是一种与Hadoop相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使Spark在某些工作负载方面表现得更加优越
李秋
·
2015-09-22 13:00
开源IMDG之GridGain
同样提供了社区版和商业版,近日GridGain的开源版本已经进入Apache孵化器项目Ignite(一款开源的
内存计算
(In-MemoryComputing)IMC中间件),目前Apache正在迁移GridGain
m635674608
·
2015-09-20 00:00
Spark入门实战系列--10.分布式内存文件系统Tachyon介绍及安装部署
1Tachyon介绍1.1Tachyon简介随着实时计算的需求日益增多,分布式
内存计算
也持续升温,怎样将海量数据近乎实时地处理,或者说怎样把离线批处理的速度再提升到一个新的高度是当前研究的重点。
yirenboy
·
2015-09-16 14:00
spark
大数据
内存
Tachyon
Spark入门实战系列--10.分布式内存文件系统Tachyon介绍及安装部署
【注】该系列文章以及使用到安装包/测试数据可以在《倾情大奉送--Spark入门实战系列》获取1、Tachyon介绍1.1 Tachyon简介随着实时计算的需求日益增多,分布式
内存计算
也持续升温,怎样将海量数据近乎实时地处理
shishanyuan
·
2015-09-16 08:00
Spark是什么?(翻译自Learning.Spark.Lightning-Fast.Big.Data.Analysis)
Spark提高速度的方式之一是
内存计算
,但是,对于运行在硬盘上的复杂应用程序,Spark依旧比MapReduce快。在通用性方面,Spark被
l294265421
·
2015-08-27 19:00
spark
什么是Spark?
什么是SparkSpark是一个基于
内存计算
的开源的集群计算系统,目的是让数据分析更加快速。Spark非常小巧玲珑,由加州伯克利大学AMP实验室的Matei为主的小团队所开发。
u011225629
·
2015-07-25 08:00
spark
spark简单总结—短小精悍
Spark是基于
内存计算
的大数据并行计算框架。因为其基于
内存计算
,较Hadoop中MapReduce计算框架具有更高的实时性,同时保证了高效容错性和可伸缩性。
TonyChai
·
2015-07-14 18:00
Pig0.15集成Tez,让猪飞起来
上图已经说明问题了,如果将我们的Hive,或者Pig运行在Tez之上,那么速度会有几倍的提升,当然这仅仅是相对MapReduce来讲的,因为Spark这种分布式
内存计算
框架才是未来的的
qindongliang1922
·
2015-06-29 19:00
mapreduce
hadoop
pig
Pig0.15集成Tez,让猪飞起来
上图已经说明问题了,如果将我们的Hive,或者Pig运行在Tez之上,那么速度会有几倍的提升,当然这仅仅是相对MapReduce来讲的,因为Spark这种分布式
内存计算
框架才是未来的的
qindongliang1922
·
2015-06-29 19:00
mapreduce
hadoop
pig
Pig0.15集成Tez,让猪飞起来
上图已经说明问题了,如果将我们的Hive,或者Pig运行在Tez之上,那么速度会有几倍的提升,当然这仅仅是相对MapReduce来讲的,因为Spark这种分布式
内存计算
框架才是未来的的
qindongliang1922
·
2015-06-29 19:00
mapreduce
hadoop
pig
Pig0.15集成Tez,让猪飞起来
上图已经说明问题了,如果将我们的Hive,或者Pig运行在Tez之上,那么速度会有几倍的提升,当然这仅仅是相对MapReduce来讲的,因为Spark这种分布式
内存计算
框架才是
qindongliang1922
·
2015-06-29 19:00
mapreduce
hadoop
pig
Pig0.15集成Tez,让猪飞起来
上图已经说明问题了,如果将我们的Hive,或者Pig运行在Tez之上,那么速度会有几倍的提升,当然这仅仅是相对MapReduce来讲的,因为Spark这种分布式
内存计算
框架才是未来的的
qindongliang1922
·
2015-06-29 19:00
mapreduce
hadoop
pig
Pig0.15集成Tez,让猪飞起来
上图已经说明问题了,如果将我们的Hive,或者Pig运行在Tez之上,那么速度会有几倍的提升,当然这仅仅是相对MapReduce来讲的,因为Spark这种分布式
内存计算
框架才是未来的的
qindongliang1922
·
2015-06-29 19:00
mapreduce
hadoop
pig
Pig0.15集成Tez,让猪飞起来
上图已经说明问题了,如果将我们的Hive,或者Pig运行在Tez之上,那么速度会有几倍的提升,当然这仅仅是相对MapReduce来讲的,因为Spark这种分布式
内存计算
框架才是未来的的
qindongliang1922
·
2015-06-29 19:00
mapreduce
hadoop
pig
关于Spark的基本概念和特性简介
○高可伸缩性 ○高容错 ○基于
内存计算
2、Spark的生态体系(BDAS,中文:伯利克分析栈) ○MapReduce属于Hadoop生态体系之一,Spark则属于BDAS生态体系之一
openthings
·
2015-06-25 10:00
spark
RDD
大数据分析
Hadoop生态系统组件
NoSQL数据库Hive:适合做ETL的大数据仓库,支持SQL查询语言,基于MapReduceImpala:新型查询系统,提供交互式的SQL查询ZooKeeper:分布式应用程序协调服务Spark:分布式
内存计算
引擎
浮躁的码农
·
2015-06-23 18:00
Spark初探
○高可伸缩性 ○高容错 ○基于
内存计算
2、Spark的生态体系(BDAS,中文:伯利克分析栈) ○MapReduce属于Hadoop生态体系之一,Spark则属于BDAS生态体系之一
datapro
·
2015-06-20 16:00
spark
Spark学习笔记之浅释
概述: Spark是一个基于
内存计算
的开源集群计算系统,目的是让数据分析更加快速。 Spark非常小巧玲珑,由加州伯克利大学AMP实验室的小团队开发。
sunlei1980
·
2015-06-20 10:00
scala
hadoop
spark
迭代
Spark火遍IT业界,AMPCamp来中国趁火打劫
而且,MapReduce没有
内存计算
的选项,每次计
大数据09
·
2015-06-19 18:00
GC调优在Spark应用中的实践
由于Spark立足于
内存计算
,常常需要在内存中存放大量数据,因此也更依赖JVM的垃圾回收机制(GC)。并且同时,它也支持兼容批处理和流式处理,对于程序吞吐量和延迟都有较高要求,
shenmanli
·
2015-06-12 13:00
spark
大数据
it培训
说说这些年做的云计算和大数据项目
入行十几年了,做了不少分布计算、并行计算、
内存计算
、海量数据处理的项目,按照现在的分类,这些都属于云计算/大数据范畴。今天说说我做过的其中三个项目,只三个。
laxcus
·
2015-06-06 10:00
大数据
CARY
GC调优在Spark应用中的实践
GC调优在Spark应用中的实践发表于23小时前| 780次阅读|来源《程序员》电子刊5月B| 2 条评论|作者仲浩Spark大数据开源Intel摘要:Spark立足
内存计算
,常常需要在内存中存放大量数据
javastart
·
2015-06-03 13:00
Spark计算过程分析
基本概念Spark是一个分布式的
内存计算
框架,其特点是能处理大规模数据,计算速度快。
原创学无止尽
·
2015-05-28 18:11
Spark
mysql
内存计算
公式
分类: MySQL2013-07-0815:35 712人阅读 评论(0) 收藏 举报mysql
内存计算
公式mysqlusedmem=key_buffer_size+query_cache_size+
南春勒
·
2015-05-08 15:38
mysql
微信红包的架构设计简介
答:微信金额是拆的时候实时算出来,不是预先分配的,采用的是纯
内存计算
,不需要预算空间存储。。采取实时计算金额的考虑:预算需要占存储,实时效率
天天顺利
·
2015-05-04 14:00
微信红包的架构设计简介
答:微信金额是拆的时候实时算出来,不是预先分配的,采用的是纯
内存计算
,不需要预算空间存储。采取实时计算金额的考虑:预算需要占存储,实时效率很高,预算才效率低。实时性
·
2015-05-04 02:00
高并发编程
Hadoop生态系统组件
NoSQL数据库Hive:适合做ETL的大数据仓库,支持SQL查询语言,基于MapReduceImpala:新型查询系统,提供交互式的SQL查询ZooKeeper:分布式应用程序协调服务Spark:分布式
内存计算
引擎
郭恩洲的博客
·
2015-04-30 15:00
spark原理介绍
1、spark是一个基于
内存计算
的开源的集群计算系统,目的是让数据分析更加快速。因此运行spark的机器应该尽量的大内存,如96G以上。
jediael_lu
·
2015-04-28 12:00
spark原理介绍
1、spark是一个基于
内存计算
的开源的集群计算系统,目的是让数据分析更加快速。因此运行spark的机器应该尽量的大内存,如96G以上。
·
2015-04-28 12:00
spark
Spark VS Hadoop
Hadoop:分布式批处理计算,强调批处理,常用于数据挖掘、分析 Spark:是一个基于
内存计算
的开源的集群计算系统,目的是让数据分析更加快速,Spark是一种与Hadoop相似的开源集群计算环境
矩阵
·
2015-04-17 11:40
hadoop
spark
对比
Spark VS Hadoop
Hadoop:分布式批处理计算,强调批处理,常用于数据挖掘、分析Spark:是一个基于
内存计算
的开源的集群计算系统,目的是让数据分析更加快速,Spark是一种与Hadoop相似的开源集群计算环境,但是两者之间还存在一些不同之处
矩阵
·
2015-04-17 11:40
对比
hadoop
spark
Hadoop
大数据系列10:Spark –
内存计算
wget http://mirrors.cnnic.cn/apache/incubator/spark/spark-0.8.0-incubating/spark-0.8.0-incubating-bin-hadoop1.tgztar -zxvfspark-0.8.0-incubating-bin-hadoop1.tgzmv spark-0.8.0-incubating-bin-hadoop1sp
杨尚川
·
2015-04-07 00:00
apache
sql
spark
spark
spark
MLlib
GraphX
Streaming
百度笔试题目及答案
b)Spark基于
内存计算
的并行计算框架。适用于需要迭代多轮计算的应用。c)MPI基于消息传递的并行计算框架。适用各种复杂应用的并行计算。支持MPMD(多程序多数据),开发复杂度高。请解释tcp
cjneo
·
2015-04-03 10:12
算法
c++
Hadoop与Storm
storm的网络直传、
内存计算
,其时延必然比hadoop的通过hdfs传输低得多;当计算模型比较适合流式时,storm的流式处理,省去了批处理的收集数据的时间;因为storm是服务型的作业,也省去了作业调度的时延
天下杰论
·
2015-03-27 09:00
hp打印机6L显示内存不足该怎么解决?
LaserJet6L系列打印机打印较大或是较复杂的文件时报内存不足怎么办,这主要是因为,打印机输出Windows测试页正常,出现此现象多是打印的文件太大或是过于复杂,导致打印机接收的数据过多而出现打印机的
内存计算
不过来
佚名
·
2015-03-20 16:42
spark第一篇--简介,应用场景和基本原理
摘要:spark的优势:(1)图计算,迭代计算(2)交互式查询计算spark特点:(1)分布式并行计算框架(2)
内存计算
,不仅数据加载到内存,中间结果也存储内存为了满足挖掘分析与交互式实时查询的计算需求
crazyhacking
·
2015-03-20 14:11
spark
内存有限的情况下 Spark 如何处理 T 级别的数据?
Spark确实擅长
内存计算
,内存容量不足时也可以回退,但题主给出的条件(8GB内存跑1TB数据)也确实是过于苛刻了……首先需要解开的一个误区是,对于Spark这类
内存计算
系统,并不是说要处理多大规模的数据就需要
宏轩
·
2015-03-08 23:56
hadoop
Hadoop与分布式数据处理 Spark VS Hadoop有哪些异同点?
Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持
内存计算
、多迭代批量处理、即席查询、流处理和图计算等多种范式。
李社河
·
2015-02-27 16:22
EJB
分布式计算
Hadoop与分布式数据处理 Spark VS Hadoop有哪些异同点?
Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持
内存计算
、多迭代批量处理、即席查询、流处理和图计算等多种范式。
lishehe
·
2015-02-27 16:00
按组处理大文件(结构化文本)
阅读更多有这样一类文本文件:文件太大无法全部读入
内存计算
;但数据已按某列排序,如果以该列为标准每次读取一组数据,则可以放入内存进行计算。电信通话记录、网站访问记录、商场会员信息等等都属于此类文件。
datamachine
·
2015-02-27 14:00
结构化文本文件
分组
处理
集算器
按组处理大文件(结构化文本)
有这样一类文本文件:文件太大无法全部读入
内存计算
;但数据已按某列排序,如果以该列为标准每次读取一组数据,则可以放入内存进行计算。电信通话记录、网站访问记录、商场会员信息等等都属于此类文件。
datamachine
·
2015-02-27 14:00
分组
集算器
处理
结构化文本文件
按组处理大文件(结构化文本)
有这样一类文本文件:文件太大无法全部读入
内存计算
;但数据已按某列排序,如果以该列为标准每次读取一组数据,则可以放入内存进行计算。电信通话记录、网站访问记录、商场会员信息等等都属于此类文件。
datamachine
·
2015-02-27 14:00
集算器
分组
处理
结构化文本文件
按组处理大文件(结构化文本)
阅读更多有这样一类文本文件:文件太大无法全部读入
内存计算
;但数据已按某列排序,如果以该列为标准每次读取一组数据,则可以放入内存进行计算。电信通话记录、网站访问记录、商场会员信息等等都属于此类文件。
datamachine
·
2015-02-27 14:00
结构化文本文件
分组
处理
集算器
大数据实时处理–Spark及BDAS技术应用
Spark是基于
内存计算
的大数据并行计算框架,Spark目前是Apache软件基金会旗下,顶级的开源项目,Spark作为MapReduce
shenmanli
·
2015-02-27 11:00
数据分析
大数据
应用
it培训
2014 Spark美国峰会顶级数据商精彩PPT分享
Spark是一个基于
内存计算
的开源的集群计算系统,目的是让数据分析更加快速。Spark非常小巧玲珑,由加州伯克利大学AMP实验室的Matei为主的小团队所开发。
zhongwen7710
·
2015-01-22 14:00
spark
2014
数据科学家
Summit
Apache Spark1.1.0部署与开发环境搭建 - Mark Lin
与MapReduce不同,Spark并不局限于编写map和reduce两个方法,其提供了更为强大的
内存计算
(in-memorycomputing)模型,使得用户可以通过编程将数据
wishchin
·
2015-01-19 17:00
上一页
15
16
17
18
19
20
21
22
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他