E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
ALLUXIO
Spark问题9之Spark通过JNI调用c的问题解决
更多代码请见:https://github.com/xubo245/SparkLearningSpark生态之
Alluxio
学习版本:
alluxio
(tachyon)0.7.1,spark-1.5.2,
KeepLearningBigData
·
2017-03-06 10:51
Spark问题
使用
Alluxio
高效存储Spark RDD
本文由南京大学顾荣、李崇杰翻译整理自
Alluxio
公司技术博客,由
Alluxio
公司授权CSDN首发(联合),版权归
Alluxio
公司所有,未经版权所有者同意请勿转载。
Alluxio
·
2017-03-02 16:05
Alluxio技术与实践
利用
Alluxio
系统提升按需数据分析服务的性能
本文由南京大学顾荣、施军翻译整理自
Alluxio
公司技术博客,由
Alluxio
公司授权CSDN首发(联合),版权归
Alluxio
公司所有,未经版权所有者同意请勿转载。
Alluxio
·
2017-02-22 13:49
Alluxio技术与实践
基于
Alluxio
系统的Spark DataFrame高效存储管理技术
本文由南京大学顾荣、黄志翻译整理自
Alluxio
公司技术博客,由
Alluxio
公司授权CSDN首发(联合),版权归
Alluxio
公司所有,未经版权所有者同意请勿转载。
Alluxio
·
2017-01-23 15:59
Alluxio技术与实践
Alluxio
计算框架整合系列 (二) --
Alluxio
& Presto
我们在上篇文章中,已经演示了如何安装
Alluxio
,并将HDFS作为
Alluxio
的底层文件系统;以及
Alluxio
&ApacheHive的整合过程。
火星人Martin
·
2017-01-17 15:34
大数据
数据仓库
OLAP
Alluxio
计算框架整合系列 (二) --
Alluxio
& Presto
我们在上篇文章中,已经演示了如何安装
Alluxio
,并将HDFS作为
Alluxio
的底层文件系统;以及
Alluxio
&ApacheHive的整合过程。
火星人Martin
·
2017-01-17 15:34
大数据
数据仓库
OLAP
Alluxio
计算框架整合系列 (一) --
Alluxio
& Apache Hive
我们在上篇文章中,已经演示了如何安装
Alluxio
,并将HDFS作为
Alluxio
的底层文件系统。这里我们将通过一系列的文章,来说明如何将
Alluxio
和常见的一些结算框架实现集成,用以提交查询。
火星人Martin
·
2017-01-17 13:09
大数据
数据仓库
OLAP
Alluxio
安装(以HDFS作为底层文件系统)
上一篇我们介绍了如何通过源码实现
Alluxio
编译的整个过程,接下来,这篇文章,将带你一起把我们编译好的安装包(或者是从官方直接下载的安装包——hadoop版本号需要跟你的基础环境一致)部署安装在我们的服务器上
火星人Martin
·
2017-01-17 11:34
大数据
数据仓库
OLAP
Alluxio
安装(以HDFS作为底层文件系统)
上一篇我们介绍了如何通过源码实现
Alluxio
编译的整个过程,接下来,这篇文章,将带你一起把我们编译好的安装包(或者是从官方直接下载的安装包——hadoop版本号需要跟你的基础环境一致)部署安装在我们的服务器上
火星人Martin
·
2017-01-17 11:34
大数据
数据仓库
OLAP
Alluxio
编译
Alluxio
的二进制发布包,是依赖于具体的hadoop版本的,截至本文撰写时,直接下载的
alluxio
二进制安装包是对应于hadoop2.2.0的,如果你的hadoop基础环境不是这个版本,那就需要根据实际情况
火星人Martin
·
2017-01-16 20:24
大数据
数据仓库
OLAP
Alluxio
简单介绍
Alluxio
原名tachyon。
Alluxio
是一个高容错的分布式文件系统,允许文件以内存的速度在集群框架中进行可靠的共享,类似Spark和MapReduce。
Janvn
·
2016-12-26 14:58
alluxio
分布式内存文件系统
Alluxio
实战
前言
Alluxio
是一个分布式内存文件系统,可以在集群里以访问内存的速度来访问存在
Alluxio
里的文件。
酱酱酱子啊
·
2016-12-09 12:35
分布式
Distributed
alluxio
的适用场景
最近一直在研究
alluxio
,希望其能够和hive,spark,hbase集成在一起,达到更快的运行速度,提高性能;但从目前情况来看,想用
alluxio
提升某个具体应用的性能,不大现实。
Data_Analyst
·
2016-11-23 15:14
Spark生态之
Alluxio
学习14--
alluxio
内存文件加载方式和分布情况分析
更多代码请见:https://github.com/xubo245/SparkLearningSpark生态之
Alluxio
学习版本:
alluxio
-1.3.0(tachyon),spark-1.5.2
KeepLearningBigData
·
2016-11-16 19:14
alluxio
Spark生态之
Alluxio
学习12--spark调用
alluxio
-1.3.0配置
更多代码请见:https://github.com/xubo245/SparkLearningSpark生态之
Alluxio
学习版本:
alluxio
(tachyon)1.3.0,spark-1.5.2,
bob601450868
·
2016-11-10 14:00
spark
集群
Tachyon
alluxio
Spark生态之
Alluxio
学习11--
alluxio
-1.3.0集群配置
更多代码请见:https://github.com/xubo245/SparkLearningSpark生态之
Alluxio
学习版本:
alluxio
(tachyon)1.3.0,spark-1.5.2,
bob601450868
·
2016-11-10 14:00
spark
集群
Tachyon
alluxio
1-3-0
Spark生态之
Alluxio
学习10--集群问法全部启动问题解决
更多代码请见:https://github.com/xubo245/SparkLearningSpark生态之
Alluxio
学习版本:
alluxio
(tachyon)0.7.1,spark-1.5.2,
bob601450868
·
2016-11-06 20:00
集群
spark
Tachyon
alluxio
Alluxio
李浩源:如何融合数据与内存速度
10月28日上午,“2016易观A10大数据应用峰会”主论坛《大数据基础框架设计——实时分析技术平台洞察与实践》,
Alluxio
创始人兼CEO李浩源受邀出席,并发表了“如何融合数据以内存的速度”的主题演讲
csdn郭芮
·
2016-11-02 13:40
Apache Ranger剖析:Hadoop生态圈的安全管家
然而,兄弟多了不好管,为了抢占企业级市场,各家都迭代出自己的一套访问控制体系,不管是老牌系统(比如HDFS、HBase),还是生态新贵(比如Kafka、
Alluxio
),ACL(AccessControlList
天外有菌
·
2016-08-16 22:40
Hadoop
Alluxio
之定位策略
Alluxio
提供定位策略,用于确定应该选择哪个Worker来存储文件数据块。
数据china
·
2016-08-09 14:34
alluxio
Alluxio
(前Tachyon)北京Meetup
2016年8月7日上午09:30-中午12:30北京市海淀区学院路37号北京航空航天大学如心楼会议中心二层(北航体育馆对面)
Alluxio
(前Tachyon)是一个开源内存级虚拟大数据存储系统,其源自UCBerkeleyAMPLab
数盟
·
2016-08-05 00:00
Spark &
Alluxio
概述
Alluxio
(在1.0版本之前名为Tachyon)是一个以内存分布式存储系统。它统一了数据访问的方式,为上层计算框架和底层存储系统构建了桥梁。
breeze_lsw
·
2016-07-27 23:08
Spark &
Alluxio
概述
Alluxio
(在1.0版本之前名为Tachyon)是一个以内存分布式存储系统。它统一了数据访问的方式,为上层计算框架和底层存储系统构建了桥梁。
breeze_lsw
·
2016-07-27 23:35
Spark
利用maven编译tachyon源码安装
今天决定编译tachyon源码,以下是我编译安装过程下载tachyon源码,我用的下载地址是https://github.com/
Alluxio
/
alluxio
/archive/v0.7.1.tar.gz
sinat_31726559
·
2016-07-03 00:00
去哪儿网大数据流处理系统:如何使用
Alluxio
(前 Tachyon)实现10倍性能提升
Alluxio
(前Tachyon)作为一个以内存为中心的虚拟分布式存储系统,在大数据系统性能提升以及生态系统多组件整合的进程中扮演着重要角色。
ccjhdopc
·
2016-05-31 09:43
big
data
去哪儿网大数据流处理系统:如何使用
Alluxio
(前 Tachyon)实现300倍性能提升
Alluxio
(前Tachyon)作为一个以内存为中心的虚拟分布式存储系统,在大数据系统性能提升以及生态系统多组件整合的进程中扮演着重要角色。
唐门教主
·
2016-05-30 17:13
Alluxio
1.0.1最新版(Tachyon为其前身)介绍,+HDFS分布式环境搭建
Alluxio
(之前名为Tachyon)是世界上第一个以内存为中心的虚拟的分布式存储系统。它统一了数据访问的方式,为上层计算框架和底层存储系统构建了桥梁。
浙江小麦
·
2016-05-11 22:00
Spark生态之Tachyon学习6---集群版搭建问题之集群无法全部启动
六个worker只启动了3个:hadoop@Master:~/cloud/
alluxio
-0.7.1$.
bob601450868
·
2016-05-05 20:00
Spark生态之Tachyon学习7--下载源码通过maven安装成功
更多代码请见:https://github.com/xubo245/SparkLearning1.环境hadoop2.6.0spark1.5.2java1.72.下载:https://github.com/
Alluxio
bob601450868
·
2016-05-05 19:00
下载源码通过maven安装成功
Spark生态之Tachyon学习6---集群版搭建和运行(
Alluxio
)
SparkLearning环境:hadoop-2.6.0spark-1.5.2scala-1.71解释完成tachyon的集群配置与运行前提:安装好java、hdfs等2.下载https://github.com/
Alluxio
bob601450868
·
2016-05-05 17:00
集群版搭建和运行Alluxio
Linux学习8之git选择源码版本
1.下载源码:gitclonehttps://github.com/
Alluxio
/
alluxio
.git 2.进入目录并查找源码版本:xubo@xubo:~/cloud/down$cd
alluxio
/
bob601450868
·
2016-05-05 16:00
Spark生态之Tachyon学习2---Spark从tachyon中读取文件(
Alluxio
)
1.启动spark-shell2.上传文件到tachyon:xubo@xubo:~/cloud/test/tachyon$../../tachyon-0.7.1/bin/tachyontfscopyFromLocal1.txt/ Copied1.txtto/ xubo@xubo:~/cloud/test/tachyon$../../tachyon-0.7.1/bin/tachyontfscat/1
bob601450868
·
2016-05-04 22:00
Spark生态之
Alluxio
学习2---Spark从tachyon中读取文件
1.启动spark-shell2.上传文件到tachyon:xubo@xubo:~/cloud/test/tachyon$../../tachyon-0.7.1/bin/tachyontfscopyFromLocal1.txt/Copied1.txtto/xubo@xubo:~/cloud/test/tachyon$../../tachyon-0.7.1/bin/tachyontfscat/1.t
KeepLearningBigData
·
2016-05-04 22:00
alluxio
Spark生态之Tachyon学习1---单机版搭建和运行(
Alluxio
)
ubuntu14.04Spark-1.5.2Tachyon-0.7.11.由于最近用的Spark-1.5.2系统默认的tachyon为0.7.1,在Spark-core的pom.xml可以查看另外虽然现在Tachyon改名为
Alluxio
bob601450868
·
2016-05-04 22:00
单机版搭建和运行Alluxio
博客模版
更多代码请见:https://github.com/xubo245/SparkLearning1解释2.代码:3.结果:参考【1】 http://
alluxio
.org/documentation/v0.7.1
bob601450868
·
2016-05-03 19:00
博客
Alluxio
源码分析:RPC框架浅析(三)
Alluxio
源码分析是一个基于内存的分布式文件系统,和HDFS、HBase等一样,也是由主从节点构成的。而节点之间的通信,一般都是采用的RPC通讯模型。
lipeng_bigdata
·
2016-03-25 16:00
Alluxio
源码分析:RPC框架浅析(一)
Alluxio
源码分析是一个基于内存的分布式文件系统,和HDFS、HBase等一样,也是由主从节点构成的。而节点之间的通信,一般都是采用的RPC通讯模型。
lipeng_bigdata
·
2016-03-25 14:50
Alluxio
Alluxio
源码分析:RPC框架浅析(一)
Alluxio
源码分析是一个基于内存的分布式文件系统,和HDFS、HBase等一样,也是由主从节点构成的。而节点之间的通信,一般都是采用的RPC通讯模型。
lipeng_bigdata
·
2016-03-25 14:00
New Technique: Tachyon (used memory instead of disk for HDFS)
-welcome-to-berkeley-where-hadoop-isnt-nearly-fast-enoughCopiedfrom http://www.oschina.net/p/tachyon
Alluxio
Firehotest
·
2016-03-24 22:00
Alluxio
源码分析定位策略:指定主机策略SpecificHostPolicy
指定主机策略SpecificHostPolicy是一种总是返回一个指定主机名的worker的定位策略。如果在那个主机名对应机器上没有活跃worker的话则返回null。在SpecificHostPolicy内部,封装了一个成员变量,如下://主机名 privatefinalStringmHostname; 这个mHostname就是SpecificHostPolicy策略实现所依赖
lipeng_bigdata
·
2016-03-24 13:00
Alluxio
源码分析定位策略:循环遍历策略RoundRobinPolicy
循环遍历策略RoundRobinPolicy是一种通过循环遍历方式并且跳过没有足够空间workers的为下一个数据块选择worker的策略。如果没有worker被找到,该策略会返回null。在RoundRobinPolicy内部,有三个十分重要的成员变量,如下://初始化的BlockWorkerInfo列表,每次都从这个列表中选择BlockWorkerInfo privateListmW
lipeng_bigdata
·
2016-03-24 11:00
Alluxio
源码分析定位策略:最大可用容量优先策略MostAvailableFirstPolicy
最大可用容量优先策略MostAvailableFirstPolicy是一种worker可用容量最大的定位策略。如果没有worker合格的话该策略返回null。它的核心方法getWorkerForNextBlock()实现如下:/** *Apolicythatreturnstheworkerwiththemostavailablebytes.Thepolicyreturnsnullifno
lipeng_bigdata
·
2016-03-24 10:00
Alluxio
源码分析定位策略:本地优先策略LocalFirstPolicy
LocalFirstPolicy是一个优先返回本地主机的定位策略,如果本地worker没有足够的容量,那么就会从活跃有效的workers列表随机选择一个worker用于每个块写入。在其内部,有一个关键的成员变量mLocalHostName,即本地主机名,它是用于选择本地本机worker的关键变量。其定义如下://本地主机名,用于选择本地本机worker的关键变量 privateStrin
lipeng_bigdata
·
2016-03-24 10:00
Alluxio
源码分析读数据:打开文件选项OpenFileOptions
OpenFileOptions是为读数据打开一个文件方法的选项,提供了打开文件的多种选择。在OpenFileOptions内部,封装了两个重要的成员变量,如下://定位策略 privateFileWriteLocationPolicymLocationPolicy; //读取类型 privateReadTypemReadType; 其中mLocationPolicy为FileWr
lipeng_bigdata
·
2016-03-23 20:00
alluxio
介绍与作用
一、介绍
Alluxio
Tachyon正式改名为
alluxio
,并发布v1.0.0版本,
alluxio
是内存高速虚拟分布式存储系统。
Lokihjl
·
2016-03-23 14:29
alluxio
alluxio
介绍与作用
一、介绍
Alluxio
Tachyon正式改名为
alluxio
,并发布v1.0.0版本,
alluxio
是内存高速虚拟分布式存储系统。
Lokihjl
·
2016-03-23 14:29
alluxio
Hadoop
Alluxio
之定位策略
Alluxio
提供定位策略,用于确定应该选择哪个Worker来存储文件数据块。
lipeng_bigdata
·
2016-03-21 21:00
Alluxio
之IO选项:读写类型
如果该数据不在本地Worker的
Alluxio
存储中,那么就将一个副本添加到本地
Alluxio
Worker中,用于每次完整地读取数据快。这是默认的读类型。
weixin_33849942
·
2016-03-21 21:00
Alluxio
之IO选项:读写类型
如果该数据不在本地Worker的
Alluxio
存储中,那么就将一个副本添加到本地
Alluxio
Worker中,用于每次完整地读取数据快。这是默认的读类型。
lipeng_bigdata
·
2016-03-21 21:00
Alluxio
层次化存储简介
一、分层存储种类 1、MEM(内存) 2、SSD(固态硬盘) 3、HDD(硬盘驱动器) 二、分层存储参数 1、
alluxio
.worker.tieredstore.levels
lipeng_bigdata
·
2016-03-21 17:00
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他