E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
sequencefile
hive存储格式
sequencefile
和rcfile的对比
创建
sequencefile
压缩表test2,使用insert overwritetabletest2select...语句将test1数据导入test2,设置配置项:sethive.exec.compress.output
czw698
·
2012-10-24 17:00
timeTunnel的学习
阅读更多采集数据(通过TT的clientAPI):APP直接写tailfiledbsyncdfswriter向HDFS写数据--向云梯写数据格式固定,
sequencefile
,基于key-valuestorm
jianchen
·
2012-09-25 19:00
hive
sequencefile
和rcfile 效率对比
创建
sequencefile
压缩表test2,使用insert overwritetabletest2select...语句将test1数据导入test2,设置配置项:sethive.exec.compress.output
wf1982
·
2012-09-17 17:00
table
domain
insert
byte
HDFS之
SequenceFile
和MapFile
HDFS提供了两种类型的容器,分别是
SequenceFile
和MapFile。一、SequenceFileSequenceFile的存储类似
mahout
·
2012-09-02 17:00
hdfs
小文件
sequenfile
浅析Hadoop文件格式
Hadoop中的文件格式1
SequenceFile
923534069
·
2012-08-25 16:38
hadoop
文件格式
利用
sequencefile
处理小文件实例
重写RecordReader:importjava.io.IOException; importorg.apache.hadoop.conf.Configuration; importorg.apache.hadoop.fs.FSDataInputStream; importorg.apache.hadoop.fs.FileSystem; importorg.apache.hadoop.fs.P
mahout
·
2012-08-21 09:00
sequenceFile
小文件
Sequencefile
文件结构
SequenceFile
是由二进制键值对组成的扁平文件。
SequenceFile
提供了writer、reader和sorter三种类来写、读和排序。
fanshadoop
·
2012-08-01 21:00
hadoop
SequenceFile
文件写入及各式分析
hadoopSequenceFile是一个由二进制形式key/value的字节流组成的存储文件,
SequenceFile
可压缩可切分,非常适合hadoop文件存储特性,
SequenceFile
的写入由
SequenceFile
.Writer
yyj0531
·
2012-07-06 16:22
hadoop
SequenceFile
hadoop
hadoop
SequenceFile
文件写入及各式分析
hadoop
SequenceFile
是一个由二进制形式key/value的字节流组成的存储文件,
SequenceFile
可压缩可切分,非常适合hadoop文件存储特性,
SequenceFile
的写入由
yyj0531
·
2012-07-06 16:22
hadoop
sequenceFile
SequenceFile
文件
SequenceFile
文件是Hadoop用来存储二进制形式的key-value对而设计的一种平面文件(FlatFile)。
xhh198781
·
2012-06-26 17:00
算法
hadoop
File
存储
Mahout K-means clustering 入门
Mahout下处理的文件必须是
SequenceFile
格式的,所以需要把txtfile转换成
sequenceFile
。
chenwq
·
2012-06-03 10:00
cluster
浅析Hadoop文件格式
Hadoop中的文件格式1
SequenceFile
江志伟
·
2012-05-28 00:00
Hadoop
SequenceFile
Writer And Reader
package cn.edu.xmu.dm.mpdemo.ioformat; import java.io.IOException; import java.net.URI; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org
chenwq
·
2012-05-19 15:00
sequence
Hadoop Archive解决海量小文件存储
另一个是HDFS中
SequenceFile
存储方式的讨论,利用Block压缩方式可以很好的解决空间压力。 HDFS中文件是按Block来存储的,默认一个Block的长度是128MB,当
chenwq
·
2012-05-18 21:00
hadoop
SequenceFile
在Hadoop中使用
概念:
SequenceFile
是一个由二进制序列化过的key/value的字节流组成的文本存储文件,它可以在map/reduce过程中的input/output的format时被使用。
flyingpig4
·
2012-05-18 12:00
数据结构
hadoop
算法
header
存储
compression
hive中间结果和结果的压缩
DEFLATE.deflate不不GzipgzipDEFLATE.gz不不ZIPzipDEFLATE.zip是是,在文件范围内bzip2bzip2bzip2.bz2不是LZOlzopLZO.lzo不不首先hive作业结果最好使用
sequencefile
inte_sleeper
·
2012-05-16 14:18
Hadoop
hive中间结果和结果的压缩
DEFLATE.deflate不不GzipgzipDEFLATE.gz不不ZIPzipDEFLATE.zip是是,在文件范围内bzip2bzip2bzip2.bz2不是LZOlzopLZO.lzo不不首先hive作业结果最好使用
sequencefile
inte_sleeper
·
2012-05-16 14:00
hadoop
脚本
table
作业
compression
Codec
【转】mahout应用kmeans进行文本聚类1之——输入输出分析
转:http://blog.csdn.net/aidayei/article/details/6674112 输入分析: mahout下处理的文件必须是
SequenceFile
格式的,所以需要把
jayghost
·
2012-05-13 22:00
Mahout
由nutch readseg -dump 中文编码乱码想到的……
两周前,我参考Hadoop权威指南2,写了一个读取
SequenceFile
的类,想读取Nutch抓取下来的segments文件。
jayghost
·
2012-05-13 22:00
Nutch
Hive 的扩展特性—自定义脚本、UDF和UDAF介绍
Hive是一个很开放的系统,很多内容都支持用户定制,包括:文件格式:TextFile,
SequenceFile
内存中的数据格式:JavaInteger/String,HadoopIntWritable/
luanwpp
·
2012-05-07 15:00
String
user
脚本
null
Integer
扩展
Hadoop SequcenceFile 处理多个小文件
利用
sequenceFile
打包多个小文件,MapFile是
sequenceFile
的排序形式,程序如下: public class testSequenceFile { public
Genie13
·
2012-04-29 11:00
hadoop
Hadoop开发常用的InputFormat和OutputFormat
nbsp;org.apache.hadoop.mapred.SequenceFileInputFormat”配置读的话,读入的数据显示的话为乱码,其实是因为读入的还是sequence file格式的,包括
sequencefile
·
2012-04-23 00:00
hadoop
hadoop下将大量小文件生成一个
sequenceFile
文件
1)遇到的问题,因为是在集群上运行,代码中StringseqFsUrl="hdfs://localhost:9000/user/mjiang/target-seq/sdfgz.seq";的localhost错误,于是老是出现连接不上的问题,(Retryingconnecttoserver:localhost/127.0.0.1:8020.Alreadytried0time(s).)所以运行程序时出
j3smile
·
2012-03-20 09:00
hadoop
String
File
存储
Path
byte
hadoop小文件操作之
SequenceFile
存储文件: import java.io.BufferedInputStream; import java.io.FileInputStream; import java.io.IOException; import java.io.InputStream; import java.net.URI; import org.apache.hadoop.conf.Co
lxm63972012
·
2012-02-29 12:00
hadoop
sequenceFile
hadoop 小文件
hadoop 小文件解决方案
基于Hadoop
Sequencefile
的小文件解决方案 一、 概述 小文件是指文件size小于HDFS上block大小的文件。
lxm63972012
·
2012-02-28 12:00
hadoop
基于HIVE文件格式的map reduce代码编写
阅读更多byhugh.wangp我们的数据绝大多数都是在HIVE上,对HIVE的
SEQUENCEFILE
和RCFILE的存储格式都有利用,为了满足HIVE的数据开放,hiveclient的方式就比较单一
hugh.wangp
·
2012-02-14 19:00
hive
sequencefile
rcfile
wordcount
mapreduce
基于HIVE文件格式的map reduce代码编写
阅读更多byhugh.wangp我们的数据绝大多数都是在HIVE上,对HIVE的
SEQUENCEFILE
和RCFILE的存储格式都有利用,为了满足HIVE的数据开放,hiveclient的方式就比较单一
hugh.wangp
·
2012-02-14 19:00
hive
sequencefile
rcfile
wordcount
mapreduce
基于HIVE文件格式的map reduce代码编写
byhugh.wangp 我们的数据绝大多数都是在HIVE上,对HIVE的
SEQUENCEFILE
和RCFILE的存储格式都有利用,为了满足HIVE的数据开放,hiveclient的方式就比较单一,直接访问
hugh.wangp
·
2012-02-14 19:00
mapreduce
hive
wordcount
sequenceFile
RcFile
HIVE文件存储格式的测试比较
HIVE的三种文件格式:TEXTFILE、
SEQUENCEFILE
、RCFILE中,TEXTFILE和
SEQUENCEFILE
的存储格式都是基于行存储的,RCFILE是基于行列混合的
hugh.wangp
·
2012-02-13 17:00
hive
文件格式
sequenceFile
RcFile
hadoop io Sequence, Map, Set, Array, BloomMap Files(译文)
hadoop 的
sequenceFile
文件为二进制的 K-V 对提供了可持久的数据结构。
dogegg250
·
2012-02-10 10:17
hadoop
职场
休闲
HDFS之
SequenceFile
和MapFile
HDFS提供了两种类型的容器,分别是
SequenceFile
和MapFile。一、SequenceFileSequenc
javaman_chen
·
2012-02-08 08:06
compression
存储
path
文档
mapreduce
header
hadoop
HDFS之
SequenceFile
和MapFile
HDFS提供了两种类型的容器,分别是
SequenceFile
和MapFile。一、SequenceFileSequenc
JavaMan_chen
·
2012-02-08 08:00
mapreduce
header
存储
文档
Path
compression
Hadoop Core 学习笔记(一)
SequenceFile
文件写入和读取Writable数据
本博客属原创文章,转载请注明出处:http://guoyunsky.iteye.com/blogs/1265944 刚接触Hadoop时,对
SequenceFile
和Writable还产生了一点联想
lwm_1985
·
2012-02-01 14:00
hadoop
String
File
user
null
Path
mahout中k-means例子的运行
首先简单说明下,mahout下处理的文件必须是
SequenceFile
格式的,所以需要把txtfile转换成
sequenceFile
。
lwm_1985
·
2012-01-31 10:00
mapreduce
hadoop
算法
input
download
output
hadoop
SequenceFile
详解
hadoop
SequenceFile
详解
SequenceFile
是一个由二进制序列化过的key/value的字节流组成的文本存储文件,它可以在map/reduce过程中的input
黎明lm
·
2012-01-05 15:00
hadoop
format
key
value
sequenceFile
mapreduce 编程
SequenceFile
类的使用
对于基于MapReduce的数据处理,将每个二进制数据的大对象融入自己的文件中并不能实现很高的可扩展性,针对上述情况,Hadoop开发了一组更高层次的容器
SequenceFile
。
zyj8170
·
2012-01-05 15:00
mapreduce
编程
String
serialization
Random
Path
Hadoop读取
sequencefile
和textfile文件内容
读取
sequencefile
,其中MockReporter是从Reporter接口派生出的一个假的reporter,它什么也不做(只实现那些接口):publicstaticListparseSequenceFile
inte_sleeper
·
2011-11-25 10:00
hadoop
String
list
null
Class
Path
Hadoop Core 学习笔记(一)
SequenceFile
文件写入和读取Writable数据
guoyunsky.iteye.com/blog/1265944 欢迎加入Hadoop超级群: 180941958 刚接触Hadoop时,对
SequenceFile
guoyunsky
·
2011-11-18 16:00
sequence
Hadoop Core 学习笔记(一)
SequenceFile
文件写入和读取Writable数据
guoyunsky.iteye.com/blog/1265944 欢迎加入Hadoop超级群: 180941958 刚接触Hadoop时,对
SequenceFile
guoyunsky
·
2011-11-18 16:00
sequence
Hive 的可拓展性
文章转自:http://www.chinaovo.net/hive/295.htm Hive是一个很开放的系统,很多内容都支持用户定制,包括:文件格式:TextFile,
SequenceFile
内存中的数据格式
tylgoodluck
·
2011-11-17 09:00
mapreduce读取
sequencefile
文件中的数据
sequencefile
中的数据是以key,value对存储的。通过mapreduce模式,可以读取
sequencefile
中的数据。
ludengji
·
2011-10-24 17:00
mapreduce
String
File
存储
Class
Path
hadoop
SequenceFile
读取例程注释
importjava.io.IOException; importjava.net.URI; importorg.apache.hadoop.conf.Configuration; importorg.apache.hadoop.fs.FileSystem; importorg.apache.hadoop.fs.Path; importorg.apache.hadoop.io.IOUtils;
lilin_xdu
·
2011-08-18 22:00
hadoop
String
null
Class
Path
import
hadoop
SequenceFile
写入例程注释
importjava.io.IOException;importjava.net.URI;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.FileSystem;importorg.apache.hadoop.fs.Path;importorg.apache.hadoop.io.IOUtils;importo
lilin_xdu
·
2011-08-18 21:00
hadoop
String
null
Class
Path
import
mahout应用kmeans进行文本聚类1之——输入输出分析
输入分析:mahout下处理的文件必须是
SequenceFile
格式的,所以需要把txtfile转换成
sequenceFile
,而聚类必须是向量格式的,mahout提供下面两个命令来将文本转成向量形式
aidayei
·
2011-08-09 22:00
存储
终端
SequenceFile
的不足
SequenceFile
的Reader用于读取
sequencefile
文件。
bupt041137
·
2011-06-20 21:21
hadoop
hive
SequenceFile
的不足
SequenceFile
的Reader 用于读取
sequencefile
文件。
bupt04406
·
2011-06-20 21:00
sequence
Hive - QTestUtil.java
srcTables: "src","src1","srcbucket","srcbucket2","src_json","src_thrift", "src_
sequencefile
bupt041137
·
2011-06-18 18:00
hive - bug
CREATE TABLE part_test (key STRING, value STRING) PARTITIONED BY (ds STRING) STORED AS
SEQUENCEFILE
;
bupt04406
·
2011-06-03 10:00
hive
SequenceFile
解决hadoop小文件问题
SequenceFileFormats2010-10-2718:50 OverviewSequenceFile isaflatfileconsistingofbinarykey/valuepairs.Itisextensivelyusedin MapReduce asinput/outputformats.Itisalsoworthnotingthat,internally,thetemporar
wf1982
·
2011-05-12 18:00
hadoop
存储
Path
import
byte
compression
hdfs上的append测试
hbase在写入数据之前会先写hlog,hlog目前是
sequencefile
格式,采用append的方式往里追加数据。之前团队的同学测试关闭hlog会一定程序上提升写hbase的稳定性。
lc_koven
·
2011-05-04 23:00
hbase
ITeye
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他