E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
textfile
浅谈一个新人的大数据之路-ORC篇
**ORCFile演变史***
TEXTFile
->列式存储->RCFile->ORCFile****本文会从
CCCCCColdkl
·
2023-03-22 06:38
Hive 存储格式详解
存储格式Hive支持的存储数的格式主要有:
TEXTFILE
(行式存储)、SEQUENCEFILE(行式存储)、ORC(列式存储)、PARQUET(列式存储)。
响彻天堂丶
·
2023-03-19 11:20
大数据组件
hive
大数据
hadoop
问题集
1.dataframe.mode(“overwrite”)的使用2.3.scalacasewhen4.什么情况下,spark可以通过.
textFile
()读取压缩包中的数据5.HDFS如何打包文件
解宏斌
·
2023-03-16 23:02
RDD分区数量
服务器是2vcoremaster-local[5]那么:1.parallelize(list,numSlices=5)分区数由numSlices参数决定,如果没有指定该参数,则由local[5]决定2.
textFile
kangwq2017
·
2023-03-15 12:04
hadoop
hadoop
spark
Metastore格式和分隔符
Hive目前支持的数据格式包括
TextFile
、SequenceFile、RCFile、Avro、ORC和Parquet,同时可以自定义INPUTFORMAT和OUTPUTFORMAT来支持其他格式。
此间少年仍犹在
·
2023-03-13 12:10
Spark-RDD持久化
(1)persist算子使用方法:varrdd=sc.
textFile
("test")rdd=rdd.persist(StorageLevel.MEMORY_ONLY)valcount=rdd.count
zhangMY12138
·
2023-03-12 08:46
Spark
Hive优化篇-Hive数据存储格式
Hive数据存储常用的格式如下:行式存储文本格式(
TextFile
)二进制序列化文件(Sequen
顶尖高手养成计划
·
2023-02-18 07:47
Hive
hive
大数据
hadoop
Spark 数据读取保存
Text文件、Json文件、csv文件、Sequence文件以及Object文件文件系统:本地文件系统、HDFS、Hbase以及数据库1.读写text/hdfs文件text/hdfs类型的文件读都可以用
textFile
风老魔
·
2023-02-06 19:33
大数据
spark
scala
大数据
spark 入门
mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-3.2.1/启动方式举例:将spark3.x的tar包上传linux,解压进入bin目录1运行spark-shell(本地模式),进行简单的wcsc.
textFile
乘以零
·
2023-02-06 03:30
textFile
构建RDD的分区及compute计算策略
1,textFileA),第一点,就是输入格式,key,value类型及并行度的意义。deftextFile(path:String,minPartitions:Int=defaultMinPartitions):RDD[String]=withScope{assertNotStopped()//输入文件的格式TextInputFormat,key的类型LongWritable,value的类型T
浪尖聊大数据-浪尖
·
2023-02-03 12:00
Spark源码-spark算子-1-构建RDD的算子
构建RDD的算子1.概述2.RDD创建方式2.1.根据驱动程序中现有并行化集合创建RDD2.1.1.parallelize方式创建RDD2.2.根据外部存储系统中的数据集创建RDD2.2.1.
textFile
zdaiqing
·
2023-02-03 12:26
源码
Spark
大数据
spark
大数据
scala
spark的wordcount创建了几个RDD
setAppName("ScalaWordCount").setMaster("local[4]")valsc=newSparkContext(conf)vallines:RDD[String]=sc.
textFile
越走越远的风
·
2023-02-01 19:02
jupyter转html无图片,Spark + jupyter notebook出现图像无法显示问题解决
最近在使用Python学习user_data=sc.
textFile
("/home/iteblog/ml-100k/u.user")user_fields=user_data.map(lambdaline
宛丘之
·
2023-01-31 14:38
jupyter转html无图片
spark学习笔记
setAppName(this.getClass.getCanonicalName.init).setMaster("local[*]")valsc=newSparkContext(conf)vallines=sc.
textFile
hadoop_qin
·
2023-01-29 17:47
spark的wordcount
importrerdd=sc.
textFile
("xx.txt")resultRdd=rdd.flatMap(lambdaline:re.split("|,|[|]|#|'|:",line)).map(
不将就_215a
·
2023-01-28 14:00
HIVE基础
HIVE特征Hive只适合用来做海量离线数据统计分析,也就是数据仓库Hive中所有的数据都存储在HDFS中,没有专门的数据存储格式,因为Hive是读模式(SchemaOnRead),可支持
TextFile
甄知一二
·
2023-01-13 17:34
hive
hive
数据库
大数据
HIVE数据的压缩与存储格式
2.2.1Gzip压缩2.2.2Bzip2压缩2.2.3Lzo压缩2.2.4Snappy压缩2.3压缩参数配置3开启Map输出阶段压缩4开启Reduce输出阶段压缩5文件存储格式5.1列式存储和行式存储5.2
TextFile
巴涅波赫夫
·
2022-12-30 08:13
大数据
hive
hadoop
大数据
Coursera课程Big Data Analysis with Scala and Spark Week 1笔记
RDD大数据的helloworld程序:wordcountvalrdd=spark.
textFile
("hdfs://...")valcount=rdd.flatMap(line=>line.
zhang35
·
2022-12-29 10:05
大数据技术栈
spark
大数据
pyspark示例
frompysparkimportSparkContexttextFile=SparkContext().
textFile
("/data/test01.txt")wordCount=(
textFile
.flatMap
春天花会开3
·
2022-12-26 15:41
spark
大数据
silvaco用户手册学习1——Getting Started with Atlas
Atlas的Inputs和Outputsinputfiles:
textfile
:包含要执行At
桐桐花
·
2022-12-23 05:25
Silvaco
TCAD仿真
仿真
spark scala dataset、dataframe、RDD 、SQL使用
toData[caseclass]dataset[String]toDataset[ThrDynamicRowV001]`valds:Dataset[ThrDynamicRowV001]=spark.read.
textFile
qq_18617299
·
2022-12-18 19:42
spark
大数据
spark
java
scala
【大数据技术Hadoop+Spark】Spark RDD创建、操作及词频统计、倒排索引实战(超详细 附源码)
我们通过Spark中的SparkContext对象调用
textFile
()方法加载数据创建RDD。
showswoller
·
2022-12-18 10:57
大数据
hadoop
spark
scala
RDD
Spark读取单路径及多路径下的文件
1sparkContext方式读取文件spark.sparkContext.
textFile
方法返回一个rdd。
盛源_01
·
2022-12-15 11:02
spark
spark
mac系统下excel打开csv中文乱码
的确,用numbers和
textFile
打开csv文件,或者在mac里采用预览模式时,是不会出现中文乱码的。而用excel打开csv,就出现了乱码,那问题只能出在excel身上。
yellowsheep96
·
2022-12-06 21:44
excel
csv
mac
乱码
Jupyter Notebook —— 新建文档
注释:Python3:python文件
TextFile
:文本文件Folder:文件夹Terminal:终端二.给文档命名/修改名字参照(一)建好文档,单击左上角的如下图所示AlexNet(作者已改名,非默认
Ensoleile。
·
2022-12-05 20:00
深度学习
Python
jupyter
python
深度学习
快速了解HIVE文件存储格式
快速了解HIVE文件存储格式一列式存储和行式存储二
TEXTFILE
格式三SequenceFilea、SequenceFile优缺点b、SequenceFile格式1、未压缩格式2、基于record压缩格式
真香IT
·
2022-11-29 16:04
Linux
大数据
hive
hadoop
大数据
hive 支持的文件格式
hive支持的文件格式hive支持的文件格式
TEXTFILE
格式SEQUENCEFILE格式RCFILE文件格式hive支持的文件格式Hive文件存储格式包括以下几类:1、
TEXTFILE
2、SEQUENCEFILE3
Joie.
·
2022-11-29 16:31
hadoop
Spark读取本地文件写法
aa\bb\cc.txtvalconf=newSparkConf().setAppName("").setMaster("local[*]")valsc=newSparkContext(conf)sc.
textFile
sghuu
·
2022-11-29 11:19
spark
spark
大数据
分布式
Spark中sc.
textFile
()读取文件路径
sc.
textFile
()路径问题已知这里我看黑马中的Pyspark,读取本地文件可以直接使用相对路径成功sc.
textFile
("相对路径")但是我这样使用就报路径错误不加file:///就默认HDFS
JStana
·
2022-11-27 20:01
Bug记录
spark
大数据
分布式
Linux面试常考命令
cat命令把
textfile
1的文档内容加
yanghaoplus
·
2022-11-22 23:39
Linux
linux
服务器
运维
面试
开发spark程序笔记
(非惰性可能占用大量内存)1.生成RDD1)从本地文件生成RDD命令:
textFile
(URI)例如:2)从hdfs文本文件生成RD
彤小彤_tong
·
2022-11-19 09:39
spark
scala
大数据
Spark中的数据读取保存和累加器实例详解
1)基本语法(1)数据读取:
textFile
(String)(2)数据保存:saveAsTextFile(String)2)实现代码demo如下:ob
·
2022-11-03 13:53
【PYTHON程序设计】期中准备
需要把编码改成UTF-8
textFile
=open("D://coder//randomnumbers//txt//jingu.txt
仿生程序员会梦见电子羊吗
·
2022-11-01 07:43
信息管理与信息系统
python
Hive数据存储格式
Hive支持的存储数的格式主要有:
TEXTFILE
(默认格式)、SEQUENCEFILE、RCFILE、ORCFILE、PARQUET。
悠然予夏
·
2022-10-18 10:36
Hadoop生态圈技术
大数据
hdfs
hive
hadoop
Clickhouse系列之整合Hive数据仓库示例详解
目录前言正文实战案例ORC数据格式Parquet数据格式
TextFile
数据格式总结前言什么是Hive?ApacheHive数据仓库软件便于使用SQL读取、写入和管理驻留在分布式存储中的大型数据集。
·
2022-10-14 23:41
Hive数据格式-ORC
比如我们表格中有abc三列,像mysql按行存储则如下所示逻辑存储格式大数据引擎存储中,大部分都是采用列式存储,比如Hive、Hbasea、b、c各列数据会集中存放在一起,如下所示标准列式存储Hive中
textfile
那些年搬过的砖
·
2022-09-24 21:27
大数据之Python入门语法基础
语言完成同样一个任务c语言1000行java100行scala/python20行面向过程及面向对象的语言同scala语言wordcountMapReduce基于spark使用scala进行wordcountsc.
textFile
梦子mengy7762
·
2022-09-24 16:28
爬虫
数据分析
python
大数据
python
java
hadoop
编程语言
Hive-文件存储格式+压缩算法
image.png前置知识点行存储:适合插入列存储:适合查询存储格式
textFile
文本sequenceFile二进制parquet列式存储二进制(自带索引)orc格式(最好)ORC不是一个单纯的列式存储格式
Eqo
·
2022-09-17 11:01
hive查询报错:Invalid postscript
目录问题描述:定位原因:解决方案:问题描述:sqoop命令导入数据后查询数据表报错Invalidpostscript定位原因:要导入的表是以orc格式存储的,直接导入的数据是txt文件解决方案:将导入的表改为
textfile
chimchim66
·
2022-09-15 12:44
踩坑记录
hive
hadoop
数据仓库
Hive中的文件存储格式
TEXTFILE
、SEQUENCEFILE、RCFILE、ORCFILE、Parquet 和 AVRO使用与区别详解
前言Hive中常用的文件存储格式有:
TEXTFILE
、SEQUENCEFILE、RCFILE、ORC、PARQUET,AVRO。
皮哥四月红
·
2022-08-25 10:53
Hive
hive
对hive二进制存储格式,即SequenceFile和RCFile的思考总结
2.
TextFile
,SequenceFile,RCFile是hive常用的三种存储格式。其中,
TextFile
是hive默认的存储格式,SequenceFile和RCFile是二进制存储格式。
自封的羽球大佬
·
2022-08-25 10:49
Hive
hive
SequenceFile
RCFile
【Hive】(二十一)
textfile
、sequencefile 和 rcfile 的使用与区别详解
一、引言hive在创建表时默认存储格式是
textfile
,或者显示自定义的storedastextfile。
云 祁
·
2022-08-25 10:16
#
----
Hive
hive
详解hive常见表结构
目录hive简介1.外部表2.内部表3.分区表1.静态分区2.动态分区4.分桶表1.抽样2.map-sidejoin5.表的文件存储格式1.
TEXTFILE
2.SEQUENCEFILE3.RCFILE4
·
2022-08-11 11:16
hive常见表结构
目录1.外部表2.内部表3.分区表1.静态分区2.动态分区4.分桶表1.抽样2.map-sidejoin5.表的文件存储格式1.
TEXTFILE
2.SEQUENCEFILE3.RCFILE4.ORC5.
q495673918
·
2022-08-10 13:03
hive
hive
hadoop
数据仓库
Hive存储格式对执行效率的影响
新世界来的像梦一样,让我暖洋洋Hive支持的存储方式hive支持的存储方式有很多,在平常的练习中,用的最多的还是
textfile
.在本篇博客中,不会过度的去讲解每个存储格式的特点以及存储格式的讲解。
数仓白菜白
·
2022-07-12 09:52
hive基础
hive
hadoop
big
data
关于Hive中的存储格式及压缩格式详解
Hive支持的存储数据的格式主要有:
TEXTFILE
文本格式
Keven He
·
2022-07-12 09:51
#
Hive
hive
hadoop
big
data
hive 数据存储格式详解
Hive的三种文件格式:
TEXTFILE
、SEQUENCEFILE、RCFILE中,
TEXTFILE
和SEQUENCEFILE的存储格式都是基于行存储的,RCFILE是基于行列混合的思想,先按行把数据划分成
weixin_34018202
·
2022-07-12 09:50
大数据
HIVE存储格式详解
目前hive常用的存储格式STOREDAS(
TextFile
|RCFile|SequenceFile|AVRO|ORC|Parquet)
TEXTFILE
,SEQUENCEFILE,RCFILE,ORC,
weixin_30551947
·
2022-07-12 09:50
大数据
hive 修改表的存储格式_Hive表的文件存储格式详解和相关性能分析
hive文件存储格式和创建语句hive文件存储格式包括以下几类:1、
TEXTFILE
2、SEQUENCEFILE3、RCFILE4、ORCFILE(0.11以后出现)其中
TEXTFILE
为默认格式,建表时不指定默认为这个格式
英语主播皮卡丘
·
2022-07-12 09:50
hive
修改表的存储格式
详解:Hive的存储格式与对比
confluence/display/Hive/FileFormats对于很多的东西,还是你要多多观看官网,更加权威,一:行式存储和列式存储在这之前先补充一个概念:二:TestFile这个就是普通的文本格式,
TextFile
墨卿风竹
·
2022-07-12 09:19
详解:Hive的存储格式与对比
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他