parquet 第22页

Hive Parquet配置

parquet的配置主要包括：parquet.compressionparquet.block.sizeparquet.page.size等，详见：https://github.com/Parquet/

bhq2010·2015-01-30 22:00

【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式

Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"

bit1129·2015-01-10 12:00

【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式

Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"

bit1129·2015-01-10 12:00

【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式

Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"

bit1129·2015-01-10 12:00

Drill：企业级Hadoop和NoSQL的SQL查询引擎

·2015-01-08 00:00

Spark SQL之External DataSource外部数据源（一）示例

u014388509·2014-12-22 01:00

从NSM到Parquet：存储结构的衍化

如优化Hive性能的RCFile，以及配合Impala实现出GoogleDremel功能(类似甚至是功能的超集)的Parquet等。今天就来一起学习一下HDFS中数据存储的进化历程。

dc_726·2014-12-06 19:00

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

最近主要在研究大数典型应用adhocquery，要实现秒级的adhocquery，通常有3种思路：1、用搜索技术，将查询都建立索引，然后用搜索技术来实现。这种技术目前主要限制是索引建立和存储成本高，索引建立不及时，例如支付宝的higo。2、实时计算，对不能指定维度的查询，理论上认为是实时计算，每个列上建立函数索引，这种典型的代表是mesa。关于mesa，前面我有篇简单的介绍性文章《mesa介绍:g

jiezhu2007·2014-11-15 19:39

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

最近主要在研究大数典型应用adhoc query，要实现秒级的adhoc query，通常有3种思路：1、用搜索技术，将查询都建立索引，然后用搜索技术来实现。这种技术目前主要限制是索引建立和存储成本高，索引建立不及时，例如支付宝的higo。2、实时计算，对不能指定维度的查询，理论上认为是实时计算，每个列上建立函数索引，这种典型的代表是mesa。关于mesa，前面我有篇简单的介绍性文章《mesa介绍

jiezhu2007·2014-11-15 19:00

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

jiezhu2007·2014-11-15 19:00

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

jiezhu2007·2014-11-15 19:00

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

最近主要在研究大数典型应用adhoc query，要实现秒级的adhoc query，通常有3种思路：1、用搜索技术，将查询都建立索引，然后用搜索技术来实现。这种技术目前主要限制是索引建立和存储成本高，索引建立不及时，例如支付宝的higo。2、实时计算，对不能指定维度的查询，理论上认为是实时计算，每个列上建立函数索引，这种典型的代表是mesa。关于mesa，前面我有篇简单的介绍性文章《mesa介绍

jiezhu2007·2014-11-15 19:00

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

jiezhu2007·2014-11-15 19:00

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

jiezhu2007·2014-11-15 19:00

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

jiezhu2007·2014-11-15 19:00

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

jiezhu2007·2014-11-15 19:00

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

jiezhu2007·2014-11-15 19:00

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

最近主要在研究大数典型应用adhoc query，要实现秒级的adhoc query，通常有3种思路：1、用搜索技术，将查询都建立索引，然后用搜索技术来实现。这种技术目前主要限制是索引建立和存储成本高，索引建立不及时，例如支付宝的higo。2、实时计算，对不能指定维度的查询，理论上认为是实时计算，每个列上建立函数索引，这种典型的代表是mesa。关于mesa，前面我有篇简单的介绍性文章《mesa介绍

jiezhu2007·2014-11-15 19:00

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

jiezhu2007·2014-11-15 19:00

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

jiezhu2007·2014-11-15 19:00

sparkSQL1.1入门之十：总结

SchemaRDDRuleTreeLogicPlanParserAnalyzerOptimizerSparkPlan运行架构：sqlContext运行架构hiveContext运行架构基本操作原生RDD的操作parquet

book_mmicky·2014-10-23 11:00

spark中的SQL

其二，支持Parquet文件的读写，且保留Schema。其三，能在Scala代码里访问Hive元数据，能执行Hive语句，并且把结果取回作为

hao707822882·2014-10-22 19:00

Spark学习笔记-SparkSQL-1

SchemaRDD可以通过RDD、Parquet文件、JSON文件、或者通过使用hiveql查询hive数据来建立。

wulinshishen·2014-09-21 23:00

sparkSQL1.1入门之六：sparkSQL之基础应用

SchemaRDD可以通过RDD、Parquet文件、JSON文件、或者通过使用hiveql查询hive数据来建立。

book_mmicky·2014-09-10 09:00

Spark SQL编程指南

JavaSchemaRDD可以通过一个已存在的RDD，Parquet文件，JSON

十一月不远·2014-08-27 21:00

Hive中配置Parquet(CDH4.3)

CDH4.3版本中并没有提供现成的Parquet安装包，所以如果在Hive或Impala中需要使用Parquet格式，需要手动进行安装，当创建Parquet格式的表时，需要定义Parquet相关的InputFormat

wangxucumt·2014-08-27 09:00

Hive中配置Parquet(CDH4.3)

CDH4.3版本中并没有提供现成的Parquet安装包，所以如果在Hive或Impala中需要使用Parquet格式，需要手动进行安装，当创建Parquet格式的表时，需要定义Parquet相关的

wangxucumt·2014-08-27 09:00

Impala 表使用 Parquet 文件格式

目录[-]Impala表使用Parquet文件格式在Impala中创建Parquet表加载数据到Parquet表ImpalaParquet表的查询性能Parquet表的分区Parquet数据文件的Snappy

原创学无止尽·2014-04-12 12:23

Spark SQL组件源码分析

其二，支持Parquet文件的读写，且保留Schema。其三，能在Scala代码里访问Hive元数据，能执行Hive语句，并且把结果取回作为

zbf8441372·2014-03-22 14:00

Impala 表使用 Parquet 文件格式

Impala表使用Parquet文件格式Impala帮助你创建、管理、和查询Parquet表。

weiqingbin·2014-01-20 12:00

CF-26C - Parquet（涂色分区）

C-ParquetCrawlinginprocess...CrawlingfailedTimeLimit:2000MSMemoryLimit:262144KB64bitIOFormat:%I64d&%I64uSubmitStatusPracticeCodeForces26CDescriptionOnceBobdecidedtolayaparquetfloorinhislivingroom.Thel

nealgavin·2013-02-04 22:00

推荐频道

parquet

Hive Parquet配置

【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式

【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式

【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式

Drill：企业级Hadoop和NoSQL的SQL查询引擎

Spark SQL之External DataSource外部数据源（一）示例

从NSM到Parquet：存储结构的衍化

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

一套数据，多种引擎续---两种数据格式（Parquet/ORCfile）浅析

sparkSQL1.1入门之十：总结

spark中的SQL

Spark学习笔记-SparkSQL-1

sparkSQL1.1入门之六：sparkSQL之基础应用

Spark SQL编程指南

Hive中配置Parquet(CDH4.3)

Hive中配置Parquet(CDH4.3)

Impala 表使用 Parquet 文件格式

Spark SQL组件源码分析

Impala 表使用 Parquet 文件格式

CF-26C - Parquet（涂色分区）