E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hive分区表
Hive
导入数据的五种方法
在
Hive
中建表成功之后,就会在HDFS上创建一个与之对应的文件夹,且文件夹名字就是表名;文件夹父路径是由参数
hive
.metastore.warehouse.dir控制,默认值是/user/
hive
/
冬瓜的编程笔记
·
2024-01-15 12:04
大数据
hive
hadoop
数据仓库
大数据开发之
Hive
(压缩和存储)
第9章:压缩和存储
Hive
不会强制要求将数据转换成特定的格式才能使用。
Key-Key
·
2024-01-15 12:34
大数据
hive
hadoop
大数据开发之
Hive
(企业级调优)
第10章:企业级调优创建测试用例1、建大表、小表和JOIN后表的语句//创建大表createtablebigtable(idbigint,tbigint,uidstring,keywordstring,url_rankint,click_numint,click_urlstring)rowformatdelimitedfieldsterminatedby'\t';//创建小表createtable
Key-Key
·
2024-01-15 12:34
大数据
hive
hadoop
大数据开发之
Hive
(统计影音视频网站的常规指标)
第11章:
Hive
实战11.1数据结构1、视频表字段备注详细描述videoId视频唯一id(String)11位字符串uploader视频上传者(String)上传视频的用户名Stringage视频年龄
Key-Key
·
2024-01-15 12:34
大数据
hive
hadoop
大数据开发之
Hive
(基本概念、安装、数据类型、DDL数据定义、DML数据操作)
第1章:
Hive
基本概念1.1
Hive
1.1.1
Hive
产生背景HDFS来存储海量的数据、MapReduce来对海量数据进行分布式并行计算、Yarn来实现资源管理和作业调度。
Key-Key
·
2024-01-15 12:04
大数据
hive
hadoop
大数据开发之
Hive
(查询、
分区表
和分桶表、函数)
第6章:查询6.1基本语法及执行顺序1、查询语句语法select_expr,select_expr,...FROMtable_reference[WHEREwhere_condition][GROUPBYcol_list][ORDERBYcol_list][CLUSTERBYcol_list|[DISTRIBUTEBYcol_list][SORTBYcol_list]][LIMITnumber]2
Key-Key
·
2024-01-15 12:04
大数据
hive
hadoop
大数据开发之
Hive
(详细版,最后有实战训练)
第1章:
Hive
基本概念1.1
Hive
1.1.1
Hive
产生背景HDFS来存储海量的数据、MapReduce来对海量数据进行分布式并行计算、Yarn来实现资源管理和作业调度。
Key-Key
·
2024-01-15 12:29
hive
hadoop
大数据
dpkg-deb: error: paste subprocess was killed by signal (Broken pipe)
:pastesubprocesswaskilledbysignal(Brokenpipe)Errorswereencounteredwhileprocessing:/var/cache/apt/arc
hive
s
joker-wt
·
2024-01-15 12:11
Ubuntu系统跳坑指南
ubuntu
linux
运维
在Ubuntu中安装node.js工具
2.更新系统的软件包列表:sudoaptupdate3.安装Node.js的PPA(PersonalPackageArc
hive
):sudoaptinstall-ycurlsoftware
~半城
·
2024-01-15 12:36
ubuntu
node.js
linux
dpkg-deb: error: paste subprocess was killed by signal
但最有效)sudodpkg-i--force-overwrite"报错的package路径"sudoapt-finstall其中,我电脑报错package的路径是:/var/cache/apt/arc
hive
s
秋雨梧桐落满阶
·
2024-01-15 12:34
linux
运维
服务器
dpkgdeb: error: paste subprocess was killed by signal (Broken pipe) 错误解决方法
错误描述dpkg:errorprocessingarc
hive
/var/cache/apt/arc
hive
s/mongodb-org-server_4.2.19_amd64.deb(--unpack):
astronautyi
·
2024-01-15 12:34
ubuntu
linux
运维
sudo apt-get -f install报错dpkg-deb: error: subprocess paste was killed by signal (Broken pipe) wine
终端执行:sudodpkg-i--force-overwrite相关路径如:sudodpkgautoremove/var/cache/apt/arc
hive
s/wine1.6_1%3a1.6.2-0ubuntu14.2
今年不吃饭...
·
2024-01-15 12:33
ubuntu
报错显示:dpkg-deb: error: paste subprocess was killed by signal (Broken pipe)
deb.nodesource.com/setup_18.x|sudo-Ebash-结果出现报错显示Errorswereencounteredwhileprocessing:/var/cache/apt/arc
hive
s
~半城
·
2024-01-15 12:02
linux
运维
服务器
Datax同步(高可用HDFS版本)
这是一个mysql同步到
hive
的json脚本,
hive
的底层使用的是HDFS存储,同步到
hive
,只能用hdfswritermysql->
hive
{"job":{"setting":{"speed":
暴走的贼宇
·
2024-01-15 12:59
hdfs
hadoop
大数据
postgresql12 客户端命令浅析
这里写自定义目录标题potgresql12客户端命令参数浅析pg_arc
hive
cleanuppg_configpg_dumpallpg_dumppg_restorepg_basebackuppg_resetwalpg_test_fsyncpg_controldatapg_recvlogicalpg_isreadypg_test_timingpgbenchpg_rewindpg_upgradeva
不上进的菜鸟
·
2024-01-15 10:03
postgresql
Zookeeper教程1
Zookeeper翻译过来就是动物园管理员,他是用来管Hadoop(大象)、
Hive
(蜜蜂)、Pig(小猪)的管理员。简称zkZookeeper是一个分布式的、开源的分布式应用程序的协调服务。
暗雪之格
·
2024-01-15 09:56
Zookeeper
zookeeper
分布式
云原生
Cloudera公司的CDH与HDP均无法下载问题(403 Forbidden (varnish) the provided credentials were incorrect)
2.解决方法使用开源的Apache的相关软件包http://arc
hive
.apache.org/dist/CDH&Ambari安装包百度云
小宇0926
·
2024-01-15 07:41
大数据平台搭建
cloudera
pipeline制品 arc
hive
Artifacts
脚本pipeline{agentanyoptions{timestamps()}stages{stage('getcode'){steps{checkout([$class:'GitSCM',branches:[[name:'*/master']],doGenerateSubmoduleConfigurations:false,extensions:[],submoduleCfg:[],userR
野猪佩挤
·
2024-01-15 06:54
Jenkins
Hadoop2.9.2在windows上的安装
1、下载hadoop-2.9.2.tar.gz官网下载地址:http://arc
hive
.apache.org/dist/hadoop/common/hadoop-2.9.2/hadoop-2.9.2.
懵懂无知的蜗牛
·
2024-01-15 06:30
hadoop
Android Studio 历史版本下载
AndroidStudiodownloadarc
hive
s|AndroidDevelopers官网提供的历史版本下载
阿启
·
2024-01-15 05:39
android
studio
android
ide
Hive
的Join操作
JOINON和WHERE条件区别7.其他常用SQL操作7.1不同数据类型判断空7.2排序或JOIN或Groupby字段空值导致结果问题7.3JOIN操作导致数据膨胀8.SemiJoin和AntiJoin9.
Hive
黄土高坡上的独孤前辈
·
2024-01-15 04:23
Hive/Kylin数据仓库
Mysql
Utils
sql
Hive
mapreduce的map与reduce个数由什么决定?
3.ReduceTask的数量决定3.1在执行
hive
shell的时候可以看到下列日志3.2官网对这三个
黄土高坡上的独孤前辈
·
2024-01-15 04:22
Hive/Kylin数据仓库
hive
项目实战-知行教育大数据分析平台-01
什么是事实表与维度表3、事实表与维度表的分类4、维度建模的三种模型5、缓慢渐变维七、本项目数仓架构八、HUE的使用九、自动化调度工具介绍十、通过HUE操作oozie本文将利用前面所学的Linux,Hadoop,
Hive
吆喝的翅膀
·
2024-01-15 04:22
python+大数据学习
数据仓库
教育电商
hive
hadoop
cloudera
Hive
QL快速使用
hive
命令包括
Hive
cli和
hive
QL命令
Hive
clicli就是命令行界面,可以通过cli创建表,检查模式和查询表。
Tim在路上
·
2024-01-15 02:31
clickhouse常规的优化方法
一、建表优化1.1日期字段避免使用String存储建表时能用数值型或日期时间型表示的字段就不要用字符串,全String类型在以
Hive
为中心的数仓建设中常见,但ClickHouse环境不应受此影响。
运维仙人
·
2024-01-15 01:08
大数据
clickhouse
大数据
大数据StarRocks(六) :Catalog
外部数据:指保存在外部数据源(如Apache
Hive
™、ApacheIceberg、ApacheHudi、DeltaLake、JDBC)中的数据。2.Catalog当前StarRocks提供两
运维仙人
·
2024-01-15 01:07
大数据
大数据
starrocks
Oracle—数据恢复
文档结构1、恢复原理1.1、recyclebin(回收站)相关操作1.2、arc
hive
dredo(归档日志)1.3、supplementallog(补充日志)2、恢复场景2.1、定义删除2.2、记录删除
蓝魔Y
·
2024-01-15 01:46
数据库
Oracle
数据恢复
附加日志
【大数据进阶第三阶段之Hue学习笔记】Hue简介和架构介绍
通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例如操作HDFS上的数据、运行MapReduceJob、执行
Hive
的SQL语句
Allen_lixl
·
2024-01-15 00:56
大数据
Hue
大数据
学习
笔记
hadoop
hue
索引下推(ICP)的应用条件
如果表访问的类型为range、ref、eq_ref和ref_or_null可以使用索引下推ICP可以用于InnoDB和MyISAM表,包括
分区表
InnoDB和MyISAM表对于InnoDB表,ICP仅用于二级索引
結城
·
2024-01-14 23:19
mysql
sql
数据库
mysql
iOS工具--解压缩
搜索了一下发现有一个压缩与解压zip文件的第三方“SSZipArc
hive
”:https://github.com/ZipArc
hive
/ZipArc
hive
是用C语言实现的,包装用于OC与swift.
半缘魔君
·
2024-01-14 22:03
大数据-
hive
函数与mysql函数的辨析及练习-将多行聚合成一行
目录1.collect_list:聚合-不去重2.collect_set(col):聚合-去重3.mysql的聚合函数-group_concat4.leetcode练习题1.collect_list:聚合-不去重将组内的元素收集成数组不会去重2.collect_set(col):聚合-去重函数只接受基本数据类型,它的主要作用是将某字段的值进行去重汇总,产生Array类型字段。//创建一张实验用表,
王哪跑nn
·
2024-01-14 21:29
大数据
hive
hadoop
数据仓库
mysql 批量别名_mysql - 批量将别名应用于MYSQL中的表列 - 堆栈内存溢出
.`',column_name,'`AS`',column_name,'_',replace(TABLE_NAME,'arc
hive
_day_',''),'`')SEPARATOR',\r\n')FROMinformat
李大锤同学
·
2024-01-14 20:08
mysql
批量别名
Hive
配置元数据库为PostgreSQL
前一篇文章说了怎样搭建
Hive
环境,但是
Hive
使用的是默认Derby数据库作为元数据库,今天说说怎样把
Hive
的元数据库从默认的Derby改成PostgreSQL数据库。
kongxx
·
2024-01-14 19:33
mysql8.0.34,win7安装配置全流程
1.下载地址:MySQL::DownloadMySQLInstaller(Arc
hive
dVersions)2.选择安装版本和操作系统,再下载第二个进行安装,第一个是在线安装,我这边选择的是最新版本,操作系统
niuniu_666
·
2024-01-14 18:17
mysql
数据库
Gaia数据在线交叉
首先打开Gaia数据的网址GaiaArc
hive
,然后选择search然后选择第二个,Advanced(ADQL)左边的就是Gaia全部的数据名称了,点击加号之后可以看到包括
夜观天象昼编程
·
2024-01-14 18:19
数据库
根据Debug和Release状态的变化来屏蔽日志输出
原文:http://www.cnblogs.com/springfield/arc
hive
/2011/05/04/2037089.html今天在这里分享一个很实用的小技巧。
lcdxwhj2003
·
2024-01-14 14:04
Iphone开发
xcode
开发工具
Python错误集锦:with方法打开文件提示:ValueError: I/O operation on closed file.
原文链接:http://www.juzicode.com/arc
hive
s/2749错误提示:使用with方法打开文件后,再次read()文件时提示:ValueError:I/Ooperationonclosedfile
桔子code
·
2024-01-14 13:40
python错误集锦
python
#工具# 最简单的anaconda安装教程!
anaconda安装安装https://repo.anaconda.com/arc
hive
/选择安装位置并记住,全部点击next,不用安装vscode插件,直接skip。
向日葵花籽儿
·
2024-01-14 11:57
conda
人工智能
Arc
hive
打包编译报错 Command PhaseScriptExecution failed with a nonzero exit code
打包编译报错,网上找了好多方法不适用。找到Pods-Runner文件夹下,Pods-Runner-frameworks.sh文件,具体请看下图:全局搜索:source="$(readlink-f"${source}")"替换为source="$(readlink"${source}")"。解决了我打包编译出错问题。
Buger123
·
2024-01-14 09:17
计算机毕业设计吊炸天spark+
hive
+nlp慕课在线教育课程数据分析可视化大屏 知识图谱课程推荐系统 课程爬虫 文本分类 LSTM情感分析 大数据毕业设计
将.csv上传到hdfs中,并使用
hive
建表后导入.csv数据;9个指标,一半使用spark/scala去做实时计算分析。一半使用
hive
_sql进行分层离线处
计算机毕业设计大神
·
2024-01-14 09:48
Hive
基础知识(十四):
Hive
的八种Join使用方式与优缺点
1.等值Join
Hive
支持通常的SQLJOIN语句。
依晴无旧
·
2024-01-14 09:33
大数据
hive
hadoop
数据仓库
Hive
基础知识(十三):
Hive
的Group by语句与Having语句
1)案例实操:(1)计算emp表每个部门的平均工资
hive
(default)>selectdeptno,avg(sal)fromempgroupbydeptno;(2)计算emp每个部门中平均薪资大于2000
依晴无旧
·
2024-01-14 09:58
大数据
hive
hadoop
数据仓库
MQTT 客户端和代理以及 MQTT 服务器连接建立说明 - MQTT 要点:第 3 部分
MQTT客户端和代理以及MQTT服务器连接建立说明-MQTT要点:第3部分
Hive
MQ现在是开源的。
Hive
MQ社区版实现了MQTT代理规范,兼容MQTT3.1、3.1.1和MQTT5。
_半夏曲
·
2024-01-14 08:33
MQTT
服务器
网络
java
物联网
开源医学影像存档与检索系统(PACS)之Dcm4che-arc-light安装部署详细教程(适用于windows平台)
它是基于Dcm4che项目的一个子项目,专注于实现轻量级而功能强大的医学影像存档与检索(ARC
HIVE
)功能。
_半夏曲
·
2024-01-14 08:33
pacs
开源
健康医疗
windows
java
Kafka的安装、管理和配置
Kafka的安装、管理和配置1.Kafka安装官网:https://kafka.apache.org/downloads下载安装包,我这里下载的是https://arc
hive
.apache.org/dist
llp1110
·
2024-01-14 08:02
Kafka
kafka
分布式
记csv、parquet数据预览一个bug的解决
二、实现过程1.业务流程如图:
hive
SQL读取数据数据写入csv或parquet文件预览csv或parquet文件top100数据2.业务逻辑为了便于测试,
爱码少年
·
2024-01-14 08:49
雕虫小技
Java
java
spark
数据结构
物理机本地和集群部署Spark
文档查看地址:https://spark.apache.org/docs/3.1.3/3)下载地址:https://spark.apache.org/downloads.htmlhttps://arc
hive
.apache.org
DIY……
·
2024-01-14 07:43
spark
大数据
分布式
物理机搭建单节点Flume
flumeFlume官网地址:http://flume.apache.org/文档查看地址:http://flume.apache.org/FlumeUserGuide.html下载地址:http://arc
hive
.apache.org
DIY……
·
2024-01-14 07:43
flume
大数据
hive
sql小技巧
hive
sql日志、执行计划怎么看/用DAG图,看多少个stage,每个stage的执行内容,mr任务,执行顺序,过滤条件,是否有按预期做数据裁剪如何判断长尾通过执行日志,查看卡住的任务,记录数、数据量远大于其它的任务
时光赠予
·
2024-01-14 07:40
单机物理机部署Datax
一、概述DataX是阿里巴巴开源的一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、
Hive
、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能
DIY……
·
2024-01-14 07:34
大数据
上一页
23
24
25
26
27
28
29
30
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他