E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hive:ORC
Debian 系统镜像下载
的版本我无法下载,提示被最新的debian-12.4.0所代替,于是找到了这个链接Indexof/cdimage/unofficial/non-free/cd-including-firmware/arc
hive
william~
·
2023-12-17 22:30
debian
运维
pip install 报错ERROR: Cannot unpack file、Cannot determine arc
hive
format of 解决办法
使用pipinstall-ihttps://pypi.tuna.tsinghua.edu.cn/simple--trusted-hostpypi.tuna.tsinghua.edu.cnmodule_name
Err0r808
·
2023-12-17 22:21
pip
python
pytorch
报错ERROR: Cannot unpack file C
报错ERROR:Cannotdeterminearc
hive
formatofC报错ERROR:CannotunpackfileC输入了pipinstall+-ihttps://mirrors.aliyun.com
何处不逢君
·
2023-12-17 22:21
python
.; ERROR: Cannot determine arc
hive
format of ...
解决:Python通过pip安装库时报错:ERROR:Cannotunpackfile…;ERROR:Cannotdeterminearc
hive
formatof…文章目录解决:Python通过pip安装库时报错
ninghes
·
2023-12-17 22:20
#
Python
Bug
python
pip
备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项——任务2:离线数据处理
Hadoop:hadoop-3.1.3.tar.gz3.1.3Jdk:jdk-8u212-linux-x64.tar.gz1.8Spark:spark-3.1.1-bin-hadoop3.2.tgz3.1.1
Hive
Stitch .
·
2023-12-17 22:18
我的大学笔记
MySQL
笔记
大数据
mysql
scala
Redis
官网:https://redis.io中文网:https://www.redis.net.cn/windows:https://github.com/microsoftarc
hive
/redis/releasesLinux
攻城狮啊尧
·
2023-12-17 21:15
Redis
redis
数据库
缓存
【星环云课堂大数据实验】InceptorSQL使用方法
文章目录一、InceptorSQL概述二、实验环境三、实验准备四、实验目的五、实验步骤5.1使用Waterdrop连接Inceptor5.2、WordCount5.3、外部表与内部表5.4、普通
ORC
表
生生不息~
·
2023-12-17 20:46
大数据
大数据
InceptorSQL
ORC表
实验报告
_pickle.UnpicklingError: invalid load key, ‘<‘.的可能解决方案
需要下载模型文件,结果没发现网络不好,模型文件只下了4k,就提示这个个报错,再次运行文件就发现了这个错误RuntimeError:PytorchStreamReaderfailedreadingziparc
hive
卜德孝
·
2023-12-17 20:22
python
flink安装
架构下载官网下载慢,可以用flink国内镜像https://mirrors.cloud.tencent.com/apache/flink或:有版本下载地址:https://arc
hive
.a
千百元
·
2023-12-17 19:21
#
flink
flink
大数据
Visual studio+Qt开发环境搭建以及注意事项和打开qt的.pro项目
下载qt-然后安装5.14.2_msvc2017不知道安装那个就全选5.14.2的父级按钮https://download.qt.io/arc
hive
/qt/5.14/5.14.2/安装Visualstudio
tiger_angel
·
2023-12-17 19:22
visual
studio
qt
数据库
2023.12.14
hive
sql的聚合增强函数 grouping set
目录1.建库建表2.需求3.使用unionall来完成需求4.聚合函数增强groupingset5.聚合增强函数cube,rollup6.rollup翻滚7.聚合函数增强--grouping判断1.建库建表--建库createdatabaseifnotexiststest;usetest;--建表createtabletest.t_cookie(monthstring,daystring,cook
白白的wj
·
2023-12-17 18:16
hive
sql
hadoop
数据仓库
大数据
database
Spark SQL 写入
hive
表 字段名称或者类型不一致
解决方案:valtargetTableSchemaArray=spark.catalog.listColumns(dbName,tableName).select("name","dataType","isPartition","isBucket").rdd.map(catalog=>{valname=catalog.getAs("name").toStringvaltypeName=catalo
团团饱饱
·
2023-12-17 17:12
Missing artifact org.wltea.analyzer:ik-analyzer:jar:5.0
】https://github.com/wks/ik-analyzerhttps://github.com/wks/ik-analyzer.githttps://code.google.com/arc
hive
spencer_tseng
·
2023-12-17 16:16
java
java
Presto连接
Hive
接前一篇文章,这里只说怎样连接
Hive
。
kongxx
·
2023-12-17 16:46
CentOS使用kkFileView实现在线预览word excel pdf等
一、环境安装1、安装LibreOfficewgethttps://downloadarc
hive
.documentfoundation.org/libreoffice/old/7.5.3.2/rpm/x86
顽石九变
·
2023-12-17 15:39
运维
centos
kkFileView
Hive
解析Json数组超全讲解
Hive
解析Json数组超全讲解在
Hive
中会有很多数据是用Json格式来存储的,如开发人员对APP上的页面进行埋点时,会将多个字段存放在一个json数组中,因此数据平台调用数据时,要对埋点数据进行解析
lz_matlab
·
2023-12-17 09:38
Hive
hive
json
大数据
oracle创建分区表,以及非分区表转分区表(转载)
什么是分区表,分区表详解:http://langgufu.iteye.com/blog/1552042本文原出处:http://blog.csdn.net/tianlesoftware/arc
hive
/
langgufu314
·
2023-12-17 08:18
ORACLE数据库
分区表
分区交换
在线重定义
oracle
Hive
Sql语法优化三 :join优化
前面提到过:
Hive
拥有多种join算法,包括CommonJoin,MapJoin,BucketMapJoin,SortMergeBucktMapJoin等;每种join算法都有对应的优化方案。
zmx_messi
·
2023-12-17 08:13
大数据
HQL优化之数据倾斜
groupby导致倾斜前文提到过,
Hive
中未经优化的分组聚合,是通过一个MapReduceJob实现的。
zmx_messi
·
2023-12-17 08:13
大数据
hive
Hive
Sql语法优化二 :join算法
Hive
拥有多种join算法,包括CommonJoin,MapJoin,BucketMapJoin,SortMergeBucktMapJoin等,下面对每种join算法做简要说明:CommonJoinCommonJoin
zmx_messi
·
2023-12-17 08:43
hive
hadoop
数据仓库
Hive
Sql语法优化四 :Bucket Map Join和Sort Merge Bucket Map Join优化
BucketMapJoin之前的mapjoin适用场景是大表join小表的情况,但是两张表都相对较大,若采用普通的MapJoin算法,则Map端需要较多的内存来缓存数据,当然可以选择为Map段分配更多的内存,来保证任务运行成功。但是,Map端的内存不可能无上限的分配,所以当参与Join的表数据量均过大时,就可以考虑采用BucketMapJoin算法。比如下面两张表进行join操作:表名大小orde
zmx_messi
·
2023-12-17 08:09
数据库
Hive
Sql语法优化一 :分组聚合优化
Hive
中未经优化的分组聚合,是通过一个MapReduceJob实现的。
zmx_messi
·
2023-12-17 08:38
大数据
Spark sql 写分区表,设置format报错
sparksqldataset写入表的时候,我写的是一个用ymd分区的表,我想设置输出格式format("
hive
"),然后报错了代码如下ds.write().partitionBy(partitionsStr
南修子
·
2023-12-17 07:25
PHP函数参考05-zip与phar压缩包
建议使用ZipArc
hive
类库。
思考的山羊
·
2023-12-17 07:05
Hadoop,
Hive
和Spark大数据框架的联系和区别
Hadoop,
Hive
和Spark是大数据相关工作中最常用的三种框架。1Hadoophadoop是一个分布式计算框架,是大数据处理的基石,大多其他框架都是以hadoop为基础。
Weiyaner
·
2023-12-17 06:00
数据库
大数据
hadoop
mapreduce
spark
Win10下安装大数据开发环境 spark+hadoop+
hive
(实测可用)
Win10下安装大数据开发环境spark+hadoop+
hive
(实测可用)基础环境安装spark安装Hadoop安装
hive
安装总结参考博客基础环境安装首先,我们需要搭建软件的运行环境,本文中所使用的软件均需要运行在
YannAdams
·
2023-12-17 06:30
Spark
Hadoop
Hive
大数据环境
Windows
spark
hadoop
hive
大数据生态中‘Hadoop’、‘
Hive
’、‘Spark’、‘Mapreduce’、‘HDFS’、‘Yarn’是什么关系
以上都是大数据相关的系统和技术,大数据又属于数据管理系统的范畴数据管理系统无非就两个问题:1.数据怎么存2.数据怎么算再进入信息爆炸时代后,数据的容量越来越大,导致一台服务器存不下,所以要用集群来存储、处理信息,但是管理一台服务器容易,怎么去统一管理集群的信息成了问题。所以用到了Hadoop生态来管理信息。Hadoop生态中HDFS:处理存储,管理信息的分布式存储、提供接口,让用户感觉集群中的信息
小书生啊
·
2023-12-17 06:29
大数据
hadoop
hive
大数据 | Hadoop、
Hive
、Spark的关系
文章总括图数据存储单机数据库时代所有数据在单机都能存的下,数据处理的任务都是IO密集型,更谈不上分布式系统一个典型的2U服务器可以插6块硬盘,每块硬盘4T,共24T原始容量,再加上一些数据包的可用冗余,再加上一些格式化的损失,保守估计一台服务器至少可以有10T以上的可用容量,再加上128G内存和两颗CPU,装入DBMS,稍微调优,单表处理10e条数据问题不大多机数据库时代当数据量变多时,单台机器无
xyzhang2018
·
2023-12-17 06:58
数据库
hadoop
大数据
spark
[AIGC ~大数据] 深入理解Hadoop、HDFS、
Hive
和Spark:Java大师的大数据研究之旅
在这个充满机遇和挑战的领域中,我深入研究了Hadoop、HDFS、
Hive
和Spark等关键技术。本篇博客将从"是什么"、"为什么"和"怎么办"三个角度,系统地介绍这些技术。文章目录是什么?
程序员三木
·
2023-12-17 06:55
AI
大数据
hadoop
AIGC
搭建Tomcat调试环境并分析CVE-2017-12615
准备下载存在漏洞版本tomcat,这里下的是8.0.45https://arc
hive
.apache.org/dist/tomcat/tomcat-8/v8.0.45/可执行文件和源码都需要下载用idea
st3pby
·
2023-12-17 06:42
tomcat
java
渗透测试
网络安全
Spark-Streaming+HDFS+
Hive
实战
文章目录前言一、简介1.Spark-Streaming简介2.HDFS简介3.
Hive
简介二、需求说明1.目标:2.数据源:3.数据处理流程:4.HDFS文件保存:5.
Hive
外部表映射:三、实战示例演练
大数据魔法师
·
2023-12-17 06:38
大数据
spark
hdfs
hive
hive
学习笔记
1.
HIVE
结构
Hive
是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。
Tech_Hog
·
2023-12-17 05:05
Hadoop
hadoop
hive
Hive
对空值的一些处理方法简单记录
最近遇到一些业务需求,需要对
Hive
的空值(空数组)做简单的处理1、字符串处理空值对于
Hive
的空值,和NULL一般使用NVL()函数selectnvl(col_name,v1,v2)fromtable
cbigchaos
·
2023-12-17 05:33
#
Hive
hive
hadoop
数据仓库
【
Hive
】CDP集群
Hive
NULL值排序前后的问题
最近公司在从本地大数据环境迁移到CDP的集群。在跑相同的SQL代码时,两边对比发现数据有问题,然后就开始查找原因:在对数据进行分组排序时,两个环境的NULL值默认排序不同。排错1、首先我们执行相同的SQL,对比了两边SQL的执行计划,selectid,times,row_number()over(partitionbyidorderbytimesdesc)asrnfrom(select1asid,
cbigchaos
·
2023-12-17 05:33
#
Hive
hive
hadoop
数据仓库
【Sqoop】数据导入导出到
Hive
问题总结
文章目录Sqoopimprot数据到
Hive
一、文件大小问题Sqoopexport数据到MySQL一、
Hive
表unionall完有中间文件夹Sqoop目录写到表后无法递归Sqoopimprot数据到
Hive
cbigchaos
·
2023-12-17 05:33
hive
sqoop
hadoop
【
Hive
】(三)
Hive
数据导入,导出,分区
文章目录一、导入数据loaddatainsertimportlocation三、导出数据分区例子1、静态分区2、动态分区一、导入数据loaddata1、语法loaddata(local)inpath'文件路径'into|overwritetablestudents;local:表示从本地加载数据,不加local则是从HDFS中加载数据overwrite:覆盖表中的原有数据2、向stutest表加载
cbigchaos
·
2023-12-17 05:02
#
Hive
【HQL】(三)
Hive
计算除数为0的情况结果
文章目录1、简单测试下2、搞个Demo建表测试在工作做一些计算时担心类型问题、报错,还有除数为0的情况,提前做一下预防。1、简单测试下--1、select1/0;--2、select0/0;--3、select0/1直观结果截图如下:除以0,结果为null0除以,结果为浮点型2、搞个Demo建表测试#建表createtablecm_test.number_t(idstring,numstring,
cbigchaos
·
2023-12-17 05:02
#
Hive
hive
大数据
hadoop
Hive
学习笔记
Hive
学习笔记1、
Hive
安装(只在主节点上安装)(1)下载安装包到/usr/app/目录下(2)解压(3)修改配置文件/etc/profile(添加export
HIVE
_HOME=/usr/local
weixin_30470857
·
2023-12-17 05:32
hive
增加表字段语录_
HIVE
常用SQL语句及语法
HIVE
建内部表语句createtabledll102.sougou(idstring,pwdstring,namestring,countint,seqnoint,addressstring)rowformatdelimitedfieldsterminatedby
weixin_39811386
·
2023-12-17 05:32
hive
增加表字段语录
Hive
笔记五:入门教程
摘要:
Hive
是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。
Mojoooo
·
2023-12-17 05:00
hive
hive
一、
Hive
中常用到的基础知识
一、
Hive
中常用到的基础知识《简介》1、表的数据类型说明2、
Hive
数据仓库支持的文件格式3、
Hive
各种文件格式的特点一、Beeline连接
Hive
二、
Hive
执行HQL文件1、hql文件:
hive
_test.hql2
斗罗昊天锤
·
2023-12-17 05:58
#
Hive组件
hadoop
hive
hadoop学习笔记--13.
hive
属性配置、交互式命令行和文件系统交互
一、
hive
配置文件常见属性1.在cli命令行上显示当前的数据库名以及查询的行头信息在
hive
-site.xml中添加以下配置
hive
.cli.print.headertrueWhethertoprintthenamesofthecolumnsinqueryoutput.
hive
.cli.print.current.dbtrueWhethertoincludethecurrentdatabasei
liuzebin9
·
2023-12-17 05:58
Hadoop
hadoop
hive
【
Hive
】【Hadoop】工作中常操作的笔记-随时添加
文章目录1、
Hive
复制一个表:2、字段级操作3、hdfs文件统计1、
Hive
复制一个表:直接Copy文件createtablenew_tableliketable_name;hdfsdfs-get/apps
cbigchaos
·
2023-12-17 05:57
#
Hive
#
Hadoop
hadoop
hive
笔记
大数据
《PySpark大数据分析实战》-11.Spark on YARN模式安装Hadoop
对大数据技术栈Hadoop、
Hive
、Spark、Kafka等有深入研究,对Data
wux_labs
·
2023-12-17 05:16
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
《PySpark大数据分析实战》-12.Spark on YARN配置Spark运行在YARN上
对大数据技术栈Hadoop、
Hive
、Spark、Kafka等有深入研究,对Data
wux_labs
·
2023-12-17 05:10
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
Hive
多分隔符支持示例
问题描述如何将多个字符作为字段分割符的数据文件加载到
Hive
表中,事例数据如下:字段分隔符为“@#$”test1@#$test1name@#$test2valuetest2@#$test2name@#$
尼小摩
·
2023-12-17 04:00
Hive
中order by,sort by,distribute by,cluster by的区别以及row_number() over函数的基本用法
一.orderby:orderby会对输入做全局排序,因此只有一个Reducer(多个Reducer无法保证全局有序),然而只有一个Reducer,会导致当输入规模较大时,消耗较长的计算时间。二.sortby:sortby不是全局排序,其在数据进入reducer前完成排序,因此,如果用sortby进行排序,并且设置mapred.reduce.tasks>1,则sortby只会保证每个reducer
LuckyBoy88888888
·
2023-12-17 04:17
hive
hive
order
by
sort
by
row_number
distribute
by
centos8不能下软件的原因
文章目录问题解决方法问题Errorsduringdownloadingmetadataforrepository‘epel’:Statuscode:404forhttp://arc
hive
s.fedoraproject.org
Mystery_zero
·
2023-12-17 03:35
linux
linux
centos
业务场景中
Hive
解析Json常用案例
业务场景中
Hive
解析Json常用案例json在线工具json格式转换在线工具https://tool.lu/json/format格式互转://格式化可以合并整行显示{"name":"JohnDoe"
王亭_666
·
2023-12-17 02:17
hive
大数据
hive
json
hadoop
大数据
数据分析
nestjs使用redis
redis安装1、windows安装,下载目录:Releases·microsoftarc
hive
/redis·GitHub,解压,打开redis-server.exe,开启redis服务2、linux
不求甚解bc
·
2023-12-17 02:59
nestjs
nodejs
redis
缓存
node.js
上一页
41
42
43
44
45
46
47
48
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他