E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hive连接方式
Hive
lateral view explode
假设表:pageadspage_idadid_listfront_page[1,2,3]contact_page[3,4,5]selectpage_id,ad_idfrompageadslateralviewexplode(adid_list)adtablesasad_idpage_id,adid_list都是原表pageads的列(字段);adtables:explode形成的新虚拟表,可以不写
空城gang
·
2023-11-20 00:01
hive
Hive
错误-->由于lateral view explode() 导致的空指针错误 FAILED: NullPointerException null
错误:代码:selectvideoId,categoryfromgulivideo_orcwherevideoIdin(selectrelatedId_namefrom(selectrelatedId,`views`fromgulivideo_orcorderby`views`desclimit50)t1--找到top50lateralviewexplode(relatedId)tmpasrela
大数据langlang
·
2023-11-20 00:00
Hive开发总结
hive
hql
sql
数据仓库
exception
Hive
Lateral View explode列为空时导致数据异常丢失
一、问题描述日常工作中我们经常会遇到一些非结构化数据,因此常常会将LateralView结合explode使用,达到将非结构化数据转化成结构化数据的目的,但是该方法对应explode的内容是有非null限制的,否则就有可能造成数据缺失。SELECTname,infoFROM(SELECTname,split(info_list,',')asinfo_arraryFROM(select'张三'asn
有语忆语
·
2023-11-20 00:28
大数据之Hive
hive
hadoop
数据仓库
Hive
参数与性能企业级调优(建议收藏)
Hive
作为大数据平台举足轻重的框架,以其稳定性和简单易用性也成为当前构建企业级数据仓库时使用最多的框架之一。
坨坨的大数据
·
2023-11-19 23:58
大数据组件spark hadoop
hive
简单介绍
spark单机启动spark-shell集群启动/usr/local/spark-2.4.5-bin-hadoop2.7/sbin/start-all.sh提交任务1.打包python环境:whereispython#/usr/local/python3/zip-rpy_env.zippy_env2.spark提交参考:pyspark打包依赖包&使用python虚拟环境notebook集成:htt
转身之后才不会
·
2023-11-19 23:29
大数据
hadoop
大数据
spark
基于trino构建新的算子下推框架
背景下推发展过程trino或者presto早期的数据源主要是
hive
表(列存),所以计算引擎的下推发力点主要在于project和filter下推,由于parquet等列存主要基于zonemap索引(min
诺野
·
2023-11-19 23:58
trino
OLAP
big
data
大数据
大数据安全 测试
测试1、用户
hive
/
[email protected]
和nn/1.common2.hadoop.fql.com分别对
Hive
进行查询(1)HDFS配置vim/usr/
bigdata-余建新
·
2023-11-19 22:50
大数据
大数据安全
Trino 与
Hive
有差异的函数
日常使用中发现trino和
hive
中的有一些函数存在差异,所以开此帖记录一下这里只是记录trino和
hive
有差异的函数,遇到了就会记录一下,不定期更新1.查看集合中元素个数
hive
:size()trino
香山上的麻雀1008
·
2023-11-19 22:49
hive
数据仓库
trino
window安装mysql5.7流程
MySQL::DownloadMySQLCommunityServer(Arc
hive
dVersions)navicat破解版http://www.ddooo.com/softdown/129457.htm2
luo_guibin
·
2023-11-19 22:54
mysql
mysql
数据库
python把指定文件夹内所有文件和子文件夹大写全部改为小写
来源:http://www.shanhubei.com/arc
hive
s/2622.html接手老项目,里面的文档大小心不同意,而在linux中对大小写又敏感。
珊瑚贝
·
2023-11-19 22:50
linux
服务器
python
2011-2022年高职大数据竞赛-赛题任务剖析
离线数据统计第五部分赛题模拟实现-数据采集与实时计算第六部分赛题模拟实现-数据可视化(一)任务一:大数据平台环境搭建具体内容按照大数据分析平台需求,需要完成Hadoop完全分布式、Spark安装配置、Flink安装配置、
Hive
xlw2003
·
2023-11-19 21:54
Spark
Flink
hadoop
spark
flume
kafka
flink
Hive
shell 中夹杂大量的日志信息问题的解决方法
在
hive
-3.1.x版本中,使用
hive
shell时,会发现在查询命令中夹杂大量的日志信息,严重干扰查询结果显示,特别是强迫症患者,不能忍受。通过修改conf下的日志文件,会发现不起任何作用。
xlw2003
·
2023-11-19 21:53
hive
hive
hadoop
数据仓库
电商大数据分析案例(Hadoop+
Hive
+Spark+Azkaban+Spring MVC+ECharts)
项目描述某著名电商平台双十一美妆销售数据分析。由于是真实的商业数据,所以做了脱敏处理,数据集中对店名的引用被处理为产品的品牌名以保护店家隐私。。通过对该平台双十一美妆销售数据的品牌、销量、热度等特征的分析(平台视角和用户视角),尝试探索以下问题:双十一期间,最受消费者青睐的产品或品牌是哪些?双十一期间,美妆行业各品类的销售情况?双十一期间,消费高峰何时出现?双十一期间,客户的评论数对销量的影响?.
xlw2003
·
2023-11-19 21:53
Spark
hive
Hadoop
hive
spark
hadoop
Spark
SQL
spring
Python大数据之linux学习总结——day10_
hive
调优
hive
调优
hive
调优
hive
命令和参数配置1.
hive
数据压缩压缩对比开启压缩2.
hive
数据存储[练习]行列存储原理存储压缩比拓展dfs-du-h3.fetch抓取4.本地模式5.join的优化操作
笨小孩124
·
2023-11-19 20:50
hive
学习总结
大数据
python
linux
Python大数据之linux学习总结——day10_hadoop原理
Hadoop原理Hadoop基础分布式和集群Hadoop框架概述生态圈版本更新hadoop架构[重点]官方示例圆周率练习词频统计[重点]需求:步骤:Hadoop-HDFS特点hdfs架构块和副本shell命令
Hive
笨小孩124
·
2023-11-19 20:38
Hadoop
学习总结
大数据
python
linux
mac基本工作环境搭建(iterm+zsh+tmux)
2019独角兽企业重金招聘Python工程师标准>>>首先,分享一篇文章,个人觉得他说的挺全的:http://www.wangyuxiong.com/arc
hive
s/52137今天分享一下自己的一些实用经验
weixin_33806509
·
2023-11-19 20:17
shell
ruby
python
mysql事务及隔离级别分析
实现可重复读并发写问题幻读问题背景原文地址:https://duktig.cn/arc
hive
s/73/事
Duktig丶
·
2023-11-19 19:12
mysql
mysql
数据库
事务
事务隔离级别
现代通信技术之分组交换技术
分组的传输方式数据报方式无
连接方式
;不需要建立连接,各分组按分组头中的地址信息,自由选择路由到达终端。虚电路方式面向
连接方式
;但与电路交换不同,它建立的是逻辑信道,利用
Leslie_Waong
·
2023-11-19 19:04
现代通信技术
Minio安装
单节点单硬盘—适用于Linux的MinIO对象存储单例下载rpm,用中国镜像wgethttps://dl.minio.org.cn/server/minio/release/linux-amd64/arc
hive
科氏加速度
·
2023-11-19 19:08
linux
运维
服务器
linux常用命令_干货:Linux常用命令全称及讲解
毕竟常用命令比较多,如果没有你常用的还望海涵,可以评论区补充~文章较长,请耐心阅读,这篇文章比较实用,喜欢的朋友欢迎点赞、收藏、转发噢--------------ar命令–建立或修改备存文件ar命令是“arc
hive
r
weixin_39656513
·
2023-11-19 19:02
linux常用命令
spark 数据倾斜优化
目录spark数据倾斜优化数据倾斜产生的原因数据倾斜七种解决方案使用
Hive
ETL预处理数据过滤少数导致倾斜的key提高shuffle操作的并行度双重聚合将reducejoin转为mapjoin采样倾斜
赤兔胭脂小吕布
·
2023-11-19 17:15
spark
大数据
hive
hadoop
分布式
2️⃣Zookeeper(动物管理员)
封装了大量复杂关键的技术(服务),将简单的接口(API)暴露,高效的使用Zookeeper,稳定性非常高在大数据生态圈,Zookeeper(动物管理员)是一个非常重要的基础技术,Hadoop(大象),
Hive
WovJf
·
2023-11-19 17:40
zookeeper
分布式
云原生
4️⃣
Hive
Hive
是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
WovJf
·
2023-11-19 17:39
hive
数据仓库
Hive
函数
文章目录一、
Hive
建表SQL二、
Hive
函数三、函数1、查看内置函数2、空字段赋值(nvl)3、CASEWHENTHENELSEEND4、行转列5、列转行6、开窗函数6.1简介6.2语法6.3案例6.4LAG
ha_lydms
·
2023-11-19 16:40
大数据
hive
hadoop
数据仓库
oracle关闭数据库归档,如何启动或关闭Oracle的归档(ARC
HIVE
LOG)模式
如何启动或关闭Oracle的归档(ARC
HIVE
LOG)模式如何启动或关闭Oracle的归档(ARC
HIVE
LOG)模式1.管理员身份连接数据库C:\Users\Administrator>sqlplussys
Gaven Wang
·
2023-11-19 16:40
oracle关闭数据库归档
物联网云服务器框架,物联网(五)---搭建自己的云平台[ESP8266+Django]
预读文章:Django中文教程:自强学堂为Django添加TCP
连接方式
:Channels推荐扩展阅读:使用到的工具:Redis数据库安装方法:Redis安装Channels-redis:Github官方库同类文章
吴佳晗
·
2023-11-19 16:40
物联网云服务器框架
HIVE
与HDFS映射关系
问题1:
Hive
一条Select语句,底层是如何读取HDFS文件的?
Eqo
·
2023-11-19 15:40
centos oracle11g开启归档模式
使用SYSDBA权限连接到数据库打开终端应用程序,输入以下命令以使用SYSDBA权限连接到数据库:su-oracle;sqlplus/assysdba;查看是否已开启归档模式arc
hive
logli
柏伦 Belen
·
2023-11-19 15:01
oracle
oracle
数据库
分组表,分桶表
1,启动
Hive
服务(1)启动
Hive
Server2服务nohup
hive
--servicemetastore&(2)启动Metastore服务nohup
hive
--service
hive
server2&
祈愿lucky
·
2023-11-19 15:29
大数据
大数据
Hive
数据表操作--学习笔记
1,
Hive
数据表操作1,建表语句和内外部表①创建内部表create[external]table[ifnotexists]表名(字段名字段类型[comment'注释'],字段名字段类型[comment
祈愿lucky
·
2023-11-19 15:59
大数据
hive
学习
笔记
Python大数据之linux学习总结——day06_
hive
02
hive
02
hive
内外表操作建表语法数据类型表分类内部表基本操作[练习]知识点:外部表基本操作[练习]知识点:示例:查看/修改表示例:默认分隔符示例:快速映射表[练习]知识点:示例:数据导入和导出文件数据加载导入
笨小孩124
·
2023-11-19 15:58
hive
学习任务
python
大数据
linux
大数据之
Hive
:regexp_extract函数案例
目录一、正则的通配符简介1、正则表达式的符号及意义2、各种操作符的运算优先级:二、案例数据要求分析实现输出结果实现2实现3总结一、正则的通配符简介1、正则表达式的符号及意义符号含义实列/做为转意,即通常在"/"后面的字符不按原来意义解释如"*“匹配它前面元字符0次或多次,/a*/将匹配a,aa,aaa,加了”/"后,/a/*/将只匹配"a*".匹配任何一个字符^匹配一个输入或一行的开头/^a/匹配
浊酒南街
·
2023-11-19 15:27
大数据系列三
hive
hadoop
数据仓库
WINDOWS安装多个JDK,并随意切换JDK版本
WIN10系统JDK1.8JDK8的下载目录:JavaArc
hive
Downloads-JavaSE8Java
JYWWABF
·
2023-11-19 15:26
其他
idea
java
jdk
2023.11.16
hive
sql高阶函数之开窗函数
目录1.开窗函数的定义2.数据准备3.开窗函数之排序需求:用三种排序方法查询学生的语文成绩排名,并降序显示4.开窗函数分组需求:按照科目来分类,使用三种排序方式来排序学生的成绩5.聚合函数与分组配合使用6.聚合函数同时和分组以及排序关键字配合使用--需求1:求出每个用户的总pv数,展示所有信息默认第一行到最后一行--需求2:求出每个用户截止到当天,累积的总pv数默认第一行到当前行做题思路,开窗函数
白白的wj
·
2023-11-19 15:49
数据库
sql
大数据
数据仓库
database
hadoop
hive
Android MQTT开发之
Hive
mq MQTT Client
使用一个开源库:
hive
mq-mqtt-client,这是Java生态的一个MQTT客户端框架,需要Java8,Android上使用的话问题不大,需要一些额外的配置,下面列出了相关的配置,尤其是packagingOptions
又菜又爱coding
·
2023-11-19 15:17
Android开发
android
mqtt
Hive
常见的面试题(十二道)
Hive
1.
Hive
SQL的执行流程⾸先客户端通过shell或者Beeline等⽅式向
Hive
提交SQL语句,之后sql在driver中经过解析器(SQLParser):将SQL字符串转换成抽象语法树AST
地球魔
·
2023-11-19 15:16
hive
hadoop
数据仓库
Hive
sql中条件写在on和where的区别
usedmp;createtabledmp.yl_test_1(idint,namestring);createtabledmp.yl_test_2(idint,ageint);insertintodmp.yl_test_1values(1,'aa');insertintodmp.yl_test_1values(2,'bb');insertintodmp.yl_test_1values(3,'cc
烟雨人长安
·
2023-11-19 15:13
hive
sql
hadoop
hive
sql 取当周周一 str_to_date(DATE_FORMAT(biz_date, ‘%Y%v‘), ‘%Y%v‘)
selectstr_to_date(DATE_FORMAT(biz_date,'%Y%v'),'%Y%v')方法拆解selectDATE_FORMAT(now(),'%Y%v'),str_to_date(202346,'%Y%v')
mohana48833985
·
2023-11-19 15:12
hive
sql
hadoop
Hive
语法,函数--学习笔记
1,排序处理1.1clusterby排序,在
Hive
中使用orderby排序时是全表扫描,且仅使用一个Reduce完成。在海量数据待排序查询处理时,可以采用【先分桶再排序】的策略提升效率。
祈愿lucky
·
2023-11-19 15:41
大数据
hive
学习
笔记
在windows操作系统下安装与配置MySQL
在其地址栏中输入网址“https://dev.mysql.com/downloads/mysql”,按回车键进入下载页面,然后选择5.7.24版本,此处选择“Windows(x86,64-bit),ZIPArc
hive
鹿其97
·
2023-11-19 14:18
MySQL
mysql
Hive
客户端
hive
与beeline的区别
hive
与beeline简介1、背景2、
hive
3、beeline4、
hive
与beeline的关系1、背景
Hive
的
hive
与beeline命令都可以为客户端提供
Hive
的控制台连接。
对许
·
2023-11-19 14:12
#
Hive
#
Hadoop生态圈
hive
hadoop
Hive
插入数据警告:
Hive
-on-MR is deprecated in
Hive
2 and may not be available in the future versions
Hive
插入表数据持续等待警告问题解决1、问题描述2、原因分析3、问题解决1、问题描述启动Hadoop,使用
hive
server2启动
Hive
的JDBC服务并使用IDE连接到
Hive
,创建表成功,但是INSERT
对许
·
2023-11-19 14:42
#
Hadoop生态圈
#
Hive
#
数据湖仓
hive
mr
hadoop
Apache Flink写入Clickhouse报错 code: 1002, ip:8123 failed to respond
目录版本一、问题1问题描述2日志二、解决解决过程1升级驱动jar包版本(无效)2修改连接参数(无效)3修改服务端参数(有效)4修改获取
连接方式
(todo)参考资料版本ClickHouseserverversion21.12.2
终回首
·
2023-11-19 14:49
大数据
flink
tcp/ip
clickhouse
Apache Atlas 执行导入
hive
元数据脚本import-
hive
.sh报错
目录一、问题一1问题2解决二、问题二1问题2解决2.1查看
hive
是否正常2.2解决
hive
命令行无法启动问题2.3解决
hive
无法查询数据库问题2.4修改
hive
-site.xml一、问题一1问题ApacheAtlas
终回首
·
2023-11-19 14:18
大数据
Apache
Atlas
Apache
Hive
3.Apache
Hive
查询报错 FAILED: org.apache.hadoop.
hive
.ql.exec.mr.MapredLocalTask
版本CDH6.2.0
Hive
2.1.1-cdh6.2.0一、问题执行查询视图的sql报错:FAILED:ExecutionError,returncode3fromorg.apache.hadoop.
hive
.ql.exec.mr.MapredLocalTask
终回首
·
2023-11-19 14:18
大数据
#
Apache
Hive
hive
大数据
结合李沐动手学深度学习配置环境
也可以通过镜像源下载:清华源:https://mirrors.tuna.tsinghua.edu.cn/anaconda/arc
hive
/(大家安装完了千万不用pipinstalljupyter在一个虚拟环境
鱼小丸
·
2023-11-19 14:14
深度学习
python
tensorflow
Apache
Hive
源码阅读环境搭建
前置软件:JDK1.8Maven3.3.91下载源码#下载源码gitclonehttps://github.com/apache/
hive
.gitcd
hive
#查看标签gittag#切换到要阅读的指定版本的
终回首
·
2023-11-19 14:08
#
Apache
Hive
大数据
apache
hive
hadoop
ERROR: Cannot determine arc
hive
format of C:\Users\0000328421\AppData\Local\Temp\pip-req-build-b3m9h
ERROR:Cannotdeterminearc
hive
formatofC:\Users\0000328421\AppData\Local\Temp\pip-req-build-b3m9hzqbpipinstall-ihttps
_冰澈
·
2023-11-19 13:41
1024程序员节
Ubuntu 下 Anaconda的安装
Anaconda安装:UbuntuAnaconda下载地址:https://www.anaconda.com/distribution/或https://repo.anaconda.com/arc
hive
余亚伟_强化班
·
2023-11-19 13:53
Zookeeper C客户端库编译
yuminstall-ycppunit-develyuminstall-yant编译下载release版本的源码:wgethttps://github.com/apache/zookeeper/arc
hive
风雅的远行者
·
2023-11-19 13:59
php对接dubbo
php
上一页
69
70
71
72
73
74
75
76
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他