E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据仓库(hive)
浅析大数据的技术生态圈(Hadoop,
hive
,spark)
大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗瓢盆,各有各的用处,互相之间又有重合。你可以用汤锅直接当碗吃饭喝汤,你可以用小刀或者刨子去皮。但是每个工具有自己的特性,虽然奇怪的组合也能工作,但是未必是最佳选择。大数据,首先你要能存的下大数据。传统的文件系统是单机的,不能横跨不同的机器。H
Rysinal
·
2024-01-29 19:11
hadoop
大数据
hadoop
spark
生态圈
Oracle 补丁那些事儿(PS、PSU、CPU、SPU、BP、DBBP…)
转自链接:https://www.anbob.com/arc
hive
s/2870.html当前ORACLE数据库提供两种方式的补丁一种是主动的ProactivePatches和另一种被动的ReactivePatches
玉儿姐
·
2024-01-29 17:55
Oracle
安卓和Android是两种不同的操作系统?
https://fostmar.online/arc
hive
s/19/安卓泛指中国厂商在Android开源代码基础上,增加了广告、
姗丽尔
·
2024-01-29 17:50
android
全面解析基于Hadoop模型的数据分析平台框架
本文主要讲解以下两个方面:♦HadoopMapReduce与
Hive
技术研究♦数据分析平台框架设计与环境配置HadoopMapReduce与
Hive
技术研究一、Hadoop框架工作机制Hadoop框架定义
丨程序之道丨
·
2024-01-29 17:04
数据湖技术之应用场景篇
比如说在线数据抽取场景原有模式对线上库表产生较大压力,flink多流join维护的大状态导致的稳定性问题等等,具体场景如下图所示:场景1:在线数据抽取业务一般会从线上mysql库表以离线方式抽取全量数据到
hive
风筝Lee
·
2024-01-29 16:04
数据湖
大数据
5000多张数据表,如何用SQL迁移到
数据仓库
?
来自公众号:SQL数据库开发作者丶平凡世界需求背景最近公司打算集中梳理几大业务系统的数据,希望将各个业务系统中的数据集中到
数据仓库
中。
码农小光
·
2024-01-29 15:33
Chromium源码分析:ContentShell启动流程
http://mogoweb.net/arc
hive
s/417ContentShell是基于ContentAPI的一个简单的浏览器外壳,下面我将分析chromiumforandroid中的ContentShell
dzhjsofo
·
2024-01-29 15:28
chromium
root + vm vh 实现响应式字体
原文链接==>http://sylblog.xin/arc
hive
s/52前言一个网页中最多的东西是啥?正常人的第一反映肯定是文字,你要是跟我说是图片,那我只能表示:响应式网页设计中
程序员半夏
·
2024-01-29 13:36
学透CSS
css
html5
html
Hive
HWI 配置
前言1、下载安装好
hive
后,发现
hive
有hwi界面功能,研究下是否可以运行,于是使用
hive
–servicehwi命令启动hwi界面报错。
chde2Wang
·
2024-01-29 11:55
大数据平台安装与部署
hive
hadoop
数据仓库
基于大数据平台的kylin安装部署手册
单例Kylin部署1.环境准备1.1软件要求1.2硬件要求1.3Hadoop环境1.4安装前环境检查1.4.1开启时钟同步1.4.2安装net-tools1.4.3检查hbase是否可用1.4.4检查
hive
猿来孺词
·
2024-01-29 10:26
部署安装
大数据
kylin
分布式
数据仓库
数据分析
Sqoop使用详解
目录1.概述2.codegen3.create-
hive
-table4.eval5.export6.import7.import-all-tables8.job9.list-databases10.list-tables11
猿来孺词
·
2024-01-29 10:26
sqoop
sqoop
hadoop
hive
数据仓库
数据库
Sqoop实用linux脚本
1、通用脚本1.1、Sqoop导入DATADB数据到
HIVE
sqoop_load_data.sh#!
猿来孺词
·
2024-01-29 10:26
sqoop
sqoop
linux
数据仓库
数据库
分布式
大数据
hive
数据仓库
(Data Warehouse,DW)
目录1、基本概念2、
数据仓库
特点2.1面向主题SubjectOriented2.2集成Integrated2.3非易失Non-Volatile2.4反应历史变化TimeVariant3、
数据仓库
VS数据库
猿来孺词
·
2024-01-29 10:25
离线数仓
数据仓库
大数据
数据库
分布式
数据分析
数据仓库
模型设计:从架构到实践的全方位指南
数据仓库
作为组织中管理和分析数据的关键平台,其建设规范对于确保数据的准确性和完整性至关重要。一、数仓模型架构在构建
数据仓库
时,首先需要明确模型架构,以确保
数据仓库
的高内聚和低耦合,以及数据的分层管理。
猿来孺词
·
2024-01-29 10:51
数据仓库
架构
大数据
Linux一条命令换阿里源
Debian/Ubuntu系统:sudocp/etc/apt/sources.list/etc/apt/sources.list.backup#备份原始源列表sudosed-i's/http:\/\/arc
hive
.ubuntu.com
吻等离子
·
2024-01-29 09:00
嵌入式知识专栏
linux
运维
服务器
Hive
-DML
Load在将数据加载到表中时,
Hive
不会进行任何转换。加载操作是将数据文件移动到与
Hive
表对应的位置的纯复制或移动操作。
KevinDu_134d
·
2024-01-29 09:20
bert预训练模型下载
查看bert模型所支持的预训练模型有哪些fromtransformersimportBERT_PRETRAINED_MODEL_ARC
HIVE
_LISTprint(BERT_PRETRAINED_MODEL_ARC
HIVE
_LIST
木下瞳
·
2024-01-29 08:13
NLP
机器学习
深度学习
模型
bert
深度学习
人工智能
Hive
报错 Invalid column reference 列名
两张表当我执行selectm.movieid,m.moviename,substr(m.moviename,-5,4)asyears,avg(r.rate)asavgScoreFROMt_movieasmjoint_ratingasronm.movieid=r.movieidGROUPbym.movieidHAVINGavgScore>=4;报错:Invalidcolumnreference'mo
木下瞳
·
2024-01-29 08:43
hive
【美团】交易系统平台-
数据仓库
研发工程师
更新时间:2024/01/28|工作地点:北京市|事业群:到家事业群|工作经验:3年部门介绍到家研发平台秉承“零售+科技”战略,致力于推动餐饮、零售需求侧和供给侧数字化升级,构建了超大规模的在线交易平台和实时调度系统,保障了百万商家和亿级用户的高效安全交易,实现了对百万骑手所在物理世界全链路的数字化。随着万物到家业务战略推进,我们在需求侧致力于通过大数据与大算力深度融合,建设强大的LBS零售电商系
探小虎
·
2024-01-29 08:53
大厂工作机会
数据仓库
java
spring
kafka
java jdk8和jdk17同时存在【环境配置】
1、先进行环境下载:jdk8:https://www.oracle.com/cn/java/technologies/javase/javase8u211-later-arc
hive
-downloads.htmljdk17
你小子在看什么……
·
2024-01-29 08:22
环境配置
java
windows
ubuntu18.04安装paddlepaddle开发环境
//www.jianshu.com/p/e70436c3b0072.安装CUDA下载选择系统信息:https://developer.nvidia.com/cuda-10.0-download-arc
hive
奋斗_登
·
2024-01-29 07:24
Hadoop,
HIve
, Spark关系简述
Hive
:在Had
小白兔奶糖ovo
·
2024-01-29 07:22
hadoop
hive
spark
【cdh】
hive
执行SQL提示缺少3.0.0-cdh6.3.2-mr-framework.tar.gz文件
问题:执行SQL报错提示缺少文件异常信息如下在hdfs上查看的时候连文件夹都没有,所以这个异常会抛出,但是我是基于CDH搭建的,可以直接基于下面操作执行完成之后查看HDFS文件重新执行SQL发现可以正常执行了
谷新龙001
·
2024-01-29 07:46
hive
sql
mr
记一次Flink自带jar包与第三方jar包依赖冲突解决
flink版本1.14.5hadoop2.6.0为了实现flink读取
hive
数据写入第三方的数据库,写入数据库需要调用数据库的SDK,当前SDK依赖的protobuf-java-3.11.0.jar,
一枚小刺猬
·
2024-01-29 06:10
flink
flink
jar
hadoop
Hive
之set参数大全-19
指定用于计算列的唯一值数(NDV,即基数)的算法在
Hive
中,
hive
.stats.ndv.algo是一个配置参数,用于指定用于计算列的唯一值数(NDV,即基数)的算法。
OnePandas
·
2024-01-29 06:39
Hive
hive
数据仓库
Hive
之set参数大全-20
指定在执行大表半连接操作时的最小表大小,以决定是否启用半连接操作的优化在
Hive
中,
hive
.tez.bigtable.minsize.semijoin.reduction是一个配置参数,用于指定在执行大表半连接操作时的最小表大小
OnePandas
·
2024-01-29 06:03
Hive
hive
数据仓库
Hive
(
Hive
Server2 & Beeline)
hive
有两种方式写SQL;方式一:bin/
hive
是
hive
的shell客户端,可直接写sql方式二:bin/
hive
--service
hive
server2后台执行脚本:nohupbin/
hive
-
%HelloWorld%
·
2024-01-29 03:41
hive
hadoop
数据仓库
Hive
初体验
首先,确保启动了Metastore服务{runjar就是metastore;hadoop要先启动}可以执行:bin/
hive
进入到
Hive
Shell环境中,可以直接执行SQL的语句;·创建表(
hive
里面的字符串就是
%HelloWorld%
·
2024-01-29 03:09
hive
hadoop
数据仓库
[架构之路-255]:目标系统 - 设计方法 - 软件工程 - 软件设计 - 架构设计 - 软件架构风格:串行-数据流风格、同步调用返回风格、并行异步分发与接收风格、虚拟机风格、
数据仓库
风格
目录前言:一、建筑风格1.1什么是建筑风格1.2常见的建筑风格1.3如何区分不同的建筑风格二、软件架构风格概述2.1什么是软件架构风格2.2如何区分不同的软件架构风格2.3软件架构风格的发展阶段2.4软件架构风格与软件架构的区别2.5常见的软件架构风格的种类1.8复杂软件系统可以组合多种架构风格二、常见的软件架构风格详解2.1A-串行-数据流风格:适合数据面业务处理(数据面)(1)A-串行-数据流
文火冰糖的硅基工坊
·
2024-01-29 00:25
架构之路
架构
软件工程
风格
Hive
中left join 中的where 和 on的区别
目录一、知识点二、测试验证三、引申一、知识点leftjoin中关于where和on条件的知识点:多表leftjoin是会生成一张临时表。on后面:一般是对leftjoin的右表进行条件过滤,会返回左表中的所有行,而右表中没有匹配上的数据直接补为null。on后面:如果存在对左表的筛选条件,无论条件真假,仍返回左表中的所有行,只是会影响右表的匹配值。即:on中针对左表的限制条件只会影响右表的匹配内容
爱吃辣条byte
·
2024-01-28 23:11
Hive
hive
hadoop
数据仓库
数仓治理-小文件治理
注:文章参考:数据治理实践|小文件治理本文中将介绍
Hive
中小文件治理的方法和技巧,希望对大家有所帮助https://mp.weixin.qq.com/s/HDxAGhGIPvXF38wPiXZ7xg[
爱吃辣条byte
·
2024-01-28 23:40
数据治理
大数据
数据仓库
Hive
SQL题——用户连续登陆
目录一、连续登陆1.1连续登陆3天以上的用户0问题描述1数据准备2数据分析3小结1.2每个用户历史至今连续登录的最大天数0问题描述1数据准备2数据分析3小结1.3每个用户连续登录的最大天数(间断也算)0问题描述1数据准备2数据分析3小结一、连续登陆1.1连续登陆3天以上的用户0问题描述查询连续登陆3天以上的用户(字节面试题)1数据准备createtableifnotexiststable1(idi
爱吃辣条byte
·
2024-01-28 23:09
Hive
数据仓库
大数据
sql
Ubuntu官方安装微信——Ubuntu16.04/18.04/20.04/22.04
,本教程适用于Ubuntu16.04/18.04/20.04/22.04安装包下载进入微信下载官网下载微信Linux客户端点击64位下载即可,如果不能下载,使用终端如下命令wgethttp://arc
hive
.ubuntukylin.com
HIT_Vanni
·
2024-01-28 18:32
Ubunut
ubuntu
linux
运维
微信
iproute 随手记
想要学习iproute请去https://www.zsythink.net/arc
hive
s/1199讲解的非常好。
kaiyuanheshang
·
2024-01-28 17:00
Linux
iproute
win10安装mysql8免安装版
官网地址:link安装mysql解压选择Windows(x86,64-bit),ZIPArc
hive
下载,将会得
迷踪客
·
2024-01-28 17:57
环境搭建
mysql
mysql
数据库
windows
关于
hive
的迁移 之 表结构批量迁移
image.png我们在做数据治理
数据仓库
的时候,集群数据迁移时必不可少的一项,因为什么呢,比如1刚开始集群搭在亚马逊aws,几十万美金的创业红包用完了,差不多三四个月,2aws的小规模集群也有900TB
Helen_Cat
·
2024-01-28 16:44
HIVE
优化场景三-合理并行控制
场景三.合理进行并行控制合理的使用并行化参数控制并行化参数有以下几个:开启任务并行执行set
hive
.exec.parallel=true;允许并行任务的最大线程数set
hive
.exec.parallel.thread.number
xuanxing123
·
2024-01-28 14:36
CUDA下载安装教程,新手详细
一、下载进入官方下载地址:https://developer.nvidia.com/cuda-toolkit-arc
hive
选择自己需要的版本。
ChangYan.
·
2024-01-28 14:57
安装问题
c++
oracle数据同步开源,阿里开源数据同步工具--DataX
:能够将MySQLsqlServerOracle
Hive
HBaseFTP之间进行稳定高效的数据同步。设计思路:网状连接-》星型连接看图:目前支持哪些数据同步?
海纳易拓
·
2024-01-28 12:09
oracle数据同步开源
mysql 同步 工具 开源_开源数据同步工具——datax
开源数据同步工具——dataxDataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括MySQL、Oracle、SqlServer、Postgre、HDFS、
Hive
、ADS、HBase、
weixin_39942572
·
2024-01-28 12:08
mysql
同步
工具
开源
Presto源码阅读——如何获取
Hive
中的Metadata(HMS+HDFS)
Presto源码阅读——如何获取
Hive
中的Metadata(HMS+HDFS)本文的Metadata定义SQLonHadoop系统在执行一个query时所需要的Metadata主要有两部分
Hive
中的
stiga-huang
·
2024-01-28 12:38
Presto
Impala-shell卡顿分析——记一次曲折的Debug经历
Impala-shell卡顿分析——记一次曲折的Debug经历问题发现最近准备在Impala中增加对UTF-8的支持,以修正跟
Hive
、Spark等基于Java的系统在UTF-8字符串上的不兼容表现(如
stiga-huang
·
2024-01-28 12:06
Impala
大数据
impala
debug
Impala元数据简介
与其它SQL-on-Hadoop的ROLAP解决方案如Presto、SparkSQL等不同的是,Impala对元数据(Metadata/Catalog)做了缓存,因此在做查询计划生成时不再依赖外部系统(如
Hive
stiga-huang
·
2024-01-28 12:05
Impala
Impala元数据缓存的生命周期
在
Hive
中建了个新表,但在Impala中不可见,如何解决?在
Hive
中建了个新的函数,
stiga-huang
·
2024-01-28 12:05
Impala
impala
Impala依赖组件的客户端源码下载
比如Impala-4.3.0依赖的CDP_BUILD_NUMBER是44206393,在bin/impala-config.sh中也列出了组件版本,如
Hive
版本是3.1.3000.7.2.18.0-273
stiga-huang
·
2024-01-28 12:04
Impala
impala
开源数据同步工具DataX
DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、
Hive
、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS
快乐江小鱼
·
2024-01-28 12:34
java
开源
java
黑猴子的家:
Hive
删除数据库
1、删除空数据库
hive
>dropdatabasedb_
hive
2;2、如果删除的数据库不存在,最好采用ifexists判断数据库是否存在
hive
>dropdatabasedb_
hive
2;FAILED
黑猴子的家
·
2024-01-28 11:12
hive
之行转列与列转行的实现
一:前言在某些场景下比如报表的产出,为了更加易于理解,往往会行列互置这样显示,又或者我们需要将某个相同键的值,所属的属性进行合并显示,这样都会用到行转列或者列转行。二:行转列如何实现使用lateralview结合explode这样的UDTF进行实现,由于explode的参数要求是list()或者array()类型,所以往往还需要用到spilt函数进行分割。以下是一个演示:selectsplit(d
愤怒的谜团
·
2024-01-28 11:02
66.管理
Hive
外部表——Sentry
66.1演示环境介绍操作系统:CentOS6.5CM和CDH版本:5.12.1采用root用户操作集群运行正常,Kerberos/HDFS/
Hive
/Impala/Hue服务已与Sentry集成,
Hive
大勇任卷舒
·
2024-01-28 11:57
浅谈
Hive
和HBase有哪些区别与联系及适用场景
在学大数据分析的过程中,
Hive
和HBase是两个非常重要的内容,对于初学者而言容易混淆。所以比较两者的联系与差别,能够帮助我们对这两个组件有一个清晰的认识和定位。
尚学先生
·
2024-01-28 11:19
上一页
14
15
16
17
18
19
20
21
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他