E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hive源码分析
大厂大数据面试题收录(1)
8.
Hive
sql到MapReduce转化的流程清楚吗?
后季暖
·
2024-01-23 11:49
java
开发语言
Hadoop基本介绍
1、Hadoop的整体框架Hadoop由HDFS、MapReduce、HBase、
Hive
和ZooKeeper等成员组成,其中最基础最重要元素为底层用于存储集群中所有存储节点文件的文件系统HDFS(HadoopDistributedFileSystem
w蕾丝
·
2024-01-23 08:53
DATAX的架构和运行原理
一.概念DATAX呢就是把各个不同构的数据库进行同步的过程,具体有hdfs
hive
Oracle等等吧。二.架构1.设计原理显而易见从强连通图到星形图,大大的简化了工作量。
加林so cool
·
2024-01-23 08:37
架构
SpringBoot
源码分析
:prepareEnviroment()
prepareEnviroment做了什么?主要作用按顺序加载命令行参数,系统参数和外部配置文件,创建并配置Web环境,获取profiles.active属性,并发布ApplicationEnvironmentPreparedEvent事件,之后获取属性时,按顺序获取,获取到就立即返回,实现了属性之间的合理加载与替换//准备环境privateConfigurableEnvironmentprepa
weixin_44145526
·
2024-01-23 07:36
spring
boot
后端
java
Sqoop数据导入到
Hive
表的最佳实践
将数据从关系型数据库导入到
Hive
表是大数据领域中的常见任务之一,Sqoop是一个强大的工具,可以帮助实现这一目标。
晓之以理的喵~~
·
2024-01-23 07:35
sqoop
hive
sqoop
hadoop
HIVE
中关联键类型不同导致数据重复,以及数据倾斜
比如左表关联键是string类型,右表关联键是bigint类型,关联后会出现多条的情况解决方案:关联键先统一转成string类型再进行关联原因:根据
HIVE
版本不同,数据位数上限不同,低版本的超过16位会出现这种情况
帅成一匹马
·
2024-01-23 07:34
hive
hadoop
数据仓库
cdh6.3.2的
hive
配udf
之后就可以永久使用了,重启hs2也可以调研先查的
hive
官网https://cwiki.apache.org/confluence/display/
Hive
/LanguageManual+UDF#La
zdkdchao
·
2024-01-23 07:02
hive
hadoop
数据仓库
究极保姆式教你如何在Ubuntu上源码安装Qt5.15.2
**Ubuntu下Qt5.15.2源码安装环境:Ubuntu18.04(qt5.15.2要求最少也得在18.04以上)一.下载源码1.打开官网:https://download.qt.io/arc
hive
程序小白的成长旅程
·
2024-01-23 06:17
c++
Qt
linux
qt
c++
linux
ubuntu
centos
Hive
拉链表详解及实例
拉链表版本迭代:
hive
0.14slowlychangingdimension=>
hive
2.6.0merge事务管理原来采用分区表,用户分区存储历史增量数据,缺点是重复数据太多定义:数仓用于解决持续增长且存在一定时间时间范围内重复的数据存储
Byyyi耀
·
2024-01-23 06:45
hive
hadoop
数据仓库
拉链表
Hive
数仓及数仓设计方案
数仓(DataWarehouse)数据仓库存在的意义在于对企业的所有数据进行汇总,为企业各个部门提供一个统一、规范的出口。做数仓就是做方案,是用数据治理企业的方案。数据仓库的特点面向主题集成公司中不同的部门都会去数据仓库中拿数据,把独立从数据仓库中拿数据的单元,称为一个主题。数据仓库中的数据是从各个分散的数据库中抽取出来的,需要进行完整集合,还要进行数据处理。涉及的数据操作主要是查询数仓的本质能够
Byyyi耀
·
2024-01-23 06:34
hive
hadoop
数据仓库
zeppelin部署文档
后台支持接入多种数据处理引擎,如spark,
hive
等。
不加班程序员
·
2024-01-23 06:54
Hadoop相关
elasticsearch
spark
spark
大数据
开发工具
hbase
数仓建设 - 维度建模 - DIM维度
表结构设计3.2ETL任务脚本四、地区维度表4.1表结构设计4.2ETL任务脚本五、日期维度表六、用户维度表6.1表结构设计6.2ETL任务脚本前置:准备数据库[hadoop@hadoop102apache-
hive
m0_46218511
·
2024-01-23 05:14
大数据基础设施搭建
维度建模
数据仓库
jenkins ios 配置
结果登录打包机看了一下发下是硬盘空间还有80G后来想想证书好像换了,所以就去检查了一下打包机的证书,果然,证书不对,导入新的证书后,发现打包还是不对,然后重新核对导出文件,结果发现导出文件也是各种对不上,所以本地又arc
hive
张_何
·
2024-01-23 05:10
RocketMQ
源码分析
----长轮询
废话这篇文章主要讲RocketMQ的长轮询,为什么叫长轮询我也不清楚....主要别人这样叫我也这样叫吧,大家明白意思就好。正文RcocketMQ消费者的模式是pull模式,也就是会定时向Broker请求消息进行消费。在源码中实现是开启了后台线程不停的去pull(当然会先从队列去PullRequest,队列为空会阻塞),刚研究RocketMQ消费者pull的代码之后不久,有个问题:如果长时间没有消息
_六道木
·
2024-01-23 05:50
《Linux高性能服务器编程》笔记05
raichen/LinuxServerCodes豆瓣:Linux高性能服务器编程文章目录Linux高性能服务器编程第12章高性能I/O框架库Libevent12.1I/O框架库概述12.2Libevent
源码分析
阿正的梦工坊
·
2024-01-23 04:26
Linux
Server
服务器
linux
PostgreSQL
源码分析
:postgres.c阅读笔记
postgres.c是PostgreSQL后端的重要源代码文件,负责管理查询的整体流程。本文以PostgreSQL-12.2为例,首先对postgres.c的功能、包含的函数及函数间的调用关系进行简单概述;然后详细介绍其中的入口函数PostgresMain,并且对于PostgresMain函数涉及的通信协议将做进一步展开说明。1.postgres.c概况PostgreSQL是典型的C/S的模式,服
fufufunny
·
2024-01-23 03:19
数据库
数据库
postgresql
源码
Presto
完全基于内存的并行计算的分布式SQL查询引擎,是一种Massivelyparallelprocessing(MPP)架构,多个节点管道式执行,适用于交互式分析查询,数据量支持GB到PB字节,presto的查询速度比
hive
Cool_Pepsi
·
2024-01-23 02:43
大数据
big
data
presto
Hadoop --
Hive
文章目录1.什么是
hive
?1.1基本思想1.2为什么使用
hive
?
Cool_Pepsi
·
2024-01-23 02:12
大数据
hive
Hadoop -- ZooKeeper
ZooKeeper就是动物园管理员,他是用来管hadoop(大象)、
Hive
(蜜蜂)等的管理员。
Cool_Pepsi
·
2024-01-23 02:42
大数据
zookeeper
Hive
自定义函数
系统内置函数查看系统内置函数
hive
>showfunctions;显示内置函数用法
hive
>descfunction函数名;详细显示内置函数用法
hive
>descfunctionextended函数名;
歌哥居士
·
2024-01-23 01:41
Spring Security
源码分析
三:Spring Social实现QQ社交登录
OAuth2.0的认证流程示意图http://dandandeshangni.oss-cn-beijing.aliyuncs.com/github/Spring%20Security/OAuth2-Sequence.png请求第三方应用第三方应用将用户请求导向服务提供商用户同意授权服务提供商返回codeclient根据code去服务提供商换取令牌返回令牌获取用户信息在标准的OAuth2协议中,1-
淡淡的伤你
·
2024-01-23 00:38
Redisson分布式锁源码篇
❤️文章目录Redisson分布式锁源码篇一、使用Redisson分布式锁1.1引入依赖1.2调用API二、源码解析2.1可重入锁原理(1)原理解释(2)
源码分析
①尝试获取锁②
欧克小奥
·
2024-01-22 23:13
Redis
分布式
Redisson
vector的模拟实现
vector的使用以及对一些常见bug的认识有了string类的模拟实现,vector的模拟实现我们上手起来就简单一点了:首先为了和库里面的vector混淆视听,放入自己命名的空间里,并且根据vector的
源码分析
我们得出了三个成员变量
只是雪豹
·
2024-01-22 21:00
c++
算法
c++
开发语言
数据结构
源码分析
->解密Lifecycle(1)之监听
关键字:Lifecycle
源码分析
基于androidx.appcompat:appcompat:1.2.01.什么是Lifecycle?
杨0612
·
2024-01-22 21:23
CDH6.2 集群离线部署
免密码登录认证在cm-server服务器上下载CDH6.2相关的安装包安装nginx做cm本地yumrepo服务器安装postgressql安装和配置cm-server配置CDH集群CDH集群配置lzo压缩
hive
那些、快乐。
·
2024-01-22 21:44
大数据
hadoop
linux
Xcode 清理缓存,瘦身
路径:1~/Library/Developer/Xcode/DerivedData释放空间:0~xxGB移除APP打包的ipa历史版本(Arc
hive
s)删除后不可恢复,文件夹是按照日期排列的,
西充小凡哥
·
2024-01-22 19:57
Impala:基于内存的MPP查询引擎
Impala查询引擎1、Impala概述1.1、Impala简介1.2、Impala的特点1.3、Impala与
Hive
1、Impala概述1.1、Impala简介Impala是Cloudera公司主导研发的高性能
对许
·
2024-01-22 17:26
Java大数据
#
Hadoop及生态圈
#
数据湖仓
大数据
Apache doris Datax DorisWriter扩展使用方法
DataX实现了包括MySQL、Oracle、SqlServer、Postgre、HDFS、
Hive
、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、Hologres
张家锋
·
2024-01-22 15:27
树莓派使用命令sudo apt-get update报错
问题描述报错内容为:Hit:1http://arc
hive
.raspberrypi.com/debianbookwormInReleaseHit:2http://raspbian.raspberrypi.com
观北海
·
2024-01-22 15:41
linux
Eighth C++基础之C++与C语言的区别及细节
原文链接(点击原文链接获取更多学习干货):http://blog.bools.cn/arc
hive
s/1335C语言与C++在之前学习当中,我们知道C语言是面向过程的,而C++是面向对象的。
布尔青年-斯利普
·
2024-01-22 15:18
基础知识
c语言
c++
r语言
CentOS7下Hadoop2.9.2、
Hive
2.3.6安装与实践
参考的安装文章地址:https://blog.csdn.net/pengjunlee/article/details/81607890实际安装的版本为:hadoop2.9.2,
hive
2.3.6;操作系统
流火星空
·
2024-01-22 14:58
大数据
hive
大数据
hive
java大数据hadoop2.9.2 Linux安装mariadb和
hive
一、安装mariadb版本centos71、检查Linux服务器是否已安装mariadbyumlistinstalledmariadb*2、如果安装了,想要卸载yumremovemariadbrm-rf/etc/my.cnfrm-rf/var/lib/mysql才能完全删除3、安装mariadb在线网络安装yuminstall-ymariadb-server开启服务systemctlstartma
crud-boy
·
2024-01-22 14:26
java大数据
大数据
linux
mariadb
EPICS Arc
hive
r Appliance的定制部署1
/details/112116112简单部署试了一下之后,又试了下Sitespecificinstalls,从下面链接开始:http://slacmshankar.github.io/epicsarc
hive
r_docs
USTC-lup
·
2024-01-22 14:24
EPICS
mysql
LNMP安装composer install时出现Warning: putenv()
hasbeendisabledforsecurityreasonsin…的问题date:2020-03-29tags:["Laravel"]原文地址:https://www.wjcms.net/arc
hive
s
wjcms
·
2024-01-22 13:41
SpringBoot @Schedule未按时执行问题解决
检查@Schedule的源码(Spring@Schedule
源码分析
),发现Schedule定时任务时串行的(定义的线程池是核心线
黄国海Argo
·
2024-01-22 13:57
spring
boot
springboot 自动注入
源码分析
spring.factories
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档目录前言一、铂金手写starter组件,开源starter组件结构1.项目层级2.各个项目引入关系3.项目侧使用二、星耀源码跟踪分析1.SpringApplication.run开始到->refreshContext2.spring的refreshContext->invokeBeanFactoryPostProcessors3.in
zengliangxi
·
2024-01-22 12:10
源码解读
springboot
自动装配
源码分析
java
SpringBoot 自动装配
自动装配
源码分析
:处理@Import的注解,获取AutoConfigurationImportSelector类调用AutoConfigurationImportSelector.selectImports
罗志宏
·
2024-01-22 12:39
java
中间件
java
spring
boot
关于
Hive
架构原理,尚硅谷
最近学习
hive
时候,在做一个实操案例,具体大概是这样子的:我在dataGip里建了一个表,然后在hadoop集群创建一个文本文件里面存储了数据库表的数据信息,然后把他上传到hdfs后,dataGrip
大数据SQLboy
·
2024-01-22 11:41
Hive
hive
架构
hadoop
【译】优化CSS 性能的20个技巧
根据最新的HTTPArc
hive
报告,在Web中,存在大量的中断网站,它们要求在80个HTTP请求中分配1700KB的数据,并需要17秒才能完全加载到移动设备上。本
依然还是或者其他
·
2024-01-22 11:57
SpringCloud Alibaba 深入源码 - Nacos 分级存储模型、支撑百万服务注册压力、解决并发读写问题(CopyOnWrite)
目录一、SpringCloudAlibaba
源码分析
1.1、SpringCloud&SpringCloudAlibaba常用组件1.2、Nacos的服务注册表结构是怎样的?
陈亦康
·
2024-01-22 10:49
SpringCloud
&
Alibaba
面试总结
spring
cloud
spring
后端
Impala
最大的特点就是速度快Impala优势Impala的诞生
Hive
与MR适合离线批处理,但是对交互式查询的场景无能为力(快速响应),所以为了积极查询速度问题开发了Impala,Impala抛弃了MR,使用了类似传统的
奋斗的蛐蛐
·
2024-01-22 10:42
【io_uring】内核
源码分析
文章目录1.`io_uring`2.系统调用`io_uring_setup`2.1.`io_uring_setup`2.2.`io_uring_create`2.3.`io_sq_offload_start`3.系统调用`io_uring_enter`4.系统调用`io_uring_register`5.内核线程`io_sq_thread`6.`IOPOLL`模式6.1.启用6.2.限制6.3.调
ywang_wnlo
·
2024-01-22 10:57
存储
io_uring
[executorService.invokeAll+Callable实现批量等待任务并发执行】 1.多线程导表案例 2.使用for循环+Future的isDone()实现等待
源码分析
ThreadDto.java//定义可以并行的任务importjava.util.concurrent.Callable;publicclassThreadDtoimplementsCallable{@OverridepublicBooleancall()throwsException{//一个线程里面具体又干10件事for(inti=0;ilist=newLinkedListtaskMap=Ma
zfoo-framework
·
2024-01-22 10:22
#
java多线程
java
开源库之 OkHttp
源码分析
分析一波OkHttp的源码实现。简单使用官方给出了使用例子,具体详情参考官网。//创建OkHttp请求客户端OkHttpClientclient=newOkHttpClient();//构建一个请求Requestrequest=newRequest.Builder().url(url).build();//执行网络请求并返回结果Responseresponse=client.newCall(req
glumes
·
2024-01-22 09:52
如何解决
Hive
数据倾斜的问题
⾸先要知道的是数据倾斜的本质是数据分配不均匀,那么造成不均匀的原因有很多,⽐如热点key,⾮热点key分布不均匀等。那么需要定位到具体发⽣原因,才能对症下药。从技术层⾯来说(1)⾸先怀疑的是数据热点key,这⾥可以根据采样统计来判断是否有部分key记录过多(2)如果是热点key,则可以采⽤单独处理或者⼆次聚合等⽅法来处理(3)如果不是热点key,那么有可能是key本身分布不均匀导致的,那么可以采⽤
不良人-程序星
·
2024-01-22 09:02
hive
hadoop
数据仓库
Apache
Hive
(二)
一、Apache
Hive
1、
Hive
SQLDML语法之加载数据2、
Hive
SQLDML语法之查询数据3、
Hive
SQLJoin关联查询4、
Hive
SQL中的函数使用数据仓库&Apache
Hive
请记住,
杀神lwz
·
2024-01-22 09:16
数据分析
大数据
apache
hive
hadoop
oracle如何定期备份数据库sql文件
可以使用RMAN备份的命令来备份数据库,例如:RMAN>BACKUPASBACKUPSETDATABASEPLUSARC
HIVE
LOG;这将
酷爱码
·
2024-01-22 08:54
经验分享
编程学习
数据库
oracle
sql
Kotlin协程的JVM实现
源码分析
(下)
协程根据是否保存切换调用栈,分为:有栈协程(stackfulcoroutine)无栈协程(stacklesscoroutine)在代码上的区别是:是否可在普通函数里调用,并暂停其执行。Kotlin协程,必须在挂起函数中调用和恢复,属于无栈协程。常见的语言,协程实现:有栈协程:Go、Lua无栈协程:Kotlin、C++20、Clojure、JavaScript二、无栈协程和Continuation2
ClassOps
·
2024-01-22 08:18
Kotlin协程
kotlin
jvm
junit
hive
sql转换成MR任务过程
hive
sql转换成MR任务过程1)用户接口:ClientCLI(command-lineinterface)、JDBC/ODBC(jdbc访问
hive
)、WEBUI(浏览器访问
hive
)2)元数据:Metastore
上官沐雪
·
2024-01-22 08:08
hive
hive
kotlin $ (字符串模版)的使用
作用就是在字符串里面识别自己定义的字符例如打印一个字符这个时候编译就提示我们使用字符串模版的是个$的作用就是识别字符串里面的i字数有点少了,在写一个demoprivatefunString.appendArc
hive
胡小牧
·
2024-01-22 08:07
Kotlin知识总结
kotlin
开发语言
android
上一页
25
26
27
28
29
30
31
32
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他