景明。

[ 知识点 ] Hive基础知识笔记

Hive基础知识笔记

一、Hive内、外部表
- （一）Hive内、外部表的异同
- （二）创建内、外部表
二、Hive分区表
- （一）分区表的基本操作
- （二）多级分区
- （三）动态分区
- （四）Hive动态、静态分区的异同
三、Hive分桶表
- （一）了解
- （二）设置
- （三）操作
四、常用命令
- （一）操作数据库的一般流程
- （二）删除表的操作
- （三）修改表的操作
- （四）修改表中的列的操作
- （五）创建临时表
- （六）装载数据
五、Hive中with...as的用法
- （一）基础格式
- （二）同级格式
- （三）嵌套格式
- （四）只能在一条SQL语句中使用
六、CTAS
- （一）了解
- （二）使用CTAS创建表的好处
- （三）使用CTAS创建表时需要注意的地方
七、使用CTAS创建表的代码
- （一）直接使用CTAS创建表,不指定创建部分的约束
- （二）在使用CTAS创建表时，指定表的存储格式等属性
- （三）使用CTE (CTAS with Common Table Expression)创建创建表
- （四）使用CTAS创建视图
- （五）查看使用CTAS建表后的表结构
八、半自动化模式create table like...
- （一）了解
- （二）操作
九、Storage SerDe

前言：下文都是一些常见的命令及用法，没有过多生僻的、技巧性的东西。

一、Hive内、外部表

（一）Hive内、外部表的异同

1.内、外部表表结构都由hive控制

2.数据控制权不同

（1）内部表由hive控制。
（2）外部表不由hive控制（可以是hdfs、hbase）。

3.删除表产生的结果不同

（1）删除内部表结构和数据一起删除。
（2）删除外部表只能删除表结构。

（二）创建内、外部表

#创建一个内部表

create table if not exists student(
id int, name string
)
row format delimited fields terminated by '\t'

#创建一个外部表

create external table if not exists employee_external (
    name string,
    work_place ARRAY<string>,
    sex_age STRUCT<sex:string,age:int>,
    skills_score MAP<string,int>,
    depart_title MAP<string,ARRAY<string>>
)
comment 'This is an external table'
row format delimited fields terminated by '|'
collection items terminated by ','
map keys terminated by ':'
stored as textfile
location '/home/hadoop/hive/warehouse/employee';

二、Hive分区表

（一）分区表的基本操作

分区表实际上就是对应一个 HDFS 文件系统上的独立的文件夹，该文件夹下
是该分区所有的数据文件。Hive 中的分区就是分目录，把一个大的数据集根据业
务需要分割成小的数据集。
1.创建分区表

create table A(
	deptno int,
	dname string,
	loc string
)
partitioned by (month string)
row format delimited fields terminated by '\t';

2.加载数据到分区表中

load data local inpath 'PATH' into table A partition(month='201909');

3.查询分区表中数据

# 单分区查询
select * from A where month='201909';

# 多分区联合查询
select * from A where month='201909'
union all
	select * from A where month='201908'
union all
	select * from A where month='201907';

4.添加分区

# 创建单个分区
alter table A add partition(month='201906') ;

# 同时创建多个分区
alter table A add
partition(month='201905')
partition(month='201904');

5.删除分区

# 删除单个分区
alter table A drop
partition(month='201904');

# 同时删除多个分区
alter table A drop 
partition(month='201905'),
partition(month='201906');

6.查看分区表有多少分区

show partitions A;

7.查看分区表结构

desc formatted A;

（二）多级分区

1.创建二级分区表（还可以创建多级分区）

create table A2 (
	deptno int,
	dname string,
	loc string
)
partitioned by (month string, day string)
row format delimited fields terminated by '\t';

2.加载数据到二级分区表中

load data local inpath 'PATH' into table A2 partition(month='201909', day='13');

3.查询分区表数据

select * from A2 where month='201909' and day='13';

（三）动态分区

1.当使用静态分区时，在想分区表中插入数据时，我们要指定具体分区列的值，而在动态分区中插入数据时，只要指定分区字段，不用指定具体的分区列值。

2.动态分区在Hive 2.3.4版本前都是禁用的，所以要将hive.exec.dynamic.partition设置为true。

（四）Hive动态、静态分区的异同

1.建表方式一致

2.分区和模式不同

（1）静态分区表动态分区关闭且模式严格，通常默认是静态分区。
（2）动态分区表需要开启动态分区却设置模式非严格。

set hive.exec.dynamic.partition=true			默认为false
set hive.exec.dynamic.partition.mode=nonstrict	默认为strict

3.载入数据方式不同

（1）静态分区只能通过load方式一次一个分区装载数据。

alter table TABLE_NAME add [if not exists] partition(FIELD='VALUE'...) location 'PATH';	
load data [local] inpath 'DATA_FILE PATH' [overwrite] into table TABLE_NAME partition(FIELD='VALUE'...)

（2）动态分区可以通过二级转换方式一次性添加多个分区数据。

create table TABLE_NAME ...
load ... into TEST_TABLE
insert into table PARTITION_TABLE partition(PARTITION_FIELDS ...) select ... from TEST_TABLE

三、Hive分桶表

（一）了解

1.分桶常作为一种优化的手段、一种补充技术。

2.可以将 Hive 中的分桶原理理解成 MapReduce 中的 HashPartitioner 的原理，都是基于 hash 值对数据进行分桶。

（二）设置

1.MR：按照key的hash值除以reduceTask个数进行取余(reduce_id =key.hashcode % reduce.num)。

2.Hive：按照分桶字段(列)的hash值，除以分桶的个数进行取余(bucket_id=column.hashcode % bucket.num)。

3.设置 Hive 的分桶开关

4.打开 Hive 客户端，并在会话终端开启 Hive 分桶的开关：

set hive.enforce.bucketing=true;
(此设置为临时设置，一旦退出会话终端，再打开就会恢复默认设置 false)

5.此开关打开之后，会自动根据 bucket个数自动分配Reduce task的个数，Reduce个数与bucket个数一致。( 此外， Reduce的个数还可以通过mapred.reduce.tasks进行设置，但是这方法不推荐在Hive分桶中使用)

（三）操作

1.建表

#建表语句
#注意分桶字段只能是建表中已有的字段
#而分区表的字段必须是建表中没有的字段
create table A(
	id int,
	name string,
	age int
)
clustered by(age) into 4 buckets
row format delimited fields terminated by '|';

2.向分桶表中插入数据

insert into table A
select id,name,age from B;

3.查看分桶是否成功

如果分桶成功，因为我们建的是内部表，所以在Hive的数据仓库位置下找到A文件夹，在该文件夹下应该有4个文件（一个bucket代表着一个文件）。

四、常用命令

（一）操作数据库的一般流程

create database if not exists A;			#创建名为A的数据库，加了if not exists，如果创建之前存在此数据库，则会报错。
use A;										#使用数据库A
show databases;								#显示所有数据库
describe database default; 					#可以查看数据库更多的描述信息
alter database A set owner user B;			#将数据库A的所属权给用户B
drop database if exists A cascade;			#如果数据库A里有表，在drop的时候命令末尾要加一个cascade

（二）删除表的操作

drop table if exists A[purge];		#purge表示直接删除，否则会放到Trash目录
truncate table A;					#清空表数据

（三）修改表的操作

alter table A rename to B;		#将表A重命名为B
alter table A tblproperties('comment'='New name,comments');
alter table A tblproperties('filed.delim'='$');
alter table A set fileformat rcfile;	#修正文件格式

（四）修改表中的列的操作

alter table A change old_B new_C;			#修改列名
alter table A add columns (B TYPE);			#添加列
alter table A replace columns (B TYPE);		#替换列

（五）创建临时表

create temporary table TABLE_NAME1;
create temporary table TABLE_NAME2 as ...;
create temporary table TABLE_NAME3 like ...;

（六）装载数据

load用于在Hive中移动数据。

#加local关键字，表示原始文件位于Linux本地，执行后为拷贝数据
#加上overwrite表示将A表中原有的数据删除，并将'data'中的数据写入A表中
load data local inpath 'PATH' into table A;
load data local inpath 'PATH' overwrite into table A;
load data loacl inpath 'PATH' overwrite into table A partition(B,C);


#没有local关键字，表示文件位于HDFS文件系统中，执行后为直接移动数据
#加上overwrite表示将A表中原有的数据删除，并将'data'中的数据写入A表中
load data inpath 'PATH' into table A partition(B,C);
load data inpath 'PATH' overwrite into table A partition(B,C);

五、Hive中with…as的用法

1.Hive可以通过with…as方法来提高查询性能，先通过with语法将数据查询结果存到with后的表的内存中，后续的sql均可以访问这个with结果,作用与视图或临时表类似。

2.当这个表中的数据会被经常用到的话，用with…as这个方法会比较方便。

（一）基础格式

with A as (select * from B)
select * from A;

（二）同级格式

同级的多个表之间用,分割with只需要一次,as后的子句必须用()。

with A as (selesc B from C),
B as (select D from E)
select * from (select XXX from A) a;

（三）嵌套格式

with A as(
	with B as (
		select * from C
	)
	select * fron B
)
select * from A;

#其间只在结尾处有一个英文封号。

（四）只能在一条SQL语句中使用

with A as(
	select * from B
)
select * from A;

select XXX from A; #此处就会报错，一个封号就代表一个with语句结束

六、CTAS

（一）了解

CTAS : create table [view] …as select…。

（二）使用CTAS创建表的好处

1.CTAS语句中使用查询的结果，创建和填充表，由CTAS创建的表是原子的，这意味着在填充所有查询结果之前，其他用户不会看到此表。因此，其他用户要么看到带有完整查询结果的表，要么根本看不到表。

2.CTAS中，select选择部分可以支持HQL的任何选择语句，create创建部分从select选择部分中获取结果，并可以使用SerDe和存储格式等其他表述下创建指定的目标表。

（三）使用CTAS创建表时需要注意的地方

1.在Hive中使用CTAS创建表时，不管源表是否为分区表，所创建的表都是非分区表，所以在创建时要注意分区功能的丢失。不过创建表以后可以添加分区，成为分区表。

2.在Hive中使用CTAS创建表时，源表是分区表，则新建的表会多字段，具体多的字段个数和名称，就是源表分区的个数和名称。

3.如果源表的储存格式不是TXTFILE，则使用CTAS建表时，表的存储格式会默认为TEXTFILE。比如源表是RCFILE，而新表则为TEXTFILE。

4.CTAS不能创建partition, external, bucket table。

七、使用CTAS创建表的代码

（一）直接使用CTAS创建表,不指定创建部分的约束

create table TABLE_TEST as
select
	A.1 as a1,
	A.2 as a2,
	A.3 as a3,
	A.4 as a4
	from B b
inner join C c
on b.x=c.y;

（二）在使用CTAS创建表时，指定表的存储格式等属性

create table A
	row format delimited fileds terminated by '|'
	store as textfile
as
	select * from B;

（三）使用CTE (CTAS with Common Table Expression)创建创建表

create table A as
with B as (select XXX from C)
select * from B;

（四）使用CTAS创建视图

create view A as
with B as (select XXX from C)
select * from B;

select * from A;

（五）查看使用CTAS建表后的表结构

0: jdbc:hive2://192.168.59.130:10000> create table A1 as select * from visit;

0: jdbc:hive2://192.168.59.130:10000> show create table A1;

INFO  : OK
+----------------------------------------------------+--+
|                   createtab_stmt                   |
+----------------------------------------------------+--+
| CREATE TABLE `A1`(                                 |
|   `user_id` string,                                |
|   `shop` string)                                   |
| ROW FORMAT SERDE                                   |
|   'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'  |
| STORED AS INPUTFORMAT                              |
|   'org.apache.hadoop.mapred.TextInputFormat'       |
| OUTPUTFORMAT                                       |
|   'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat' |
| LOCATION                                           |
|   'hdfs://192.168.59.130:9000/opt/software/hadoop/hive110/warehouse/a1' |
| TBLPROPERTIES (                                    |
|   'COLUMN_STATS_ACCURATE'='true',                  |
|   'numFiles'='1',                                  |
|   'numRows'='0',                                   |
|   'rawDataSize'='0',                               |
|   'totalSize'='0',                                 |
|   'transient_lastDdlTime'='1607834463')            |
+----------------------------------------------------+--+

八、半自动化模式create table like…

（一）了解

1.create table 创建表的形似允许您精确地复制现有表的定义（不复制其数据），其除了创建的表名和源表不一样外，其余所有的细节都是医用的，不过没有源表中的数据。

2.create table like的形式非常适合对源表模式的复制。

（二）操作

#建表
0: jdbc:hive2://192.168.59.130:10000> create table A2 like select * from visit;

#查询表结构
0: jdbc:hive2://192.168.59.130:10000> show create table A2;

INFO  : OK
+----------------------------------------------------+--+
|                   createtab_stmt                   |
+----------------------------------------------------+--+
| CREATE TABLE `A2`(                                 |
|   `user_id` string,                                |
|   `shop` string)                                   |
| ROW FORMAT SERDE                                   |
|   'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'  |
| WITH SERDEPROPERTIES (                             |
|   'field.delim'='|',                               |
|   'serialization.format'='|')                      |
| STORED AS INPUTFORMAT                              |
|   'org.apache.hadoop.mapred.TextInputFormat'       |
| OUTPUTFORMAT                                       |
|   'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat' |
| LOCATION                                           |
|   'hdfs://192.168.59.130:9000/opt/software/hadoop/hive110/warehouse/a2' |
| TBLPROPERTIES (                                    |
|   'transient_lastDdlTime'='1607834504')            |
+----------------------------------------------------+--+

#查看源表结构
0: jdbc:hive2://192.168.59.130:10000> show create table visit;

INFO  : OK
+----------------------------------------------------+--+
|                   createtab_stmt                   |
+----------------------------------------------------+--+
| CREATE EXTERNAL TABLE `visit`(                     |
|   `user_id` string,                                |
|   `shop` string)                                   |
| ROW FORMAT SERDE                                   |
|   'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'  |
| WITH SERDEPROPERTIES (                             |
|   'field.delim'='|',                               |
|   'serialization.format'='|')                      |
| STORED AS INPUTFORMAT                              |
|   'org.apache.hadoop.mapred.TextInputFormat'       |
| OUTPUTFORMAT                                       |
|   'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat' |
| LOCATION                                           |
|   'hdfs://192.168.59.130:9000/opt/software/hadoop/hive110/warehouse/visit' |
| TBLPROPERTIES (                                    |
|   'COLUMN_STATS_ACCURATE'='true',                  |
|   'numFiles'='1',                                  |
|   'totalSize'='95',                                |
|   'transient_lastDdlTime'='1605252908')            |
+----------------------------------------------------+--+

九、Storage SerDe

SerDe：Serializer and Deserializer，序列化与反序列化。

Hive支持不同类型的Storage SerDe
LazySimpleSerDe: TEXTFILE
BinarySerializerDeserializer: SEQUENCEFILE
ColumnarSerDe: ORC, RCFILE
ParquetHiveSerDe: PARQUET
AvroSerDe: AVRO
OpenCSVSerDe: for CST/TSV
JSONSerDe
RegExSerDe
HBaseSerDe

sequelize + Nodejs + MySQL 的简单用法小公鸡卡哇伊呀~ mysql 数据库
HowtoUseSequelizeORMinNodeJS-Tutorial1Sequlize简介Sequelize是最流行的可以与Nodejs一起使用的一种关系数据库ORM(Object-relationalmapping对象关系映射)，Mongoose是MongoDB的ORM.Sequelize的作用，简单地说，就是避免在代码里写原生SQL语句，而是将这种语句改成JavaScript：不必再写类
JavaWeb学习——登录校验灰太狼想上班 JavaWeb基础学习 spring tomcat servlet 后端
JavaWeb学习——登录校验一、功能实现只需要接受请求参数username和password，然后调用接口在数据库表中查询键值匹配的数据项即可二、登录校验登录校验通常分为两步，一是登录标记，二是统一拦截1、会话跟踪会话：用户打开浏览器，访问web服务器的资源，会话建立，知道有一方断开连接，会话结束。在一次会话中可以包含多次请求和响应会话跟踪：一种维护浏览器的方法，服务器要识别多次请求是否来自于同
运维面试常问的100道题（大数据统计）無爲謂人工智能运维面试
一、基础知识类1、请解释什么是运维？运维是指对企业的IT系统进行运行维护，包括硬件设备、软件系统、网络等的监控、管理、优化和故障处理，以确保系统的稳定、高效运行，满足业务需求。2、简述运维的主要职责有哪些？服务器的安装、配置、维护和监控。网络设备的管理和维护。数据库的管理和维护。应用系统的部署、升级和维护。故障处理和应急响应。性能优化和容量规划。安全管理和漏洞修复。3、什么是服务器？有哪些类型？服
基于oracle linux的 DBI/DBD 标准化安装文档(四) linux
一、安装DBIDBI(DatabaseInterface)是perl连接数据库的接口。其是perl连接数据库的最优方法，他支持包括Orcale,Sybase,mysql,db2等绝大多数的数据库，下面将简要介绍其安装方法。1.1解压tar-zxvfDBI-1.616_901.tar.gz1.2安装依赖yuminstallperl-ExtUtils-CBuilderperl-ExtUtils-Mak
mysql中json数组对象mybatis如何自动映射
需求:假如数据库某个表的一个字段是json数据类型,字段名是students,类型是,存的是json格式的学生数组,现要用一个List来接收,如何实现自动转换.1.实现TypeHandlerwhy?如果json字段存的是数组,直接使用"com.baomidou.mybatisplus.extension.handlers.FastjsonTypeHandler"会给你转成List类型;所以需要自己
wordpress导入mysql数据库文件的方法及注意事项 wodrpress资源分享 wordpress 数据库 mysql wordpress
WordPress是一个流行的开源内容管理系统，通常用于构建网站和博客。它使用MySQL数据库来存储和管理网站数据。在某些情况下，您可能需要将现有的MySQL数据库导入到新的WordPress安装中。本文将介绍如何导入MySQL数据库文件到WordPress以及需要注意的事项。一、备份现有数据库在进行任何数据库导入操作之前，强烈建议您先备份现有的数据库。这样可以确保在导入过程中出现问题时，您不会丢
【go从入门到精通】探秘struct结构体转json为什么需要首字母大写？前网易架构师-高司机 golang从入门到精通 golang json go 结构体首字母大写 golang从入门到精通 go从入门到精通
目录作者简介：问题抛出分析结论作者简介：高科，先后在IBMPlatformComputing从事网格计算，淘米网，网易从事游戏服务器开发，拥有丰富的C++，go等语言开发经验，mysql，mongo，redis等数据库，设计模式和网络库开发经验，对战棋类，回合制，moba类页游，手游有丰富的架构设计和开发经验。并且深耕深度学习和数据集训练，提供商业化的视觉人工智能检测和预警系统（煤矿，工厂，制造业
Linq的理解 It_sharp C#Linq 匿名类型
前面的话这篇文章主要是在工具书中linq的基础上，我做了一些归纳。目录什么是Linq方法语法和查询语法查询表达式的结构标准查询运算符什么是Linq?Linq（link）代表语言集成查询（LanguageIntegratedQuery）Linq是.NET框架的扩展，它允许我们以使用SQL查询数据库的方式来查询数据集合。使用Linq，你可以从数据库、程序对象的集合以及XML文档中查询数据。一个例子st
SQLite？低调不是小众... 架构文摘JGWZ sqlite 数据库学习后端
前几天在一个群里看到一位同学说：“SQLite这么小众的数据库，到底是什么人在用啊？”首先要说的是SQLite可不是小众的数据库，相反，SQLite是世界上装机量最多的数据库，远超MySQL，只不过比较低调而已。低调到我想在官网上找一个好看的用来当插图的图片都找不到，只能截一张官网首页来撑一撑，看起来十分朴素。我最早听说SQLite是刚毕业工作的时候，我们部门做微软内容管理产品的二次开发，其中有一
融合网络实训室初步建设方案设想武汉唯众智创网络融合网络实训室融合网络融合网络实验室网络融合实训室网络融合实验室
一、引言在数字化浪潮席卷全球的当下，网络技术已然成为推动社会发展和经济增长的关键力量。从日常的生活购物到企业的运营管理，从便捷的社交沟通到前沿的科研探索，网络技术无处不在，深刻地改变着人们的生活与工作方式。随着5G、物联网、云计算、大数据等新兴技术的迅猛发展，网络技术领域对于专业人才的需求呈现出爆发式增长。据权威机构预测，未来几年，网络技术相关岗位的人才缺口将持续扩大。这些岗位不仅要求从业者具备扎
Redis 安装详细教程（小白版）小小鸭程序员 spring java AI编程 spring cloud redis
一、Windows系统安装Redis方法1：直接安装（推荐新手）下载RedisforWindows访问微软维护的Redis版本：https://github.com/microsoftarchive/redis/releases下载Redis-x64-3.2.100.msi（或最新版本）安装包。安装Redis双击下载的.msi文件点击下一步，勾选“AddRedisinstallationfolde
mysql迁移docker_docker迁入迁出mysql 困困斐 mysql迁移docker
docker迁出mysql数据库测试环境：docker服务器mysql服务器IP192.168.163.19192.168.163.16操作系统CentOS7.8CentOS7.8docker版本Docker18.09.9/数据库版本MySQL8.0.22MySQL8.0.221.查看docker相关情况[root@docker-test/data/mysql/data]$dockerps启动my
docker容器迁移，以mysql容器为例风萧易去情难还 docker docker mysql 容器
在容器化环境中，容器迁移是确保应用程序在不同环境中平滑部署和运行的关键。本文将详细介绍如何将一个正在运行的MySQL容器从一台机器迁移到另一台机器。特别内网安装数据库等软件时，所需依赖和工具下载困难，可以通过镜像迁移方式完成软件安装。一、准备工作在开始迁移之前，我们需要准备以下几项工作：源机器（A机器）：正在运行的MySQL容器。#拉取mysql镜像dockerpullmysql:8.0.25#创
Hive SQL 精进系列：REGEXP_REPLACE 函数的用法进一步有进一步的欢喜 Hive SQL 精进系列 hive sql hadoop
目录一、引言二、REGEXP_REPLACE函数基础2.1基本语法参数详解2.2简单示例三、REGEXP_REPLACE函数的应用场景3.1去除特殊字符3.2统一字符串格式四、REGEXP_REPLACE与REPLACE函数的对比4.1功能差异4.2适用场景五、REGEXP_REPLACE与REGEXP函数的对比5.1功能差异5.2适用场景六、总结一、引言字符串处理是数据处理中的常见需求，Hive
Hive SQL 精进系列：SUBSTR 函数的多样用法进一步有进一步的欢喜 Hive SQL 精进系列 hive sql hadoop
目录一、引言二、SUBSTR函数基础介绍2.1基本语法2.2参数详解2.3简单示例三、SUBSTR函数常见应用场景3.1提取日期中的年份、月份或日期3.2隐藏部分敏感信息四、SUBSTR函数高级用法4.1结合条件判断动态截取4.2处理复杂字符串模式五、总结一、引言SUBSTR函数是HiveSQL中一个用于字符串截取的重要函数，在处理文本数据时发挥着关键作用。本文将全面且深入地介绍HiveSQL中S
云原生：K8s（Kubernetes）高频典型面试题汇总老舅的火箭爱扫地云原生 kubernetes 容器
1.简述etcd及其特点？答：etcd是CoreOS团队发起的开源项目，是一个管理配置信息和服务发现（servicediscovery）的项目，它的目标是构建一个高可用的分布式键值（key-value）数据库，基于Go语言实现。特点：l简单：支持REST风格的HTTP+JSONAPIl安全：支持HTTPS方式的访问l快速：支持并发1k/s的写操作l可靠：支持分布式结构，基于Raft的一致性算法，R
Hive----Hive进阶操作(三) HIVE 特殊分隔符处理 XiaodunLP Hive
HIVE特殊分隔符处理补充：hive读取数据的机制：1、首先用InputFormat的一个具体实现类读入文件数据，返回一条一条的记录（可以是行，或者是你逻辑中的“行”）2、然后利用SerDe的一个具体实现类，对上面返回的一条一条的记录进行字段切割Hive对文件中字段的分隔符默认情况下只支持单字节分隔符，如果数据文件中的分隔符是多字符的，如下所示：01||huangbo02||xuzheng03||
Docker 中 MySQL 迁移策略（单节点） Java咩 docker mysql 容器
目录一、简介二、操作流程2.1进入mysql容器2.2导出MySQL数据2.3.将导出的文件复制到宿主机2.4创建DockerCompose配置2.5启动新的Docker容器2.6导入数据到新的容器2.7验证数据2.8删除旧的容器（删除操作需慎重）三、推荐配置四、写在后面一、简介本人发现自己Docker中Mysql的时区不对，导致每次连接数据库都需要设置时区，所以考虑进行数据库迁移，重新搭建一个正
hive-进阶版-1 数据牧马人 hive hadoop 数据仓库
第6章hive内部表与外部表的区别Hive是一个基于Hadoop的数据仓库工具，用于对大规模数据集进行数据存储、查询和分析。Hive支持内部表（ManagedTable）和外部表（ExternalTable）两种表类型，它们在数据存储、管理方式和生命周期等方面存在显著区别。以下是内部表和外部表的主要区别：1.数据存储位置内部表：数据存储在Hive的默认存储目录下，通常位于HDFS（HadoopDi
数据库核心技术面试题深度剖析：主从同步、二级索引与Change Buffer 后端数据库mysql
在数据库相关岗位的面试中，主从同步、二级索引、ChangeBuffer是高频考察点。本文将从面试题角度拆解这三个技术点，覆盖底层原理、性能优化、设计思想，并结合实际场景与高频追问，助你构建系统性回答框架。一、主从同步：高可用架构的灵魂1.基础问题：主从同步的基本流程是什么？答：核心流程：主库将事务写入Binlog（二进制日志）从库的IO线程拉取Binlog到本地RelayLog从库的SQL线程重放
嵌入式SDIO 总线面试题及参考答案大模型大数据攻城狮 fpga开发嵌入式面经 SPI USB接口 SD总线 SDIO总线牛客网
目录SDIO总线与SD总线的核心区别是什么？(附框架图）简述SDIO总线物理接口的组成及其功能（CLK、CMD、DAT0-DAT3）。SDIO总线支持的最大数据传输位宽是多少？如何配置？解释SDIO总线中的主从模式架构及通信流程。SDIO卡的功能类型有哪些（如Wi-Fi、蓝牙、GPS）？SDIO总线时钟信号（CLK）的作用及典型频率范围SDIO协议中的OCR寄存器作用是什么？如何通过CMD5获取卡
计算机毕业设计springboot教务管理系统 0k1c1源码+系统+程序+lw文档+部署呦呦网络 spring boot java mysql
计算机毕业设计springboot教务管理系统0k1c1源码+系统+程序+lw文档+部署计算机毕业设计springboot教务管理系统0k1c1源码+系统+程序+lw文档+部署本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：MySQL5
大模型和数据要素赋能实体零售行业数字化转型建设和实施方案优享智库大模型数据要素数据治理数据仓库主数据零售
大模型和数据要素赋能实体零售行业数字化转型建设和实施方案更多参考公众号：优享智库引言项目背景与意义数字化转型目标与期望实施方案概述零售行业现状及挑战实体零售行业现状数字化转型面临的挑战市场需求与趋势分析大模型与数据要素赋能策略大模型技术及应用场景数据要素采集、整合与治理赋能策略制定与实施路径数字化转型关键技术与解决方案人工智能技术及应用大数据分析与挖掘技术云计算、物联网等技术支持定制化解决方案设计
面试求助：接口测试用例设计主要考虑哪些方面？海姐软件测试 lua 开发语言
一、基础功能验证1.正常场景覆盖关键点：验证接口在合法输入下的正确响应（状态码、数据结构、业务逻辑）。案例：json复制//用户登录接口输入：{"username":"合法用户","password":"正确密码"}预期：200OK+token返回+数据库登录记录更新2.异常场景覆盖关键点：触发错误码（4xx/5xx）的边界条件。测试维度：参数缺失/类型错误（如整型传字符串）非法参数值（如手机号格
SpringBoot实践（三十二）：5分钟搭建springboot单体应用开发框架 A叶子叶 #SpringBoot与微服务 java 开发语言
熟悉语言和开发工具上基础快速使用框架构建应用是个机械工作，5分钟完成开发准备工作，没有冗余动作。目录准备工作开发框架搭建spring初始化常规依赖其他依赖规范化开发目录结构依赖适配代码生成器响应体封装github代码准备工作后端开发需要数据持久化，数据库使用mysql，这也是生产环境大部分的选择，本地开发如果没有mysql可以直接在idea上创建h2数据库，具体创建方式可以参考：使用IDEA创建H
MySQL UPDATE 更新操作详解 wjs2024 开发语言
MySQLUPDATE更新操作详解概述在数据库管理中，UPDATE语句是用于修改表中现有记录的重要工具。本篇文章将详细介绍MySQL中的UPDATE语句，包括其语法、使用场景、注意事项等，旨在帮助数据库管理员和开发者更好地理解和运用这一关键操作。语法结构MySQL的UPDATE语句的基本语法如下：UPDATEtable_nameSETcolumn1=value1,column2=value2,..
建立高质量个人数据库：解锁DeepSeek的关键 CodeJourney. 人工智能算法 python
在人工智能飞速发展的时代，DeepSeek为普通人处理数据、提升工作效率带来了新的可能。然而，很多人在使用过程中存在误区，本文围绕如何正确利用DeepSeek搭建高质量个人数据库展开探讨，强调其对个人成长和发展的重要性，并通过具体实例展示其强大功能。重新理解DeepSeekDeepSeek的普及使普通人能够轻松搭建个人数据库，但不少人在使用时存在错误认知。他们将DeepSeek视为主角，把杂乱无章
postgresql 数据库使用 what_2018 数据库数据库 postgresql oracle
目录索引查看索引创建删除索引修改数据库时区索引查看索引 select*frompg_indexeswheretablename='t_table_data'; 或者select*frompg_statio_all_indexeswhererelname='t_table_data';创建CREATEINDEXix_table_data_timeONt_table_data(id,create_ti
Python 简单后台项目的脚手架程序媛了了 python 开发语言
说明近期写了一个简单的项目，在后台运行获取网上的期货数据并保存到相应的数据库里。由于之前工作很多这种简单的类似调用接口或攫取数据的项目都是用Python来写，因此这次也继续用Python写。但是这次更换了几个包，此份文档简单来说明一下。依赖的包toml：用户解析配置文件，配置文件用的是toml格式。arrow：用于处理日期相关。loguru：用于日志处理。requests：用于http请求响应。p
PHP与数据库连接常见问题及解决办法奥顺互联_老张 php教程 php 数据库
PHP与数据库连接常见问题及解决办法在现代Web开发中，PHP与数据库的连接是不可或缺的一部分。无论是构建动态网站、内容管理系统（CMS）还是电子商务平台，PHP与数据库的交互都是核心功能之一。然而，在实际开发过程中，开发者常常会遇到各种与数据库连接相关的问题。本文将探讨PHP与数据库连接中的常见问题，并提供相应的解决办法。1.数据库连接失败问题描述在PHP中，连接数据库时最常见的错误是无法连接到
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

[ 知识点 ] Hive基础知识笔记

Hive基础知识笔记

一、Hive内、外部表

（一）Hive内、外部表的异同

（二）创建内、外部表

二、Hive分区表

（一）分区表的基本操作

（二）多级分区

（三）动态分区

（四）Hive动态、静态分区的异同

三、Hive分桶表

（一）了解

（二）设置

（三）操作

四、常用命令

（一）操作数据库的一般流程

（二）删除表的操作

（三）修改表的操作

（四）修改表中的列的操作

（五）创建临时表

（六）装载数据

五、Hive中with…as的用法

（一）基础格式

（二）同级格式

（三）嵌套格式

（四）只能在一条SQL语句中使用

六、CTAS

（一）了解

（二）使用CTAS创建表的好处

（三）使用CTAS创建表时需要注意的地方

七、使用CTAS创建表的代码

（一）直接使用CTAS创建表,不指定创建部分的约束

（二）在使用CTAS创建表时，指定表的存储格式等属性

（三）使用CTE (CTAS with Common Table Expression)创建创建表

（四）使用CTAS创建视图

（五）查看使用CTAS建表后的表结构

八、半自动化模式create table like…

（一）了解

（二）操作

九、Storage SerDe

你可能感兴趣的:(数据库,大数据,hive)