风影楼前

Hive零基础从入门到实战入门篇（二十一） HiveQL：数据插入

前言

1. CREATE TABLE 表名 AS SELECT……

2. INSERT

2.1 无分区表插入数据

2.2 分区表插入数据

2.2.1 静态分区插入

2.2.2 动态分区插入

2.2.3 静态分区和动态分区混合使用

前言

我们在入门篇（十）中介绍了如何将文件中的数据导入一个表中。但实际工作中，更常用的数据插入操作是：将查询出的数据插入一个表中。实现这个操作有两种方法，1：使用CREATE TABLE 表名 AS SELECT……语句；2：使用INSERT语句。下文中我们会分别详细介绍这两种语句的用法。

1. CREATE TABLE 表名 AS SELECT……

这个语句的含义是：创建一个表，将后面SELECT语句查询出的数据插入这个新创建的表，字段名和字段数据类型全都和查询出来的数据保持一致。

1.1 语法

CREATE TABLE 表名1 AS
SELECT *
FROM 表名2;

后面的select语句可以使用所有合法的查询语句，但只能跟一条HQL语句，因此复杂查询会需要多层子查询嵌套，而且此语句不支持使用with as 语句，所以逻辑复杂时可读性较差。

1.2 应用场景

当数据需求较为复杂时，我们会先建立一些逻辑较为简单的中间临时表，此时使用这个语句会十分方便。

1.3 举例

这里我们使用之前博客的语句进行演示，语句如下：

CREATE TABLE temp_test AS
SELECT user_id
      ,use_cnt
FROM app.t_od_use_cnt
WHERE date_8 = 20190101 limit 5;

运行后查询新建的表temp_test，运行结果如下：

hive (app)> select * from temp_test;
OK
temp_test.user_id	temp_test.use_cnt
10004	29
10003	1
10002	23
10001	49
10000	6
Time taken: 0.085 seconds, Fetched: 5 row(s)

2. INSERT

INSERT语句可以将查询出的数据插入一个已经建好的表中，查询所得数据的列顺序必须与已存在表中的列顺序一致。

2.1 无分区表插入数据

无分区表插入数据的操作一般用于向临时表中插入数据，因为一般只有临时表才不需要分区。

2.1.1 语法

插入数据覆盖表中的原有数据

INSERT overwrite TABLE 表名
SELECT * FROM ……;

插入数据追加在表中原有数据的后面，原有数据不会删除

INSERT INTO TABLE 表名
SELECT * FROM ……;

这里的查询语句同样只能跟一条HQL语句，因此复杂查询会需要多层子查询嵌套，但是，此语句支持使用with as 语句。

当使用WITH AS语句时语法如下：

WITH a
AS (……)
      ,b
AS (……)
……
INSERT into | overwrite TABLE 表名
SELECT ……;

只要将WITH AS 语句最后的那个SELECT语句放在INSERT语句后即可。

2.1.2 应用场景

当需要建的临时中间表逻辑较为复杂，使用子查询可读性较差时，可以使用先建一个临时表，然后使用WITH AS ……INSERT语句将查询所得数据插入表中。

2.1.3 举例

这里我们向上文新建的temp_test表插入10条数据，并覆盖之前的数据，这里使用两种语句进行演示，效果是一样的：

直接插入

INSERT overwrite TABLE temp_test
SELECT user_id
      ,use_cnt
FROM app.t_od_use_cnt
WHERE date_8 = 20190101 limit 10;

WITH AS插入

WITH a
AS (
      SELECT user_id
            ,use_cnt
      FROM app.t_od_use_cnt
      WHERE date_8 = 20190101 limit 10
      )
INSERT overwrite TABLE temp_test
SELECT *
FROM a;

查询表temp_test，运行如下：

hive (app)> select * from temp_test; 
OK
temp_test.user_id	temp_test.use_cnt
10009	40
10008	25
10007	40
10006	12
10005	15
10004	29
10003	1
10002	23
10001	49
10000	6
Time taken: 0.075 seconds, Fetched: 10 row(s)

可见之前的数据已被覆盖，重新插入了10条数据。

2.2 分区表插入数据

在前面的博客我们讲过：Hive 是存储在 HDFS 上的，Hive 的一个分区名对应一个目录名，子分区名就是子目录名，分区字段并不是一个实际字段。在Hive中向分区表中插入数据有两种操作，一种是静态分区插入，一种是动态分区插入，下文我们来分别详细介绍。

2.2.1 静态分区插入

2.2.1.1 语法：

[WITH a
AS (……)
      ,b
AS (……)
……]
INSERT into | overwrite TABLE 表名 PARTITION(分区字段1='xxx',分区字段2='xxx'……)
SELECT ……;

所谓静态分区就是在INSERT语句后指定要插入的分区的值，如果不写关键字partition直接插入，会报错；

分区字段有几个，插入时就要指定几个分区，否则会报错；

SELECT后的字段不能包含分区字段；否则会报错；

如果分区字段的数据类型为STRING，需要将内容用 ‘ ’ 括起来，如果是数值型则无需 ‘ ’。

2.2.1.2 应用场景：

静态分区插入数据一般用于日常的报表例行化操作中，每天脚本跑昨天的数据，然后指定插入到昨天的分区当中。

2.2.1.3 举例：

建立一个分区表temp_test1，语句如下：

CREATE TABLE temp_test1 (
      user_id BIGINT comment '用户id'
      ,use_cnt INT comment '当日使用次数'
      ) partitioned BY (
      date_8 INT
      ,hour INT
      );

如果对分区表插入数据如果不写关键字partition直接插入，会报错，如下：

hive (app)> 
          > WITH a
          > AS (
          >       SELECT user_id
          >             ,use_cnt
          >       FROM app.t_od_use_cnt
          >       WHERE date_8 = 20190101 limit 10
          >       )
          > INSERT overwrite TABLE temp_test1
          > SELECT *
          > FROM a;
FAILED: SemanticException 8:23 Need to specify partition columns because the destination table is partitioned. Error encountered near token 'temp_test1'
hive (app)>

如果只指定date_8或者hour其中一个分区插入数据，会报错，如下：

hive (app)> WITH a
          > AS (
          >       SELECT user_id
          >             ,use_cnt
          >       FROM app.t_od_use_cnt
          >       WHERE date_8 = 20190101 limit 10
          >       )
          > INSERT overwrite TABLE temp_test1 PARTITION(date_8=20190101) 
          > SELECT *
          > FROM a;
FAILED: SemanticException [Error 10006]: Line 8:44 Partition not found '20190101'
hive (app)>

hive (app)> WITH a
          > AS (
          >       SELECT user_id
          >             ,use_cnt
          >       FROM app.t_od_use_cnt
          >       WHERE date_8 = 20190101 limit 10
          >       )
          > INSERT overwrite TABLE temp_test1 PARTITION(hour=1)
          > SELECT *
          > FROM a;
FAILED: SemanticException Line 0:-1 Partition not found '1'
hive (app)>

正确写法：

INSERT overwrite TABLE temp_test1 PARTITION (
      date_8 = 20190101
      ,hour = 1
      )
SELECT user_id
      ,use_cnt
FROM app.t_od_use_cnt
WHERE date_8 = 20190101 limit 10;

WITH a
AS (
      SELECT user_id
            ,use_cnt
      FROM app.t_od_use_cnt
      WHERE date_8 = 20190101 limit 10
      )
INSERT overwrite TABLE temp_test1 PARTITION (
      date_8 = 20190101
      ,hour = 1
      )
SELECT *
FROM a;

二者效果一致。

查询表temp_test1，运行效果如下：

hive (app)> select * from temp_test1 where date_8=20190101 and hour=1; 
OK
temp_test1.user_id	temp_test1.use_cnt	temp_test1.date_8	temp_test1.hour
10009	40	20190101	1
10008	25	20190101	1
10007	40	20190101	1
10006	12	20190101	1
10005	15	20190101	1
10004	29	20190101	1
10003	1	20190101	1
10002	23	20190101	1
10001	49	20190101	1
10000	6	20190101	1
Time taken: 0.34 seconds, Fetched: 10 row(s)

hive (app)> select * from temp_test1 where date_8=20190101; 
OK
temp_test1.user_id	temp_test1.use_cnt	temp_test1.date_8	temp_test1.hour
10009	40	20190101	1
10008	25	20190101	1
10007	40	20190101	1
10006	12	20190101	1
10005	15	20190101	1
10004	29	20190101	1
10003	1	20190101	1
10002	23	20190101	1
10001	49	20190101	1
10000	6	20190101	1
Time taken: 0.112 seconds, Fetched: 10 row(s)

hive (app)> select * from temp_test1 where hour=1; 
OK
temp_test1.user_id	temp_test1.use_cnt	temp_test1.date_8	temp_test1.hour
10009	40	20190101	1
10008	25	20190101	1
10007	40	20190101	1
10006	12	20190101	1
10005	15	20190101	1
10004	29	20190101	1
10003	1	20190101	1
10002	23	20190101	1
10001	49	20190101	1
10000	6	20190101	1
Time taken: 0.073 seconds, Fetched: 10 row(s)

可见在查询分区表时，指定其中一个分区就不会报错，但插入时必须全部指定。

2.2.2 动态分区插入

启用 hive 动态分区，首先需要在 hive 会话中设置两个参数：

是否允许动态分区，默认值：false
set hive.exec.dynamic.partition=true;

strict模式是避免全分区字段是动态的，必须有至少一个分区字段是指定有值的，默认值：strict
set hive.exec.dynamic.partition.mode=nonstrict;

另外，如果要插入的分区大于100个小于1000个，需要修改如下参数，否则运行到reduce阶段会报错。

此参数用来限制每个mapper或者reducer的最大动态分区数，默认值是100，此处修改为1000
set hive.exec.max.dynamic.partitions.pernode=1000;

如果要插入的分区大于1000个，需要修改如下参数，否则运行到reduce阶段会报错。

此参数用来限制每个节点的最大动态分区数，默认值是100，此处修改为为符合需求的值即可。
set hive.exec.max.dynamic.partitions.pernode=2000;

此参数用来限制一个DML操作可以创建的动态分区的总分区数，默认值为1000，此处修改为符合需求的值即可。
set hive.exec.max.dynamic.partitions=2000

2.2.2.1 语法：

[WITH a
AS (……)
      ,b
AS (……)
……]
INSERT into | overwrite TABLE 表名 PARTITION(分区字段1,分区字段2……)
SELECT ……分区字段1,分区字段2…… 
FROM ……;

动态分区插入数据时只需要写出分区字段名，并不指定具体的分区，然后在下面的查询中最后几个字段必须包含有动态分区的字段，且顺序必须和PARTITION后的分区字段完全一致。

因为hive 会先获取 select 的最后几个位置的分区字段的参数值，然后将这些值填写到 insert 语句 partition 中的几个分区字段中，即动态分区是通过位置来对应分区值的。原始表 select 出来的值和输出 partition 的值的关系仅仅是通过位置来确定的，和名字并没有关系！

2.2.2.2 应用场景：

动态分区插入数据多用于例行化表的回溯数据，比如要将过去30天每天的数据插入一张按天分区的表，如果使用静态分区回溯数据，需要跑30次脚本才行，而使用动态分区则可以一次性全部插入。

2.2.2.3 举例：

如果没有设置参数就使用动态分区，会报错：

hive (app)> INSERT overwrite TABLE temp_test1 PARTITION (
          >       date_8
          >       ,hour
          >       )
          > SELECT user_id
          >       ,use_cnt
          >       ,date_8
          >       ,12 hour
          > FROM app.t_od_use_cnt
          > WHERE date_8 = 20190102 limit 10;
FAILED: SemanticException [Error 10096]: Dynamic partition strict mode requires at least one static partition column. To turn this off set hive.exec.dynamic.partition.mode=nonstrict

如果少查询一个分区字段，会报错：

hive (app)> INSERT overwrite TABLE temp_test1 PARTITION (
          >       date_8
          >       ,hour
          >       )
          > SELECT user_id
          >       ,use_cnt
          >       ,date_8
          > FROM app.t_od_use_cnt
          > WHERE date_8 = 20190102 limit 10;
FAILED: SemanticException [Error 10044]: Line 1:23 Cannot insert into target table because column number/types are different 'hour': Table insclause-0 has 4 columns, but query has 3 columns.

如果顺序写错，代码不会报错，但插入的数据是错误的：

INSERT overwrite TABLE temp_test1 PARTITION (
      date_8
      ,hour
      )
SELECT user_id
      ,use_cnt
      ,12 hour
      ,date_8
FROM app.t_od_use_cnt
WHERE date_8 = 20190102 limit 10;

查询表中数据，可以看到虽然字段都有，但最后两个分区字段的内容是错误的：

hive (app)> select * from temp_test1;
OK
temp_test1.user_id	temp_test1.use_cnt	temp_test1.date_8	temp_test1.hour
10209	39	12	20190102
10208	26	12	20190102
10207	46	12	20190102
10206	39	12	20190102
10205	47	12	20190102
10204	30	12	20190102
10203	18	12	20190102
10202	31	12	20190102
10201	13	12	20190102
10200	46	12	20190102

正确写法：

先设置参数，这些设置只在本次会话中生效，如果想永久生效，可以将其写入.hiverc文件中，具体可参见入门篇（十一）。然后使用动态分区向表temp_test1中插入数据，这里因为表t_od_use_cnt中没有hour字段，所以hour我们直接人为设定一个12：

set hive.exec.dynamic.partition=true;
set hive.exec.dynamic.partition.mode=nonstrict;
INSERT overwrite TABLE temp_test1 PARTITION (
      date_8
      ,hour
      )
SELECT user_id
      ,use_cnt
      ,date_8
      ,12 hour
FROM app.t_od_use_cnt
WHERE date_8 = 20190102 limit 10;

查询分区date_8=20190102,hour=12中的数据：

hive (app)> select * from temp_test1 where date_8=20190102 and hour=12;
OK
temp_test1.user_id	temp_test1.use_cnt	temp_test1.date_8	temp_test1.hour
10209	39	20190102	12
10208	26	20190102	12
10207	46	20190102	12
10206	39	20190102	12
10205	47	20190102	12
10204	30	20190102	12
10203	18	20190102	12
10202	31	20190102	12
10201	13	20190102	12
10200	46	20190102	12
Time taken: 0.077 seconds, Fetched: 10 row(s)

2.2.3 静态分区和动态分区混合使用

静态分区和动态分区混合使用时，静态分区值必须在动态分区值的前面，否则会报错。

举例：

如果动态分区值必须在静态分区值的前面，报错如下：

hive (app)> set hive.exec.dynamic.partition=true;
hive (app)> set hive.exec.dynamic.partition.mode=nonstrict;
hive (app)> INSERT overwrite TABLE temp_test1 PARTITION (
          >       date_8
          >       ,hour=1
          >       )
          > SELECT user_id
          >       ,use_cnt
          >       ,12 hour
          > FROM app.t_od_use_cnt
          > WHERE date_8 = 20190101 limit 10;
FAILED: SemanticException [Error 10094]: Line 2:6 Dynamic partition cannot be the parent of a static partition '1'

正确写法：

set hive.exec.dynamic.partition=true;
set hive.exec.dynamic.partition.mode=nonstrict;
INSERT overwrite TABLE temp_test1 PARTITION (
      date_8=20190101
      ,hour
      )
SELECT user_id
      ,use_cnt
      ,12 hour
FROM app.t_od_use_cnt
WHERE date_8 = 20190101 limit 10;

能看到这里的同学，就右上角点个赞顺便关注我吧，3Q~

vue3阻止事件冒泡到父元素我爱加班、、前端功能实现以及问题解决前端开发遇到的问题 vue.js javascript 前端
在Vue3中，如果你想在子组件的点击事件中阻止父组件绑定的点击事件触发，可以使用以下方法：1.使用.stop修饰符Vue提供了.stop修饰符，可以阻止事件冒泡到父元素。这是最简单直接的方式。示例代码点击我exportdefault{methods:{handleParentClick(){console.log('父元素被点击');},handleChildClick(){console.log
LGBMRegressor CatBoostRegressor XGBRegressor回归兔兔爱学习兔兔爱学习竞赛代码实践回归数据挖掘
importpandasaspd#导入csv文件的库importnumpyasnp#进行矩阵运算的库importpolarsaspl#和pandas类似,但是处理大型数据集有更好的性能.#用于对一组元素计数,一个存在默认值的字典,访问不存在的值时抛出的是默认值fromcollectionsimportCounter,defaultdictimportre#用于正则表达式提取fromscipy.st
移动 APP 应用架构概述你一身傲骨怎能输软件架构设计架构
移动APP应用架构概述在现代软件开发中，尤其是移动应用开发，架构设计是一个至关重要的环节。架构不仅影响到应用的性能、可维护性和可扩展性，还直接关系到开发团队的工作效率和项目的成功与否。即使是从事基础开发工作的人员，也需要理解架构的基本概念，以便更好地融入团队和项目。什么是架构？架构是一个多维度的概念，通常可以从以下几个方面进行理解：名词与动词的双重含义：作为名词：架构指的是软件系统的结构和组织关系
Lambda离线实时分治架构深度解析与实战喜欢猪猪架构
一、引言在大数据技术日新月异的今天，Lambda架构作为一种经典的数据处理模型，在应对大规模数据应用方面展现出了强大的能力。它整合了离线批处理和实时流处理，为需要同时处理批量和实时数据的应用场景提供了成熟的解决方案。本文将对Lambda架构的演变、核心组件、工作原理及痛点进行深度解析，并通过Java代码实现一个实战实例。二、Lambda架构的演变Lambda架构是由Storm的作者NathanMa
“大模型横扫千军”背后的大数据挖掘--浅谈MapReduce 绒绒毛毛雨大数据挖掘数据挖掘 mapreduce 人工智能
文章目录O背景知识1数据挖掘2邦费罗尼原则3TF.IDF4哈希函数5分布式文件系统一、MapReduce基本介绍1.Map任务2.按键分组3.Reduce任务4.节点失效处理5.小测验：在一个大型语料库上有100个map任务和若干reduce任务：二、基于MapReduce的基本运算1.选择（Selection）2.交（Intersection）3.并（Union）4.补（Difference）5
解锁 MySQL 数据库的无限潜能：全方位深度解析秋夜Autumn 数据库 mysql
目录一、MySQL简介二、MySQL安装与配置（一）安装MySQL（二）配置MySQL三、MySQL基础语法（一）数据类型（二）数据库操作（三）表操作（四）数据操作四、MySQL高级特性（一）索引（二）视图（三）存储过程与函数（四）事务处理（五）数据备份与恢复五、MySQL性能优化（一）查询优化（二）服务器配置优化（三）数据库设计优化六、MySQL与其他技术的集成（一）MySQL与Web开发（二）
Python Pandas数据清洗与处理大数据张老师 Python程序设计 python pandas 开发语言
PythonPandas数据清洗与处理在进行数据分析时，原始数据往往包含了许多不完整、不准确或者冗余的信息。数据清洗与处理的任务就是将这些杂乱无章的数据清理干净，确保数据的准确性和一致性，从而为后续的分析工作打下坚实的基础。Pandas提供了强大的工具来帮助我们清洗和处理数据，尤其是在处理Series和DataFrame时，它能够高效地进行数据的筛选、填充、删除、替换等操作。本节将通过一些常见的数
【数据分享】1929-2024年全球站点的逐年平均降水量（Shp\Excel格式）小鲨鱼-立方数据学社立方数据学社数据分享气象数据气象站点降水数据
气象数据是在各项研究中都经常使用的数据，气象指标包括气温、风速、降水、湿度等指标！说到气象数据，最详细的气象数据是具体到气象监测站点的数据！有关气象指标的监测站点数据，之前我们分享过1929-2024年全球气象站点的逐年平均气温数据、最高气温数据和最低气温数据（均可查看之前的文章获悉详情）。本次我们为大家继续带来具体到气象监测站点的数据——1929-2024年全球气象站点的逐年平均降水量数据！原始
STM32——LCD液晶显示三只树懒 STM32 单片机 stm32
LCD结构体typedefstruct{vu16LCD_REG;vu16LCD_RAM;}LCD_TypeDef;//使用NOR/SRAM的Bank1.sector4，地址位HADDR[27,26]=11A10作为数据命令区分线//注意设置时STM32内部会右移一位对齐#defineLCD_BASE((u32)(0x6C000000|0x0000007E))#defineLCD((LCD_Type
一、初识操作系统【Lite OS】阿猿先森华为LiteOS物联网操作系统 iot os iot
一、为什么要用操作系统从裸机到操作系统是必然发展路线（1）发展阶段1：裸机并且全部代码自写（2）发展阶段2：裸机但调用库函数（3）发展阶段3：裸机加状态机实现简单的多任务（4）发展阶段4：上简单操作系统：RTOS（ucos、LiteoS）（5）发展阶段5：上复杂操作系统：Linux、Windows、Android二、用操作系统的优势（1）轻松实现多任务（2）轻松借用很多第三方组件功能（3）更好实现
Java常用类 ufosuai555 java python 开发语言
包装类包装类定义包装类就是将基本数据类型封装到类中，使基本数据类型具有类的特点，方便操作包装类分类byte->Byteshort->Shortint->Integerlong->Longfloat->Floatdouble->Doublechar->Characterboolean->Boolean基本数据类型与包装类之间的转换在JDK5之前，基本数据类型与包装类之间的转换需要手动编写代码实现，在
成功使用devpi搭建PyPI缓存源，建立内网python安装包服务器（通过代理上网） jcsx 基础运维知识库开源学习 python pip nginx
前言缓存源和镜像源的区别：缓存源：初始状态为空。下载请求的软件包没有缓存，则回源到设置的上游镜像源，然后该软件包会被缓存。如果请求的软件包已经被缓存，则直接从本地缓存返回用户。下载速度：第一次速度=通过外网从上游镜像源下载的速度；之后的速度=内网带宽速度。磁盘空间：少。初始时只保存了软件包索引，随着使用过程，软件包被缓存，磁盘占用逐渐变大。镜像源：初始状态含有所有软件包，并且定时与上游镜像源同步。
Python接口自动化测试框架（实战篇）-- Jenkins持续集成职说测试 python jenkins ci/cd 自动化测试接口自动化测试
文章目录一、前言二、[Jenkins](https://www.jenkins.io/)2.1、环境搭建2.2、插件准备2.3、创建job2.4、小结2.5、构建策略2.6、报告展示2.7、扩展三、总结一、前言温馨提示：在框架需要集成jenkins的时候，一定要注意环境切换问题，如果jenkins和开发环境是同样的系统且都有python环境，基本不用太担心代码的移植问题，如果是跨平台了，那么需要注
红黑树实现黎相思 C++算法 c++数据结构
目录1.红黑树的概念1.1红黑树的规则1.2红黑树如何确保最长路径不超过最短路径的2倍呢?1.3红黑树的效率编辑2.红黑树的实现2.1红黑树的结构2.2红黑树的插入2.2.1红黑树插入一个值的大概过程2.2.2情况1:变色2.2.3情况2:单旋+变色2.2.4情况3:双旋+变色2.3红黑树的插入代码实现2.4红黑树的查找2.5红黑树的高度2.6红黑树节点个数2.7红黑树的验证2.8红黑树的删除3.
基于大数据的电影数据分析可视化系统设计与应用 AI架构设计之禅大数据AI人工智能 AI大模型应用入门实战与进阶计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
基于大数据的电影数据分析可视化系统设计与应用作者：禅与计算机程序设计艺术1.背景介绍1.1大数据时代的电影行业随着互联网技术和数字化的发展,电影行业已经进入大数据时代。每天都有海量的电影相关数据在各个平台上生成,包括票房数据、评分数据、影评数据等。这些数据蕴含着巨大的价值,如果能够有效地分析和利用,将为电影行业的发展提供重要的决策支持。1.2电影数据分析与可视化的意义1.2.1洞察电影市场趋势通过
python实战项目34：基于flask的天气数据可视化系统1.0 wp_tao Python副业接单实战项目 flask 信息可视化 python
基于flask的天气数据可视化系统1.0一、效果展示二、flask简介三、图表绘制四、前端页面编写五、完整代码一、效果展示该flask项目相对简单入门，使用了flask框架、bootstrap前端技术，数据使用的是上一篇scrapy爬取城市天气数据中爬取到的数据。二、flask简介Flask是一个基于Python的Web开发框架，它以灵活、微框架著称，基于werkzeug的轻量级web框架，可提高
如何在 Flask 中实现用户认证？ Channing Lewis Python flask python 后端
在Flask中实现用户认证，可以通过以下方式完成：基础步骤设置用户数据库：存储用户信息（如用户名、密码）。注册功能：允许用户创建账号。登录功能：验证用户输入的凭据。会话管理：使用Flask的session或第三方工具管理登录状态。登出功能：清除用户的登录状态。实现步骤以下是一个完整示例，展示如何实现用户认证功能：1.项目文件结构flask_auth/├──app.py#主应用├──auth/#用户
flask实现重启后需要重新输入用户名而避免浏览器使用之前已经记录的用户名 Channing Lewis Python flask python 后端
要实现重启后重新输入用户名的功能，关键是确保Flask在应用重启时不会保留之前的用户会话（即清除登录状态）。以下是一些可能的原因和解决方法：1.问题原因：Session数据没有清除Flask使用session来保存用户的登录状态（如用户名），默认存储在浏览器的Cookie中。如果Flask使用了持久化的secret_key，即使重启服务器，客户端的Cookie仍然有效，导致会话数据还存在。2.解决
元数据驱动的设想吾爱乐享 python python
本文永久更新地址:1.背景针对相似结构的表单，为了提高ui自动化编写效率，减少以减少重复工作，设想是否可以设计一个针对neoUI2.0通过元数据驱动的方式适应不同业务对象的测试框架2.设计元数据模型-字段名-字段类型-是否必填-是否只读-默认值-业务逻辑（可选，后期扩展）3.构建自动化测试框架利用现有的RF框架已实现的功能，通过实体名称打开对应实体的表单关键L进入【进入菜单】关键字进入【点击新建业
性能测试的指标2 吾爱乐享性能测试性能测试指标性能测试
性能测试指标主要包括两大分类系统指标：系统指标主要包括系统的响应时间，tps，并发数等资源指标：对硬件资源的利用率，cpu，磁盘，内存等1.系统指标响应时间：从用户发送一个请求到用户接受到服务器返回到响应数据这段时间响应时间是由，网络传输时间+应用程序处理时间，一个用户发起请求-->到服务器的传输时间--->服务器处理时间--->数据库传输时间---->数据库到处理时间--->数据库处理结果传输给
RPA与Python 空着
部分朋友可能是了解Python的。Python这两年，火的两点，就是聚焦于两个场景：数据抓取和办公自动化。那么Python算RPA吗？RPA是一种概念，依托于这个概念诞生了很多产品。而Python是一种计算机语言，Python不仅仅可以做RPA概念范围内的东西，还可以做其他东西。但是，Python做数据抓取也好，做办公自动化也好，他都是聚焦于具体的场景本身。而并非聚焦于RPA概念上的。所以，很少见
流媒体直播实时视频延迟时间排查和剖析：gop关键帧间隔导致延迟，流媒体和播放器缓存，B帧等导致的延迟 eguid_1 #1.4.3版本）直播延迟视频延迟直播平台播放延迟网络延迟
本章是流媒体直播实时视频延迟时间排查和剖析javaCV系列文章：javacv开发详解之1：调用本机摄像头视频javaCV开发详解之2：推流器实现，推本地摄像头视频到流媒体服务器以及摄像头录制视频功能实现(基于javaCV-FFMPEG、javaCV-openCV)javaCV开发详解之3：收流器实现，录制流媒体服务器的rtsp/rtmp视频文件(基于javaCV-FFMPEG)
信息学奥赛c++语言:求分数序列和敲代码的八戒信息学奥赛c++c++算法开发语言数据结构
题目描述有一个分数序列q1/p1，q2/p2，q3/p3，q4/p4，q5/p5，....,其中q(i+1)=qi+pi，p(i+1)=qi，p1=1，q1=2。比如这个序列前6项分别是2/1,3/2,5/3,8/5,13/8,21/13,求这个分数序列的前n项之和。输入输入有一行，包含一个正整数n(n≤30)。输出输出有一行，包含一个浮点数，表示分数序列前n项的和，精确到小数点后4位。样例输入2
Redis基本命令详解微刻时光 Redis redis 数据库缓存
1.基本命令命令不区分大小写，而key是区分大小写的#select数据库间的切换数据库共计16个127.0.0.1:6379>select1#dbsize返回当前数据库的key的数量127.0.0.1:6379[1]>dbsize#keys*查看数据库所有的key127.0.0.1:6379[1]>keys*#flushdb清除当前数据库127.0.0.1:6379[1]>flushdb#flus
基于大语言模型构建本地个人AI助理由数入道人工智能语言模型自然语言处理
在构建本地专属的个人AI助理时，我们需要处理多个方面的技术需求，确保其在多模态数据处理、实时查询、灵活推理、知识图谱更新等方面具备高效性、实时性和可扩展性。以下探讨如何基于大语言模型构建一个具备全面功能的个人AI助理，涵盖知识库管理、动态推理、用户交互、实时学习和跨模态集成等关键技术。一、技术设计总体架构1.目标与需求个性化AI助理：构建一个本地专属AI助理，能够处理多种输入格式（文本、图像、音频
应急管理响应决策智能体由数入道人工智能
1.功能定位决策智能体在应急场景中扮演“政府指挥中枢”或“联合指挥部”角色，负责整合多源数据、统筹跨部门资源，并下达关键指令。它的精确度与及时性对整体救援成效和灾害应对速度具有决定性影响。宏观指挥核心全局视角：实时汇总灾情（洪水范围、地震烈度、火情位置）、物资库存、交通负载、舆情指标等信息；多智能体协作：根据策略或规则，对资源执行智能体、对抗智能体的防御环节、舆情管理子系统等发布指令；跨级别应急部
LiteOS 学习第二篇——基本介绍未知电子
基本概念从系统的角度看，任务是竞争系统资源的最小运行单元。任务可以使用或等待CPU、使用内存空间等系统资源，并独立于其它任务运行。HuaweiLiteOS的任务模块可以给用户提供多个任务，实现了任务之间的切换和通信，帮助用户管理业务程序流程。这样用户可以将更多的精力投入到业务功能的实现中。HuaweiLiteOS是一个支持多任务的操作系统。在HuaweiLiteOS中，一个任务表示一个线程。Hua
分享wind量化交易平台接口编程代码「已注销」 python 开发语言
相信做股票投资的的人对于wind应该很熟悉，它是一个比较高端的金融数据服务商，有很多人做数据分析之前，一定都需要到wind上看看相关资料，但是wind上面的信息非常多，如果可以通过量化交易接口进行筛选，操作起来就会方面很多了，今日我们就来分享一组wind量化交易平台接口的编程代码。importpandasaspdfromWindPyimport*fromdatetimeimport*importt
浅析AI大模型现状及其应用，零基础入门到精通，收藏这篇就够了程序员_大白互联网程序员大模型人工智能数据挖掘大模型
随着人工智能技术的迅猛发展，AI大模型已经成为全球科技竞争的焦点，展现出巨大的发展潜力和广阔的应用前景。AI大模型的应用落地正引发行业关注，技术进步正促使AI大模型的应用逐步从云端向终端设备延伸，从通用模型向针对特定行业的定制化解决方案转变，其商业潜力和对行业的影响不断增强。与此同时，国内外企业在大模型领域的竞争日趋激烈。AI大模型蓬勃发展AI大模型主要特征AI大模型具有泛化性(知识迁移到新领域)
行业模板｜DataEase企业管理大屏模板推荐 FIT2CLOUD飞致云开源数据可视化 DataEase 模板市场数据大屏企业管理
DataEase开源BI工具于2022年6月发布模板市场（https://templates.dataease.cn），并于2024年1月新增适用于DataEasev2版本的模板分类。模板市场旨在为DataEase用户提供专业、美观、拿来即用的大屏模板，方便用户根据自身的业务需求和使用场景选择对应的大屏模板，并且在优质模板的基础上轻松制作自己的仪表板及数据大屏。截至2024年12月18日，Data
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

Hive零基础从入门到实战 入门篇（二十一） HiveQL：数据插入

目录

前言

1. CREATE TABLE 表名 AS SELECT……

2. INSERT

2.1 无分区表插入数据

2.2 分区表插入数据

2.2.1 静态分区插入

2.2.2 动态分区插入

2.2.3 静态分区和动态分区混合使用

前言

1. CREATE TABLE 表名 AS SELECT……

1.1 语法

1.2 应用场景

1.3 举例

2. INSERT

2.1 无分区表插入数据

2.1.1 语法

2.1.2 应用场景

2.1.3 举例

2.2 分区表插入数据

2.2.1 静态分区插入

2.2.2 动态分区插入

2.2.3 静态分区和动态分区混合使用

你可能感兴趣的:(Hive零基础从入门到实战 入门篇（二十一） HiveQL：数据插入)

Hive零基础从入门到实战入门篇（二十一） HiveQL：数据插入

你可能感兴趣的:(Hive零基础从入门到实战入门篇（二十一） HiveQL：数据插入)