风影楼前

Hive零基础从入门到实战入门篇（七）HiveQL：表操作（上）

前言

1. 最简单的建表语句

2. 查看表结构

3. 删除表

4. 建表时为字段添加注释

5. 建表可选项IF NOT EXITS

6. 建表可选项 EXTERNAL

6.1 内部表

6.2 外部表

7. 建分区表

8. 其余建表可选项

9. 查询既有表的建表语句

前言

熟悉了Hive的库操作后，本文来介绍Hive中的的建表、删表操作。

1. 最简单的建表语句

Hive建表的全部建表语法如下：

CREATE [EXTERNAL] TABLE [IF NOT EXISTS] 表名
(列名 data_type [COMMENT 列注释], ...)
[COMMENT 表注释]
[PARTITIONED BY (列名 data_type [COMMENT 列注释], ...)]
[CLUSTERED BY (列名, 列名, ...) 
[SORTED ，BY (列名 [ASC|DESC], ...)] INTO num_buckets BUCKETS]
[ROW FORMAT row_format]
[STORED AS file_format]
[LOCATION hdfs_path]

所有[ ]中的内容都是可选项，即可有可无，下面我们分别详细介绍。

其中

CREATE [EXTERNAL] TABLE [IF NOT EXISTS] 表名
(列名 data_type)

是建表语句必须有的，举个栗子，这是后续实战篇要用到的第一个表，用户启动表：

CREATE TABLE t_od_use_cnt (
      date_8 INT
      ,platform string
      ,app_version string
      ,user_id BIGINT
      ,use_cnt INT
      ,is_active TINYINT
      );

首先我们建一个库app，然后使用并在其中建表，执行效果如下：

hive> create database app;
OK
Time taken: 0.899 seconds
hive> use app;
OK
Time taken: 0.03 seconds
hive> create table t_od_use_cnt(
    >       date_8 int
    >       ,platform string
    >       ,app_version string
    >       ,user_id bigint
    >       ,use_cnt int
    >       ,is_active tinyint
    >       );
OK
Time taken: 0.389 seconds
hive>

ps:Hive中的关键字大小写是不区分的，所有关键字均可使用小写。

2. 查看表结构

DESC 表名;

查询上一步新建表的字段及字段对应的数据类型，运行效果如下：

hive> desc t_od_use_cnt;
OK
date_8              	int                 	                
platform            	string              	    
app_version         	string              	              
user_id             	bigint              	               
use_cnt             	int                 	            
is_active           	tinyint             	                
Time taken: 0.28 seconds, Fetched: 6 row(s)
hive>

3. 删除表

删除表的语句和删除库的类似，只是把database换成了table，都是使用drop关键字进行删除操作。

DROP TABLE 表名;

4. 建表时为字段添加注释

这里我们先删去刚才新建的表t_od_use_cnt，重新建一个有字段注释的表，因为Hive中是不允许有同名表存在的。

使用刚学的删表语句：

DROP TABLE t_od_use_cnt;

执行效果如下：

hive> drop table t_od_use_cnt;
OK
Time taken: 0.898 seconds
hive>

重新建表，为字段添加中文注释，注意需要Xshell编码格式已修改为UTF-8。

CREATE TABLE t_od_use_cnt (
      date_8 INT comment '日期'
      ,platform string comment '平台 android,ios'
      ,app_version string comment 'app版本'
      ,user_id BIGINT comment '用户id'
      ,use_cnt INT comment '当日使用次数'
      ,is_active TINYINT comment '是否活跃'
      );

查询上一步新建的表，执行效果如下：

hive> desc t_od_use_cnt;
OK
date_8              	int                 	??                  
platform            	string              	?? android?ios      
app_version         	string              	APP??               
user_id             	bigint              	??id                
use_cnt             	int                 	??????              
is_active           	tinyint             	????                
Time taken: 0.28 seconds, Fetched: 6 row(s)
hive>

此时字段注释里的中文显示是乱码，英文可以正常显示，在工作中这种情况我们是不会遇到的，运维的同事会帮我们搞定，如果是使用我提供的虚拟机的同学，此时会遇到这种情况，按如下操作即可：

首先复制此时的窗口，右键单击New Session，点击Duplicate

登陆Hive的元数据库mysql，输入 mysql -uroot -proot，运行效果如下：

[root@hadoop ~]# mysql -uroot -proot
Warning: Using a password on the command line interface can be insecure.
Welcome to the MySQL monitor.  Commands end with ; or \g.
Your MySQL connection id is 122
Server version: 5.6.25-log MySQL Community Server (GPL)

Copyright (c) 2000, 2015, Oracle and/or its affiliates. All rights reserved.

Oracle is a registered trademark of Oracle Corporation and/or its
affiliates. Other names may be trademarks of their respective
owners.

Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.

mysql>

使用hive库，修改字符编码为utf8,命令如下：

use hive;
alter table COLUMNS_V2 modify column comment varchar(256) character set utf8;
alter table TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
alter table PARTITION_KEYS modify column PKEY_COMMENT varchar(4000) character set utf8;
alter table PARTITION_PARAMS  modify column PARAM_VALUE varchar(4000) character set utf8;

运行效果如下：

mysql> use hive;
Database changed

mysql> alter table COLUMNS_V2 modify column comment varchar(256) character set utf8;
Query OK, 25 rows affected (0.75 sec)
Records: 25  Duplicates: 0  Warnings: 0

mysql> alter table TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
Query OK, 7 rows affected (0.28 sec)
Records: 7  Duplicates: 0  Warnings: 0

mysql> alter table PARTITION_KEYS modify column PKEY_COMMENT varchar(4000) character set utf8;
Query OK, 0 rows affected (0.32 sec)
Records: 0  Duplicates: 0  Warnings: 0

mysql> alter table PARTITION_PARAMS  modify column PARAM_VALUE varchar(4000) character set utf8;
Query OK, 0 rows affected (0.16 sec)
Records: 0  Duplicates: 0  Warnings: 0

返回Hive窗口，删除t_od_use_cnt，重新建表并查询表结构，运行效果如下：

hive> drop table t_od_use_cnt;
OK
Time taken: 0.456 seconds
hive> CREATE TABLE t_od_use_cnt(
    >       date_8 INT COMMENT '日期'
    >       ,platform STRING COMMENT '平台 android,ios'
    >       ,app_version STRING COMMENT 'APP版本'
    >       ,user_id BIGINT COMMENT '用户id'
    >       ,use_cnt INT COMMENT '当日使用次数'
    >       ,is_active TINYINT COMMENT '是否活跃'
    >       );
OK
Time taken: 0.106 seconds
hive> desc t_od_use_cnt;
OK
date_8              	int                 	日期                  
platform            	string              	平台 android,ios      
app_version         	string              	APP版本               
user_id             	bigint              	用户id                
use_cnt             	int                 	当日使用次数              
is_active           	tinyint             	是否活跃                
Time taken: 0.115 seconds, Fetched: 6 row(s)
hive>

5. 建表可选项IF NOT EXITS

如果用户增加上可选项 IF NOT EXITS，那么若表已经存在了，Hive就会忽略掉后面的执行语句，而且不会有任何提示。在那些第一次执行时需要创建表的脚本中，这么写是非常有用的。不过工作中基本用不到，可以忽略。

6. 建表可选项 EXTERNAL

6.1 内部表

在Hive中，我们把在建表时建表语句中没有加 [EXTERNAL]的表称为内部表或者管理表，代表着Hive可以控制这个表的生命周期，如果drop掉这个表，那么这个表的元数据和数据会被一起删掉。默认情况下，Hive会给数据指定一个默认的HDFS中的存储目录，上面的表所在的目录是hdfs://hadoop:9000/usr/hive/warehouse/app.db/t_od_use_cnt，/usr/hive/warehouse是默认的数据仓库路径地址，app.db是数据库目录，t_od_use_cnt是表目录。

通过以下语句可以查询到目录信息及很多其他表的信息，后续我们会经常用到这个语句：

DESC formatted 表名;

运行效果如下：

hive> desc formatted t_od_use_cnt;
OK
# col_name            	data_type           	comment             
	 	 
date_8              	int                 	日期                  
platform            	string              	平台 android,ios      
app_version         	string              	app版本               
user_id             	bigint              	用户id                
use_cnt             	int                 	当日使用次数              
is_active           	tinyint             	是否活跃                
	 	 
# Detailed Table Information	 	 
Database:           	app                 	 
Owner:              	root                	 
CreateTime:         	Thu Apr 18 17:29:21 CST 2019	 
LastAccessTime:     	UNKNOWN             	 
Protect Mode:       	None                	 
Retention:          	0                   	 
Location:           	hdfs://hadoop:9000/usr/hive/warehouse/app.db/t_od_use_cnt	 
Table Type:         	MANAGED_TABLE       	 
Table Parameters:	 	 
	transient_lastDdlTime	1555579761          
	 	 
# Storage Information	 	 
SerDe Library:      	org.apache.hadoop.hive.serde2.lazy.LazySimpleSerD 
InputFormat:        	org.apache.hadoop.mapred.TextInputFormat	 
OutputFormat:       	org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat	 
Compressed:         	No                  	 
Num Buckets:        	-1                  	 
Bucket Columns:     	[]                  	 
Sort Columns:       	[]                  	 
Storage Desc Params:	 	 
	serialization.format	1                   
Time taken: 0.157 seconds, Fetched: 31 row(s)
hive>

可以看到内部表的Table Type: MANAGED_TABLE

6.2 外部表

在Hive中，我们把在建表时建表语句中加 [EXTERNAL]的表称为外部表，与内部表不同，Hive只能拥有外部表的元数据（描述表的信息），删除表时并不会删掉数据本身，同时通过[LOCATION] 关键字自定义数据路径。

不过建外部表的操作在数据分析师的工作中基本用不到。建表语句如下：

CREATE EXTERNAL TABLE t_od_use_cnt (
      date_8 INT comment '日期'
      ,platform string comment '平台 android,ios'
      ,app_version string comment 'app版本'
      ,user_id BIGINT comment '用户id'
      ,use_cnt INT comment '当日使用次数'
      ,is_active TINYINT comment '是否活跃'
      ) location '/data/test';

建表后使用 desc formatted t_od_use_cnt; 查询表信息如下：

hive> create database test;
OK
Time taken: 0.144 seconds
hive> use test;
OK
Time taken: 0.027 seconds
hive> create external table t_od_use_cnt(
    >       date_8 int comment '日期'
    >       ,platform string comment '平台 android,ios'
    >       ,app_version string comment 'app版本'
    >       ,user_id bigint comment '用户id'
    >       ,use_cnt int comment '当日使用次数'
    >       ,is_active tinyint comment '是否活跃'
    >       )
    > location '/data/test';
OK
Time taken: 0.187 seconds
hive> desc formatted t_od_use_cnt;
OK
# col_name            	data_type           	comment             
	 	 
date_8              	int                 	日期                  
platform            	string              	平台 android,ios      
app_version         	string              	app版本               
user_id             	bigint              	用户id                
use_cnt             	int                 	当日使用次数              
is_active           	tinyint             	是否活跃                
	 	 
# Detailed Table Information	 	 
Database:           	test                	 
Owner:              	root                	 
CreateTime:         	Fri Apr 19 07:37:34 CST 2019	 
LastAccessTime:     	UNKNOWN             	 
Protect Mode:       	None                	 
Retention:          	0                   	 
Location:           	hdfs://hadoop:9000/data/test	 
Table Type:         	EXTERNAL_TABLE      	 
Table Parameters:	 	 
	EXTERNAL            	TRUE                
	transient_lastDdlTime	1555630654          
	 	 
# Storage Information	 	 
SerDe Library:      	org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe	 
InputFormat:        	org.apache.hadoop.mapred.TextInputFormat	 
OutputFormat:       	org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat	 
Compressed:         	No                  	 
Num Buckets:        	-1                  	 
Bucket Columns:     	[]                  	 
Sort Columns:       	[]                  	 
Storage Desc Params:	 	 
	serialization.format	1                   
Time taken: 0.134 seconds, Fetched: 32 row(s)
hive>

可以看到外部表的Table Type: EXTERNAL_TABLE

7. 建分区表

Hive中有分区表的概念，分区表改变了Hive对数据存储的组织方式，提高了查询速度。上面我们已经介绍过，如果我们在app数据库中建表，数据存储路径是hdfs://hadoop:9000/usr/hive/warehouse/app.db/t_od_use_cnt，如果我们以日期date_8作为分区字段，那么数据存储路径会反映出分区结构的子目录，例如：

/usr/hive/warehouse/app.db/t_od_use_cnt/date_8=20190401

/usr/hive/warehouse/app.db/t_od_use_cnt/date_8=20190402

/usr/hive/warehouse/app.db/t_od_use_cnt/date_8=20190403

/usr/hive/warehouse/app.db/t_od_use_cnt/date_8=20190404

/usr/hive/warehouse/app.db/t_od_use_cnt/date_8=20190405

......

这样查询时如果我们限定了分区范围，Hive就可以直接去相应的目录下查询数据，而不需要扫描整个表，所以当数据量很大时可以显著提高查询性能。

建立分区表要使用关键字[PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)] ，注意分区的字段不可在普通字段中重复出现。分区表在工作中十分常见，一般来说公司所有的表都会以日期进行分区，以便提高查询效率。

我们还是以t_od_use_cnt为例，建表语句如下：

CREATE TABLE t_od_use_cnt (
      platform string comment '平台 android,ios'
      ,app_version string comment 'app版本'
      ,user_id BIGINT comment '用户id'
      ,use_cnt INT comment '当日使用次数'
      ,is_active TINYINT comment '是否活跃'
      ) partitioned BY (date_8 INT comment '日期');

我们先使用set hive.cli.print.current.db=true;命令来显示当前库名，然后使用show tables;命令来查询当前库有哪些表，建表成功后，再使用desc命令查询表结构。执行效果如下：

hive> set hive.cli.print.current.db=true;
hive (default)> use app;
OK
Time taken: 0.619 seconds
hive (app)> show tables;
OK
t_od_use_cnt
Time taken: 0.262 seconds, Fetched: 1 row(s)
hive (app)> drop table t_od_use_cnt;
OK
Time taken: 1.303 seconds
hive (app)> create table t_od_use_cnt(
          >        platform string comment '平台 android,ios'
          >       ,app_version string comment 'app版本'
          >       ,user_id bigint comment '用户id'
          >       ,use_cnt int comment '当日使用次数'
          >       ,is_active tinyint comment '是否活跃'
          >       )
          > partitioned by (date_8 int comment '日期');
OK
Time taken: 0.921 seconds
hive (app)> desc t_od_use_cnt;
OK
platform            	string              	平台 android,ios      
app_version         	string              	app版本               
user_id             	bigint              	用户id                
use_cnt             	int                 	当日使用次数              
is_active           	tinyint             	是否活跃                
date_8              	int                 	日期                  
	 	 
# Partition Information	 	 
# col_name            	data_type           	comment             
	 	 
date_8              	int                 	日期                  
Time taken: 0.165 seconds, Fetched: 11 row(s)
hive (app)>

可以看到date_8作为分区字段创建好后表现的和普通字段完全一样。

8. 其余建表可选项

[CLUSTERED BY (col_name, col_name, ...) [SORTED ，BY (col_name [ASC|DESC], ...)] INTO num_buckets BUCKETS] ：

这个关键字是Hive中的分桶操作，数据分析师基本用不到，感兴趣的同学自行百度即可；

[ROW FORMAT row_format] ：

这个关键字用于指定数据切分格式，一般使用 '\t' 作为列之间的切分格式。本博客中为了导入csv文件，统一使用逗号进行分割，建表语句如下：

CREATE TABLE t_od_use_cnt (
      platform string comment '平台 android,ios'
      ,app_version string comment 'app版本'
      ,user_id BIGINT comment '用户id'
      ,use_cnt INT comment '当日使用次数'
      ,is_active TINYINT comment '是否活跃'
      ) partitioned BY (date_8 INT comment '日期') row format delimited fields terminated BY ',';

执行后查看表信息，效果如下：

hive> create table t_od_use_cnt (
    >       platform string comment '平台 android,ios'
    >       ,app_version string comment 'app版本'
    >       ,user_id BIGINT comment '用户id'
    >       ,use_cnt INT comment '当日使用次数'
    >       ,is_active TINYINT comment '是否活跃'
    >       ) partitioned BY (date_8 INT comment '日期') row format delimid fields terminated BY ',';
OK
Time taken: 0.313 seconds
hive> desc formatted t_od_use_cnt;
OK
# col_name            	data_type           	comment             
	 	 
platform            	string              	平台 android,ios      
app_version         	string              	app版本               
user_id             	bigint              	用户id                
use_cnt             	int                 	当日使用次数              
is_active           	tinyint             	是否活跃                
	 	 
# Partition Information	 	 
# col_name            	data_type           	comment             
	 	 
date_8              	int                 	日期                  
	 	 
# Detailed Table Information	 	 
Database:           	default             	 
Owner:              	root                	 
CreateTime:         	Thu Apr 25 11:01:56 CST 2019	 
LastAccessTime:     	UNKNOWN             	 
Protect Mode:       	None                	 
Retention:          	0                   	 
Location:           	hdfs://hadoop:9000/usr/hive/warehouse/t_od_use_cn 
Table Type:         	MANAGED_TABLE       	 
Table Parameters:	 	 
	transient_lastDdlTime	1556161316          
	 	 
# Storage Information	 	 
SerDe Library:      	org.apache.hadoop.hive.serde2.lazy.LazySimpleSerD 
InputFormat:        	org.apache.hadoop.mapred.TextInputFormat	 
OutputFormat:       	org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat	 
Compressed:         	No                  	 
Num Buckets:        	-1                  	 
Bucket Columns:     	[]                  	 
Sort Columns:       	[]                  	 
Storage Desc Params:	 	 
	field.delim         	,                   
	serialization.format	,                   
Time taken: 0.244 seconds, Fetched: 36 row(s)

[STORED AS file_format] ：

这个关键字用于设定数据在Hive中的存储格式，一般不指定，直接使用默认，或照公司其他表的存储格式即可。

9. 查询既有表的建表语句

在公司中需要查询既有表的建表格式时使用以下语句即可：

show create table tablename;

查询第六步所建外部表的建表语句，运行效果如下：

hive> show create table t_od_use_cnt;
OK
CREATE TABLE `t_od_use_cnt`(
  `platform` string COMMENT 's� android,ios', 
  `app_version` string COMMENT 'appH,', 
  `user_id` bigint COMMENT '(7id', 
  `use_cnt` int COMMENT 'S.(!p', 
  `is_active` tinyint COMMENT '/&;�')
PARTITIONED BY ( 
  `date_8` int COMMENT '�')
ROW FORMAT DELIMITED 
  FIELDS TERMINATED BY ',' 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  'hdfs://hadoop:9000/usr/hive/warehouse/t_od_use_cnt'
TBLPROPERTIES (
  'transient_lastDdlTime'='1556161316')

结果中文注释会显示乱码，这个问题需要重新编译jar包才能解决，在此就不提供解决办法了，有兴趣的同学自行百度即可，在工作里中文注释会有运维同学帮搞定~

可以看到其中有很多我们建表时并没有输入的语句，这些都是系统默认的设置，有兴趣的同学逐项百度，这里就不一一介绍了，因为工作中真的用不到~

能看到这里的同学，就右上角点个赞顺便关注我吧，3Q~

展望 AIGC 前景：通义万相 2.1 与蓝耘智算平台共筑 AI 生产力高地 accurater AIGC 人工智能神经网络深度学习
喜欢可以到主页订阅专栏引言人工智能生成内容（AIGC）技术正在重塑内容创作、影视制作、广告设计等行业的底层逻辑。作为该领域的革命性技术代表，通义万相2.1凭借其开源特性、多模态生成能力和技术突破，成为全球视频生成模型的标杆。而蓝耘智算平台则通过高性能算力支持与分布式架构优化，为AIGC技术的规模化应用提供了基础设施保障。两者的协同不仅推动了AI生产力的跃迁，更开启了从技术研发到商业落地的全链条创新
语音识别后处理代码 hitsz_syl 语音识别后处理
importreimportdifflibimportosfromdatetimeimportdatetime,timedeltadefextract_snippets_no_duplicates(input_file,output_file,window=150):"""从输入文本文件中提取包含目标字符（A、B、C、D、"开始"、"结束"）前后`window`个字符范围的文本。提取时扩展到完整的
Next.js博客项目-快速起步 Ktovoz nextjs javascript 开发语言 react 前端
作者:KTO原文:Next.js博客项目-快速起步简介:从nextjs博客模板开始，快速配置搭建自己的博客项目。部署出来的网站样式可以参考原文的网站。Next.js博客项目-快速起步使用的模板我们使用的模板是：tailwind-nextjs-starter-blog该模板有1.0版本和2.0版本。本文以1.0版本为例进行介绍。1.环境配置安装Node.js首先，确保你的机器上已安装Node.js。
文心一言提前免费，高性能大模型全面入局该咋看？江瀚视野人工智能机器人
3月16日，百度正式发布文心大模型4.5及文心大模型X1，在文心一言官网即可免费使用。这件事我们该怎么看？首先，从技术创新的角度来看，百度文心大模型4.5和X1的发布展示了百度在AI大模型领域的显著进步。文心大模型4.5作为首个原生多模态大模型，在多模态理解、文本和逻辑推理能力上的显著提升，使其在多项测试中表现优于GPT4.5，这体现了百度在AI技术研发上的深厚积累。同时，文心大模型X1作为深度思
Java中的参数传递机制：值传递与引用传递的真相啊sen丶 java 开发语言
在Java编程中，参数传递机制是每个开发者都必须理解的基本概念之一。然而，关于Java的参数传递机制，常常存在一些误解。很多人会问：“Java是按值传递还是按引用传递？”本文将通过详细的解释和代码示例，帮助你彻底理解Java的参数传递机制。一、值传递与引用传递的基本概念（一）值传递（PassbyValue）值传递是指在调用方法时，将实际参数的值复制一份传递给方法。在方法内部对参数的修改不会影响到原
【DevOps】Backstage介绍及如何在Azure Kubernetes Service上进行部署小涵 Azure云企业实践分享 devops azure kubernetes 容器 docker backstage
【DevOps】Backstage介绍及如何在AzureKubernetesService上进行部署推荐超级课程：本地离线DeepSeekAI方案部署实战教程【完全版】Docker快速入门到精通Kubernetes入门到大师通关课AWS云服务快速入门实战目录【DevOps】Backstage介绍及如何在AzureKubernetesService上进行部署Backstage介绍在AKS上部署Bac
K8S学习之基础二十八：k8s中的configMap 云上艺旅 K8S学习 kubernetes 学习容器云原生
k8s中的configMapconfigMap是k8s的资源对象，简称cm，用于保存非机密性的配置，数据可以用key/value键值对形式保存，也可以通过文件形式保存在部署服务的时候，每个服务都有自己的配置文件，如果一台服务器上部署多个服务：nginx、tomcat、apache等，那么这些配置都存在这个节点上，假如一台服务器不能满足线上高并发的要求，需要对服务器扩容，扩容之后的服务器还是需要部署
kubernetes(K8S)学习（七）：K8S之系统核心组件 ꯭ 瞎꯭扯꯭蛋꯭ Kubernetes kubernetes 学习容器
K8S之系统核心组件K8s系统核心组件1.1Master和Node1.2kubeadm1.3先把核心组件总体过一遍1.4Kubernetes源码查看方式1.5kubectl1.6APIServer1.7集群安全机制之APIServer1.8Scheduler1.9kubelet1.10kube-proxyK8s系统核心组件1.1Master和Node官网：https://kubernetes.io
Spring Boot 多级缓存实战：基于 Redis+Redisson 构建高并发解决方案 Isaac_Gao 缓存 spring boot redis
SpringBoot多级缓存实战：基于Redis+Redisson构建高并发解决方案本文适合人群：中高级Java开发工程师、系统架构师、对高并发场景优化感兴趣的技术人员一、为什么需要多级缓存？在百万级并发的电商系统中，我们曾遇到这样的性能瓶颈：本地缓存导致各节点数据不一致单纯依赖Redis造成带宽瓶颈缓存雪崩导致DB被打挂多级缓存架构通过结合本地缓存与分布式缓存的优势，实现了：热点数据纳秒级访问分
blockly二次开发刘阿去
目前有的问题1.文档少,主要是因为谷歌的网站上不去,2.BlocklyDevelopTools使用有问题,预览有问题,暂时无法解决.目前源码下载难度较大github下载速度慢,自己在gitee上弄了一份.https://gitee.com/liuaqu/blockly
lua5.3 交叉编译到安卓 polygenelubricants linux 错误整理 gcc/gdb编译调试 linux lua android
lua5.3交叉编译到安卓提示:如果只是打算在终端使用lua的话,可以尝试termux,或者说只打算获得lua的可执行文件,也可以安装termux,直接在~/../usr/bin目录下就可以找到lua的可执行文件(前提是你安装过了)开始##前言因为lua使用了readline库,而readline库中的一些函数(例如:tputs)是在ncurses库中实现,所以编译lua前要先编译这两个库:1.下
K8S之QoS详解 RedCong 云原生 k8s Openshift kubernetes 容器云原生
PodQoS类服务质量（QualityofService，QoS）类，阐述Kubernetes如何根据为Pod中的容器指定的资源约束为每个Pod设置QoS类。Kubernetes依赖这种分类来决定当Node上没有足够可用资源时要驱逐哪些Pod。QoS类（QualityofServiceclasses）Kubernetes对你运行的Pod进行分类，并将每个Pod分配到特定的QoS类中。Kuberne
Python入门实战：Python的代码重构 AI智能涌现深度研究 DeepSeek R1 &大数据AI人工智能大数据人工智能语言模型 AI LLM Java Python 架构设计
1.背景介绍Python是一种基于社区发展、易用性、生态系统完善、可扩展性强、性能卓越等特点的高级编程语言。作为一门解释型语言，它具有高效率、简洁语法、丰富的库函数、跨平台能力和多种开发范式等优点。但随着项目不断迭代更新，代码量逐渐增加，导致代码结构混乱、缺乏模块化设计、重复逻辑过多、命名不规范等问题。如何有效地组织、管理和维护代码、提升代码质量、更好地实现功能，是一个技术人的日常工作。如何进行代
学校打算用十万购买一台服务器，大家有什么推荐吗？ m0_59732961 云服务器阿里云
上云吧！上云是趋势，先po几条有的没的：北京市国税局与阿里云达成战略合作共同推进“智慧税务”建设...阿里云为12306提供技术支持...浙江启动“十万企业上云”计划...为什么要上云：1、自购服务器很可能会遇到技术壁垒，面对技术问题没有成熟的解决方案；2、运维成本低，几乎没什么运维成本；3、云服务器三副本可靠性高，自己买一台服务器还要考虑到容灾的问题吧；4、灵活扩展在线升降配，不会造成资源浪费冗
powershell运行脚本报错哦里哦里哦里给编程杂记后端
因为在此系统上禁止运行脚本。有关详细信息，请参阅https:/go.microsoft.com/fwlink/?LinkID=135170中的about_Execution_Policies。所在位置行:1字符:1+./compose.ps1up--build+~~~~~~~~~~~~~+CategoryInfo:SecurityError:(:)[]，PSSecurityException+Fu
从0到1构建AI深度学习视频分析系统--基于YOLO 目标检测的动作序列检查系统：（2）消息队列与消息中间件 shiter 人工智能系统解决方案与技术架构人工智能深度学习音视频
文章大纲原始视频队列Python内存视频缓存优化方案（4GB以内）一、核心参数设计二、内存管理实现三、性能优化策略四、内存占用验证五、高级优化技巧六、部署建议检测结果队列YOLO检测结果队列技术方案一、技术选型矩阵二、核心实现代码三、性能优化策略四、可视化方案对比五、部署建议逻辑判定队列时间片图论时间序列大模型引入参考文献原始视频队列想要在单机内存中缓存1-5分钟的视频片段，python技术栈的话
.NET/C# 生成二维码 ~请叫我小祸害~ .NET/C#.net c#开发语言 javascript
大家好，在本章是如何通过.net/C#来生成二维码首先大家还是需要仔细阅读这篇文档有小细节就需要注意大家需要生成一些类，把我的方法复制进去，如果不想添加类的话，大家需要再主代码上更改引用信息找到我们所添加的方法不适用于零基础的朋友，适用于有点经验的懂一点代码的就行1、首先我们新建一个自己的项目.netcore或其他项目新建好后新建一个控制器我们需要在里面写自己的代码，在控制器里面生成一个index
100.HarmonyOS NEXT跑马灯组件教程：实际应用与场景示例 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT跑马灯组件教程：实际应用与场景示例1.跑马灯组件应用概述跑马灯组件在HarmonyOSNEXT应用中有着广泛的应用场景，特别是在需要在有限空间内展示较长文本内容的情况下。本文将介绍跑马灯组件的实际应用场景和使用方法，帮助开发者更好地理解
python内存泄露 weixin_39810989 内存泄漏 python malloc
定位工具及使用1.tracemalloc可以通过创建快照的方式记录当前的内存占用情况。从而可以比较快照与快照之间的内存占用差异。可以获取内存块的回溯，定位到内存占用最多的文件和代码行。osgeo.cn/cpython/library/tracemalloc.html2.pympler可以创建快照（summaries）进行内存块占用对比frompympler.classtrackerimportCl
python selenium 点击按钮_Python Selenium等待用户单击按钮 Shu Wang python selenium 点击按钮
语境：>我的脚本使用seleniumwebdriver启动到网站>用户填写网站上的一些东西>用户将点击一个按钮,弹出确认()dialogbox询问用户“你想提交数据吗”我的本意：我的脚本会等到用户点击按钮.一旦检测到用户点击了该按钮,我的脚本就会获得一个元素的值,然后(不知何故)在dialogbox上单击OK.题：如何等待用户点击按钮？然后如何在dialogbox上单击“确定”？补充说明：使用：c
从零开始大模型开发与微调：PyCharm的下载与安装 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
从零开始大模型开发与微调：PyCharm的下载与安装1.背景介绍随着人工智能和深度学习技术的不断发展,大型语言模型(LargeLanguageModels,LLMs)已经成为当前最引人注目的研究热点之一。LLMs能够在各种自然语言处理任务上展现出惊人的性能,例如机器翻译、文本生成、问答系统等。PyTorch和TensorFlow等深度学习框架为训练和微调大型语言模型提供了强大的支持。PyCharm
第十二届蓝桥杯真题Python组卡片阿于阿于蓝桥杯模拟/真题
卡片本题总分：5分【问题描述】小蓝有很多数字卡片，每张卡片上都是数字0到9小蓝准备用这些卡片来拼一些数，他想从1开始拼出正整数，每拼一个，就保存起来，卡片就不能用来拼其它数了。小蓝想知道自己能从1拼到多少。例如，当小蓝有30张卡片，其中0到9各3张，则小蓝可以拼出1到10,但是拼11时卡片1已经只有一张了，不够拼出11现在小蓝手里有0到9的卡片各2021张，共20210张，请问小蓝可以从1拼到多少
金融时间序列分析（Yahoo Finance API实战）闲人编程 Python数据分析实战精要金融 yfinance 时间序列波动率数据归一化数据分析 Dash
这里写目录标题金融时间序列分析（YahooFinanceAPI实战）1.引言2.项目背景与意义3.数据集介绍4.GPU加速在数据处理中的应用5.交互式GUI设计与加速处理6.系统整体架构7.数学公式与指标计算8.完整代码实现9.代码自查与BUG排查10.总结与展望金融时间序列分析（YahooFinanceAPI实战）1.引言在当今金融市场中，时间序列数据分析是理解股票、指数以及其他金融产品走势的重
系分 02 软件工程一越王超软考系统分析师软件工程
软件工程本身涵盖内容很广，从系统规划到分析……到维护都属于软件工程，但是我们将会在其他章节讨论相关内容，本节我们主要内容如下：系统规划软件工程信息系统生命周期（★）软件开发模型（★★★★）逆向工程（★★）净室软件工程（★）需求工程系统设计系统测试与维护基础知识软件工程是指应用计算机科学、数学及管理科学等原理，以工程化的原则和方法来解决软件问题的工程，其目的是提高软件生产率、提高软件质量、减低软件成
Python第二十三课：自监督学习 | 无标注数据的觉醒程之编 Python全栈通关秘籍 python 开发语言人工智能机器学习
本节目标理解自监督学习的核心范式与优势掌握对比学习（ContrastiveLearning）框架实现图像掩码自编码器（MaskedAutoencoder）开发实战项目：亿级参数模型轻量化探索数据增强的创造性艺术一、自监督学习基础（AI的拼图游戏）1.核心思想解析学习范式数据需求生活比喻监督学习海量标注数据老师逐题批改作业无监督学习纯无标签数据自学杂乱笔记自监督学习自动生成伪标签玩拼图游戏（根据碎片
洛谷-P5534 【XR-3】等差数列兔子递归洛谷题解 c++经验分享
题目：P5534【XR-3】等差数列题目分析：首先得输入，然后根据前两项的值算出“d”，即a[2]-a[1]。提示：十年OI一场空，不开longlong见祖宗接着求出前n项：从3开始，到n项结束。递推公式："a[i]=a[i-1]+d;"。最后从1到n累加，输出。上代码：#includeusingnamespacestd;longa[1000005];intmain(void){longi,d,a
94.HarmonyOS NEXT动画系统实现教程：深入理解FuncUtils harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT动画系统实现教程：深入理解FuncUtils1.动画系统基础1.1核心概念概念说明应用场景动画持续时间动画执行的时长控制动画速度动画曲线动画的变化规律定义动画效果动画回调动画执行的具体内容实现状态变化1.2动画执行函数解析exportf
97.HarmonyOS NEXT跑马灯组件教程：基础概念与架构设计 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT跑马灯组件教程：基础概念与架构设计1.跑马灯组件概述跑马灯（Marquee）是一种常见的UI组件，主要用于在有限的空间内展示超出显示区域的文本内容。当文本内容过长无法在固定宽度内完整显示时，跑马灯组件会使文本自动滚动，以便用户可以查看全
85.HarmonyOS NEXT 网络请求与数据处理：构建可靠的数据层 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT网络请求与数据处理：构建可靠的数据层1.网络请求基础1.1基本概念概念说明使用场景HTTP请求基本的网络通信API调用WebSocket双向实时通信即时消息数据序列化数据格式转换请求/响应处理1.2HTTP请求封装classHttpCl
82.HarmonyOS NEXT 性能优化指南：从理论到实践 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT性能优化指南：从理论到实践1.性能优化概述1.1性能指标指标类型关键指标目标值启动时间首屏渲染=[];privatepageSize:number=20;//2.使用虚拟列表build(){List(){LazyForEach(this
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，Django@Python2.x 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f

Hive零基础从入门到实战 入门篇（七）HiveQL：表操作（上）

目录

前言

1. 最简单的建表语句

2. 查看表结构

3. 删除表

4. 建表时为字段添加注释

5. 建表可选项IF NOT EXITS

6. 建表可选项 EXTERNAL

6.1 内部表

6.2 外部表

7. 建分区表

8. 其余建表可选项

9. 查询既有表的建表语句

前言

1. 最简单的建表语句

2. 查看表结构

3. 删除表

4. 建表时为字段添加注释

5. 建表可选项IF NOT EXITS

6. 建表可选项 EXTERNAL

6.1 内部表

6.2 外部表

7. 建分区表

8. 其余建表可选项

9. 查询既有表的建表语句

你可能感兴趣的:(Hive零基础从入门到实战 入门篇（七）HiveQL：表操作（上）)

Hive零基础从入门到实战入门篇（七）HiveQL：表操作（上）

你可能感兴趣的:(Hive零基础从入门到实战入门篇（七）HiveQL：表操作（上）)