weixin_39879651

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义

一、数据仓库--DDL数据定义

1、创建数据库

（1）创建一个数据库，数据库在HDFS上的默认存储路径是/user/hive/warehouse/*.db。

hive (default)> create database db_hive;

OK
Time taken: 0.123 seconds
hive (default)>

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第2张图片

（2）创建数据表

hive (default)> create table db_hive.test(id int);

OK
Time taken: 0.18 seconds
hive (default)>

刷新后：

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第3张图片

若不想创建数据库放在默认的路径的话，想指定别的目录我们可以这样操作

hive (default)> create database db_hive1 location '/db_hive1.db';

FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:java.lang.IllegalArgumentException: java.net.URISyntaxException: Relative path in absolute URI: hdfs://hadoop101:9000./db_hive1.db)
hive (default)> 
//注意：若已经存在的数据文件，将会创建失败，如上。

//正确创建
hive (default)> create database db_hive1 location '/db_hive1.db';

OK
Time taken: 0.067 seconds

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第4张图片

（3）创建数据库db_hive1的表

hive (default)>  create table db_hive1.test(id int);

OK
Time taken: 0.268 seconds
hive (default)>

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第5张图片

2、查询数据库

（1）显示数据库

hive (default)> show databases;

OK
database_name
db_hive
db_hive1
default
Time taken: 0.111 seconds, Fetched: 3 row(s)

hive (default)> 

// 创建数据库的另一种写法:
//不存在才创建数据库，只需要在sql语句添加if not exists的判断
hive (default)> create database if not exists  db_hive; 

OK
Time taken: 0.125 seconds
hive (default)> 

//过滤显示查询的数据库
hive (default)> show databases like 'db_hive*';

OK
database_name
db_hive
db_hive1
Time taken: 0.073 seconds, Fetched: 2 row(s)
hive (default)> 


//查看数据库详情信息
hive (default)> desc database db_hive;

OK
db_name	comment	location	owner_name	owner_type	parameters
db_hive		hdfs://hadoop101:9000/user/hive/warehouse/db_hive.db	root	USER	
Time taken: 0.058 seconds, Fetched: 1 row(s)
hive (default)> 

//显示数据库详细信息，extended
hive (default)> desc database extended db_hive;

OK
db_name	comment	location	owner_name	owner_type	parameters
db_hive		hdfs://hadoop101:9000/user/hive/warehouse/db_hive.db	root	USER	
Time taken: 0.035 seconds, Fetched: 1 row(s)
hive (default)> 

以上，由于显示数据库信息与显示数据库详细信息，查询出来的数据是相同，是因为没有添加额外信息

//切换当前数据库
hive (default)> use db_hive;

3、修改数据库

用户可以使用ALTER DATABASE命令为某个数据库的DBPROPERTIES设置键-值对属性值，来描述这个数据库的属性信息。数据库的其他元数据信息都是不可更改的，包括数据库名和数据库所在的目录位置。

//改数据库（增加了属性）
hive (default)> alter database db_hive set dbproperties('createtime'='20170830');

OK
Time taken: 0.162 seconds
hive (default)> 

//在hive中查看修改结果
hive (default)> desc database extended db_hive;
OK
db_name	comment	location	owner_name	owner_type	parameters
db_hive		hdfs://hadoop101:9000/user/hive/warehouse/db_hive.db	root	USER	{createtime=20170830}
Time taken: 0.051 seconds, Fetched: 1 row(s)
hive (default)>

4、删除数据库

 //删除空数据库
hive (default)> drop database db_hive1;

FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. InvalidOperationException(message:Database db_hive1 is not empty. One or more tables exist.)

以上：报错提示，说明数据库里面没有数据才报错
注意：只要数据库里面没有数据表，当删除都会报错

//可以采用cascade命令，强制删除（级联删除）
hive (default)> drop database db_hive cascade;

OK
Time taken: 0.881 seconds
hive (default)> 

//如果删除的数据库不存在，最好采用 if exists判断数据库是否存在，不然将会报错
hive (default)> drop database  if exists  db_hive;
OK
Time taken: 0.02 seconds
hive (default)>

5、创建表

（1）建表语法

CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name 
[(col_name data_type [COMMENT col_comment], ...)] 
[COMMENT table_comment] 
[PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)] 
[CLUSTERED BY (col_name, col_name, ...) 
[SORTED BY (col_name [ASC|DESC], ...)] INTO num_buckets BUCKETS] 
[ROW FORMAT row_format] 
[STORED AS file_format] 
[LOCATION hdfs_path]

（2）字段解释说明

（1）CREATE TABLE 创建一个指定名字的表。如果相同名字的表已经存在，则抛出异常；用户可以用 IF NOT EXISTS 选项来忽略这个异常。
（2）EXTERNAL关键字可以让用户创建一个外部表，在建表的同时指定一个指向实际数据的路径（LOCATION），Hive创建内部表时，会将数据移动到数据仓库指向的路径；若创建外部表，仅记录数据所在的路径，不对数据的位置做任何改变。在删除表的时候，内部表的元数据和数据会被一起删除，而外部表只删除元数据，不删除数据。
（3）COMMENT：为表和列添加注释。===
（4）PARTITIONED BY创建分区表
（5）CLUSTERED BY创建分桶表
（6）SORTED BY不常用
（7）ROW FORMAT
DELIMITED [FIELDS TERMINATED BY char] [COLLECTION ITEMS TERMINATED BY char]
[MAP KEYS TERMINATED BY char] [LINES TERMINATED BY char]
| SERDE serde_name [WITH SERDEPROPERTIES (property_name=property_value, property_name=property_value, …)]
用户在建表的时候可以自定义SerDe或者使用自带的SerDe。如果没有指定ROW FORMAT 或者ROW FORMAT DELIMITED，将会使用自带的SerDe。在建表的时候，用户还需要为表指定列，用户在指定表的列的同时也会指定自定义的SerDe，Hive通过SerDe确定表的具体的列的数据。
SerDe是Serialize/Deserilize的简称，目的是用于序列化和反序列化。
（8）STORED AS指定存储文件类型
常用的存储文件类型：SEQUENCEFILE（二进制序列文件）、TEXTFILE（文本）、RCFILE（列式存储格式文件）
如果文件数据是纯文本，可以使用STORED AS TEXTFILE。如果数据需要压缩，使用 STORED AS SEQUENCEFILE。
（9）LOCATION ：指定表在HDFS上的存储位置。
（10）LIKE允许用户复制现有的表结构，但是不复制数据。

6、HiveJDBC访问

（1）开启JDBC服务

//首先，执行启动hiveserver2 服务
[root@hadoop101 module]# cd hive-1.2.1/bin/
[root@hadoop101 bin]# ./hiveserver2 

//接着，再开另一个窗口，开启beeline 服务
[root@hadoop101 ~]# cd /usr/local/hadoop/module/hive-1.2.1/bin/
[root@hadoop101 bin]# ./beeline 
beeline> 

//beeline 的帮助命令
beeline> help

!addlocaldriverjar  Add driver jar file in the beeline client side.
!addlocaldrivername Add driver name that needs to be supported in the beeline
                    client side.
!all                Execute the specified SQL against all the current connections
!autocommit         Set autocommit mode on or off
!batch              Start or execute a batch of statements
!brief              Set verbose mode off
!call               Execute a callable statement
!close              Close the current connection to the database
!closeall           Close all current open connections
!columns            List all the columns for the specified table
!commit             Commit the current transaction (if autocommit is off)
!connect            Open a new connection to the database.
!dbinfo             Give metadata information about the database
!describe           Describe a table
!dropall            Drop all tables in the current database
!exportedkeys       List all the exported keys for the specified table
!go                 Select the current connection
!help               Print a summary of command usage
!history            Display the command history
!importedkeys       List all the imported keys for the specified table
!indexes            List all the indexes for the specified table
!isolation          Set the transaction isolation for this connection
!list               List the current connections
!manual             Display the BeeLine manual
!metadata           Obtain metadata information
!nativesql          Show the native SQL for the specified statement
!nullemptystring    Set to true to get historic behavior of printing null as
                    empty string. Default is false.
!outputformat       Set the output format for displaying results
                    (table,vertical,csv2,dsv,tsv2,xmlattrs,xmlelements, and
                    deprecated formats(csv, tsv))
!primarykeys        List all the primary keys for the specified table
!procedures         List all the procedures
!properties         Connect to the database specified in the properties file(s)
!quit               Exits the program
!reconnect          Reconnect to the database
!record             Record all output to the specified file
!rehash             Fetch table and column names for command completion
!rollback           Roll back the current transaction (if autocommit is off)
!run                Run a script from the specified file
!save               Save the current variabes and aliases
!scan               Scan for installed JDBC drivers
!script             Start saving a script to a file
!set                Set a beeline variable
!sh                 Execute a shell command
!sql                Execute a SQL command
!tables             List all the tables in the database
!typeinfo           Display the type map for the current connection
!verbose            Set verbose mode on

Comments, bug reports, and patches go to ???
beeline> 


//使用beeline连接jdbc
beeline> !connect jdbc:hive2://localhost:10000
Connecting to jdbc:hive2://localhost:10000

Enter username for jdbc:hive2://localhost:10000: root
Enter password for jdbc:hive2://localhost:10000: 
Connected to: Apache Hive (version 1.2.1)
Driver: Hive JDBC (version 1.2.1)
Transaction isolation: TRANSACTION_REPEATABLE_READ
0: jdbc:hive2://localhost:10000> 


//连接beeline的jdbc之后，显示jdbc当前的数据库
0: jdbc:hive2://localhost:10000> show databases;
+----------------+--+
| database_name  |
+----------------+--+
| db_hive1       |
| default        |
+----------------+--+
2 rows selected (2.181 seconds)
0: jdbc:hive2://localhost:10000> 


//使用default的数据库，显示当前数据库的表
0: jdbc:hive2://localhost:10000> use default;
No rows affected (0.125 seconds)

0: jdbc:hive2://localhost:10000> show tables;
+-------------+--+
|  tab_name   |
+-------------+--+
| db_hive1    |
| hive_test   |
| sqoop_test  |
| student     |
| test        |
+-------------+--+
5 rows selected (0.11 seconds)
0: jdbc:hive2://localhost:10000> 


//查询student表
0: jdbc:hive2://localhost:10000> select * from student;
+-------------+---------------+--------------+--+
| student.id  | student.name  | student.age  |
+-------------+---------------+--------------+--+
| 1001        | zhangshan     | NULL         |
| 1002        | lishi         | NULL         |
| 1003        | zhaoliu       | NULL         |
+-------------+---------------+--------------+--+
3 rows selected (1.74 seconds)
0: jdbc:hive2://localhost:10000> 


//之后，会发现进程hiveserver2服务报错信息
FAILED: ParseException line 1:10 mismatched input '' expecting EXTENDED near 'table' in show statement

解决问题：关闭服务，重新连接hiveserver2服务

注意的是：当重新连接hiveserver2服务，beeline 服务也需要关闭重新连接，重新操作！

7、数据定义–内部表（管理表）

（1）理论

默认创建的表都是所谓的管理表，有时也被称为内部表。因为这种表，Hive会（或多或少地）控制着数据的生命周期。Hive默认情况下会将这些表的数据存储在由配置项hive.metastore.warehouse.dir(例如，/user/hive/warehouse)所定义的目录的子目录下。当我们删除一个管理表时，Hive也会删除这个表中数据。管理表不适合和其他工具共享数据。

（2）操作步骤

//首先，显示当前所有数据
hive (default)> show tables;

OK
tab_name
db_hive1
hive_test
sqoop_test
student
test
Time taken: 0.163 seconds, Fetched: 5 row(s)
hive (default)> 

//查询test表数据
hive (default)> select * from test;

OK
test.name	test.friends	test.children	test.address
songsong	["bingbing","lili"]	{"xiao song":18,"xiaoxiao song":19}	{"street":"hui long guan","city":"beijing"}
yangyang	["caicai","susu"]	{"xiao yang":18,"xiaoxiao yang":19}	{"street":"chao yang","city":"beijing"}
Time taken: 0.255 seconds, Fetched: 2 row(s)
hive (default)> 

//删除test表
hive (default)> drop table test;

OK
Time taken: 0.837 seconds
hive (default)> 

//再查询当前所有数据
hive (default)> show tables;
OK
tab_name
db_hive1
hive_test
sqoop_test
student
Time taken: 0.037 seconds, Fetched: 4 row(s)
hive (default)> 

说明test表数据没有了，同时HDFS分布式文件的test也会没有的

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第6张图片

当然，我们也可以使用另一种方式创建表，同时也将会把数据给复制过来的，执行如下：

hive (default)> create table student1 as select * from  student;

Query ID = root_20191231013137_74305e99-4485-4f32-95e4-a75ecaee3de9
Total jobs = 3
Launching Job 1 out of 3
Number of reduce tasks is set to 0 since there's no reduce operator
Starting Job = job_1577715694305_0001, Tracking URL = http://hadoop101:8088/proxy/application_1577715694305_0001/
Kill Command = /usr/local/hadoop/module/hadoop-2.7.2/bin/hadoop job  -kill job_1577715694305_0001
Hadoop job information for Stage-1: number of mappers: 1; number of reducers: 0
2019-12-31 01:32:08,597 Stage-1 map = 0%,  reduce = 0%
2019-12-31 01:32:21,388 Stage-1 map = 100%,  reduce = 0%, Cumulative CPU 1.48 sec
MapReduce Total cumulative CPU time: 1 seconds 480 msec
Ended Job = job_1577715694305_0001
Stage-4 is selected by condition resolver.
Stage-3 is filtered out by condition resolver.
Stage-5 is filtered out by condition resolver.
Moving data to: hdfs://hadoop101:9000/user/hive/warehouse/.hive-staging_hive_2019-12-31_01-31-37_390_2456736349393130958-1/-ext-10001
Moving data to: hdfs://hadoop101:9000/user/hive/warehouse/student1
Table default.student1 stats: [numFiles=1, numRows=3, totalSize=48, rawDataSize=45]
MapReduce Jobs Launched: 
Stage-Stage-1: Map: 1   Cumulative CPU: 1.48 sec   HDFS Read: 2895 HDFS Write: 120 SUCCESS
Total MapReduce CPU Time Spent: 1 seconds 480 msec
OK
student.id	student.name	student.age
Time taken: 47.631 seconds
hive (default)>  


//此时，我们对student1数据表进行查询
hive (default)>  select * from student1;

OK
student1.id	student1.name	student1.age
1001	zhangshan	NULL
1002	lishi	NULL
1003	zhaoliu	NULL
Time taken: 0.183 seconds, Fetched: 3 row(s)
hive (default)>

方式二：创建表（只有表数据，没有表结构）

//创建，执行命令：
hive (default)> create table student2 like  student;
OK
Time taken: 0.23 seconds
hive (default)> 


hive (default)> show tables;
OK
tab_name
db_hive1
hive_test
sqoop_test
student
student1
student2
Time taken: 0.045 seconds, Fetched: 6 row(s)
hive (default)> 


//只有表数据，没有表结构，执行命令如下：
hive (default)> desc student;
OK
col_name	data_type	comment
id                  	int                 	                    
name                	string              	                    
age                 	int                 	                    
Time taken: 0.179 seconds, Fetched: 3 row(s)
hive (default)> 

//查看表信息
hive (default)> desc extended student;

OK
col_name	data_type	comment
id                  	int                 	                    
name                	string              	                    
age                 	int                 	                    
	 	 
Detailed Table Information	Table(tableName:student, dbName:default, owner:root, createTime:1577672971, lastAccessTime:0, retention:0, sd:StorageDescriptor(cols:[FieldSchema(name:id, type:int, comment:null), FieldSchema(name:name, type:string, comment:null), FieldSchema(name:age, type:int, comment:null)], location:hdfs://hadoop101:9000/user/hive/warehouse/student, inputFormat:org.apache.hadoop.mapred.TextInputFormat, outputFormat:org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat, compressed:false, numBuckets:-1, serdeInfo:SerDeInfo(name:null, serializationLib:org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe, parameters:{field.delim=	, serialization.format=
Time taken: 0.133 seconds, Fetched: 5 row(s)
hive (default)> 

//查看表的初始化信息
hive (default)> desc formatted student;

OK
col_name	data_type	comment
# col_name            	data_type           	comment             
	 	 
id                  	int                 	                    
name                	string              	                    
age                 	int                 	                    
	 	 
# Detailed Table Information	 	 
Database:           	default             	 
Owner:              	root                	 
CreateTime:         	Mon Dec 30 02:29:31 GMT 2019	 
LastAccessTime:     	UNKNOWN             	 
Protect Mode:       	None                	 
Retention:          	0                   	 
Location:           	hdfs://hadoop101:9000/user/hive/warehouse/student	 
Table Type:         	MANAGED_TABLE       	 
Table Parameters:	 	 
	COLUMN_STATS_ACCURATE	false               
	numFiles            	1                   
	numRows             	-1                  
	rawDataSize         	-1                  
	totalSize           	39                  
	transient_lastDdlTime	1577672971          
	 	 
# Storage Information	 	 
SerDe Library:      	org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe	 
InputFormat:        	org.apache.hadoop.mapred.TextInputFormat	 
OutputFormat:       	org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat	 
Compressed:         	No                  	 
Num Buckets:        	-1                  	 
Bucket Columns:     	[]                  	 
Sort Columns:       	[]                  	 
Storage Desc Params:	 	 
	field.delim         	t                  
	serialization.format	t                  
Time taken: 0.182 seconds, Fetched: 34 row(s)
hive (default)>

8、数据定义–外部表

（1）理论

因为表是外部表，所以Hive并非认为其完全拥有这份数据。删除该表并不会删除掉这份数据，不过描述表的元数据信息会被删除掉。

（2）管理表和外部表的使用场景

每天将收集到的网站日志定期流入HDFS文本文件。在外部表（原始日志表）的基础上做大量的统计分析，用到的中间表、结果表使用内部表存储，数据通过SELECT+INSERT进入内部表。

（3）案例实操

分别创建部门和员工外部表，并向表中导入数据

步骤：

先进入 /usr/local/hadoop/module/datas目录下创建一个dept文本

[root@hadoop101 datas]# cd /usr/local/hadoop/module/datas/
[root@hadoop101 datas]# vim dept.txt

10	ACCOUNTING	1700
20	RESEARCH	1800
30	SALES	1900
40	OPERATIONS	1700

创建部门表，执行命令如下

hive (default)>  create external table if not exists default.dept(
deptno int,
dname string,
loc int
)
row format delimited fields terminated by 't';  

OK
Time taken: 0.123 seconds
hive (default)>

进入 /usr/local/hadoop/module/datas目录下创建一个emp文本，创建员工表

[root@hadoop101 datas]# cd /usr/local/hadoop/module/datas/
[root@hadoop101 datas]# vim emp.txt

7369	SMITH	CLERK	7902	1980-12-17	800.00		20
7499	ALLEN	SALESMAN	7698	1981-2-20	1600.00	300.00	30
7521	WARD	SALESMAN	7698	1981-2-22	1250.00	500.00	30
7566	JONES	MANAGER	7839	1981-4-2	2975.00		20
7654	MARTIN	SALESMAN	7698	1981-9-28	1250.00	1400.00	30
7698	BLAKE	MANAGER	7839	1981-5-1	2850.00		30
7782	CLARK	MANAGER	7839	1981-6-9	2450.00		10
7788	SCOTT	ANALYST	7566	1987-4-19	3000.00		20
7839	KING	PRESIDENT		1981-11-17	5000.00		10
7844	TURNER	SALESMAN	7698	1981-9-8	1500.00	0.00	30
7876	ADAMS	CLERK	7788	1987-5-23	1100.00		20
7900	JAMES	CLERK	7698	1981-12-3	950.00		30
7902	FORD	ANALYST	7566	1981-12-3	3000.00		20
7934	MILLER	CLERK	7782	1982-1-23	1300.00		10

创建员工表，执行命令如下

hive (default)> create external table if not exists default.emp(
empno int,
ename string,
job string,
mgr int,
hiredate string, 
sal double, 
comm double,
deptno int)
row format delimited fields terminated by 't';

OK
Time taken: 0.171 seconds
hive (default)>

查看创建的表

hive (default)> show tables;
OK
tab_name
db_hive1
dept
emp
hive_test
sqoop_test
student
student1
student2
Time taken: 0.037 seconds, Fetched: 8 row(s)
hive (default)>

向外部表中导入数据，执行命令如下:

hive (default)> load data local inpath '/usr/local/hadoop/module/datas/dept.txt' into table default.dept;

Loading data to table default.dept
Table default.dept stats: [numFiles=1, totalSize=69]
OK
Time taken: 0.724 seconds
hive (default)> 

hive (default)> load data local inpath '/usr/local/hadoop/module/datas/emp.txt' into table default.emp;

Loading data to table default.emp
Table default.emp stats: [numFiles=1, totalSize=657]
OK
Time taken: 0.417 seconds
hive (default)>

查询表emp、dept

hive (default)> select * from emp;
OK
emp.empno	emp.ename	emp.job	emp.mgr	emp.hiredate	emp.sal	emp.comm	emp.deptno
7369	SMITH	CLERK	7902	1980-12-17	800.0	NULL	20
7499	ALLEN	SALESMAN	7698	1981-2-20	1600.0	300.0	30
7521	WARD	SALESMAN	7698	1981-2-22	1250.0	500.0	30
7566	JONES	MANAGER	7839	1981-4-2	2975.0	NULL	20
7654	MARTIN	SALESMAN	7698	1981-9-28	1250.0	1400.0	30
7698	BLAKE	MANAGER	7839	1981-5-1	2850.0	NULL	30
7782	CLARK	MANAGER	7839	1981-6-9	2450.0	NULL	10
7788	SCOTT	ANALYST	7566	1987-4-19	3000.0	NULL	20
7839	KING	PRESIDENT	NULL	1981-11-17	5000.0	NULL	10
7844	TURNER	SALESMAN	7698	1981-9-8	1500.0	0.0	30
7876	ADAMS	CLERK	7788	1987-5-23	1100.0	NULL	20
7900	JAMES	CLERK	7698	1981-12-3	950.0	NULL	30
7902	FORD	ANALYST	7566	1981-12-3	3000.0	NULL	20
7934	MILLER	CLERK	7782	1982-1-23	1300.0	NULL	10
Time taken: 0.144 seconds, Fetched: 14 row(s)
hive (default)> 


hive (default)> select * from dept;
OK
dept.deptno	dept.dname	dept.loc
10	ACCOUNTING	1700
20	RESEARCH	1800
30	SALES	1900
40	OPERATIONS	1700
Time taken: 0.075 seconds, Fetched: 4 row(s)
hive (default)>

在分布式文件系统HDFS也可以查看到

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第7张图片

需要删除部门表emp，执行命令如下：

hive (default)> show tables;

OK
tab_name
db_hive1
dept
emp
hive_test
sqoop_test
student
student1
student2
Time taken: 0.069 seconds, Fetched: 8 row(s)

hive (default)> drop table emp;

OK
Time taken: 0.196 seconds

hive (default)> show tables;

OK
tab_name
db_hive1
dept
hive_test
sqoop_test
student
student1
student2
Time taken: 0.036 seconds, Fetched: 7 row(s)
hive (default)>

由上得知emp表已经删除了，这是内部表已经删除，我们再去看看外部表（分布式文件系统HDFS查看）

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第8张图片

这样做的好处：

当内部表的数据被删除，儿外部表的数据还是会被保留不会被删除；
当我们想要恢复内部表被删除的数据，只需要执行该表的sql命令即可：

hive (default)>  create external table if not exists default.emp(
empno int,
ename string,
job string,
mgr int,
hiredate string, 
sal double, 
comm double,
deptno int)
row format delimited fields terminated by 't';

OK
Time taken: 0.215 seconds

hive (default)> select * from emp;

OK
emp.empno	emp.ename	emp.job	emp.mgr	emp.hiredate	emp.sal	emp.comm	emp.deptno
7369	SMITH	CLERK	7902	1980-12-17	800.0	NULL	20
7499	ALLEN	SALESMAN	7698	1981-2-20	1600.0	300.0	30
7521	WARD	SALESMAN	7698	1981-2-22	1250.0	500.0	30
7566	JONES	MANAGER	7839	1981-4-2	2975.0	NULL	20
7654	MARTIN	SALESMAN	7698	1981-9-28	1250.0	1400.0	30
7698	BLAKE	MANAGER	7839	1981-5-1	2850.0	NULL	30
7782	CLARK	MANAGER	7839	1981-6-9	2450.0	NULL	10
7788	SCOTT	ANALYST	7566	1987-4-19	3000.0	NULL	20
7839	KING	PRESIDENT	NULL	1981-11-17	5000.0	NULL	10
7844	TURNER	SALESMAN	7698	1981-9-8	1500.0	0.0	30
7876	ADAMS	CLERK	7788	1987-5-23	1100.0	NULL	20
7900	JAMES	CLERK	7698	1981-12-3	950.0	NULL	30
7902	FORD	ANALYST	7566	1981-12-3	3000.0	NULL	20
7934	MILLER	CLERK	7782	1982-1-23	1300.0	NULL	10
Time taken: 0.102 seconds, Fetched: 14 row(s)
hive (default)>

查看表格式化数据

hive (default)> desc formatted dept;

OK
col_name	data_type	comment
# col_name            	data_type           	comment             
	 	 
deptno              	int                 	                    
dname               	string              	                    
loc                 	int                 	                    
	 	 
# Detailed Table Information	 	 
Database:           	default             	 
Owner:              	root                	 
CreateTime:         	Tue Dec 31 02:01:51 GMT 2019	 
LastAccessTime:     	UNKNOWN             	 
Protect Mode:       	None                	 
Retention:          	0                   	 
Location:           	hdfs://hadoop101:9000/user/hive/warehouse/dept	 
Table Type:         	EXTERNAL_TABLE      	 
Table Parameters:	 	 
	COLUMN_STATS_ACCURATE	true                
	EXTERNAL            	TRUE                
	numFiles            	1                   
	totalSize           	69                  
	transient_lastDdlTime	1577760554          
	 	 
# Storage Information	 	 
SerDe Library:      	org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe	 
InputFormat:        	org.apache.hadoop.mapred.TextInputFormat	 
OutputFormat:       	org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat	 
Compressed:         	No                  	 
Num Buckets:        	-1                  	 
Bucket Columns:     	[]                  	 
Sort Columns:       	[]                  	 
Storage Desc Params:	 	 
	field.delim         	t                  
	serialization.format	t                  
Time taken: 1.611 seconds, Fetched: 33 row(s)
hive (default)>

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第9张图片

9、管理表与外部表的互相转换

（1）查询表的类型

hive (default)> desc formatted student2;
Table Type:             MANAGED_TABLE

hive (default)>

（2）修改内部表student2为 EXTERNAL_TABLE

alter table student2 set tblproperties('EXTERNAL'='TRUE');

OK
Time taken: 0.27 seconds
hive (default)>

（3）查询表的类型（EXTERNAL_TABLE：外部表）

hive (default)> desc formatted student2;
Table Type:             EXTERNAL_TABLE

（4）修改外部表student2为内部表

alter table student2 set tblproperties('EXTERNAL'='FALSE');

OK
Time taken: 0.27 seconds
hive (default)>

（5）查询表的类型（MANAGED_TABLE ：内部表）

hive (default)> desc formatted student2;
Table Type:         	MANAGED_TABLE

10、分区表

分区表实际上就是对应一个HDFS文件系统上的独立的文件夹，该文件夹下是该分区所有的数据文件。Hive中的分区就是分目录，把一个大的数据集根据业务需要分割成小的数据集。在查询时通过WHERE子句中的表达式选择查询所需要的指定的分区，这样的查询效率会提高很多。

分区表基本操作

（1）创建一个分区表（按月分区）

hive (default)> create table stu_partition(id int,name string)
              > partitioned by(month string)
              > row format delimited fields  terminated by 't';
              
OK
Time taken: 0.449 seconds
hive (default)>

（2）查看当前的数据表

hive (default)> show tables;

OK
tab_name
db_hive1
dept
emp
hive_test
sqoop_test
stu_partition
student
student1
student2
Time taken: 0.046 seconds, Fetched: 9 row(s)
hive (default)>

虽然在内部表创建成功，而在外部表HDFS文件系统查看stu_partition数据库的是空表

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第10张图片

我们需要在分区表里面加载一些数据

hive (default)> load data local inpath '/usr/local/hadoop/module/datas/student.txt' into table stu_partition;

FAILED: SemanticException [Error 10062]: Need to specify partition columns because the destination table is partitioned
hive (default)>

从上面提示错误：由于是分区表，需要指定分区的地方，本身在创建这个分区表都已经被分区了！

正确写法：

hive (default)> load data local inpath '/usr/local/hadoop/module/datas/student.txt' into table stu_partition partition(month="20200623")  ;

Loading data to table default.stu_partition partition (month=20200623)
Partition default.stu_partition{month=20200623} stats: [numFiles=1, numRows=0, totalSize=39, rawDataSize=0]
OK
Time taken: 2.211 seconds
hive (default)>

我们可以在外部表HDFS文件系统查看stu_partition数据库的表已经有分区的数据了

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第11张图片

查询一下，分区的数据（查询这个分区表还是会进行全表扫描）

hive (default)> select * from stu_partition;

OK
stu_partition.id	stu_partition.name	stu_partition.month
1001	zhangshan	20200623
1002	lishi	20200623
1003	zhaoliu	20200623
Time taken: 0.729 seconds, Fetched: 3 row(s)
hive (default)>

分区表的结构

hive (default)> select * from stu_partition;

OK
stu_partition.id	stu_partition.name	stu_partition.month
1001	zhangshan	20200623
1002	lishi	20200623
1003	zhaoliu	20200623
Time taken: 0.189 seconds, Fetched: 3 row(s)
hive (default)>

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第12张图片

当然，也可以创建分区表的：20200624、20200625**，外部表HDFS文件系统就会生成三个文件夹

hive (default)> load data local inpath '/usr/local/hadoop/module/datas/student.txt' into table stu_partition partition(month="20200624")  ;

Loading data to table default.stu_partition partition (month=20200624)
Partition default.stu_partition{month=20200624} stats: [numFiles=1, numRows=0, totalSize=39, rawDataSize=0]
OK
Time taken: 0.68 seconds


hive (default)> load data local inpath '/usr/local/hadoop/module/datas/student.txt' into table stu_partition partition(month="20200625")  ;

Loading data to table default.stu_partition partition (month=20200625)
Partition default.stu_partition{month=20200625} stats: [numFiles=1, numRows=0, totalSize=39, rawDataSize=0]
OK
Time taken: 0.627 seconds
hive (default)>

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第13张图片

这三个文件夹都将会同时有数据

我们可以在内部表查询测试一下（这个数据将会有三份）

hive (default)> select * from stu_partition;

OK
stu_partition.id	stu_partition.name	stu_partition.month
1001	zhangshan	20200623
1002	lishi	20200623
1003	zhaoliu	20200623
1001	zhangshan	20200624
1002	lishi	20200624
1003	zhaoliu	20200624
1001	zhangshan	20200625
1002	lishi	20200625
1003	zhaoliu	20200625
Time taken: 0.162 seconds, Fetched: 9 row(s)
hive (default)>

我们也可以按条件查询一个分区表的数据，执行sql命令：

hive (default)> select * from stu_partition where month=20200625 ;

OK
stu_partition.id	stu_partition.name	stu_partition.month
1001	zhangshan	20200625
1002	lishi	20200625
1003	zhaoliu	20200625
Time taken: 0.6 seconds, Fetched: 3 row(s)
hive (default)>

如果查询二个或多个分区表的数据，执行sql命令（这种写法会将数据排序）：

缺点：加载比较慢

hive (default)> select * from stu_partition where month=20200625 
              > union
              > select * from stu_partition where month=20200624; 
              
Query ID = root_20191231153625_7a2ed346-e390-41ae-bb47-83cd31b986e3
Total jobs = 1
Launching Job 1 out of 1
Number of reduce tasks not specified. Estimated from input data size: 1
In order to change the average load for a reducer (in bytes):
  set hive.exec.reducers.bytes.per.reducer=
In order to limit the maximum number of reducers:
  set hive.exec.reducers.max=
In order to set a constant number of reducers:
  set mapreduce.job.reduces=
Starting Job = job_1577801392917_0001, Tracking URL = http://hadoop101:8088/proxy/application_1577801392917_0001/
Kill Command = /usr/local/hadoop/module/hadoop-2.7.2/bin/hadoop job  -kill job_1577801392917_0001
Hadoop job information for Stage-1: number of mappers: 2; number of reducers: 1
2019-12-31 15:36:49,805 Stage-1 map = 0%,  reduce = 0%
2019-12-31 15:37:11,282 Stage-1 map = 100%,  reduce = 0%, Cumulative CPU 3.26 sec
2019-12-31 15:37:22,462 Stage-1 map = 100%,  reduce = 100%, Cumulative CPU 5.76 sec
MapReduce Total cumulative CPU time: 5 seconds 760 msec
Ended Job = job_1577801392917_0001
MapReduce Jobs Launched: 
Stage-Stage-1: Map: 2  Reduce: 1   Cumulative CPU: 5.76 sec   HDFS Read: 14645 HDFS Write: 132 SUCCESS
Total MapReduce CPU Time Spent: 5 seconds 760 msec
OK
_u2.id	_u2.name	_u2.month
1001	zhangshan	20200624
1001	zhangshan	20200625
1002	lishi	20200624
1002	lishi	20200625
1003	zhaoliu	20200624
1003	zhaoliu	20200625
Time taken: 58.974 seconds, Fetched: 6 row(s)
hive (default)>

还有另一种写法，也是创建分区表（单个分区）的：

hive (default)> alter table stu_partition add partition(month='20200626');

OK
Time taken: 0.293 seconds
hive (default)>

HDFS文件系统就会生成一个month=20200626文件夹

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第14张图片

同时创建多个分区

hive (default)> alter table stu_partition add partition(month='20200627') partition(month='20200628');

OK
Time taken: 0.25 seconds
hive (default)>

HDFS文件系统就会生成2个文件夹

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第15张图片

删除分区

//删除单个分区
hive (default)> alter table stu_partition drop partition (month='20200628');

Dropped the partition month=20200628
OK
Time taken: 0.732 seconds
hive (default)>

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第16张图片

//同时删除多个分区
hive (default)> alter table stu_partition drop partition (month='20200627'), partition (month='20200626');

Dropped the partition month=20200626
Dropped the partition month=20200627
OK
Time taken: 0.331 seconds
hive (default)>

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第17张图片

查看分区表

//查看分区表有多少分区
hive (default)> show partitions stu_partition;

OK
partition
month=20200623
month=20200624
month=20200625
Time taken: 0.162 seconds, Fetched: 3 row(s)
hive (default)> 

//查看分区表结构
hive (default)> show partitions stu_partition;

OK
partition
month=20200623
month=20200624
month=20200625
Time taken: 0.162 seconds, Fetched: 3 row(s)
hive (default)> desc formatted stu_partition;
OK
col_name	data_type	comment
# col_name            	data_type           	comment             
	 	 
id                  	int                 	                    
name                	string              	                    
	 	 
# Partition Information	 	 
# col_name            	data_type           	comment             
	 	 
month               	string              	                    
	 	 
# Detailed Table Information	 	 
Database:           	default             	 
Owner:              	root                	 
CreateTime:         	Tue Dec 31 14:55:48 GMT 2019	 
LastAccessTime:     	UNKNOWN             	 
Protect Mode:       	None                	 
Retention:          	0                   	 
Location:           	hdfs://hadoop101:9000/user/hive/warehouse/stu_partition	 
Table Type:         	MANAGED_TABLE       	 
Table Parameters:	 	 
	transient_lastDdlTime	1577804148          
	 	 
# Storage Information	 	 
SerDe Library:      	org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe	 
InputFormat:        	org.apache.hadoop.mapred.TextInputFormat	 
OutputFormat:       	org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat	 
Compressed:         	No                  	 
Num Buckets:        	-1                  	 
Bucket Columns:     	[]                  	 
Sort Columns:       	[]                  	 
Storage Desc Params:	 	 
	field.delim         	t                  
	serialization.format	t                  
Time taken: 0.107 seconds, Fetched: 33 row(s)
hive (default)>

11、分区表注意事项

（1）创建二级分区表

hive (default)> create table stu2(id int,name string)
              >  partitioned by (month string, day string)
              >  row format delimited fields terminated by 't';
              
OK
Time taken: 0.429 seconds
hive (default)>

（2）正常的加载数据

//加载数据到二级分区表中
hive (default)> load data local inpath '/usr/local/hadoop/module/datas/student.txt'
              > into table stu2
              > partition(month='202006', day='23');
              
Loading data to table default.stu2 partition (month=202006, day=23)
Partition default.stu2{month=202006, day=23} stats: [numFiles=1, numRows=0, totalSize=39, rawDataSize=0]
OK
Time taken: 1.568 seconds
hive (default)> 

//查询二级分区数据
hive (default)> select * from stu2;

OK
stu2.id	stu2.name	stu2.month	stu2.day
1001	zhangshan	202006	23
1002	lishi	202006	23
1003	zhaoliu	202006	23
Time taken: 0.446 seconds, Fetched: 3 row(s)
hive (default)>

在HDFS查看二级分区

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第18张图片

//查询分区数据
hive (default)> select * from dept_partition2 where month='202006' and day='23';

OK
dept_partition2.deptno	dept_partition2.dname	dept_partition2.loc	dept_partition2.month	dept_partition2.day
Time taken: 0.439 seconds
hive (default)>

12、分区表与数据关联的三种方式

方式一：上传数据后修复

（1）上传数据在HDFS的文件目录，

例如：把/usr/local/hadoop/module/datas/student.txt数据信息上传到HDFS文件系统的文件夹上：

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第19张图片

执行命令如下：

hive (default)> dfs -put /usr/local/hadoop/module/datas/student.txt /user/hive/warehouse/stu2/month=202006;
hive (default)>

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第20张图片

当我们在内部表查询，发现查询数据

hive (default)> select * from stu2 where month=202006 and day=23;

OK
stu2.id	stu2.name	stu2.month	stu2.day
1001	zhangshan	202006	23
1002	lishi	202006	23
1003	zhaoliu	202006	23
Time taken: 0.169 seconds, Fetched: 3 row(s)
hive (default)>

假如查询不到数据，我们可以：执行修复命令

hive (default)> msck repair table stu2;
OK
Time taken: 0.131 seconds
hive (default)>

自己的可以查询的到，所以忽略过了！

方式二：上传数据后添加分区

(1) 在HDFS文件系统的/user/hive/warehouse/stu_partition路径下，创建一个month=20200626文件夹，执行命令如下：

hive (default)> dfs -mkdir -p /user/hive/warehouse/stu_partition/month=20200626;
hive (default)>

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第21张图片

把本地数据/usr/local/hadoop/module/datas/student.txt上传到HDFS文件系统的/user/hive/warehouse/stu_partition/month=20200626路径下，执行命令如下：

hive (default)> dfs -put  /usr/local/hadoop/module/datas/student.txt /user/hive/warehouse/stu_partition/month=20200626;
hive (default)>

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第22张图片

//执行添加分区
hive (default)>  alter table stu_partition add partition(month='20200626');

OK
Time taken: 0.177 seconds
hive (default)> 

//查询数据
hive (default)> select * from stu_partition where month=20200626;

OK
stu_partition.id	stu_partition.name	stu_partition.month
1001	zhangshan	20200626
1002	lishi	20200626
1003	zhaoliu	20200626
Time taken: 0.157 seconds, Fetched: 3 row(s)
hive (default)>

方式三：创建文件夹后load数据到分区

//创建目录
hive (default)> dfs -mkdir -p /user/hive/warehouse/db_hive1/kiss;

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第23张图片

上传数据

//上传数据
hive (default)> load data local inpath '/opt/module/datas/dept.txt' into table
 dept_partition2 partition(month='201709',day='10');

//查询数据
hive (default)> select * from dept_partition2 where month='201709' and day='10';

13、修改表

（1）重命名表

//语法

操作步骤：

//查看当前数据表

由上述得知，该数据student2表已经不存在，却多了student3表，由此可见该表修改成功

同时，当内部表修改成功之后，外部表HDFS文件系统的文件名f也将会发生改变！

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第24张图片

（2）增加/修改/替换列信息

语法

//更新列

操作步骤

//更改字段名的命令

由上面得知，增加表的字段成功！

（3）添加表的字段(一个)

hive

由上可得知，多了一个desc字段列，说明添加成功！

hive 修改cluster by算法_Hive入门实战（二）DDL数据定义_第25张图片

我们再查看student3数据表，可以看到表字段

hive

当然，我们也可替换(replace)数据表的字段

hive

再查看student3数据表结构，可以看到表字段的变化

hive

你可能感兴趣的:(hive,修改cluster,by算法,hive查看表中列的信息命令)

【有啥问啥】深入了解 FlashMLA：Hopper GPU 的高效 MLA 解码内核有啥问啥大模型行业调研科普算法语言模型
深入了解FlashMLA：HopperGPU的高效MLA解码内核简介在人工智能(AI)领域，特别是大型语言模型(LLM)领域，对计算效率和速度的需求持续增长。为了应对这些挑战，DeepSeek推出了FlashMLA，这是一种专为NVIDIAHopperGPU架构优化的高效MLA(Multi-LayerAttention)解码内核。FlashMLA旨在加速LLM的解码过程，从而显著提高模型的响应速度
Python连接SQL SEVER数据库全流程 m0_74824865 面试学习路线阿里巴巴数据库 python sql
背景介绍在数据分析领域，经常需要从数据库中获取数据进行分析和处理。而SQLServer是一种常用的关系型数据库管理系统，因此学习如何使用Python连接SQLServer数据库并获取数据是非常有用的。以下是Python使用pymssql连接SQLServer数据库的全流程：安装pymssql库本地账号设置脚本连接数据导入函数实现一、安装pymssqlpymssql是Python连接SQLServe
Spring 核心技术解析【纯干货版】- XII：Spring 数据访问模块 Spring-R2dbc 模块精讲 m0_74825003 面试学习路线阿里巴巴 spring java 后端
在现代应用架构中，高并发、低延迟的需求推动了响应式编程的发展，而传统的JDBC由于其同步阻塞机制，在高吞吐场景下可能成为瓶颈。R2DBC（ReactiveRelationalDatabaseConnectivity）作为响应式关系型数据库访问标准，正是为了解决这一问题而诞生的。SpringR2DBC作为Spring生态对R2DBC的封装，提供了非阻塞、异步的数据库访问能力，并与SpringWebF
Spring Boot的项目结构 m0_74823983 面试学习路线阿里巴巴 spring boot 后端 java
SpringBoot的项目结构技术背景SpringBoot项目结构遵循Maven或Gradle的标准目录结构，同时融入了SpringBoot的特定约定。良好的项目结构不仅有助于代码组织，还能提高开发效率和项目可维护性。了解SpringBoot的项目结构对于开发高质量的应用至关重要。1.基础项目结构1.1标准目录结构基本的SpringBoot项目结构如下：myproject/├──src/│├──m
类和对象——const修饰的类的对象和函数 Darkwanderor c++学习 c++const
const修饰的类的对象和函数const成员函数和const对象1const成员函数2调用关系3const在成员函数中的位置4取地址&及const取地址操作符重载const成员函数和const对象1const成员函数将const修饰的“成员函数”称之为const成员函数，const修饰类成员函数，实际修饰该成员函数隐含的this指针，表明在该成员函数中不能对类的任何成员进行修改。例如：#inclu
类和对象——static修饰类的成员 Darkwanderor c++学习 c++
static修饰类的成员static成员1static成员的概念2特性static成员有时会有这样的需求：计算程序中创建出了多少个类的对象，以及多少个正在使用的对象。因为构造函数和析构函数都只会调用一次，所以可以通过设置生命周期和main函数一致的计数变量进行统计。计数变量用全局变量还会有别的问题：c++讲究封装，用全局变量可能会被不明因素修改。#include#includeintn,m;cla
解释SQL和NoSQL数据库的区别，各自的适用场景是什么？破碎的天堂鸟学习教程 nosql 数据库
SQL与NoSQL数据库的深度对比及适用场景分析一、核心定义与数据模型差异1：SQL数据库结构化数据模型：基于关系型模型，数据以表格（行和列）形式存储，表之间通过外键建立关联。例如，客户表与订单表通过客户ID关联，形成严格的逻辑结构。预定义模式（Schema）：需提前定义表结构（字段类型、主键、外键等），修改结构需通过ALTER等命令，灵活性较低。标准化查询语言：使用SQL（StructuredQ
网络安全工具 AWVS 与 Nmap：原理、使用及代码示例阿贾克斯的黎明网络安全安全 web安全网络
目录网络安全工具AWVS与Nmap：原理、使用及代码示例AWVS：Web漏洞扫描的利器1.工具概述2.工作原理3.使用方法4.代码示例（Python调用AWVSAPI进行扫描）Nmap：网络探测与端口扫描的神器1.工具概述2.工作原理3.使用方法4.代码示例（Python调用Nmap进行扫描）总结在网络安全领域，AWVS（AcunetixWebVulnerabilityScanner）和Nmap是
深入剖析 Weblogic、ThinkPHP、Jboss、Struct2 历史漏洞阿贾克斯的黎明网络安全 web安全
目录深入剖析Weblogic、ThinkPHP、Jboss、Struct2历史漏洞一、Weblogic漏洞（一）漏洞原理（二）漏洞利用代码（Python示例）（三）防范措施二、ThinkPHP漏洞（一）漏洞原理（二）漏洞利用代码（示例，假设存在漏洞的代码片段）（三）防范措施三、Jboss漏洞（一）漏洞原理（二）漏洞利用代码（Java示例，用于构造恶意序列化数据）（三）防范措施四、Struct2漏洞
深入剖析 Java 反序列化：FASTjson 漏洞与 Shiro 漏洞阿贾克斯的黎明网络安全 php web安全开发语言
目录深入剖析Java反序列化：FASTjson漏洞与Shiro漏洞引言Java反序列化原理示例代码FASTjson漏洞分析漏洞成因示例代码防护措施Shiro漏洞分析漏洞成因示例代码（模拟攻击场景）防护措施总结引言在Java应用开发中，反序列化是一项重要的技术，但同时也隐藏着巨大的安全风险。FASTjson和Shiro作为Java开发中常用的工具和框架，其反序列化漏洞曾引发了广泛关注。本文将深入探讨
2024年BCSP-X小学低年级组初赛测试题（模拟题解析）天秀信奥编程培训 #BCXP-X模拟题北京BCSP-X试题讲解专栏 BCXP-X 信息学奥赛 c++
一、单项选择（共15题，每题2分，共计30分，每题有且仅有一个正确选项）以下是题目和解析的完整格式:不可以作为c++中的变量名的是（）。A.I以下loveChinaB.I_loveChinaC.I_love_ChinaD.i_loveChina正确答案：A.I以下loveChina解析：在C++中，变量名命名需要遵循一定的规则。变量名可以由字母、数字和下划线组成，但是第一个字符不能是数字。此外，变
【2000NOIP普及组】T4.单词接龙试题解析宏阳李老师 CSP/NOIP-J组试卷解析算法数据结构 c++蓝桥杯青少年编程
【2000NOIP普及组】T4.单词接龙试题解析时间限制:1000ms内存限制:65536KB【题目描述】单词接龙是一个与我们经常玩的成语接龙相类似的游戏，现在我们己知一组单词，且给定一个开头的字母，要求出以这个字母开头的最长的“龙”(每个单词都最多在“龙"中出现两次)，在两个单词相连时，其重合部分合为一部分，例如beast和astonish，如果接成一条龙则变为beastonish，另外相邻的两
冒泡排序原理及C++的实现方法小鹏编程 c++排序算法算法
冒泡排序是一种简单的排序算法，通过重复遍历列表并交换相邻元素来排序。一、算法原理核心思想：每次遍历将当前未排序部分的最大元素"冒泡"到正确位置。操作方式：比较相邻元素顺序错误则交换位置每轮遍历减少一次比较次数二、模拟示例以下用4个数据的数组[4,3,2,1]详细演示冒泡排序过程：初始数组[4,3,2,1]第一轮遍历（确定最大值）目标：将最大的数移动到最右侧比较与交换：比较4和3→交换→[3,4,2
HC32F460_SCI驱动（一）嵌入式老牛 HC32F460驱动库 HC32F460 C语言嵌入式硬件驱动库串口
在开始介绍HC32F460的SCI驱动之前，先重点说明一下功能组与串口相关参数，以便于更好的描述SCI驱动。1.功能组1.1基本概念HC32F460的引脚功能复用机制通过Func_Grp（功能组）实现，其灵活性显著高于传统单片机（如STM32系列）。每个引脚支持多种外设功能，具体功能通过选择对应的Func_Grp编号配置。该方案的灵活度极高，户可自由分配外设到指定引脚，无需遵循固定映射规则，极大提
NX二次开发-UFUN重新分配内存UF_reallocate_memory 阿飞2018 UG二次开发(C++)c++
版本NX9+VS2012例子说明关于这个分配内存UF_allocate_memory和重新分配内存UF_reallocate_memory，我之前是在唐工的视频中学过。但是我做了这两年开发，虽然没开发过多少东西。但是还真的从来都没用过分配内存和重新分配内存。都忘记有这个东西的存在了快。这东西也就在C语言开发中，才会有，要是用C#开发的话，都不会有指针这些东西。也不用那么麻烦。我试过想自己单独写一个
【数组】- 如何在C++的数组中插入元素？小鹏编程 C++c++数组
数组逆序数组是C++语言重要的数据结构，对它的一些基本操作要熟练掌握。今天，我们就来讨论，如何在数组中插入元素？案例题目描述在一个数组的第x个位置插入一个新的数y。输入有四行第一行有一个整数n(5usingnamespacestd;intmain(){inta[11],i,n,x,y;cin>>n;for(i=0;i>a[i];}cin>>x;//插入的位置cin>>y;//插入的元素x--;//
【数组】- 如何用C++数组统计相同数字出现的次数？小鹏编程 C++c++算法
统计数字出现次数数组是C++语言重要的数据结构，对它的一些基本操作要熟练掌握。那么，今天我们就来讨论，怎么使用数组统计一组数中每个数字出现的次数？案例题目描述有50个数（0-19），求这50个数中相同数字出现的最多次数为几次？输入50个数字。样例输入110201581270315015181671716911916121712431111421114611464111318703231819216
Qt5.6在Linux中无法切换中文输入法问题解决糯米藕片经验分享 qt linux 开发语言
注意Qt5.6.1要编译1.0.6版本源码chmod777赋权复制两个地方so重启QtCreatorsudocplibfcitxplatforminputcontextplugin.so/home/shen/Qt5.6.1/Tools/QtCreator/lib/Qt/plugins/platforminputcontextssudocplibfcitxplatforminputcontextpl
前端开发中的常见问题与疑惑：解析与应对策略 lina_mua javascript vue.js html 前端 es6
1.引言1.1前端开发的复杂性前端开发涉及HTML、CSS、JavaScript等多种技术，同时还需要考虑性能优化、跨浏览器兼容性、用户体验等问题。随着前端技术的快速发展，开发者面临的挑战也越来越多。1.2本文的目标本文旨在总结前端开发中常见的问题与疑惑，并提供相应的解决方案和应对策略，帮助开发者更好地应对挑战。2.HTML/CSS常见问题2.1布局问题：如何实现复杂的页面布局？问题描述：实现复杂
使用 acme.sh 申请和管理免费SSL 证书：告别 certbot 的繁琐 lihuang319 linux ssl
使用acme.sh申请和管理SSL证书：告别certbot的繁琐引言介绍SSL证书的重要性传统certbot的痛点（如live目录、复杂的配置）acme.sh的优势（轻量、灵活、自动化）一、acme.sh简介什么是acme.shacme.sh的主要特点支持多种DNS服务商自动化续期直接指定证书路径无需额外依赖二、安装acme.sh基本安装curlhttps://get.acme.sh|sh-sem
Transformer 代码剖析2 - 模型训练（pytorch实现） lczdyx Transformer代码剖析 transformer pytorch 深度学习人工智能 python
一、模型初始化模块参考：项目代码1.1参数统计函数defcount_parameters(model):returnsum(p.numel()forpinmodel.parameters()ifp.requires_grad)遍历模型参数筛选可训练参数统计参数数量返回总数技术解析：numel()方法计算张量元素总数requires_grad筛选需要梯度更新的参数统计结果反映模型复杂度，典型Tran
【C++设计模式】工厂方法设计模式：深入解析从基础到进阶老猿讲编程 C++编程 c++设计模式开发语言
1.引言在软件开发的世界里，设计模式如同巧妙的建筑蓝图，为解决常见问题提供了行之有效的方案。工厂方法模式作为一种广受欢迎的创建型设计模式，以其独特的优势在众多项目中得到广泛应用。它不仅能够为对象的创建提供通用且灵活的方式，还能有效隐藏实现细节，提升代码的可维护性和可扩展性。本文将全方位深入探讨工厂方法模式，从基础定义、实现过程，到进阶优化和功能扩展，带领读者全面掌握这一重要的设计模式。2.工厂方法
【Python专栏】Python的发展历程雾岛心情 Python入门到精通 python 开发语言
Python的创始人为吉多·范罗苏姆（GuidovanRossum），人称龟叔1989年，为了打发圣诞节假期，Guido开始写Python语言的编译器。Python这个名字，来自Guido所挚爱的电视剧MontyPython’sFlyingCircus。他希望这个新的叫做Python的语言，能符合他的理想：创造一种C和shell之间，功能全面，易学易用，可拓展的语言。Python的具体发展历史和版
[NOIP2007 提高组] 矩阵取数游戏题解 ◥༺ʚ 无聊鸭本鸭 ɞ༻◤ 洛谷刷题(C/C++)矩阵算法深度优先线性代数图论开发语言
题目描述帅帅经常跟同学玩一个矩阵取数游戏：对于一个给定的n×mn×m的矩阵，矩阵中的每个元素ai,jai,j均为非负整数。游戏规则如下：每次取数时须从每行各取走一个元素，共nn个。经过mm次后取完矩阵内所有元素；每次取走的各个元素只能是该元素所在行的行首或行尾；每次取数都有一个得分值，为每行取数的得分之和，每行取数的得分=被取走的元素值×2i×2i，其中ii表示第ii次取数（从11开始编号）；游戏
阿里巴巴DIN模型原理与Python实现 eso1983 python 开发语言算法推荐算法
阿里巴巴的DeepInterestNetwork(DIN)是一种用于点击率预测（CTR）的深度学习模型，特别针对电商场景中用户兴趣多样化和动态变化的特性设计。其核心思想是通过注意力机制动态捕捉用户历史行为中与当前候选商品相关的兴趣。1.DIN模型原理1.核心问题传统推荐模型（如Embedding+MLP）将用户历史行为视为固定长度的向量，忽略了用户兴趣的多样性。例如，用户历史行为中可能包含多个互不
游戏开放经济系统的部分思考 ArimaMisaki 大数据人工智能
游戏内的经济系统设计确实与现实中的宏观经济调控有相似逻辑，而现实中的对抗“非法经济组织”（如黑市、洗钱集团、垄断企业）的策略，经过适当改造后可以迁移到游戏内对抗工作室。下文是具体对比与可借鉴方案:一、现实中的“工作室”类比与应对手段1.打击非法金融活动（类比游戏内黑市交易）现实手段：央行监控大额资金流动（如反洗钱系统）。对异常账户冻结调查（如频繁跨行转账、多账户资金归集）。游戏借鉴：交易链路追踪：
Llama.cpp 服务器安装指南（使用 Docker，GPU 专用）田猿笔记 AI 高级应用 llama 服务器 docker llama.cpp
前置条件在开始之前，请确保你的系统满足以下要求：操作系统：Ubuntu20.04/22.04（或支持Docker的Linux系统）。硬件：NVIDIAGPU（例如RTX4090）。内存：16GB+系统内存，GPU需12GB+显存（RTX4090有24GB）。存储：15GB+可用空间（用于源码、镜像和模型文件）。网络：需要互联网连接以下载源码和依赖。软件：已安装并运行Docker。已安装NVIDIA
文心一言产品拆解调研报告 Charlues.k AI产品经理文心一言 ai
目录一、产品概述二、目标用户与市场定位三、核心功能分析1.功能列表2.功能使用流程3.交互体验四、用户体验评估1.用户视角1.1学习曲线1.2操作流畅度1.3用户心理预期满足程度2.情感设计2.1细节设计与用户情感体验2.2界面与交互符合用户预期3.使用场景3.1高频场景下的操作体验3.2低频或紧急场景下的操作便利性总结五、数据和技术分析1.技术架构1.1技术架构概述1.2核心功能支持与稳定性1.
从零开始：使用ArcBlock构建你自己的DID YekForth 区块链
随着区块链技术的发展，去中心化身份（DecentralizedIdentifiers，DID）成为了数字身份管理的重要组成部分。DID提供了一种去中心化的方式来验证和管理数字身份，使得用户可以更好地掌握自己的身份信息。在本文中，我们将介绍如何使用ArcBlock构建和管理自己的DID，并提供相关的源代码示例。DID是一个唯一标识符，它与特定的实体（如个人、组织或物品）相关联。ArcBlock是一个
Spring Boot@Component注解下的类无法@Autowired的问题 Micrle_007 springboot Spring
这个问题心累(确实)在把我的一个非Web程序迁移从Spring迁移到SpringBoot时，出现了在@Component注解下@Autowired的类为null的情况，也就是没注入成功，或者说是此类在bean加载之前就被调用了。试了各种办法，修改扫描包，修改@Component注解等等，皆未成功，后来看到了一个方法，探究了一下。@ComponentpublicclassComponentClass
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &