YoreYuan

Beeline 的进阶使用

1 Beeline 简介
2 Beeline 使用样例
3 Beeline 命令参数说明
- 3.1 Beeline 命令项
- 3.2 Beeline 命令
- 3.3 Beeline Hive 命令
4 Beeline 输出格式
- 4.1 table
- 4.2 vertical
- 4.3 xmlattr
- 4.4 xmlelements
- 4.5 csv2、tsv2、dsv
- 4.6 csv2、tsv2 和 dsv 格式中的引号
- 4.7 csv、tsv
5 Beeline 链接 Hive
- 5.1 测试数据
- 5.2 方式一：交互式
- 5.3 方式二：执行 sql 语句
- 5.4 方式三：sql 脚本
- 5.5 关于脚本的后台执行
6 Beeline 链接 Impala
- 6.1 分析系统环境的 beeline 脚本
- 6.2 导入 Impala 驱动包
- 6.3 mpala-shell 方式执行 sql
- 6.4 通过 beeline 执行 Impala sql 语句
- 6.5 通过 beeline 执行 Impala sql 脚本
7 Beeline 链接 Mysql
8 SQLLine
- 8.1 安装
- 8.2 进入 CLI
- 8.3 执行 SQL

1 Beeline 简介

操作 Hive 数据使用的客户端比较常用的应该是 Hive CLI ，但我们查看官网文档时 LanguageManual，可以看到在 Commands and CLIs 时又给我们提供了一个 Beeline CLI (new)，很显然这个是 Hive 新版本的 CLI ，当然也是推荐使用的 Hive CLI 连接方式。

Beeline 是一个基于 SQLLine CLI的 JDBC 客户端。HiveServer2 支持与 HiveServer2 一起使用的命令行 Shell Beeline。当然SQLLine 的语法（详细文档见）也适用于也 Beeline。使用 Beeline 替代 Hive CLI 的详细实现可以查看此。

Beeline Shell 在嵌入式模式（embedded mode）和远程模式（remote mode）下均可工作。在嵌入式模式下，它运行嵌入式Hive（类似于Hive CLI），而远程模式用于通过Thrift连接到单独的 HiveServer2 进程。从 Hive 0.14 开始，当 Beeline 与 HiveServer2 一起使用时它还会打印 HiveServer2 的日志消息，以查询执行到 STDERR（标准错误）的查询。 建议将远程 HiveServer2 模式用于生产环境，因为它更安全并且不需要为用户授予直接 HDFS/metastore 访问权限。注意：在远程模式下 HiveServer2 仅接受有效的 Thrift 调用，即使在HTTP模式下，消息正文也包含 Thrift 有效负载。

2 Beeline 使用样例

可以在配置好环境变量的系统下执行

$ bin/beeline 
Beeline version 2.1.1-cdh6.3.2 by Apache Hive

beeline> !connect jdbc:hive2://cdh3:10000/default
Connecting to jdbc:hive2://cdh3:10000/default
Enter username for jdbc:hive2://cdh3:10000/default: 
Enter password for jdbc:hive2://cdh3:10000/default:
Connected to: Apache Hive (version 2.1.1-cdh6.3.2)
Driver: Hive JDBC (version 2.1.1-cdh6.3.2)
Transaction isolation: TRANSACTION_REPEATABLE_READ

0: jdbc:hive2://cdh3:10000/default> show tables;
+-------------------+
|     tab_name      |
+-------------------+
| primitives        |
| src               |
| src1              |
| src_json          |
| src_sequencefile  |
| src_thrift        |
| srcbucket         |
| srcbucket2        |
| srcpart           |
+-------------------+
9 rows selected (1.079 seconds)

我们还可以直接在系统的 shell 下直接输入如下命令进入 Beeline

$ beeline -u jdbc:hive2://cdh3:10000/default -n scott -w password_file

# 如果需要通过 NoSASL 模式进行连接的 Beeline ，则必须明确指定身份验证模式：
$ beeline -u jdbc:hive2://:/;auth=noSasl -n scott -p pass

3 Beeline 命令参数说明

3.1 Beeline 命令项

Beeline CLI支持以下命令行选项：

命令	描述
`-u`	要连接的 JDBC URL，如果需要参数值中的特殊字符应使用 URL 编码进行编码。用法：`beeline -u db_URL`
`r`	重新连接到上次使用的URL（如果用户以前使用 `!connect` 到 URL，并且使用 `!save` 到 beeline.properties 文件）。用法：`beeline -r` 版本：: 2.1.0 (HIVE-13670)
`-n`	连接的用户名。用法：`beeline -n valid_user`
`-p`	连接的密码。用法：`beeline -p valid_password` 可选的 password 模式。从Hive 2.2.0（HIVE-13589）开始，`-p`选项的参数是可选的。用法：`beeline -p [valid_password]` 如果未提供密码，则`-p` Beeline 将在启动连接时提示您输入密码，当提供密码时，Beeline使用它来启动连接并且不提示。
`-d`	要使用的驱动程序类。用法：`beeline -d driver_class`
`-e`	应该执行的查询，双引号或单引号引起来的查询字符串，可以多次指定此选项。用法：`beeline -e "query_string"` 支持在单个 query_string 中运行多个用分号分隔的 SQL 语句：1.2.0（HIVE-9877）错误修复（空指针异常）：0.13.0（HIVE-5765）错误修复（不支持`--headerInterval`）：0.14.0（HIVE-7647）错误修复（在后台运行 `-e`）：1.3.0 和 2.0.0（HIVE-6758）;早期版本可用的解决方法
`-f`	应执行的脚本文件。用法：`beeline -f filepath` 版本：0.12.0 (HIVE-4268) 注意：如果脚本包含 tab 符，则查询编译在版本0.12.0中会失败，此错误已在版本0.13.0（HIVE-6359）中修复。错误修复（在后台运行`-f`）：1.3.0和2.0.0（HIVE-6758）；早期版本可用的解决方法
`-i (or) --init`	用于初始化的 init 文件用法：`beeline -i /tmp/initfile` 单文件。版本: 0.14.0 (HIVE-6561) 多文件文件。版本: 2.1.0 (HIVE-11336
`-w (or) --password-file`	从保存密码的文件中读取密码版本：1.2.0 (HIVE-7175)
`-a (or) --authType`	身份验证类型作为 auth 属性传递给 jdbc 版本：0.13.0 (HIVE-5155)
`--property-file`	从中读取配置属性的文件用法：`beeline --property-file /tmp/a` 版本：2.2.0 (HIVE-13964)
`--hiveconf property=value`	给定配置属性的使用值。`hive.conf.restricted.list` 中列出的属性无法使用 `hiveconf` 重置（请参阅限制列表和白名单）。用法：`beeline --hiveconf prop1=value1` 版本：0.13.0 (HIVE-6173)
`--hivevar name=value`	配置单元变量名称和值，这是特定于 Hive 的设置，其中可以在会话级别设置变量，并在Hive命令或查询中引用。用法：`beeline --hivevar var1=value1`
`--color=[true/false]`	控制是否使用颜色进行显示。默认为false。用法：`beeline --color=true` （不支持分数值输出格式。请参阅 HIVE-9770）
`--showHeader=[true/false]`	在查询结果中显示列名（true）或者（false），默认为 true。用法：`beeline --showHeader=false`
`--headerInterval=ROWS`	当 outputformat 为表时，重新显示列标题的间隔（以行数为单位），默认值为100。用法：`beeline --headerInterval=50` （不支持分数值输出格式。请参阅 HIVE-9770）
`--fastConnect=[true/false]`	连接时跳过为 HiveQL 语句的制表符完成而建立所有表和列的列表（true）或建立list（false），默认为true。用法：`beeline --fastConnect=false`
`--autoCommit=[true/false]`	启用/禁用自动事务提交。默认为false。用法：`beeline --autoCommit=true`
`--verbose=[true/false]`	显示详细的错误消息和调试信息（true）或不显示（false），默认为false。用法：`beeline --verbose=true`
`--showWarnings=[true/false]`	显示发出任何 HiveQL 命令后在连接上报告的警告，默认为false。用法：`beeline --showWarnings=true`
`--showDbInPrompt=[true/false]`	在提示中显示当前数据库名称（例如`(库名)>`），默认为false。用法：`beeline --showDbInPrompt=true` 版本: 2.2.0 (HIVE-14123)
`--showNestedErrs=[true/false]`	显示嵌套错误，默认为false。用法：`beeline --showNestedErrs=true`
`--numberFormat=[pattern]`	使用 DecimalFormat 模式格式化数字。用法：`beeline --numberFormat="#,###,##0.00"`
`--force=[true/false]`	脚本出现错误是否继续运行，默认为false。用法：`beeline--force=true`
`--maxWidth=MAXWIDTH`	当 outputformat 是 table 时，在截取数据之前显示的最大宽度（以字符为单位），默认是查询终端当前宽度，然后回落到 80。用法：`beeline --maxWidth=150`
`--maxColumnWidth=MAXCOLWIDTH`	当 outputformat 为 table 时，最大列宽（以字符为单位）。在Hive 2.2.0+版本（请参阅 HIVE-14135）中，默认值为50；在较早版本中，默认值为15。用法：`beeline --maxColumnWidth=25`
`--silent=[true/false]`	是否减少显示的信息消息的数量。它还停止显示来自 HiveServer2（Hive 0.14和更高版本）和 HiveQL 命令（Hive 1.2.0和更高版本）的查询日志消息。默认为false。用法：`beeline --silent=true`
`--autosave=[true/false]`	自动保存首选项（true）或不自动保存（false），默认为false。用法：`beeline --autosave=true`
`--outputformat=[table/vertical/csv/tsv/dsv/csv2/tsv2]`	结果显示的格式化模式，默认为表格。有关建议的sv选项的说明，请参见下面的分隔值输出格式。用法：`beeline --outputformat=tsv` 版本：dsv/csv2/tsv2 added in 0.14.0 (HIVE-8615)
`--truncateTable=[true/false]`	如果为true，则超过控制台长度时会在控制台中截断表格列。版本：0.14.0 (HIVE-6928)
`--delimiterForDSV= DELIMITER`	定界符分隔值的分隔符输出格式。默认值为 ‘\|’ 字符。版本：0.14.0 (HIVE-7390)
`--isolation=LEVEL`	将事务隔离级别设置为 TRANSACTION_READ_COMMITTED 或者 TRANSACTION_SERIALIZABLE。请参阅Java Connection文档中的 “字段详细信息” 部分。用法：`beeline --isolation=TRANSACTION_SERIALIZABLE`
`--nullemptystring=[true/false]`	使用将 null 打印为空字符串（true）的历史行为，或使用将 null 打印为 NULL（false）的当前行为，默认为false。用法：`beeline --nullemptystring=false` 版本： 0.13.0 (HIVE-4485)
`--incremental=[true/false]`	从 Hive 2.3 起默认为true，之前默认为false。如果设置为false，则在显示结果之前先提取并缓冲整个结果集，从而获得最佳的显示列大小。设置为true时，结果行将在提取时立即显示，从而以较低的显示列填充为代价，降低了等待时间和内存使用量。如果在客户端遇到 OutOfMemory，则建议设置 `--incremental=true`（由于获取的结果集的大小太大）。
`--incrementalBufferRows=NUMROWS`	在 stdout 上打印行时要缓冲的行数，默认为1000；默认值为1000，仅在 `--incremental=true` 和 `--outputformat=table` 时适用用法：`beeline --incrementalBufferRows=1000` 版本： 2.3.0 (HIVE-14170)
`--maxHistoryRows=NUMROWS`	Beeline 存储历史记录的最大行数。版本：2.3.0 (HIVE-15166)
`--delimiter=;`	设置用 Beeline 编写的查询的分割符，允许使用多字符定界符，但不允许使用引号、斜杠，并且 `--`是默认的。用法：`beeline --delimiter=$$` 版本：3.0.0 (HIVE-10865)
`--convertBinaryArrayToString=[true/false]`	将二进制列数据显示为字符串或字节数组。用法：`beeline --convertBinaryArrayToString=true` 版本：3.0.0 (HIVE-14786)
`--help`	显示用法信息。用法：`beeline --help`

3.2 Beeline 命令

命令	描述
`!`	SQLLine 命令列表可从 http://sqlline.sourceforge.net/ 获得。示例：`!quit` 退出 Beeline 客户端。
`!delimiter`	设置用 Beeline 编写的查询的分隔符。允许使用多字符分隔符，但不允许使用引号、斜杠，并且`--`符为默认的；用法：`!delimiter $$` 版本：3.0.0 (HIVE-10865)

3.3 Beeline Hive 命令

默认以 ; 作为命令的终止符，脚本的注释可以使用 -- 前缀指定。

命令	描述
`reset`	将配置重置为默认值。
`reset`	将指定配置变量(key)的值重置为默认值。注意：如果是拼写错误的变量名，Beeline 将不会提示错误。
`set =`	设置特定配置变量(key)的值。注意：如果是拼写错误的变量名，Beeline 将不会提示错误。
`set`	打印由用户或 Hive 覆盖的变量列表
`set -v`	打印所有 Hadoop 和 Hive 配置变量
①`add FILE[S] ` ②`add JAR[S] ` ③`add ARCHIVE[S] *`	将一个或多个文件、jar 或存档（archives）添加到分布式缓存中的资源列表。有关更多信息请参见Hive资源。
①`add FILE[S] ` ②`add JAR[S] ` ③`add ARCHIVE[S] *`	从Hive 1.2.0开始，使用格式为 `ivy://group:module:version?query_string` 的ivy URL将一个或多个文件、jar或存档添加到分布式缓存中的资源列表中。有关更多信息请参见Hive资源。
①`list FILE[S]` `list JAR[S]` ②`list ARCHIVE[S]`	列出已经添加到分布式缓存的资源。有关更多信息请参见Hive资源。（自Hive 0.14.0起：HIVE-7592）。
①`list FILE[S] ` ②`list JAR[S] ` `③list ARCHIVE[S] *`	检查给定资源是否已经添加到分布式缓存中。有关更多信息请参见Hive资源。
①`delete FILE[S] ` ②`delete JAR[S] ` ③`delete ARCHIVE[S] *`	从分布式缓存中删除资源。
①`delete FILE[S] ` ②`delete JAR[S] ` ③`delete ARCHIVE[S] *`	从 Hive 1.2.0 开始，从分布式缓存中删除使用添加的资源。有关更多信息，有关更多信息请参见Hive资源。
`reload`	从Hive 0.14.0开始，使 HiveServer2 获知配置参数hive.reloadable.aux.jars.path 指定的路径中的任何jar变化（无需重新启动 HiveServer2）。所做的更改可以是添加、删除或更新jar文件。
`dfs`	执行dfs命令。
	执行 Hive 查询并将结果打印到标准输出。

4 Beeline 输出格式

在Beeline中，结果可以以不同的格式显示。可以使用 outputformat 选项设置格式模式。支持以下输出格式：

table
vertical
xmlattr
xmlelements
separated-value formats (csv, tsv, csv2, tsv2, dsv)

4.1 table

结果显示在表格中，结果的一行对应于表中的一行，一行中的值显示在表中的单独列中。这是默认的格式模式。例：

-- 查询结果
> select id, value, comment from test_table;
+-----+---------+-----------------+
| id  |  value  |     comment     |
+-----+---------+-----------------+
| 1   | Value1  | Test comment 1  |
| 2   | Value2  | Test comment 2  |
| 3   | Value3  | Test comment 3  |
+-----+---------+-----------------+

4.2 vertical

结果的每一行都以键值格式的块显示，其中键是列的名称。例：

-- 查询结果
> select id, value, comment from test_table;
id       1
value    Value1
comment  Test comment 1

id       2
value    Value2
comment  Test comment 2

id       3
value    Value3
comment  Test comment 3

4.3 xmlattr

结果以 XML 格式显示，其中每一行都是XML中的“结果”元素。在“结果”元素上，将行的值显示为属性，属性的名称是列的名称。例：

-- 查询结果
> select id, value, comment from test_table;
<resultset>
  <result id="1" value="Value1" comment="Test comment 1"/>
  <result id="2" value="Value2" comment="Test comment 2"/>
  <result id="3" value="Value3" comment="Test comment 3"/>
</resultset>

4.4 xmlelements

结果以 XML 格式显示，其中每一行都是XML中的“结果”元素。行的值显示为结果元素的子元素。例：

-- 查询结果
> select id, value, comment from test_table;
<resultset>
  <result>
    <id>1</id>
    <value>Value1</value>
    <comment>Test comment 1</comment>
  </result>
  <result>
    <id>2</id>
    <value>Value2</value>
    <comment>Test comment 2</comment>
  </result>
  <result>
    <id>3</id>
    <value>Value3</value>
    <comment>Test comment 3</comment>
  </result>
</resultset>

4.5 csv2、tsv2、dsv

从 Hive 0.14 开始，提供了改进的 SV 输出格式，即dsv、csv2 和 tsv2。这三种格式的区别仅在于单元格之间的分隔符，对于 csv2 是逗号，对于 tsv2 是制表符，而对于 dsv 是可配置的。

对于 dsv 格式，可以使用 delimiterForDSV 选项设置分隔符。默认分隔符为 ‘|’。请注意，仅支持单个字符定界符。例：

-- 查询结果
> select id, value, comment from test_table;

-- csv2
id,value,comment
1,Value1,Test comment 1
2,Value2,Test comment 2
3,Value3,Test comment 3

-- tsv2
id	value	comment
1	Value1	Test comment 1
2	Value2	Test comment 2
3	Value3	Test comment 3

-- dsv (分隔符是 |)
id|value|comment
1|Value1|Test comment 1
2|Value2|Test comment 2
3|Value3|Test comment 3

4.6 csv2、tsv2 和 dsv 格式中的引号

如果未禁用引号，则如果值包含特殊字符（例如分隔符或双引号字符）或跨多行，则在值周围添加双引号。嵌入的双引号与前面的双引号一起转义。

可以通过将 disable.quoting.for.sv 系统变量设置为true来禁用引号。如果禁用了引号，则不会在值周围添加双引号（即使它们包含特殊字符），并且不会对嵌入的双引号进行转义。默认情况下，引用被禁用。例：

-- 查询结果
> select id, value, comment from test_table;

-- csv2 中 引号可用时
id,value,comment
1,"Value,1",Value contains comma
2,"Value""2",Value contains double quote
3,Value'3,Value contains single quote

-- csv2中 引号禁用时
id,value,comment
1,Value,1,Value contains comma
2,Value"2,Value contains double quote
3,Value'3,Value contains single quote

4.7 csv、tsv

这两种格式的区别仅在于值之间的分隔符，对于csv是逗号，对于tsv是制表符。
即使使用disable.quoting.for.sv系统变量禁用了引号，这些值也始终用单引号字符引起来。
这些输出格式不会转义嵌入的单引号。
请注意，不建议使用这些输出格式，仅保留它们是为了向后兼容。

例：

-- 查询结果
> select id, value, comment from test_table;

-- csv
'id','value','comment'
'1','Value1','Test comment 1'
'2','Value2','Test comment 2'
'3','Value3','Test comment 3'

--tsv
'id'	'value'	'comment'
'1'	'Value1'	'Test comment 1'
'2'	'Value2'	'Test comment 2'
'3'	'Value3'	'Test comment 3'

5 Beeline 链接 Hive

使用这种方式可以远程连接 Hive，只要环境中已经有可用的 beeline，主要远程访问 hive.server2.thrift.port 配置项的值，默认为 10000。

当然除了使用 Beeline 连接 Hive，还可以通过其它方式连接 Hive。连接 Hive 的方式主要有如下几种，下面我们主要以 Beeline 为例进行介绍。

hive CLI
beeline
JDBC

5.1 测试数据

假设有如下表和数据

-- 1 查看表
0: jdbc:hive2://cdh3:10000 (default)> desc tmp_test;
OK
id                      int                 
name                    string 

-- 2 插入 3 条数据
0: jdbc:hive2://cdh3:10000 (default)> insert into tmp_test values(1, "a"),(2, "b"), (3, "c");

5.2 方式一：交互式

如下通过 Beeline 链接 Hive ：

# 参数说明
#  -n	username，连接 Hive 的用户名（如果未开启权限认证可以不写）
#  -p   password, 连接 Hive 的用户的密码（如果未开启权限认证可以不写）
#  -d   driver class, 连接 Hive 的 驱动类（无特殊情况下，可以选填）
#  -u   database url, 必填，连接 Hive 的 URL
#  --color=true   彩色显示
#  --showDbInPrompt=true 在命令前面显示数据库的名称
#  --isolation 设置事物的隔离级别，
#  --incremental=false  使输出的结果更加美观，但输出结果的速度会慢，2.3 之后默认为 true
beeline -n hive -p hive -d "org.apache.hive.jdbc.HiveDriver" -u "jdbc:hive2://cdh3:10000/hive_test" \
--color=true  --showDbInPrompt=true --isolation=TRANSACTION_SERIALIZABLE --incremental=false

执行一个查询

0: jdbc:hive2://cdh3:10000 (hive_test)> SELECT * FROM tmp_test;
+--------------+----------------+
| tmp_test.id  | tmp_test.name  |
+--------------+----------------+
| 1            | a              |
| 2            | b              |
| 3            | c              |
+--------------+----------------+
3 rows selected (0.474 seconds)

5.3 方式二：执行 sql 语句

# 参数说明如下
#  --hiveconf  格式为 property=value ， 设置 Hive 属性值
#  --hivevar  格式为 name=value，配置会话级别的变量名和值，例如 --hivevar hive.security.authorization.enabled=false
#  -e   query, 执行的 查询语句
#  --help  查看帮助
beeline -n hive -p hive -d "org.apache.hive.jdbc.HiveDriver" -u "jdbc:hive2://cdh3:10000/default" \
--hiveconf mapreduce.job.queuename=datacenter --color=true \
-e "select count(*) from hive_test.tmp_test"

# 结果如下
+------+
| _c0  |
+------+
| 3    |
+------+
1 row selected (34.441 seconds)

5.4 方式三：sql 脚本

在 sql 脚本的目录下有 my-hive.sql 文件，文件中有如下 SQL

SELECT m.id,m.movie_name,m.rating_num,m.rating_people,q.rank,q.quote FROM movie m LEFT JOIN quote q ON q.id=m.id ORDER BY m.rating_num DESC,m.rating_people DESC LIMIT 10;
use hive_test;
select count(*) from tmp_test;

使用 beeline 执行上面的 SQL 脚本

# 参数说明：
#  -f   执行的脚本文件
beeline -n hive -p hive -d "org.apache.hive.jdbc.HiveDriver" -u "jdbc:hive2://cdh3:10000/default"  --color=true \
--hiveconf mapreduce.job.queuename=datacenter \
-f ./my-hive.sql

运行上面命令可以看到输出的结果如下：

0: jdbc:hive2://cdh3:10000/default> SELECT m.id,m.movie_name,m.rating_num,m.rating_people,q.rank,q.quote FROM movie m LEFT JOIN quote q ON q.id=m.id ORDER BY m.rating_num DESC,m.rating_people DESC LIMIT 10;
+----------+------------------------------------------+---------------+------------------+---------+------------------+
|   m.id   |               m.movie_name               | m.rating_num  | m.rating_people  | q.rank  |     q.quote      |
+----------+------------------------------------------+---------------+------------------+---------+------------------+
| 1292052  | 肖申克的救赎 The Shawshank Redemption (1994)   | 9.7           | 1502851          | 1       | 希望让人自由。          |
| 1291546  | 霸王别姬 (1993)                              | 9.6           | 1112641          | 2       | 风华绝代。            |
| 1296141  | 控方证人 Witness for the Prosecution (1957)  | 9.6           | 195362           | 29      | 比利·怀德满分作品。       |
| 1292063  | 美丽人生 La vita è bella (1997)              | 9.5           | 690618           | 5       | 最美的谎言。           |
| 1295124  | 辛德勒的名单 Schindler's List (1993)           | 9.5           | 613865           | 8       | 拯救一个人，就是拯救整个世界。  |
| 1295644  | 这个杀手不太冷 Léon (1994)                      | 9.4           | 1363430          | 3       | 怪蜀黍和小萝莉不得不说的故事。  |
| 1292720  | 阿甘正传 Forrest Gump (1994)                 | 9.4           | 1178003          | 4       | 一部美国近现代史。        |
| 1292722  | 泰坦尼克号 Titanic (1997)                     | 9.4           | 1119405          | 7       | 失去的才是永恒的。        |
| 1293182  | 十二怒汉 12 Angry Men (1957)                 | 9.4           | 253408           | 36      | 1957年的理想主义。      |
| 1291561  | 千与千寻 千と千尋の神隠し (2001)                     | 9.3           | 1205228          | 6       | 最好的宫崎骏，最好的久石让。   |
+----------+------------------------------------------+---------------+------------------+---------+------------------+
10 rows selected (50.576 seconds)
0: jdbc:hive2://cdh3:10000/default> use hive_test;
No rows affected (0.069 seconds)
0: jdbc:hive2://cdh3:10000/default> select count(*) from tmp_test;
+------+
| _c0  |
+------+
| 3    |
+------+
1 row selected (34.686 seconds)

5.5 关于脚本的后台执行

我们通过前面可以看到，不管是 sql 语句的执行，还是 sql 脚本的执行，都是在前台执行，如果有多个 beeline 命令要执行，则需要前面先执行后面的等待执行，这样很不适合于脚本的自动化和批量处理。

此时我们可以通过，在 CentOS 环境下我们可以使用 nohup 命令从终端断开进行后台处理。如下所示执行了两个后台命令，这样会在后台启动一个进程执行脚本或 SQL ，并将执行的结果和日志重定向输出到指定文件中。

nohup beeline -n hive -p hive -d "org.apache.hive.jdbc.HiveDriver" -u "jdbc:hive2://cdh3:10000/default" \
--hiveconf mapreduce.job.queuename=datacenter --silent=true --showHeader=true --outputformat=csv2 \
-e "desc hive_test.tmp_test" \
</dev/null >> /tmp/output.log 2>> /tmp/error.log &

nohup beeline -n hive -p hive -d "org.apache.hive.jdbc.HiveDriver" -u "jdbc:hive2://cdh3:10000/default" \
--hiveconf mapreduce.job.queuename=datacenter --silent=true --showHeader=true --outputformat=dsv \
-f ./my-hive.sql \
</dev/null >> /tmp/output.log 2>> /tmp/error.log &

上面的第一个命令时查看 tmp_test 结构，以 csv2 格式输出到结果文件。第二个命令时执行 sql 脚本，输出格式为可配置的 dsv 格式（默认分隔符为 |），执行完毕后两个后台进程自动结束，查看结果文件如下：

col_name,data_type,comment
id,int,
name,string,
m.id|m.movie_name|m.rating_num|m.rating_people|q.rank|q.quote
1292052|肖申克的救赎 The Shawshank Redemption (1994)|9.7|1502851|1|希望让人自由。
1291546|霸王别姬 (1993)|9.6|1112641|2|风华绝代。
1296141|控方证人 Witness for the Prosecution (1957)|9.6|195362|29|比利·怀德满分作品。
1292063|美丽人生 La vita è bella (1997)|9.5|690618|5|最美的谎言。
1295124|辛德勒的名单 Schindler's List (1993)|9.5|613865|8|拯救一个人，就是拯救整个世界。
1295644|这个杀手不太冷 Léon (1994)|9.4|1363430|3|怪蜀黍和小萝莉不得不说的故事。
1292720|阿甘正传 Forrest Gump (1994)|9.4|1178003|4|一部美国近现代史。
1292722|泰坦尼克号 Titanic (1997)|9.4|1119405|7|失去的才是永恒的。
1293182|十二怒汉 12 Angry Men (1957)|9.4|253408|36|1957年的理想主义。
1291561|千与千寻 千と千尋の神隠し (2001)|9.3|1205228|6|最好的宫崎骏，最好的久石让。
_c0
3

6 Beeline 链接 Impala

6.1 分析系统环境的 beeline 脚本

这里以 CDH 环境为例，我们在 Beeline 环境下输入如下命令查看 beeline 信息，

# 1 查看系统环境下的 beeline 的路径
bogon:~ yoreyuan$ which beeline
/usr/bin/beeline

# 2 查看文件信息，发现这个是一个软连接，指向了 /etc/alternatives 下
bogon:~ yoreyuan$ ll -h /usr/bin/beeline
lrwxrwxrwx 1 root root 25 Dec 19 02:01 /usr/bin/beeline -> /etc/alternatives/beeline

# 3 我们再次查看 /etc/alternatives/beeline 文件，我们发现它依然是一个软连接
bogon:~ yoreyuan$ ll  /etc/alternatives/beeline
lrwxrwxrwx 1 root root 65 Dec 19 02:01 /etc/alternatives/beeline -> /opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/bin/beeline

# 4 再次跟踪查看上面的文件。OK，这次是一个文件了
bogon:~ yoreyuan$ ll /opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/bin/beeline
-rwxr-xr-x 1 root root 771 Nov  9 00:09 /opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/bin/beeline

# 5 查看 beeline 脚本文件
bogon:~ yoreyuan$  vim  /opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/bin/beeline

beeline 脚本文件如下。从脚本中我们可以看到最后执行的是exec $LIB_DIR/hive/bin/beeline "$@"，这个值其实就是执行的 /opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/bin/../lib/hive/bin/beeline 的 beeline 脚本，也就是 CDH 的 Hive 中带的 beeline 客户端。

#!/bin/bash
  # Reference: http://stackoverflow.com/questions/59895/can-a-bash-script-tell-what-directory-its-stored-in
  SOURCE="${BASH_SOURCE[0]}"
  BIN_DIR="$( dirname "$SOURCE" )"
  while [ -h "$SOURCE" ]
  do
    SOURCE="$(readlink "$SOURCE")"
    [[ $SOURCE != /* ]] && SOURCE="$BIN_DIR/$SOURCE"
    BIN_DIR="$( cd -P "$( dirname "$SOURCE"  )" && pwd )"
  done
  BIN_DIR="$( cd -P "$( dirname "$SOURCE" )" && pwd )"
  LIB_DIR=$BIN_DIR/../lib
# Autodetect JAVA_HOME if not defined
. $LIB_DIR/bigtop-utils/bigtop-detect-javahome
BIGTOP_DEFAULTS_DIR=${BIGTOP_DEFAULTS_DIR-$BIN_DIR/../etc/default}
[ -n "${BIGTOP_DEFAULTS_DIR}" -a -r ${BIGTOP_DEFAULTS_DIR}/hbase ] && . ${BIGTOP_DEFAULTS_DIR}/hbase
export HIVE_HOME=$LIB_DIR/hive
exec $LIB_DIR/hive/bin/beeline "$@"

因此我们再来查看 hive 下的 beeline 脚本：vim /opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/bin/../lib/hive/bin/beeline，脚本内容如下：

#!/usr/bin/env bash

# Licensed to the Apache Software Foundation (ASF) under one or more
# contributor license agreements.  See the NOTICE file distributed with
# this work for additional information regarding copyright ownership.
# The ASF licenses this file to You under the Apache License, Version 2.0
# (the "License"); you may not use this file except in compliance with
# the License.  You may obtain a copy of the License at
#
#     http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

bin=`dirname "$0"`
bin=`cd "$bin"; pwd`

# Set Hadoop User classpath to true so that httpclient jars are taken from
# hive lib instead of hadoop lib.
export HADOOP_USER_CLASSPATH_FIRST=true

# If process is backgrounded, don't change terminal settings
if [[ ( ! $(ps -o stat= -p $$) =~ "+" ) && ! ( -p /dev/stdin ) && ( ! $(ps -o tty= -p $$) =~ "?" ) ]]; then
  export HADOOP_CLIENT_OPTS="$HADOOP_CLIENT_OPTS -Djline.terminal=jline.UnsupportedTerminal"
fi

. "$bin"/hive --service beeline "$@"

从上面的脚本内容我们可以看到最终执行的命令为 "$bin"/hive --service beeline "$@"，其中 $bin 的值为 /opt/cloudera/parcels/CDH/lib/hive/bin，也就是执行的是 hive 客户端脚本，只不过传入的参数为 --service beeline ，我们可以通过 hive --help 查看帮助信息：--service : 启动指定的服务或组件，cli 是默认的 ，这个可以通过查看 hive 脚本第 69 行到 75 行验证（可见hive脚本）：

if [ "$SERVICE" = "" ] ; then
  if [ "$HELP" = "_help" ] ; then
    SERVICE="help"
  else
    SERVICE="cli"
  fi
fi

我们进一步查看 hive 脚本大约在 146 行（可见hive脚本），可以看到 hive 脚本会将 ${HIVE_HOME}/auxlib/*.jar 下的 jar 包添加进来。

# adding jars from auxlib directory
for f in ${HIVE_HOME}/auxlib/*.jar; do
  if [[ ! -f $f ]]; then
      continue;
  fi
  if $cygwin; then
      f=`cygpath -w "$f"`
  fi
  AUX_CLASSPATH=${AUX_CLASSPATH}:$f
  if [ "${AUX_PARAM}" == "" ]; then
    AUX_PARAM=file://$f
  else
    AUX_PARAM=${AUX_PARAM},file://$f;
  fi
done

6.2 导入 Impala 驱动包

从上面可以看到脚本会加载 /opt/cloudera/parcels/CDH/lib/hive/auxlib/ 下的 jar 包，但是直接使用 beeline 连接 Impala 会报驱动找不到的错误。因此我们需要将 Impala 驱动包导入环境。

Connecting to jdbc:impala://cdh3:21050/impala_demo
com.cloudera.impala.jdbc41.Driver
com.cloudera.impala.jdbc41.Driver
No current connection

我们直接从官网下载 Impala 驱动包导入上面的路径下即可（不用重启 Impala 也不用重启 Hive）。

# 1 下载驱动包
wget https://downloads.cloudera.com/connectors/impala_jdbc_2.5.41.1061.zip

# 2 解压到某一个临时的文件夹下
mkdir impala_drive
unzip impala_jdbc_2.5.41.1061.zip -d ./impala_drive/
# 查看  ./impala_drive/2.5.41.1061\ GA/ 可以看到有两个版本的 JDBC 驱动压缩包
unzip ./impala_drive/2.5.41.1061\ GA/Cloudera_ImpalaJDBC41_2.5.41.zip -d ./impala_drive/

# 3 拷贝第二步解压的两个 jar 包到指定目录（CDH 环境下）
cp ./impala_drive/ImpalaJDBC41.jar  /opt/cloudera/parcels/CDH/lib/hive/auxlib/
cp ./impala_drive/TCLIServiceClient.jar  /opt/cloudera/parcels/CDH/lib/hive/auxlib/

# 4 如果下载的驱动包不再使用，可以删除
rm -rf impala_drive/

6.3 mpala-shell 方式执行 sql

# 1 执行 sql 语句 
# 参数说明如下：
#   -u      认证的用户，默认为 root
#   -i      指定 Impala 的 IMPALAD 服务地址，默认为 localhost:21000，
#   -f      执行的查询 脚本文件
impala-shell -u impala -i cdh3:21000 \
-q "use impala_demo; SELECT id,movie_name,rating_num,rating_people,release_date FROM movie ORDER BY release_date DESC LIMIT 5;" 

# 2 sql 脚本
# 2.1 my-impala.sql 中有如下 sql
use impala_demo; 
SELECT id,movie_name,rating_num,rating_people,release_date FROM movie ORDER BY release_date DESC LIMIT 5;

# 2.2 执行
impala-shell -u impala -i cdh3:21000 \
-f ./my-impala.sql

6.4 通过 beeline 执行 Impala sql 语句

#  执行 sql 语句 
#  如果有错误提示 Error: [Simba][JDBC](11975) Unsupported transaction isolation level: 4. (state=HY000,code=11975)
#  可以加上参数：--isolation=default 
beeline -n impala -d "com.cloudera.impala.jdbc41.Driver" -u "jdbc:impala://cdh3:21050/impala_demo" \
--isolation=default \
-e "SELECT id,movie_name,rating_num,rating_people,release_date FROM movie ORDER BY release_date DESC LIMIT 5;"

6.5 通过 beeline 执行 Impala sql 脚本

# sql 脚本
beeline -n impala -d "com.cloudera.impala.jdbc41.Driver" -u "jdbc:impala://cdh3:21050/impala_demo" \
--isolation=default \
-f ./my-impala.sql

7 Beeline 链接 Mysql

通过前面的介绍我们可以知道 Impala 是一个基于 SQLLine CLI的 JDBC 客户端，那么当然也可以连接传统的关系型数据（可以查看啊 SQLine CLI introduction），例如 Oracle、MySQL 等。这里我们连接 MySQL 为例。

执行如下命令远程连接 MySQL。如果执行时报 MySQL驱动找不到，可以按照上面6.2 导入 Impala 驱动包中的方式下载 MySQL 驱动包导入环境中。因为我的这个节点是一个 cdh 的节点，在安装 CDH 时已经将 MySQL 驱动导入环境中了，所以这里可以直接使用 Beeline 连接 MySQL。

beeline -n scm -p 123456 -d "com.mysql.jdbc.Driver" \
-u "jdbc:mysql://cdh1:3306/flink_test?useUnicode=true&characterEncoding=utf8&useSSL=false" \
--color=true --isolation=TRANSACTION_SERIALIZABLE --incremental=false

Connecting to jdbc:mysql://cdh1:3306/flink_test?useUnicode=true&characterEncoding=utf8&useSSL=false
Connected to: MySQL (version 5.6.44-log)
Driver: MySQL Connector Java (version mysql-connector-java-5.1.42 ( Revision: 1f61b0b0270d9844b006572ba4e77f19c0f230d4 ))
Transaction isolation: TRANSACTION_SERIALIZABLE
Beeline version 2.1.1-cdh6.3.2 by Apache Hive
0: jdbc:mysql://cdh1:3306/flink_test> SHOW TABLES;
+-------------------------+
|  Tables_in_flink_test   |
+-------------------------+
| flower                  |
| …… 省略                  |
+-------------------------+
23 rows selected (0.108 seconds)

-- 执行 sql 
0: jdbc:mysql://cdh1:3306/flink_test> SELECT * FROM flower LIMIT 3;
+-----+-------+-------+---------------------+------------+
| id  | date  | name  |       en_name       | utterance  |
+-----+-------+-------+---------------------+------------+
| 1   | 1月1日  | 雪莲花   | Snow Drop           | 纯白的爱       |
| 2   | 1月2日  | 黄水仙   | Narcisus Jonquilla  | 神秘         |
| 3   | 1月3日  | 藏红花   | Spring Crocus       | 执著         |
+-----+-------+-------+---------------------+------------+
3 rows selected (0.25 seconds)

8 SQLLine

正如 Beeline 介绍部分，Beeline 使用的是 SQLLine，那我们这部分使用 SQLLine 来查询数据，这里主要以 MySQL、Hive、Impala 为例，其他的可以参考官方文档 SQLLine 1.0.2。

8.1 安装

# 1 创建安装目录
mkdir /opt/sqlline
cd /opt/sqlline
mkdir lib

# 2 下载 SQLLine
wget https://jaist.dl.sourceforge.net/project/sqlline/sqlline/1.0.2/sqlline-1_0_2.jar

# 3 下载 SQLLine 依赖的 jline
#  注意：jline版本不能高于 1.1.0，否则会报如下异常
#  Caused by: java.lang.ClassNotFoundException: jline.Completor
wget https://repo1.maven.org/maven2/jline/jline/1.0/jline-1.0.jar -P lib/

# 4 下载 MySQL 驱动
wget https://repo1.maven.org/maven2/mysql/mysql-connector-java/5.1.42/mysql-connector-java-5.1.42.jar -P lib/

# 5 下载 Impala 驱动
wget https://downloads.cloudera.com/connectors/impala_jdbc_2.5.41.1061.zip -P lib/
unzip lib/impala_jdbc_2.5.41.1061.zip -d lib/
unzip lib/2.5.41.1061\ GA/Cloudera_ImpalaJDBC41_2.5.41.zip -d lib/
rm -rf lib/2.5.41.1061\ GA
rm -rf lib/*.pdf

# 6 下载 Hive 驱动及其依赖
wget https://repo1.maven.org/maven2/org/apache/hive/hive-jdbc/1.1.1/hive-jdbc-1.1.1.jar
wget https://repo1.maven.org/maven2/org/apache/hive/hive-cli/1.1.0/hive-cli-1.1.0.jar
wget https://repo1.maven.org/maven2/org/apache/hive/hive-service/1.1.0/hive-service-1.1.0.jar
wget https://repo1.maven.org/maven2/org/apache/hadoop/hadoop-common/2.7.7/hadoop-common-2.7.7.jar
wget https://repo1.maven.org/maven2/org/apache/hive/hive-common/1.0.0/hive-common-1.0.0.jar
wget https://repo1.maven.org/maven2/com/google/guava/guava/11.0.2/guava-11.0.2.jar

8.2 进入 CLI

# 1 查看帮助
java -Djava.ext.dirs=$JAVA_HOME/jre/lib/ext:/opt/sqlline/lib -jar /opt/sqlline/sqlline-1_0_2.jar --help
Usage: java sqlline.SqlLine
   -u <database url>               the JDBC URL to connect to
   -n <username>                   the username to connect as
   -p <password>                   the password to connect as
   -d <driver class>               the driver class to use
   --color=[true/false]            control whether color is used for display
   --showHeader=[true/false]       show column names in query results
   --headerInterval=ROWS;          the interval between which heades are displayed
   --fastConnect=[true/false]      skip building table/column list for tab-completion
   --autoCommit=[true/false]       enable/disable automatic transaction commit
   --verbose=[true/false]          show verbose error messages and debug info
   --showWarnings=[true/false]     display connection warnings
   --force=[true/false]            continue running script even after errors
   --maxWidth=MAXWIDTH             the maximum width of the terminal
   --maxColumnWidth=MAXCOLWIDTH    the maximum width to use when displaying columns
   --silent=[true/false]           be more silent
   --autosave=[true/false]         automatically save preferences
   --outputformat=[table/vertical/csv/tsv]   format mode for result display
   --isolation=LEVEL               set the transaction isolation level
   --help                          display this message


# 2 连接 Hive
java -Djava.ext.dirs=$JAVA_HOME/jre/lib/ext:/opt/sqlline/lib -jar /opt/sqlline/sqlline-1_0_2.jar \
--color=true --autoCommit=false -d "org.apache.hive.jdbc.HiveDriver" \
-u "jdbc:hive2://cdh3:10000/default" -n hue -p hue123456

# 3 连接 MySQL
java -Djava.ext.dirs=$JAVA_HOME/jre/lib/ext:/opt/sqlline/lib -jar /opt/sqlline/sqlline-1_0_2.jar \
--color=true -d "com.mysql.jdbc.Driver" -u "jdbc:mysql://localhost:3306/flink_test" -n scm -p 3UsaTx#bHR

# 4 连接 Impala
java -Djava.ext.dirs=$JAVA_HOME/jre/lib/ext:/opt/sqlline/lib/ -jar /opt/sqlline/sqlline-1_0_2.jar \
--color=true --isolation=TRANSACTION_READ_UNCOMMITTED -d "com.cloudera.impala.jdbc41.Driver" \
-u "jdbc:impala://cdh3:21050/reportmart;UID=impala;AuthMech=3;SSL=0;PWD=cdhImpala_123" -n impala -p cdhImpala_123

8.3 执行 SQL

-- 1 进入 sqlline cli
-- java -Djava.ext.dirs=$JAVA_HOME/jre/lib/ext:/opt/sqlline/lib -jar /opt/sqlline/sqlline-1_0_2.jar 

-- 2 查看帮助
sqlline> !help
!all                Execute the specified SQL against all the current connections
!autocommit         Set autocommit mode on or off
!batch              Start or execute a batch of statements
!brief              Set verbose mode off
!call               Execute a callable statement
!close              Close the current connection to the database
!closeall           Close all current open connections
!columns            List all the columns for the specified table
!commit             Commit the current transaction (if autocommit is off)
!connect            Open a new connection to the database.
!dbinfo             Give metadata information about the database
!describe           Describe a table
!dropall            Drop all tables in the current database
!exportedkeys       List all the exported keys for the specified table
!go                 Select the current connection
!help               Print a summary of command usage
!history            Display the command history
!importedkeys       List all the imported keys for the specified table
!indexes            List all the indexes for the specified table
!isolation          Set the transaction isolation for this connection
!list               List the current connections
!manual             Display the SQLLine manual
!metadata           Obtain metadata information
!nativesql          Show the native SQL for the specified statement
!outputformat       Set the output format for displaying results
                    (table,vertical,csv,tsv,xmlattrs,xmlelements)
!primarykeys        List all the primary keys for the specified table
!procedures         List all the procedures
!properties         Connect to the database specified in the properties file(s)
!quit               Exits the program
!reconnect          Reconnect to the database
!record             Record all output to the specified file
!rehash             Fetch table and column names for command completion
!rollback           Roll back the current transaction (if autocommit is off)
!run                Run a script from the specified file
!save               Save the current variabes and aliases
!scan               Scan for installed JDBC drivers
!script             Start saving a script to a file
!set                Set a sqlline variable
!sql                Execute a SQL command
!tables             List all the tables in the database
!typeinfo           Display the type map for the current connection
!verbose            Set verbose mode on

-- 3 查看当前环境可使用 Driver
sqlline> !scan
scan complete in 457ms
8 driver classes found
Compliant Version Driver Class
no        2.5     com.cloudera.impala.jdbc41.Driver
no        5.1     com.mysql.fabric.jdbc.FabricMySQLDriver
no        5.1     com.mysql.jdbc.Driver
no        5.1     com.mysql.jdbc.NonRegisteringDriver
no        5.1     com.mysql.jdbc.NonRegisteringReplicationDriver
no        5.1     com.mysql.jdbc.ReplicationDriver
no        1.1     org.apache.hive.jdbc.HiveDriver
no        5.1     org.gjt.mm.mysql.Driver

-- 4 执行脚本
!connect jdbc:hive2://cdh3:10000/default impala cdhImpala_123 "org.apache.hive.jdbc.HiveDriver"
!run  /root/show_db.sql

你可能感兴趣的:(大数据,Hive,工具)

npm错误 gyp错误 vs版本不对 msvs_version不兼容澎湖Java架构师前端 html npm node.js 前端
npm错误gyp错误vs版本不对msvs_version不兼容windowsSDK报错执行更新GYP语句第一种方案第二种方案执行更新GYP语句npminstall-gnode-gyp最新的GYP好像已经不支持Python2.7版本，npm会提示你更新都3.*.*版本安装Node.js的时候一定要勾选以下这个，会自动检测安装缺少的环境第一种方案管理员运行CMD（PowerShell也行）执行更新工具
一、Python入门基础 MeyrlNotFound python 开发语言
1.Python简介与环境搭建•了解Python的历史、特点和应用领域Python的历史Python是一种高级编程语言，由GuidovanRossum于1989年发明。Python语言的设计目标是让代码易读、易写、易维护，从而提高开发效率和代码质量。自其诞生以来，Python已从一个简单的系统管理工具发展成为一种广泛应用于多个领域的编程语言。Python的特点1.简单易学：Python的语法简洁明
深入理解C++中的std::string::substr成员函数：子串操作的艺术星途码客 c++c++开发语言
引言在C++编程中，字符串处理是一项常见且重要的任务。std::string类作为C++标准库中的一部分，提供了丰富的成员函数来支持字符串的各种操作，其中substr成员函数在获取字符串子串方面扮演着关键角色。本文将深入探讨std::string::substr函数的工作原理、使用方法、异常处理以及性能考量，帮助读者全面掌握这一强大的字符串处理工具。题目：探索C++std::string::sub
npm error gyp info 计算机辅助工程 npm 前端 node.js
在使用npm安装Node.js包时，可能会遇到各种错误，其中gyp错误是比较常见的一种。gyp是Node.js的一个工具，用于编译C++代码。这些错误通常发生在需要编译原生模块的npm包时。下面是一些常见的原因和解决方法：常见原因及解决方法Python未安装或版本不兼容：Node.js使用Python来运行gyp。确保你的系统上安装了Python，并且版本与node-gyp兼容。通常推荐使用Pyt
人民日报报道，华为云赋能智能制造助力图扑软件构造数字孪生场景智慧园区华为人工智能物联网
2021年12月22日，《人民日报》头版头条刊登了《华为云赋能智能制造，助力图扑软件构造数字孪生场景》一文，聚焦数据可视化建设发展。报道指出，数字经济发展的背后，是大数据时趋势下各地区积极贯彻国家数字经济发展战略的时代精神;高效便捷管控的背后，是云端平台各大企业的互助共赢;高质精准2D、3D数据可视图的背后，是专注于数据可视化Web组态开发的厦门图扑软件科技有限公司。并对厦门图扑软件科技有限公司进
Java架构师成长之路 hweiyu00 分享 spring 微服务 spring cloud java
概述本教程主要从6个方面，全面讲解Java技术栈的知识。1.性能调优深入理解MySQL底层原理、索引逻辑，数据结构与算法。使用Explain进行优化分析MVCC原理剖析日志机制解析2.框架源码掌握Spring底层原理带你手写一个Spring解析IOC、AOP源码、以及事务原理3.并发编程剖析Java底层锁机制CAS、JUC工具使用、AQS源码分析以及并发的集合类的讲解4.分布式开发剖析分布式中使用
LangChain组件Tools/Toolkits详解（5）——返回产出artifact 龙焰智能 langchain artifact ToolCall BaseTool 工具产物 ToolMessages
LangChain组件Tools/Toolkits详解（5）——返回产出artifact本篇摘要14.LangChain组件Tools/Toolkits详解14.5返回产出artifact14.5.1定义工具14.5.2使用ToolCall调用工具14.5.3与模型一起使用14.5.4从子例化BaseTool返回参考文献本章目录如下：《LangChain组件Tools/Toolkits详解（1）—
JDK8新特性陈天在睡觉知识点总结 JavaSE java JDK8 javase 八股文后端
JDK8是官方发布的一个大版本,提供了很多新特性功能给开发者使用,包含语言、编译器、库、工具和JVM等方面的十多个新特性。本文将介绍编码过程中常用的一些新特性。一、Lambda表达式1.优点简化匿名内部类的写法，允许你以简洁的方式表示可传递给方法或存储在变量中的代码块，用更加简洁和表达性的语法来编写匿名函数，从而简化了对函数式接口的实现，使代码更加简洁紧凑。提高了代码的可读性和可维护性，尤其是在处
python环境部署工具 uv Honnnnnn uv
以原先使用的pipenv工具为例子，通过pipfile.lock生成requirements文件，再将requirements转成pyproject.toml文件，最后生成uv.lock基于当前虚拟环境导出requirements.txt--pipfreeze>requirements.txt（如果原先不是env而是基础的通过requirements.txt文件，省去转化requirements的
华为云赋能智能制造，助力图扑软件构造数字孪生场景 36Kr网科技华为云制造 big data
出行手机查看交通方案、物业管理的智能可视勘察管控、疫情地图提前预知危害……这些曾经存在于科幻片中的高科技场景一一在现代生活得到了应用与普及，其背后的数据可视化应用，正贯穿于当今大数据时代的各行各业，成为人们洞察数据内涵的有力工具，推动数字经济发展驶入“快车道”。数字经济发展的背后，是大数据时趋势下各地区积极贯彻国家数字经济发展战略的时代精神；高效便捷管控的背后，是云端平台各大企业的互助共赢；高质精
spark explain如何使用 fzip Spark spark 执行计划
在Spark中，explain是分析SQL或DataFrame执行计划的核心工具，通过不同模式可展示查询优化和执行的详细信息，默认情况下，这个语句只提供关于物理计划的信息。以下是具体使用方法及不同模式的作用：1.explain的基本语法在Spark3.0及以上版本，explain支持多种模式参数，通过mode指定输出格式：#DataFrame调用方式df.explain(mode="simple"
《Oracle DBA入门实战：十大高频问题详解与避坑指南》鸿·蒙数据库 Oracle数据库 DBA入门数据库管理 IT技术干货学习笔记
OracleDBA入门作业十问十答本文为OracleDBA入门作业整理，涵盖工具使用、配置管理及权限控制等核心知识点，适合新手快速上手。如有疑问或补充，欢迎评论区交流！1.DBA常用工具有哪些？OracleUniversalInstaller(OUI)用途：安装、升级或删除软件组件。OracleDatabaseConfigurationAssistant(DBCA)用途：通过图形界面创建、删除或修
回答我！！！如何用“快递分拣”讲明白OSI五层模型？茫忙然计算机网络网络
刚开始学习计算机网络时，会比较难理解计算机网络的五层协议，毕竟确实挺抽象的，接下来我用寄快递的过程来类比计算机网络的五层协议（物理层、数据链路层、网络层、传输层、应用层），帮助大家理解每一层的功能和作用。1.物理层（PhysicalLayer）——交通工具和道路快递中的比喻：卡车、飞机、轮船等运输工具，以及高速公路、铁路、航线等物理路径。功能：负责将包裹（数据）从一个地点物理传输到另一个地点，不关
【Spark】查询优化中分区（Partitioning）和分桶（Bucketing）是什么关系？什么时候应当分区，什么时候应当分桶？ petrel2015 spark 大数据分布式数据库
在学习Spark的过程中，分区和分桶乍一看很像，都能为了计算加速，但是仔细一想，一查还是有些差异的，甚至说差异很大。那么具体有什么差异点，有什么相同点。我做出了如下的整理，供大家参考，欢迎指正。相同点分区（Partitioning）和分桶（Bucketing）在很多方面具有相似性，它们都是用于优化大数据查询性能的技术数据划分的目的：优化查询性能分区和分桶的核心目标是通过将数据分割成更小的逻辑单元来
不神话大模型，不做技术乌托邦，用"传统IT+AI积木"实现企业智能转型人工智能
一、开篇：AI革命的务实辩证法在技术狂热与落地鸿沟并存的AI时代，灵燕智能体开发平台提出"三轮驱动法则"：•不颠覆的智慧：MySQL、知识图谱库、MQ等传统中间件构成数字地基•不空想的创新：大模型仅承担"认知苦力"，在人类设计的思考链中定向发力•不取巧的工程：通过D2R映射、低代码工具、元数据治理实现可落地的智能装配二、核心价值：智能开发的工业流水线技术要素原子化拆解将复杂需求分解为可执行的"技术
188.HarmonyOS NEXT系列教程之列表切换案例工具类与最佳实践 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之列表切换案例工具类与最佳实践效果演示1.日志工具类1.1Logger类实现classLogger{privatedomain:number;privateprefix:string;privateformat:string='
六十天前端强化训练之第二十九天之深入解析：从零构建企业级Vue项目的完整指南编程星辰海 #前端前端 Vue项目
=====欢迎来到编程星辰海的博客讲解======看完可以给一个免费的三连吗，谢谢大佬！目录一、Vite核心原理与开发优势二、项目创建深度解析三、配置体系深度剖析四、企业级项目架构设计五、性能优化实战六、开发提效技巧七、质量保障体系八、扩展阅读推荐一、Vite核心原理与开发优势1.1为什么选择Vite？Vite采用现代浏览器原生ES模块系统（NativeESM）作为开发服务器，颠覆了传统打包工具的
Docker之安装与配置雨五夜 Docker docker 容器运维
Docker之安装与配置一、Docker环境配置1.基本配置2.镜像加速3.网络配置4.数据持久化5.优化建议6.常见问题与解决方案7.补充工具二、Docker配置本地仓库指南1.拉取Registry镜像2.启动本地仓库3.配置Docker客户端Linux/macOSWindows4.推送镜像到本地仓库标记镜像推送镜像5.推送镜像到本地仓库6.管理本地仓库7.优化与安全性8.常见问题一、Docke
中国大陆网站用了lightHouse之后还有必要用WebPageTest么？混血哲谈网络
对于中国大陆的网站，即使已使用Lighthouse进行性能优化，WebPageTest仍有不可替代的价值。两者并非互斥，而是互补工具，适用于不同维度的性能分析。以下是具体原因和场景说明：一、核心结论：Lighthouse与WebPageTest的定位差异工具核心价值适用场景中国大陆场景的局限性Lighthouse提供代码级优化建议（如压缩资源、渲染阻塞修复）本地开发调试、快速生成优化清单仅反映本地
JavaScript 性能优化实战：优化循环结构提升效率 deying0865423 javascript 开发语言
目录一、理解循环的性能损耗二、减少循环迭代次数（一）缓存数组长度（二）提前终止循环三、优化循环内部操作（一）避免在循环内执行复杂计算（二）减少DOM操作四、选择合适的循环类型（一）for循环与while循环的选择（二）for...in与for...of的使用场景在JavaScript编程中，循环结构是实现重复执行任务的基础工具。然而，不当的循环使用常常会导致性能瓶颈，特别是在处理大量数据时，循环的
Python环境管理新利器：UV工具详解云水木石 python uv 开发语言
Python包和环境管理最好的工具无疑是Anaconda，但我在之前的一篇文章《注意，使用这款Python软件可能会带来麻烦》写过，个人使用完全没有问题。如果在公司内使用，就需要格外小心，可能会招来官司。在我们公司，Anaconda（包括Miniconda）就是禁止安装的软件之一。但是在工作中，确实又存在需要切换不同Python版本的需求，比如编译Chromium需要Python3.8以上的版本，
使用 UV 管理 Python 项目 | python小知识 aiweker 跟我学python uv python 人工智能
使用UV管理Python项目|python小知识1.引言在Python开发中，项目管理工具是必不可少的。常见的工具如pip、pipenv、poetry等，它们各有优缺点。近年来，uv作为一个新兴的Python项目管理工具，逐渐受到开发者的关注。uv旨在提供更快的依赖解析和安装速度，同时保持与现有工具的兼容性。本文将详细介绍uv的功能和应用场景，并通过代码示例展示其使用方法。最后，我们将对比uv与其
nvm管理多版本node,nvm 配置国内镜像，npm配置国内镜像奇纳尼 npm 前端 node.js
目录前言nvm是什么？安装nvm配置nvm国内镜像nvm常用命令npm配置国内镜像：淘宝镜像nrm源管理命令：可以不用实际项目中会遇到的问题前言公司多个项目需要配置不同版本的node,按照传统方式一直切换下载安装不同版本的node太麻烦了，发现nvm可以管理多版本nodenvm是什么？nvm（node.jsversionmanagement），是一个nodejs的版本管理工具。nvm和n都是nod
C#winform窗体应用如何新增button控件出生猿 c#
1.在栏目视图中找到工具箱2.打开工具箱找到公共控件，点开下拉列表，选中button，鼠标拖动到winform窗体中即可完成。
基于 STC89C52 的智能秒表 @小张要努力单片机 stm32 51单片机 proteus mcu c++c语言
引言秒表作为一种常见的计时工具，在体育赛事、实验测量等众多场景中有着广泛应用。随着电子技术的发展，基于单片机的智能秒表凭借其高精度、多功能等优势逐渐取代传统机械秒表。本文将详细介绍一款基于STC89C52单片机的智能秒表设计，该秒表通过两位数码管进行时间显示。STC89C52单片机特性回顾STC89C52是一款性能卓越的8位CMOS微控制器。它拥有8K字节的系统可编程Flash存储器，可方便地存储
AI大模型编程能力对比：Deepseek&Claude&Gemini 黑夜路人（heiyeluren） AI人工智能人工智能 ai AIGC 语言模型
在当今快速发展的技术领域，人工智能（AI）模型在编程和数据处理方面的应用越来越广泛。不同的AI模型因其独特的设计理念和技术优势，适用于不同的编程任务和场景。本文将对三种主流的AI模型——DeepSeekv3、GeminiFlash2.0和Claude3.5Sonnet的编程能力进行详细对比，帮助读者根据具体需求选择最合适的工具。同时对DeepSeekv3、GeminiFlash2.0和Claude
【005安卓开发方案调研】之Flutter+Dart技术开发安卓 ThinkPet 移动app开发 android flutter dart 跨平台
基于2025年国内移动开发环境现状，结合多份行业分析报告和技术文档，对Flutter+Dart开发安卓应用的技术成熟度和生态适配性分析如下：一、技术成熟度评估1.跨平台能力达到生产级标准Flutter的Skia自渲染引擎和Dart的AOT/JIT双编译模式，实现了90%以上的原生性能表现，在电商、社交、工具类应用中已无明显性能瓶颈。实测数据显示，列表滚动帧率稳定在55-60FPS，与原生开发差距小
RK3588开发笔记-DDR4降频实战与系统稳定性优化 flypig哗啦啦 RK3588 DDR
目录前言一、DDR变频原理与工具准备1.1DDR变频机制1.2工具链配置二、DDR降频操作步骤2.1找到RK3588DDR默认bin文件2.2修改DDRbin文件频率三、进阶优化与调试3.1温控策略调整3.2电源设计优化四、常见问题与解决方案总结前言RK3588作为瑞芯微旗舰级SoC，其DDR4/LPDDR4X内存接口最高支持2112MHz频率，但在实际开发中，高频可能导致系统不稳定或功耗过高。例
零基础入门机器学习：用Scikit-learn实现鸢尾花分类藍海琴泉机器学习 scikit-learn 分类
适合人群：机器学习新手|数据分析爱好者|需快速展示案例的学生一、引言：为什么要学这个案例？目的：明确机器学习解决什么问题，建立学习信心。机器学习定义：让计算机从数据中自动学习规律（如分类鸢尾花品种）。为什么选鸢尾花数据集：数据量小、特征明确，适合教学演示。Scikit-learn优势：提供现成算法和工具，无需从头写数学公式。二、环境准备：5分钟快速上手目的：搭建可运行的代码环境，避免卡在工具安装环
内核调试环境：buildroot/debootstrap制作文件系统、编译内核、QEMU模拟苏打呀 linux qemu kernel
编译内核#安装常用工具和依赖，可能会多，懒得分了，全装了吧反正以后说不定还要用。。。sudoaptinstallcurlwgetgpgzshtreegitnet-toolsproxychains4remminavimtarstracellvmclangunzipgccgcc-multilibbuild-essentialflexbisoncmakemakegawkdkmsautoconfninja
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc