旺财AI

Hive命令和CLI(三)

Beeline – 命令行Shell

HiveServer2支持命令行工具Beeline， Beeline是一个基于SQLLine CLI的JDBC客户端。 SQLLine的使用规则也适用于Beeline。Beeline shell 既可以在本地模式下工作，也可以在远程模式下工作。在本地模式下，运行本地的Hive(类似于Hive CLI)，而远程模式用于通过Thrift连接到单独的HiveServer2进程。从Hive 0.14开始，当Beeline与HiveServer2一起使用时，它还会打印HiveServer2的日志消息，以查询执行到STDERR的操作。建议将远程HiveServer2模式用于生产环境，因为它更安全并且不需要为用户授予直接HDFS /元存储访问权限。在远程模式下，HiveServer2仅接受有效的Thrift调用-即使在HTTP模式下，消息正文也包含Thrift有效负载。

Beeline例子

% bin/beeline 
Hive version 0.11.0-SNAPSHOT by Apache
beeline> !connect jdbc:hive2://localhost:10000 scott tiger
!connect jdbc:hive2://localhost:10000 scott tiger 
Connecting to jdbc:hive2://localhost:10000
Connected to: Hive (version 0.10.0)
Driver: Hive (version 0.10.0-SNAPSHOT)
Transaction isolation: TRANSACTION_REPEATABLE_READ
0: jdbc:hive2://localhost:10000> show tables;
show tables;
+-------------------+
|     tab_name      |
+-------------------+
| primitives        |
| src               |
| src1              |
| src_json          |
| src_sequencefile  |
| src_thrift        |
| srcbucket         |
| srcbucket2        |
| srcpart           |
+-------------------+
9 rows selected (1.079 seconds)

也可以在命令行上指定连接参数。这意味着可以从UNIX Shell历史记录中找到带有连接字符串的命令。例如：

% beeline -u jdbc:hive2://localhost:10000/default -n scott -w password_file
Hive version 0.11.0-SNAPSHOT by Apache

Connecting to jdbc:hive2://localhost:10000/default

beeline与 NoSASL 连接

如果想通过 NOSASL 模式进行连接，则必须明确指定身份验证模式：

% bin/beeline beeline> !connectjdbc:hive2://<host>:<port>/<db>;auth=noSasl hiveuser pass

beeline命令

命令	描述
!	SQLLine命令列表。例如：`!quit`退出 Beeline client。
！分界	为Beeline编写的查询设置分隔符。允许使用多字符分隔符，但不允许使用引号，斜杠和 - 。默认为; 用法：`!delimiter $$`

beeline Hive命令

当使用 Hive JDBC 驱动程序时，Hive 特定命令(与Hive CLI 命令相同)可以在Beeline 中运行。使用“;”(分号)终止命令。可以使用“--”前缀指定脚本中的注释。

命令	描述
reset	将 configuration 重置为默认值。
reset	将特定 configuration 变量(key)的 value 重置为默认 value。注意：如果拼错变量 name，Beeline 不会显示错误。
set =	设置特定 configuration 变量(key)的 value。注意：如果拼错变量 name，Beeline 不会显示错误。
set	打印由用户或 Hive 覆盖的 configuration 变量列表。
set -v	打印所有 Hadoop 和 Hive configuration 变量。
add FILE[S] * add JAR[S] * add ARCHIVE[S] *	将一个或多个 files，jars 或 archives 添加到分布式缓存中的资源列表中。
add FILE[S] * add JAR[S] * add ARCHIVE[S] *	从Hive 1.2.0开始，使用 ivy://group:module:version?query_string 形式的ivy URL 将一个或多个 files，jars 或 archives 添加到分布式缓存中的资源列表中。
list FILE[S] list JAR[S] list ARCHIVE[S]	列出已添加到分布式缓存的资源。
list FILE[S] * list JAR[S] * list ARCHIVE[S] *	检查给定资源是否已添加到分布式缓存中。
delete FILE[S] * delete JAR[S] * delete ARCHIVE[S] *	从分布式缓存中删除资源。
delete FILE[S] * delete JAR[S] * delete ARCHIVE[S] *	从Hive 1.2.0开始，删除使用从分布式缓存添加的资源。
reload	从Hive 0.14.0开始，使HiveServer2知道配置参数hive.reloadable.aux.jars.path指定的路径中的任何jar变化（无需重新启动HiveServer2）。
dfs	执行 dfs 命令。
	执行 Hive 查询并将结果打印到标准输出。

beeline命令选项

选项	描述
-u	要连接的 JDBC URL。如果需要，参数值中的特殊字符应使用 URL 编码进行编码。用法：`beeline -u` db_URL
-r	重新连接到上次使用的 URL(如果用户以前使用`!connect`到 URL 并使用`!save`到 beeline.properties 文件)。用法：`beeline -r`
-n	要连接的用户名。用法：`beeline -n` valid_user
-p	连接密码为。用法：`beeline -p` valid_password 可选密码模式：启动 Hive 2.2.0 -p 选项的参数是可选的。用法：beeline -p [148] 如果在-p Beeline 之后未提供密码，则会在启动连接时提示输入密码。当提供密码时，Beeline 使用它启动连接而不提示。
-d	要使用的驱动程序 class。用法：`beeline -d` driverclass
-e	应该执行的查询。双或单引号括起查询 string。可以多次指定此选项。用法：`beeline -e "querystring"`，支持 run 多个 SQL语句，每个 querystring 用分号分隔。
-f	应该执行的脚本文件。用法：`beeline -f` filepath。
-i(或)–init	init files 用于初始化用法：`beeline -i /tmp/initfile`
-w(或)–password-file	从中读取密码的密码文件。
-a(或)–authType	身份验证类型作为 auth property Version 传递给 jdbc。
–property-file	从文件读取 configuration properties的用法：`beeline --property-file /tmp/a` 。
–hiveconf property = value	对给定的 configuration property 使用 value。hive.conf.restricted.list中列出的 Properties 无法使用hiveconf重置。用法：`beeline --hiveconf` prop1 `=` value1
–hivevar name = value	Hive 变量 name 和 value。这是一个 Hive-specific 设置，其中变量可以在 session level 中设置并在 Hive 命令或查询中引用。用法：`beeline --hivevar` var1 `=` value1
–color = [true/false]	控制是否使用颜色进行显示。默认为 false。用法：`beeline --color=true` (Separated-Value 输出格式不支持。
–showHeader = [true/false]	在查询结果中显示列名(true)或不显示(false)。默认为 true。用法：`beeline --showHeader=false`
–headerInterval =Rows	当outputformat为 table 时，以行数重新显示列 headers 的时间间隔。默认值为 100. 用法：`beeline --headerInterval=50`
–fastConnect = [true/false]	当 connecting 时，跳过 building 为 tab-completion 的 HiveQL statements(true)或 build 列表(false)的所有表和列的列表。默认为 true。用法：`beeline --fastConnect=false`
–autoCommit = [true/false]	Enable/disable 自动 transaction 提交。默认为 false。用法：`beeline --autoCommit=true`
–verbose = [true/false]	显示详细错误消息和调试信息(true)或不显示(false)。默认为 false。用法：`beeline --verbose=true`
–showWarnings = [true/false]	显示发出任何 HiveQL 命令后在连接上报告的警告。默认为 false。用法：`beeline --showWarnings=true`
–showDbInPrompt = [true/false]	在提示符中显示当前数据库 name。默认为 false。用法：`beeline --showDbInPrompt=true`
–showNestedErrs = [true/false]	显示嵌套错误。默认为 false。用法：`beeline --showNestedErrs=true`
–numberFormat = [pattern]	使用DecimalFormat模式格式化数字。用法：`beeline --numberFormat="#,###,##0.00"`
–force = [true/false]	即使出现错误（true）或不继续（false）也继续运行脚本。默认为false。用法：`beeline--force=true`
–maxWidth = MAXWIDTH	截断数据前显示的最大宽度，以字符为单位，当outputformat为 table 时。默认是查询终端当前宽度，然后回退到 80。用法：`beeline --maxWidth=150`
–maxColumnWidth = MAXCOLWIDTH	outputformat为 table 时的最大列宽(以字符为单位)。默认值为 50 或早期版本中为 15。用法：`beeline --maxColumnWidth=25`
–silent = [true/false]	减少显示的信息量(true)或不减少(false)。它还会停止显示来自 HiveServer2和 HiveQL 命令的查询的日志消息。默认为 false。用法：`beeline --silent=true`
–autosave = [true/false]	自动保存首选项(true)或不自动保存(false)。默认为 false。用法：`beeline --autosave=true`
–outputformat = [table/vertical/csv/tsv/dsv/csv2/tsv2]	结果显示的格式模式。默认为 table。用法：`beeline --outputformat=tsv`
- truncateTable = [true/false]	如果 true，当 console 超过 console 长度时，会截断 console 中的 table 列。
–delimiterForDSV = DELIMITER	delimiter-separated 值的分隔符输出格式。默认为’\|‘
–isolation = LEVEL	将 transaction isolation level 设置为 TRANSACTION_READ_COMMITTED 或 TRANSACTION_SERIALIZABLE。用法：`beeline --isolation=TRANSACTION_SERIALIZABLE`
–nullemptystring = [true/false]	使用将 null 作为空 string(true)打印的历史行为，或使用将 null 作为 NULL(false)打印的当前行为。默认为 false。用法：`beeline --nullemptystring=false`
–incremental = [true/false]	在默认为`false` `.`之前默认为`true`，设置为`false`时，整个结果集在显示之前被提取和缓冲，从而产生最佳的显示列大小。设置为`true`时，结果行会在获取时立即显示，从而以额外显示列填充的价格产生较低的延迟和 memory 使用率。如果在 client 端遇到 OutOfMemory，则建议设置`--incremental=true`(由于获取的结果集大小很大)。
–incrementalBufferRows = NUMROWS	在 stdout 上打印行时要缓冲的行数，默认为 1000;仅适用于`--incremental=true`和`--outputformat=table` 用法：`beeline --incrementalBufferRows=1000`
–maxHistoryRows = NUMROWS	store Beeline 历史记录的最大行数。
–delimiter =;	为以直线编写的查询设置分隔符。允许使用多字符分隔符，但不允许使用引号，斜杠和 - 。默认为; 用法：`beeline --delimiter=$$`
–convertBinaryArrayToString = [true/false]	将二进制列数据显示为 string 或 byte array。用法：`beeline --convertBinaryArrayToString=true`
–help	显示用法消息。用法：`beeline --help`

输出格式

在beeline中，结果可以以不同的格式显示。可以使用outputformat选项设置格式模式。

支持以下输出格式：

table
vertical
xmlattr
xmlelements
separated-value formats (csv, tsv, csv2, tsv2, dsv)

table

结果显示在 table 中。结果的一行对应于 table 中的一行，而一行中的值显示在 table 的不同列中。
这是默认格式模式。

例如：

查询结果select id, value, comment from test_table

+-----+---------+-----------------+
| id  |  value  |     comment     |
+-----+---------+-----------------+
| 1   | Value1  | Test comment 1  |
| 2   | Value2  | Test comment 2  |
| 3   | Value3  | Test comment 3  |
+-----+---------+-----------------+

vertical

结果的每一行都以 key-value 格式的块显示，其中键是列的名称。

例如

查询结果select id, value, comment from test_table

id       1
value    Value1
comment  Test comment 1

id       2
value    Value2
comment  Test comment 2

id       3
value    Value3
comment  Test comment 3

xmlattr

结果以 XML 格式显示，其中每一行都是 XML 中的“result”元素。行的值在“result”元素上显示为属性。属性的名称是列的名称。

例如

查询结果select id, value, comment from test_table

<resultset>
  <result id="1" value="Value1" comment="Test comment 1"/>
  <result id="2" value="Value2" comment="Test comment 2"/>
  <result id="3" value="Value3" comment="Test comment 3"/>
resultset>

xmlelements

结果以 XML 格式显示，其中每一行都是 XML 中的“result”元素。行的值显示为 result 元素的 child 元素。
例如

查询结果select id, value, comment from test_table

<resultset>
  <result>
    <id>1id>
    <value>Value1value>
    <comment>Test comment 1comment>
  result>
  <result>
    <id>2id>
    <value>Value2value>
    <comment>Test comment 2comment>
  result>
  <result>
    <id>3id>
    <value>Value3value>
    <comment>Test comment 3comment>
  result>
resultset>

Separated-Value 输出格式

行的值由不同的分隔符分隔。有五种 separated-value 输出格式：csv，tsv，csv2，tsv2 和 dsv。

csv2，tsv2，dsv

从Hive 0.14开始，可以使用改进的 SV 输出格式，即 dsv，csv2 和 tsv2。这三种格式仅与单元格之间的分隔符不同，csv2 为逗号，tsv2 为 tab，dsv 为可配置。对于 dsv 格式，可以使用delimiterForDSV选项设置分隔符。默认分隔符为“|”。请注意，仅支持单个字符分隔符。
例如

查询结果select id, value, comment from test_table

CSV2

id,value,comment
1,Value1,Test comment 1
2,Value2,Test comment 2
3,Value3,Test comment 3

TSV2

id	value	comment
1	Value1	Test comment 1
2	Value2	Test comment 2
3	Value3	Test comment 3

dsv(分隔符是|)

id|value|comment
1|Value1|Test comment 1
2|Value2|Test comment 2
3|Value3|Test comment 3

在 csv2，tsv2 和 dsv 格式中引用

如果未禁用引用，则在 value 周围添加双引号(如果它包含特殊字符(例如分隔符或双引号字符)或 spans multiple lines)。嵌入的双引号使用前面的双引号进行转义。可以通过将disable.quoting.for.sv系统变量设置为 true 来禁用引用。如果禁用引用，则不会在值周围添加双引号(即使它们包含特殊字符)，并且不会转义嵌入的双引号。默认情况下，引用被禁用。
例如

查询结果select id, value, comment from test_table

csv2，引用已启用

id,value,comment
1,"Value,1",Value contains comma
2,"Value""2",Value contains double quote
3,Value'3,Value contains single quote

csv2，引用被禁用

id,value,comment
1,Value,1,Value contains comma
2,Value"2,Value contains double quote
3,Value'3,Value contains single quote

csv，tsv

这两种格式的区别仅在于值之间的分隔符，即 csv 的逗号和 tsv 的 tab。即使引号被disable.quoting.for.sv系统变量禁用，值也始终用单引号字符包围。这些输出格式不会逃避嵌入的单引号。请注意，这些输出格式已弃用，仅为了向后兼容而维护。
例如

查询结果select id, value, comment from test_table

CSV

'id','value','comment'
'1','Value1','Test comment 1'
'2','Value2','Test comment 2'
'3','Value3','Test comment 3'

TSV

'id'	'value'	'comment'
'1'	'Value1'	'Test comment 1'
'2'	'Value2'	'Test comment 2'
'3'	'Value3'	'Test comment 3'

HiveServer2日志

从 Hive 0.14.0 开始，HiveServer2 操作日志可用于 Beeline客户端。这些参数配置 logging：

hive.server2.logging.operation.enabled
hive.server2.logging.operation.log.location
hive.server2.logging.operation.verbose
hive.server2.logging.operation.level

HIVE-11488将 logging queryId 和 sessionId 的支持添加到 HiveServer2日志文件中。要启用它，将％X和％X编辑/添加到日志记录配置文件的模式格式字符串中。

取消查询

当用户在 Beeline shell 上输入CTRL+C时，如果有一个查询在同一 time 运行运行，则 Beeline 会在关闭与 HiveServer2 的 socket 连接时尝试取消查询。仅当hive.server2.close.session.on.disconnect设置为true时才会启用此行为。从 Hive 2.2.0开始当用户输入CTRL+C时，当取消 running 查询时，Beeline 不会退出命令行 shell。如果用户希望退出命令行Shell，则可以在取消查询时第二次输入CTRL + C。但是，如果当前没有查询在运行，则第一个CTRL + C将退出Beeline Shell。此行为类似于Hive CLI处理CTRL + C的方式。

!quit是退出 Beeline shell 的推荐命令。

终端脚本中的后台查询

可以使用 nohup 和 disown 等命令将 Beeline 与终端 run 断开连接以进行批处理和自动化脚本。某些版本的 Beeline客户端可能需要一种解决方法，允许 nohup 命令在不停止的情况下将 Beeline 程序正确放入后台。

可以更新以下环境变量：

export HADOOP_CLIENT_OPTS="$HADOOP_CLIENT_OPTS -Djline.terminal=jline.UnsupportedTerminal"

Running with nohangup(nohup)和＆符号(＆)将 process 放在后台并允许终端断开连接，同时保持 Beeline process running。

nohup beeline --silent=true --showHeader=true --outputformat=dsv -f query.hql </dev/null > /tmp/output.log 2> /tmp/error.log &

JDBC

HiveServer2 有一个 JDBC 驱动程序。它支持对 HiveServer2 的本地和远程访问。远程HiveServer2 模式建议用于生产环境使用，因为它更安全，不需要为用户授予直接 HDFS/metastore 访问权限。

连接 URL

连接 URL 格式

HiveServer2 URL 是一个 string，语法如下：

jdbc:hive2://:,:/dbName;initFile=;sess_var_list?hive_conf_list#hive_var_list

其中

:,:是要连接的服务器实例或以逗号分隔的服务器实例列表(如果启用了动态服务发现)。如果为空，将使用本地服务器。
dbName是初始数据库的 name。
是 init 脚本文件的路径。该脚本文件使用SQL语句编写，将在连接后自动执行。
sess_var_list是会话变量的键=值对的分号分隔列表(例如，user=foo;password=bar)
hive_conf_list是此会话的Hive配置变量的键=值对的分号分隔列表
hive_var_list是此会话的Hive变量的键=值对的分号分隔列表。

如果需要，sess_var_list, hive_conf_list, hive_var_list参数值中的特殊字符应根据需要使用URL编码进行编码。

远程或本地模式连接 URL

JDBC 连接 URL 格式的前缀为jdbc:hive2://，Driver class 为org.apache.hive.jdbc.HiveDriver。请注意，这与旧的HiveServer不同。

对于远程服务器，URL 格式为jdbc:hive2://:/;initFile=(HiveServer2 的默认 port 为 10000)。
对于本地服务器，URL 格式为jdbc:hive2:///;initFile=(无 host 或 port)。

initFile选项在Hive 2.2.0及更高版本中可用。

当 HiveServer2 在 HTTP 模式下运行时连接 URL

JDBC 连接 URL：jdbc:hive2://:/;transportMode=http;httpPath=，其中：

是hive-site.xml中配置的相应 HTTP 端点。默认 value 是cliservice。
HTTP 传输模式的默认 port 是 10001。

在0.14版本前，这些参数过去分别被称为hive.server2.transport.mode和hive.server2.thrift.http.path，并且是 hive_conf_list 的一部分。这些版本已被弃用，以支持新版本(它们是 sess_var_list 的一部分)，但现在仍在继续使用。

在 HiveServer2 中启用 SSL 时的连接 URL

JDBC 连接 URL：jdbc:hive2://:/;ssl=true;sslTrustStore=;trustStorePassword=，其中：

是 client 的信任库文件所在的路径。
是访问信任库的密码。

在 HTTP 模式下：jdbc:hive2://:/;ssl=true;sslTrustStore=;trustStorePassword=;transportMode=http;httpPath=。

启用 ZooKeeper 服务开发时连接 URL

Hive 0.14.0中引入的基于ZooKeeper开发服务可实现 HiveServer2 的高可用性和滚动升级。需要使用指定的 JDBC URL 来使用这些属性。

随着 Hive 2.0.0 和 1.3.0的进一步更改，需要指定其他 configuration 参数，例如身份验证模式，传输模式或 SSL 参数，因为它们是从 ZooKeeper 条目和主机名一起检索的。

JDBC 连接 URL：jdbc:hive2:///;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=hiveserver2。

与 HiveServer2 使用的 hive-site.xml/hivserver2-site.xml 中 hive.zookeeper.quorum configuration 参数的 value 相同。

可以通过以下方式在URL中提供查询所需的其他运行时参数，方法是像以前一样将其附加为？

JDBC 连接 URL：jdbc:hive2:///;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=hiveserver2?tez.queue.name=hive1&hive.server2.thrift.resultset.serialize.in.tasks=true

命名连接 URL

从 Hive 2.1.0开始，Beeline 还通过使用环境变量来支持命名的 URL 连接 strings。如果您尝试将!connect设置为不像 URL 的 name，则 Beeline 将尝试查看是否存在名为 BEELINE_URL_ 的环境变量。例如，如果指定!connect blue，它将查找 BEELINE_URL_BLUE，并使用它进行连接。这应该使系统管理员更容易为用户指定环境变量，并且用户无需在每个 time 时键入完整的 URL 进行连接。

重新连接

传统上，!reconnect已经努力刷新已经建立的连接。 !close运行后，无法进行全新连接。从 Hive 2.1.0开始，Beeline 会记住在 session 中成功连接的最后一个 URL，并且即使已经 run 也可以重新连接。此外，如果用户执行!save，则会将其保存在 beeline.properties 文件中，然后允许!reconnect在多个直线会话中连接到此已保存的 last-connected-to URL。这也允许使用命令 line 中的beeline -r在启动时重新连接。

使用 hive-site.xml 自动连接到 HiveServer2

从 Hive 2.2.0开始，Beeline 添加了对使用 classpath 中存在的 hive-site.xml 的支持，以根据 hive-site.xml 中的 configuration properties 和其他用户 configuration 文件自动生成连接 URL。并非所有的 URL properties 都可以从 hive-site.xml 派生，因此在 order 中使用此 feature 用户必须创建一个名为“beeline-hs2-connection.xml”的 configuration 文件，这是一个 Hadoop XML 格式文件。此文件用于为连接 URL 提供 user-specific 连接 properties。 Beeline在$ /.beeline /（基于Unix的操作系统）或$ \ beeline \目录（对于Windows）中寻找此配置文件。如果在上述位置找不到文件，则Beeline会依次在$位置和/etc /hive /conf中检查该文件（检查HIVE-16335，它会从Hive 2.2.0中的/etc /conf /hive中修复此位置）。找到文件后，Beeline 将 beeline-hs2-connection.xml 与 class 路径中的 hive-site.xml 结合使用以确定连接 URL。

beeline-hs2-connection.xml中的URL连接属性必须具有前缀“ beeline.hs2.connection”。然后是URL属性名称。例如，为了提供属性ssl，beeline-hs2-connection.xml中的属性密钥应为“ beeline.hs2.connection.ssl”。下面的示例beeline.hs2.connection.xml提供了Beeline连接URL的用户和密码值。在这种情况下，其余的属性（例如HS2主机名和端口信息，Kerberos配置属性，SSL属性，传输模式等）是使用类路径中的hive-site.xml来获取的。如果密码为空，则应删除beeline.hs2.connection.password属性。在大多数情况下，beeline-hs2-connection.xml中的以下配置值以及类路径中正确的hive-site.xml应该足以建立与HiveServer2的连接。



<configuration>
<property>
 <name>beeline.hs2.connection.username>
 <value>hivevalue>
property>
<property>
 <name>beeline.hs2.connection.passwordname>
 <value>hivevalue>
property>
configuration>

如果beeline-hs2-connection.xml和hive-site.xml中都存在属性，则从beeline-hs2-connection.xml派生的属性值优先。例如，在下面的beeline-hs2-connection.xml文件中，提供了在启用Kerberos的环境中Beeline连接的主体值。在这种情况下，就连接URL而言，beeline.hs2.connection.principal的属性值将覆盖hive-site.xml中的HiveConf.ConfVars.HIVE_SERVER2_KERBEROS_PRINCIPAL的值。



<configuration>
<property>
 <name>beeline.hs2.connection.hostsname>
 <value>localhost:10000value>
property>
<property>
 <name>beeline.hs2.connection.principalname>
 <value>hive/[email protected]value>
property>
configuration>

对于属性beeline.hs2.connection.hosts，beeline.hs2.connection.hiveconf和beeline.hs2.connection.hivevar，属性值是逗号分隔的值列表。例如，以下beeline-hs2-connection.xml以逗号分隔格式提供hiveconf和hivevar值。



<configuration>
<property>
 <name>beeline.hs2.connection.username>
 <value>hivevalue>
property>
<property>
 <name>beeline.hs2.connection.hiveconfname>
 <value>hive.cli.print.current.db=true, hive.cli.print.header=truevalue>
property>
<property>
 <name>beeline.hs2.connection.hivevarname>
 <value>testVarName1=value1, testVarName2=value2value>
property>
configuration>

当 beeline-hs2-connection.xml 存在且没有提供其他 arguments 时，Beeline 会自动连接到使用 configuration files 生成的 URL。当提供连接 arguments(-u，-n 或-p)时，Beeline 使用它们并且不使用 beeline-hs2-connection.xml 自动连接。删除或重命名 beeline-hs2-connection.xml 会禁用此 feature。

使用 beeline-site.xml 自动连接到 HiveServer2

除了使用 hive-site.xml 和 beeline-hs2-connection.xml 来导出从 Beeline 连接到 HiveServer2 时使用的 JDBC 连接 URL 的上述方法之外，用户可以选择将 beeline-site.xml 添加到 classpath，并且在 beeline-site.xml 中，可以指定完整的 JDBC URL。用户还可以指定多个命名 URL 并使用beeline -c连接到特定 URL。当相同的 cluster 具有多个 HiveServer2 实例 running 具有不同的配置时，这尤其有用。其中一个命名的 URL 被视为默认值(这是用户只需键入beeline时使用的 URL)。 beeline-site.xml 如下所示：



<configuration>
<property>
  <name>beeline.hs2.jdbc.url.tcpUrlname>
  <value>jdbc:hive2://localhost:10000/default;user=hive;password=hivevalue>
property>

<property>
  <name>beeline.hs2.jdbc.url.httpUrlname>
  <value>jdbc:hive2://localhost:10000/default;user=hive;password=hive;transportMode=http;httpPath=cliservicevalue>
property>

<property>
  <name>beeline.hs2.jdbc.url.defaultname>
  <value>tcpUrlvalue>
property>
configuration>

在上面的例子中，只需 typing beeline打开一个到jdbc:hive2://localhost:10000/default;user=hive;password=hive的新 JDBC 连接。如果 classpath 中同时存在 beeline-site.xml 和 beeline-hs2-connection.xml，则通过在 beeline-hs2-connection.xml 派生的 URL properties 之上应用 beeline-hs2-connection.xml 中指定的 properties 来创建最终 URL。作为示例，请考虑以下 beeline-hs2-connection.xml：



<configuration>
<property>
 <name>beeline.hs2.connection.username>
 <value>hivevalue>
property>
<property>
  <name>beeline.hs2.connection.passwordname>
  <value>hivevalue>
property>
configuration>

考虑以下 beeline-site.xml：



<configuration>
<property>
  <name>beeline.hs2.jdbc.url.tcpUrlname>
  <value>jdbc:hive2://localhost:10000/defaultvalue>
property>

<property>
  <name>beeline.hs2.jdbc.url.httpUrlname>
  <value>jdbc:hive2://localhost:10000/default;transportMode=http;httpPath=cliservicevalue>
property>

<property>
  <name>beeline.hs2.jdbc.url.defaultname>
  <value>tcpUrlvalue>
property>
configuration>

在上面的例子中，只需 typing beeline打开一个到j dbc:hive2://localhost:10000/default;user=hive;password=hive的新 JDBC 连接。当用户键入beeline -c httpUrl时，连接将打开jdbc:hive2://localhost:10000/default;transportMode=http;httpPath=cliservice;user=hive;password=hive。 ``

使用 JDBC

可以使用 JDBC 访问存储在关系数据库或其他表格格式中的数据。

加载 HiveServer2 JDBC 驱动程序。从1.2.0应用开始，不再需要使用 Class.forName()显式加载 JDBC 驱动程序。

例如：

Class.forName("org.apache.hive.jdbc.HiveDriver");

通过使用 JDBC 驱动程序创建Connection object 来连接数据库。

例如：

Connection cnct = DriverManager.getConnection("jdbc:hive2://<host>:<port>", "<user>", "<password>");

默认是 10000.在 non-secure 配置中，为查询指定以 run 为。在 non-secure 模式中忽略``字段 value。

Connection cnct = DriverManager.getConnection("jdbc:hive2://<host>:<port>", "<user>", "");

在 Kerberos 安全模式下，用户信息基于 Kerberos 凭据。

通过创建Statement object 并使用其executeQuery()方法将 SQL 提交到数据库。

例如：

Statement stmt = cnct.createStatement();
ResultSet rset = stmt.executeQuery("SELECT foo FROM bar");

如有必要，处理结果集。

这些步骤在下面的 sample code 中说明。

JDBC Client Sample Code

import java.sql.SQLException;
import java.sql.Connection;
import java.sql.ResultSet;
import java.sql.Statement;
import java.sql.DriverManager;

public class HiveJdbcClient {
  private static String driverName = "org.apache.hive.jdbc.HiveDriver";

  /**
   * @param args
   * @throws SQLException
   */
  public static void main(String[] args) throws SQLException {
      try {
      Class.forName(driverName);
    } catch (ClassNotFoundException e) {
      // TODO Auto-generated catch block
      e.printStackTrace();
      System.exit(1);
    }
    //replace "hive" here with the name of the user the queries should run as
    Connection con = DriverManager.getConnection("jdbc:hive2://localhost:10000/default", "hive", "");
    Statement stmt = con.createStatement();
    String tableName = "testHiveDriverTable";
    stmt.execute("drop table if exists " + tableName);
    stmt.execute("create table " + tableName + " (key int, value string)");
    // show tables
    String sql = "show tables '" + tableName + "'";
    System.out.println("Running: " + sql);
    ResultSet res = stmt.executeQuery(sql);
    if (res.next()) {
      System.out.println(res.getString(1));
    }
       // describe table
    sql = "describe " + tableName;
    System.out.println("Running: " + sql);
    res = stmt.executeQuery(sql);
    while (res.next()) {
      System.out.println(res.getString(1) + "\t" + res.getString(2));
    }

    // load data into table
    // NOTE: filepath has to be local to the hive server
    // NOTE: /tmp/a.txt is a ctrl-A separated file with two fields per line
    String filepath = "/tmp/a.txt";
    sql = "load data local inpath '" + filepath + "' into table " + tableName;
    System.out.println("Running: " + sql);
    stmt.execute(sql);

    // select * query
    sql = "select * from " + tableName;
    System.out.println("Running: " + sql);
    res = stmt.executeQuery(sql);
    while (res.next()) {
      System.out.println(String.valueOf(res.getInt(1)) + "\t" + res.getString(2));
    }

    // regular hive query
    sql = "select count(1) from " + tableName;
    System.out.println("Running: " + sql);
    res = stmt.executeQuery(sql);
    while (res.next()) {
      System.out.println(res.getString(1));
    }
  }
}

运行 JDBC Sample Code

# Then on the command-line
$ javac HiveJdbcClient.java

# To run the program using remote hiveserver in non-kerberos mode, we need the following jars in the classpath
# from hive/build/dist/lib
#     hive-jdbc*.jar
#     hive-service*.jar
#     libfb303-0.9.0.jar
# 	  libthrift-0.9.0.jar
# 	  log4j-1.2.16.jar
# 	  slf4j-api-1.6.1.jar
#	  slf4j-log4j12-1.6.1.jar
# 	  commons-logging-1.0.4.jar
#
#
# To run the program using kerberos secure mode, we need the following jars in the classpath 
#     hive-exec*.jar
#     commons-configuration-1.6.jar (This is not needed with Hadoop 2.6.x and later).
#  and from hadoop
#     hadoop-core*.jar (use hadoop-common*.jar for Hadoop 2.x)
#
# To run the program in embedded mode, we need the following additional jars in the classpath
# from hive/build/dist/lib
#     hive-exec*.jar
#     hive-metastore*.jar
#     antlr-runtime-3.0.1.jar
#     derby.jar
#     jdo2-api-2.1.jar
#     jpox-core-1.2.2.jar
#     jpox-rdbms-1.2.2.jar
# and from hadoop/build
#     hadoop-core*.jar
# as well as hive/build/dist/conf, any HIVE_AUX_JARS_PATH set,
# and hadoop jars necessary to run MR jobs (eg lzo codec)

$ java -cp $CLASSPATH HiveJdbcClient

或者，您可以运行以下 bash 脚本，该脚本将调用数据文件并在调用 client 之前 build 您的 classpath。该脚本还添加了在嵌入模式下使用 HiveServer2 所需的所有其他 jars。

#!/bin/bash
HADOOP_HOME=/your/path/to/hadoop
HIVE_HOME=/your/path/to/hive

echo -e '1\x01foo' > /tmp/a.txt
echo -e '2\x01bar' >> /tmp/a.txt

HADOOP_CORE=$(ls $HADOOP_HOME/hadoop-core*.jar)
CLASSPATH=.:$HIVE_HOME/conf:$(hadoop classpath)

for i in ${HIVE_HOME}/lib/*.jar ; do
    CLASSPATH=$CLASSPATH:$i
done

java -cp $CLASSPATH HiveJdbcClient

JDBC 数据类型

以下 table lists 列出了为 HiveServer2 JDBC 实现的数据类型。


Hive 类型	Java 类型	格式
TINYINT	字节	签名或未签名的 1-byte integer
SMALLINT	短	签名 2-byte integer
INT	INT	签名 4-byte integer
BIGINT	长	签名 8-byte integer
浮动	双	single-precision 数字(约 7 位数)
双	双	double-precision 号码(约 15 位数)
DECIMAL	java.math.BigDecimal	fixed-precision decimal value
BOOLEAN	boolean	一位(0 或 1)
串	串	character string 或 variable-length character string
TIMESTAMP	java.sql.Timestamp	date 和 time value
BINARY	串	二进制数据
复杂类型
array	String - json 编码	一种数据类型的值
地图	String - json 编码	key-value 对
STRUCT	String - json 编码	结构化价值观

安全 Cluster 的 JDBC Client 设置

使用 Kerberos 身份验证连接到 HiveServer2 时，URL 格式为：

jdbc:hive2://:/;principal=

在 connecting 之前，client 需要在票证缓存中具有有效的 Kerberos 票证。

注意：如果 port 编号后面没有“/”，则 jdbc 驱动程序不会解析主机名，并且_End up running HS2 处于嵌入模式。因此，如果要指定主机名，请确保在 port 编号后面有“/”或“/ ”。

对于 LDAP，CUSTOM 或 PAM 身份验证，client 需要将有效的用户 name 和密码传递给 JDBC 连接 API。

To use sasl.qop, add the following to the sessionconf part of your HiveJDBC hive connection string, e.g.
jdbc:hive://hostname/dbname;sasl.qop=auth-int

Multi-User 场景和程序化登录 Kerberos KDC

在当前使用 Kerberos 的方法中，您需要在 connecting 之前在票证缓存中拥有有效的 Kerberos 票证。这需要静态登录(使用 kinit，key tab 或 ticketcache)以及每个 client 限制一个 Kerberos 用户。这些限制限制了中间件系统和其他 multi-user 场景的使用，以及 client 希望以编程方式登录 Kerberos KDC 的情况。

缓解 multi-user 场景问题的一种方法是使用安全代理用户。从 Hive 0.13.0 开始，对安全代理用户的支持有两个组成部分：

特权 Hadoop 用户的直接代理访问。这使特权用户可以在连接期间直接指定备用 session 用户。如果 connecting 用户具有 Hadoop level 特权来模拟请求的用户标识，则 HiveServer2 将_seun 运行 session 作为请求的用户。
Oozie的基于委托令牌的连接。这是 Hadoop 生态系统组件的 common 机制。

Hadoop 生态系统中的代理用户权限与用户名和主机相关联。也就是说，该特权可用于某些主机的某些用户。如果您从一台授权(祝福)机器连接，之后您需要从另一台 non-blessed 机器建立连接，则应使用 Hive 中的委派令牌。您从受祝福的计算机获取委派令牌，并使用来自 non-blessed 计算机的委派令牌进行连接。主要用例是 Oozie，它从服务器计算机获取委托令牌，然后从 Hadoop 任务节点获取另一个连接。

如果只是从单个受保护的计算机作为特权用户建立 JDBC 连接，则直接代理访问是更简单的方法。您可以使用 hive.server2.proxy.user = 参数传递您需要在 JDBC URL 中模拟的用户。

使用 HiveServer2 二进制传输模式hive.server2.transport.mode支持委托令牌从 0.13.0 开始可用;在HIVE-13169中添加了对具有 HTTP 传输模式的 feature 的支持，这应该是 Hive 2.1.0 的一部分。

另一种方法是使用 pre-authenticated Kerberos 主题。在此方法中，从 Hive 0.13.0 开始，Hive JDBC client 可以使用 pre-authenticated 主题对 HiveServer2 进行身份验证。这使得中间件系统能够在用户运行 client 时运行查询。

将 Kerberos 与 Pre-Authenticated 主题一起使用

要使用 pre-authenticated 主题，您需要进行以下更改。

除了常规的 Hive JDBC jars(不需要 commons-configuration-1.6.jar 和 hadoop-core * .jar)之外，还要将 hive-exec * .jar 添加到 classpath。
除了具有“principal”url property 之外，还要添加 auth=kerberos 和 kerberosAuthType=fromSubject JDBC URL properties。
在 Subject.doAs()中打开连接。

以下 code 片段说明了用法：

static Connection getConnection( Subject signedOnUserSubject ) throws Exception{
       Connection conn = (Connection) Subject.doAs(signedOnUserSubject, new PrivilegedExceptionAction<Object>()
           {
               public Object run()
               {
                       Connection con = null;
                       String JDBC_DB_URL = "jdbc:hive2://HiveHost:10000/default;" ||
                                              "principal=hive/[email protected];" || 
                                              "kerberosAuthType=fromSubject";
                       try {
                               Class.forName(JDBC_DRIVER);
                               con =  DriverManager.getConnection(JDBC_DB_URL);
                       } catch (SQLException e) {
                               e.printStackTrace();
                       } catch (ClassNotFoundException e) {
                               e.printStackTrace();
                       }
                       return con;
               }
           });
       return conn;
}

与 SQuirrel SQL Client 集成

从SQuirrel SQL 网站下载，安装和启动 SQuirrel SQL Client。
选择’Drivers - > New Driver …'来注册与 HiveServer2 一起使用的 Hive 的 JDBC 驱动程序。
输入驱动程序 name 和 example URL：

Name: Hive
   Example URL: jdbc:hive2://localhost:10000/default

选择’Extra Class Path - > Add’，从本地 Hive 和 Hadoop 发行版中添加以下 jars。

HIVE_HOME/lib/hive-jdbc-*-standalone.jar
   HADOOP_HOME/share/hadoop/common/hadoop-common-*.jar

版本信息

Hive JDBC 独立 jars 用于 Hive 0.14.0 向前;对于以前版本的 Hive，请改用HIVE_HOME/build/dist/lib/*.jar。

hadoop-common jars 适用于 Hadoop 2.0;对于以前版本的 Hadoop，请改用HADOOP_HOME/hadoop-*-core.jar。

选择“列表驱动程序”。这将导致 SQuirrel 解析您的 jars for JDBC 驱动程序，可能需要几秒钟。从’Class Name’输入框中选择 Hive 驱动程序以使用 HiveServer2：

org.apache.hive.jdbc.HiveDriver

单击“确定”以完成驱动程序注册。
选择’别名 - >添加别名…'以创建 HiveServer2 实例的连接别名。
在“Name”输入框中为连接别名指定 name。
从’Driver’drop-down 中选择 Hive 驱动程序。
根据需要修改 example URL 以指向 HiveServer2 实例。
输入“User Name”和“Password”，然后单击“确定”以保存连接别名。
要连接到 HiveServer2，double-click Hive 别名并单击“连接”。

建立连接后，您将在 log console 中看到错误，并可能会收到驱动程序与 JDBC 3.0 兼容的警告。这些警报是由 JDBC 元数据 API 的 yet-to-be-implemented 部分引起的，可以安全地忽略。要测试连接，请在 console 中输入 SHOW TABLES，然后单击 run 图标。

另请注意，当查询为 running 时，对“取消”按钮的支持尚不可用。

与 SQL Developer 集成

使用 JDBC 连接可以使用 Oracle SQLDeveloper 集成。

免费下载，安装和启动 DbVisualizer 或从https://www.dbvis.com/购买 DbVisualizer Pro。
按照github上的说明操作。

Integration 与其他工具的高级 Features

在 HTTP 模式下支持 Cookie 重放

Version 1.2.0 以及之后，此选项从Hive 1.2.0开始可用。HIVE-9709引入了对 JDBC 驱动程序的支持，以启用 cookie 重放。默认情况下会启用此功能，以便将传入的 cookies 发送回服务器进行身份验证。

启用时的 JDBC 连接 URL 应如下所示：

jdbc:hive2://:/?transportMode=http;httpPath=;cookieAuth=true;cookieName=

cookieAuth 默认设置为true。
cookieName：如果任何传入的 cookies’键匹配 cookieName 的 value，则 JDBC 驱动程序不会向服务器发送任何登录 credentials/Kerberos 票证。 client 只会将 cookie 单独发送回服务器进行身份验证。 cookieName 的默认 value 是 hive.server2.auth(这是 HiveServer2 cookie name)。
要关闭 cookie 重放，必须在 JDBC URL 中使用 cookieAuth=false。
**重要说明：**作为HIVE-9709的一部分，我们将 Hive 的 Apache http-client 和 http-core 组件升级为 4.4. 为了避免 HttpComponents 的升级 version 与系统中可能存在的其他任何版本之间发生任何冲突(例如 Apache Hadoop 2.6 提供的@这样一种方式 Beeline-related jars 出现在 HADOOP lib jars 之前。这是通过在使用 hive-jdbc 之前设置 HADOOP_USERCLASSPATH_FIRST=true 来实现的。事实上，在 bin/beeline.sh 我们这样做！

在 HTTP 模式下使用 2-way SSL

此选项从Hive 1.2.0开始可用。HIVE-10447使 JDBC 驱动程序在 HTTP 模式下支持 2-way SSL。请注意，HiveServer2 目前不支持 2-way SSL。因此，当有一个像 Knox 这样的中间服务器需要 client 来支持 2-way SSL 时，这个 feature 很方便。

JDBC 连接 URL：

jdbc:hive2://:/;ssl=true;twoWay=true;` `sslTrustStore=;trustStorePassword=;sslKeyStore=;keyStorePassword=` `?transportMode=http;httpPath=

< truststore_path >是 client 的信任库文件所在的路径。这是一个强制的 non-empty 字段。
是访问信任库的密码。
< keystore_path >是 client 的密钥库文件所在的路径。这是一个强制的 non-empty 字段。
< key_store_password>是访问密钥库的密码。

通过 JDBC 驱动程序传递 HTTP 标头 Key/Value 对

此选项从Hive 1.2.0开始可用。HIVE-10339为 clients 引入了一个选项，以提供可以发送到底层服务器的自定义 HTTP headers(Hive 1.2.0 及更高版本)。

JDBC 连接 URL：

jdbc:hive2://:/;transportMode=http;httpPath=;http.header.=;http.header.=

指定上述 URL 后，Beeline 将调用基础请求以将 HTTP 标头集添加到和，将另一个 HTTP 标头集设置为和。当最终用户需要将 HTTP 标头中的标识向下发送到中间服务器(如 Knox，通过 Beeline 进行身份验证)时，这非常有用，例如http.header.USERNAME=;http.header.PASSWORD=。

通过 JDBC 驱动程序传递自定义 HTTP Cookie Key/Value 对

在 Hive version 3.0.0，HIVE-18447中为 clients 引入了一个选项，以提供可以发送到底层服务器的自定义 HTTP cookies。某些身份验证机制(如 Single Sign On)需要能够通过 JDBC 驱动程序将 cookie 传递给某些中间身份验证服务(如 Knox)。

JDBC 连接 URL：

jdbc:hive2://:/;transportMode=http;httpPath=;http.cookie.=;http.cookie.=

指定上述 URL 后，Beeline 将调用基础请求以在请求标头中添加 HTTP cookie，并将其设置为 = 和 = 。

你可能感兴趣的:(Hive学习笔记)

图像质量评价学习笔记02：IQA模型性能评价指标（PLCC、SROCC、KROCC、RMSE）可靠的豆包蟹同志图像质量评估IQA 图像处理计算机视觉人工智能算法
性能好的图像质量评价（IQA）算法，其质量评测分数会与主观质量分数高度一致，IQA有许多评价指标，为了衡量方法测试结果与主观评价之间的一致性，视频质量专家组VQEG（VideoQualityExpertsGroup，目前国际上对视频质量进行标准化及性能测试的权威组织）提出了四个可以验证客观评价结果和主观评价结果之间的紧密程度的四个指标：PLCC、SROCC、KROCC和RMSE，也是目前最常用的I
计算机基础：编码01，无符号数编码水饺编程 MFC学习笔记 Win32学习笔记 mfc c++visual studio windows
专栏导航本节文章分别属于《Win32学习笔记》和《MFC学习笔记》两个专栏，故划分为两个专栏导航。读者可以自行选择前往哪个专栏。（一）WIn32专栏导航上一篇：计算机基础：二进制基础13，十六进制与二进制的相互转换回到目录下一篇：计算机基础：编码02，有符号数编码，原码（二）MFC专栏导航上一篇：计算机基础：二进制基础13，十六进制与二进制的相互转换回到目录下一篇：计算机基础：编码02，有符号数编
先验地图--slam学习笔记超级璐璐人工智能机器学习
先验信息(PriorInformation)先验信息指的是在收集新数据之前已有的知识或假设。这种信息可以来自之前的实验、历史数据、理论模型或专家意见。地图信息：在无人驾驶中，车辆通常会预先加载高精度地图数据，这些地图数据提供了道路布局、车道线位置、交叉口结构等信息。这些信息就是先验信息。车辆动力学模型：车辆的动力学模型，包括车辆的物理特性（如质量、轮胎摩擦系数等），这些模型可以帮助预测车辆的行为。
Xilinx系ZYNQ学习笔记（二）ZYNQ入门及点亮LED灯贾saisai FPGA学习学习笔记 fpga开发
系列文章目录文章目录系列文章目录前言简单介绍简称xc7z020型号FPGAZYNQ实操通用IO点亮LED灯硬件逻辑基础前言简单入门一下ZYNQ是何种架构，如何编程，至于深入了解应该要分开深入学习Linux和FPGA简单介绍其基本架构都是在同一个硅片上集成FPGA和CPU，并通过高速、高带宽的互联架构连接起来。ARM的顺序控制、丰富外设，开源驱动、FPGA的并行运算、高速接口、灵活定制、数字之王的特
ZYNQ学习笔记_GPIO之输入输出凌星星星星星 ZYNQ学习笔记 gpio mio fpga 嵌入式单片机
ZYNQ学习笔记_GPIO之输入输出GPIO介绍MIO介绍EMIO介绍控制GPIO接口的寄存器原理_输入输出部分GPIO介绍GPIO的英文全称为General-purposeinput/output，即一种通用外设，可以通过MIO（MultiuseI/O）模块对器件的引脚做观测（input）和控制（output）。ZYNQ的PS端上的GPIO也可以通过EMIO（ExtraMIO）模块对PL端的IP
zynq设计学习笔记2——GPIO之MIO控制LED实验墨漓_lyl FPGA之zynq设计学习笔记嵌入式 fpga
vivado软件操作步骤与学习笔记1——helloworld差不多，这里不再过多赘述，不同点是在zynq的设置中添加上GPIO的设置即可。进入SDK软件后，程序如下：#include"stdio.h"#include"xparameters.h"#include"xgpiops.h"#include"sleep.h"#defineGPIO_DEVICE_IDXPAR_XGPIOPS_0_DEVIC
linux+docker安装常见中间件+shell学习笔记芦屋花绘 linux docker 中间件
初始设置下载虚拟机软件：选择适合的虚拟机软件（如VirtualBox或VMware）。下载操作系统ISO映像文件：选择并下载你想安装的Linux发行版（例如Ubuntu、CentOS等）的ISO文件。ISO映像文件：是包含了完整光盘内容的文件，包含引导记录、文件系统、数据文件和目录结构。导入ISO文件到虚拟机，并进行相关配置，如分配内存、硬盘空间等。了解基本linuxLinux常见目录及其用途Li
Apache大数据旭哥优选大数据选题 Apache大数据旭大数据定制选题 java hadoop spark 开发语言 idea hive 数据库架构
定制旭哥服务，一对一，无中介包安装+答疑+售后态度和技术都很重要定制按需求做要求不高就实惠一点定制需提前沟通好怎么做，这样才能避免不必要的麻烦python、flask、Django、mapreduce、mysqljava、springboot、vue、echarts、hadoop、spark、hive、hbase、flink、SparkStreaming、kafka、flume、sqoop分析+推
hive相关命令 Wang·Br bigdata 笔记 hive
hive相关命令1.hive-helphive-e:不进入hive交互窗口，执行sql语句hive-e"select*users"hive-f:执行脚本中sql语句#创建文件hqlfile1.sql，内容：select*fromusers#执行文件中的SQL语句hive-fhqlfile1.sql#执行文件中的SQL语句，将结果写入文件hive-fhqlfile1.sql>>result1.log
hive服务启停脚本热爱技术的小陈大数据 hive 大数据 hadoop
hive.sh#!/bin/bashHIVE_LOG_DIR=$HIVE_HOME/logs#创建日志目录if[!-d$HIVE_LOG_DIR]thenmkdir-p$HIVE_LOG_DIRfi#检查进程是否运行正常,参数1为进程名,参数2为进程端口functioncheck_process(){pid=$(ps-ef2>/dev/null|grep-vgrep|grep-i$1|awk'{p
【Hive】-- hive 3.1.3 伪分布式部署（单节点） oo寻梦in记 Apache Paimon 大数据服务部署 hive 分布式 hadoop
1、环境准备1.1、版本选择apachehive3.1.3apachehadoop3.1.0oraclejdk1.8mysql8.0.15操作系统：Macos10.151.2、软件下载https://archive.apache.org/dist/hive/https://archive.apache.org/dist/hadoop/1.3、解压tar-zxvfapache-hive-4.0.0-
Hive 分区实战指南：动态分区 vs 静态分区的深度解析自然术算 Hive面试100篇 hive hadoop 数据仓库
一、为什么需要分区？在Hive数据仓库中，表数据通常以**分区（Partition）**形式组织。想象一个存储了10年电商订单的表，如果没有分区，所有数据会集中在一个目录下：/user/hive/warehouse/orders/├──part-00000├──part-00001└──...（百万个文件）这种情况下，即使执行WHEREdt='2023-12-31'的查询，Hive也需要扫描全表数
mysql数据库学号数据类型_MySQL数据库学习笔记（二）----MySQL数据类型艾萨里昂之光 mysql数据库学号数据类型
【正文】上一章节中，我们学习了MySQL软件的安装，既然软件都装好了，现在就正式开始MySQL的基础知识的学习吧，即使是零基础，也要一步一个脚印。恩，首先要学习的就是MySQL的数据类型。一、数据类型：1、整型(xxxint)2、浮点型(float和double)3、定点数(decimal)4、字符串(char,varchar,xxxtext)5、二进制数据(xxxBlob)6、日期时间类型二、数
学习笔记——GPU 鹤岗小串 gpu算力分布式信息与通信系统架构硬件架构运维笔记
本文为学习笔记，故只对知识点依据自己的理解作概要总结，方便以后复习激活记忆。注：本文中GPU的讲解以A100型号为例，V100跟A100的架构差别不大也可适用，但是其他架构可能会有所出入。一、GPU硬件结构NVIDIAA100GPU的硬件结构HBM2：显存MemoryController：负责控制HBM2和L2Cache之间的通信High-SpeedHub：GPU总线，将NVLink、PCIE、E
侯捷 C++ 课程学习笔记：深入掌握 C++ 高阶特性 —— 实践与心得分享清水白石008 C++学习笔记课程教程 c++学习笔记
侯捷C++课程学习笔记：深入掌握C++高阶特性——实践与心得分享自从开始接触侯捷C++系列精品课程以来，我对C++语言有了全新的认识与深入理解。这套课程不仅系统地梳理了C++的基础知识，更从实际案例中展示了许多高阶特性和工程实战技巧。作为一名长期从事C++开发的专业人士，我深深感受到侯捷老师讲解中那种由浅入深、逻辑严密的魅力，也正是这种教学风格让我在短时间内掌握了不少难以琢磨的知识点。今天，我将结
jmeter安装和jmeter历史版本下载 weixin_30432007 java
一、jmete下载：1、最新版本下载地址：http://jmeter.apache.org/download_jmeter.cgi2、历史版本下载地址：https://archive.apache.org/dist/jmeter/binaries/二、软件安装及设置环境变量1、JDK安装目录在D:\ProgramFiles\Java，其环境变量设置为：JAVA_HOME值为：D:\ProgramF
达梦数据库学习笔记 lwq979991632 数据库
达梦数据库学习资料一、操作系统安装1、配置信息CPU：4核心内存：4G网络：NAT2.安装包选择选择带GUI的服务器，勾选Java平台、KDE二、安装前准备1.数据库远程访问：关闭防火墙systemctlstopfirewalld（禁用）systemctldisablefirewalld(停止，关闭开机自启动)systemctlstatusfirewalld（查看状态）2.安装gcc包rpm-qa
MySQL 到 Hadoop：Sqoop 数据迁移 ETL Ice星空 ETL
文章目录ETL：Extract-Transform-Load数据迁移过程一、Extract数据抽取1.ODS：OperationalDataStore-可操作数据存储2.DW：DataWarehouse-数据仓库3.DM：DataMart-数据集市二、Transform数据清洗和转换1.数据清洗2.数据转换三、Load数据加载四、数据迁移方法1.Sqoop1.1MySQL->Hive1.1.1im
【Azure 架构师学习笔记】- Azure Networking(1) -- Service Endpoint 和 Private Endpoint 發糞塗牆 Azure 架构师学习笔记 Azure 网络安全 azure Network
本文属于【Azure架构师学习笔记】系列。本文属于【AzureNetworking】系列。前言最近公司的安全部门在审计云环境安全性时经常提到serviceendpoint（SE）和priavateendpoint（PE）的术语，为此做了一些研究储备。云计算的本质就是网络，默认情况下资源间及外部都是通过公网也就是互联网访问。为了安全，Azure引入了SE和PE等服务。云环境网络流动主要有两个：inb
计算机基础：编码02，有符号数编码，原码水饺编程 MFC学习笔记 Win32学习笔记 c++windows mfc c语言
专栏导航本节文章分别属于《Win32学习笔记》和《MFC学习笔记》两个专栏，故划分为两个专栏导航。读者可以自行选择前往哪个专栏。（一）WIn32专栏导航上一篇：计算机基础：编码01，无符号数编码回到目录下一篇：计算机基础：编码03，根据十进制数，求其原码（二）MFC专栏导航上一篇：计算机基础：编码01，无符号数编码回到目录下一篇：计算机基础：编码03，根据十进制数，求其原码本节前言上一节，我是讲解
「Kubernetes Objects」- Service（学习笔记） @20210227 k4nzdroid
Service，服务，用于暴露Pod以供访问。官方文档及手册KubernetesAPIv1.18/Servicev1coreService?Pod会被创建，并且还会消失，这由ReplicaSets控制。每个Pod都有自己的IP地址，但是这些IP地址不能视为可靠的。那么，如果前端的一部分Pod依赖于后端的Pod，那前端的这些Pod如何找出并追踪后端的Pod？ServiceService是一个抽象，定
k8s学习笔记（3）--- kubernetes核心技术概念梦谜 k8s基础知识 k8基本核心概念
kubernetes核心技术概念1.容器（Container）2.API对象3.集群（Cluster）4.Master5.Node6.Pod7.复制控制器（ReplicationController，RC）8.副本集（ReplicaSet，RS）9.部署(Deployment)10.服务（Service）11.任务（Job）12.定时任务（CronJob）13.后台支撑服务集（DaemonSet）
关于Go那些懒得看又不得不知道的东西 Hock2024 golang 开发语言后端
写在前面当开始学习go，亦或是cpp、还是java向go进行转职，这部分内容都是比较重要的。go的编译环境，模块管理以及一些基本的语法我认为还是很有必要去学习的，因此重新学习了这个部分并且写下下面的学习笔记！如果有写错或者不全面的地方，还希望大家及时纠正和指导。连接环境首先，作为一个后端er，能使用linux系统是必备的技能，这里我建议可以使用Xshell连接云服务器的方案来完成。云服务器建议使用
Hive常用函数 - abs Called_Kingsley Hive hive 函数
Hive常用函数-abs官方解释abs(x)-returnstheabsolutevalueofx个人理解就是返回函数括号内数字的绝对值。想要获取该数的绝对值的时候就用这个函数没错使用示例selectabs(-1);>1官方示例abs(x)-returnstheabsolutevalueofxExample:>SELECTabs(0)FROMsrcLIMIT1;0>SELECTabs(-5)FRO
Eagle_Wood-滤波方式学习笔记 OverflowSummer 嵌入式泛用知识学习笔记人工智能算法嵌入式硬件笔记学习
//1.移动平均滤波器（信号处理）#defineWINDOW_SIZE5floatmoving_average(float*buffer,floatnew_sample){ staticfloatsum=0; staticintindex=0; staticfloatsamples[WINDOW_SIZE]={0}; sum-=samples[index]; samples[ind
通过启用Ranger插件的Hive审计日志同步到Doris做分析 fzip Doris Hive doris 审计 hive
以下是基于ApacheDoris的RangerHive审计日志同步方案详细步骤，结合审计日志插件与数据导入策略实现：一、Doris环境准备1.创建审计日志库表参考搜索结果的表结构设计，根据Ranger日志字段调整建表语句：CREATEDATABASEIFNOTEXISTSranger_audit;CREATETABLEIFNOTEXISTSranger_audit_hive_log(repoTyp
AWS SAP学习笔记-概念 HainesFreeman AWS aws
1、什么是ETL应用程序，举个例子说明？ETL（Extract,Transform,Load）应用程序是一种用于数据处理和迁移的工具或程序，它主要负责从多个数据源提取数据，对数据进行转换和清洗，然后将处理后的数据加载到目标数据仓库或数据库中。ETL应用程序广泛应用于数据集成、数据仓库构建、数据分析和数据迁移等场景。ETL的三个主要步骤：Extract（提取）：从各种数据源（如数据库、文件、API等
linux上安装postgresql9.5 crayon-shin-chan #postgresql surprise #linux linux ubuntu PostgreSQL 数据库
1.查看源版本czy@Mint~$sudoapt-getupdateczy@Mint~$apt-cachemadisonpostgresqlpostgresql|9.5+173ubuntu0.3|http://archive.ubuntu.com/ubuntuxenial-updates/mainamd64Packagespostgresql|9.5+173ubuntu0.3|http://arc
Effective Modern C++ 条款6：auto推导若非己愿，使用显式类型初始化惯用法举个栗子2 Effective Modern C++c++
更多C++学习笔记，关注wx公众号：cpp读书笔记Item6:Usetheexplicitlytypedinitializeridiomwhenautodeducesundesiredtypes在Item5中解释了比起显式指定类型使用auto声明变量有若干技术优势，但是有时当你想向左转auto却向右转。举个例子，假如我有一个函数，参数为Widget，返回一个std::vector，这里的bool表
Linux内核学习之 -- epoll()一族系统调用分析笔记 lagransun linux 学习笔记
背景linux4.19epoll()也是一种I/O多路复用的技术，但是完全不同于select()/poll()。更加高效，高效的原因其他博客也都提到了，这篇笔记主要是从源码的角度来分析一下实现过程。作为自己的学习笔记，分析都在代码注释中，后续回顾的时候看注释好一点。相关链接：Linux内核学习之–ARMv8架构的系统调用笔记Linux内核学习之–系统调用open()和write()的实现笔记Lin
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">