顧棟

【Hive实战】Hive的事务表

Hive Transactions

在升级到Hive 3之前，需要把在事务表上Major Compaction。主要是为了合并掉增量文件。更准确地说，自上次Major Compaction以来在其上执行过任何更新/删除/合并语句的任何分区都必须进行另一次Major Compaction。在 Hive 升级到 Hive 3 之前，此分区上不会再发生更新/删除/合并。

What is ACID and why should you use it?

ACID 代表数据库事务的四个特征

原子性（操作要么完全成功，要么失败，不会留下部分数据）、
一致性（应用程序执行操作后，该操作的结果在每个后续操作中都可见）、
隔离性（一个用户不完整的操作不会对其他用户造成意外的副作用），
持久性（一旦操作完成，它将即使面对机器或系统故障也能保留）。

直到 Hive 0.13，原子性、一致性和持久性都是在分区级别提供的。可以通过打开可用的锁定机制之一（ZooKeeper 或在内存中）来提供隔离。通过在 Hive 0.13 中添加事务，现在可以在行级别提供完整的 ACID 语义，以便一个应用程序可以添加行而另一个则从同一个分区读取数据而不会互相干扰。

具有 ACID 语义的事务已添加到 Hive 中以解决以下场景：

读写流式数据。许多用户拥有 Apache Flume、Apache Storm 或 Apache Kafka，他们用来将数据流式传输到 Hadoop 集群中。虽然这些工具可以以每秒数百行或更多行的速度写入数据，但 Hive 只能每十五分钟到一小时添加一次分区。更频繁地添加分区很快会导致表中出现大量分区。这些工具可以将数据流式传输到现有分区中，但这会导致读取器脏读（也就是说，他们会看到在开始查询后写入的数据），并在目录中留下许多小文件，这会给 NameNode 带来压力。有了这个新功能，将支持同时允许读者获得一致的数据视图并避免太多文件。
数据变化缓慢。在典型的星型数据仓库中，维度表随着时间的推移而缓慢变化。例如，零售商将开设新商店，需要将其添加到商店表中，或者现有商店可能会更改其面积或其他一些跟踪特征。这些更改会导致插入单个记录或更新记录（取决于所选的策略）。从 0.14 开始，Hive 能够支持这一点。
数据更新。有时发现收集的数据不正确并需要更正。或者，数据的第一个实例可能是近似值（90% 的服务器报告），稍后提供完整数据。或者，业务规则可能要求由于后续交易而重述某些交易（例如，在购买后，客户可以购买会员资格，从而有权享受折扣价格，包括先前购买的折扣价格）。或者，根据合同，用户可能需要在关系终止时删除其客户的数据。从 Hive 0.14 开始，这些场景可以通过 INSERT、UPDATE，和 DELETE 操作。
使用 SQL MERGE 语句进行批量更新。

Limitations 局限性

不支持手动事务。尚不支持 BEGIN、COMMIT 和 ROLLBACK。所有语言操作都是自动提交的。
只支持文件格式ORC。第一个版本仅支持 ORC 文件格式。该功能的构建使得任何存储格式都可以使用事务，这些存储格式可以确定如何将更新或删除应用于基本记录（基本上，具有显式或隐式行 ID），但到目前为止，集成工作仅针对兽人。
默认情况下，事务配置为关闭。请参阅下面的配置部分，了解需要设置哪些值来配置它。
表必须被bucketed才能使用这些功能。同一系统中不使用事务和ACID的表不需要分桶。外部表无法成为 ACID 表，因为外部表上的更改超出了压缩器的控制范围 (HIVE-13175)。
不允许从非 ACID 会话读取/写入 ACID 表。换句话说，Hive 事务管理器必须设置为 org.apache.hadoop.hive.ql.lockmgr.DbTxnManager 才能使用 ACID 表。
目前仅支持快照级别隔离。当给定查询启动时，将为其提供一致的数据快照。不支持脏读、已提交读、可重复读或可序列化。引入 BEGIN 的目的是在事务期间支持快照隔离，而不仅仅是单个查询。可以根据用户请求添加其他隔离级别。
现有的 ZooKeeper 和内存锁管理器与事务不兼容。无意解决这个问题。请参阅下面的基本设计，了解如何为事务存储锁的讨论。
ACID 表不支持使用 ALTER TABLE 进行架构更改。 HIVE-11421 正在跟踪它。已在 1.3.0/2.0.0 中修复。
使用 Oracle 作为 Metastore DB 和“datanucleus.connectionPoolingType=BONECP”可能会生成间歇性的“无此类锁…”和“无此类事务…”错误。在这种情况下，建议设置“datanucleus.connectionPoolingType=DBCP”。
事务表不支持 LOAD DATA… 语句。（直到 HIVE-16732 才正确执行此操作）

Streaming APIs

Hive提供了流式数据采集和流式数据修改的API:

Hive HCatalog Streaming API
Hive Streaming API (Since Hive 3)
HCatalog Streaming Mutation API (available in Hive 2.0.0 and later)

这两个api的比较可以在StreamingMutation文档的Background部分找到。

语法的变化

从Hive 0.14版本开始支持INSERT…VALUES, UPDATE, and DELETE 语法。详情请参阅LanguageManual DML。

为了支持ACID和事务，Hive的DDL中添加了几个新命令，另外还修改了一些现有的DDL。

新增命令SHOW TRANSACTIONS，详见SHOW TRANSACTIONS。

新增命令SHOW COMPACTIONS，详见SHOW COMPACTIONS。

SHOW LOCKS命令已被修改，以提供与事务相关的新锁的信息。如果你使用的是ZooKeeper或内存锁管理器，你会发现这个命令的输出没有什么不同。详情请参见Show Locks。

ALTER TABLE中增加了一个新选项来请求压缩表或分区。一般来说，用户不需要请求压缩，因为系统将检测到对它们的需求并启动压缩。但是，如果一个表的压缩被关闭，或者用户想在系统不愿意选择的时候压缩表，可以使用ALTER table 来启动压缩。参见Alter Table/PartitionCompact了解详细信息。这将为压缩和返回请求排队。要查看压缩的进度，用户可以使用 SHOW COMPACTIONS。

增加了一个新的命令ABORT TRANSACTIONS，详情请参见ABORT TRANSACTIONS。

Basic Design

HDFS 不支持对文内容件进行更改。面对写入器写入到用户正在读取的文件时，它也不提供读取一致性。为了在 HDFS 之上提供这些功能，我们遵循其他数据仓库工具中使用的标准方法。表或分区的数据存储在一组基本文件中。新记录、更新和删除都存储在增量文件中。为每个更改表或分区的事务（或者在 Flume 或 Storm 等流代理的情况下，为每批事务）创建一组新的增量文件。在读取时，读取器合并基本文件和增量文件，在读取时应用任何更新和删除。

Base and Delta Directories

以前，分区（或表，如果表未分区）的所有文件都位于单个目录中。通过这些更改，使用 ACID 感知写入器写入的任何分区（或表）都将具有用于基本文件的目录和用于每组增量文件的目录。对于未分区的表“t”，这可能是这样的：

Filesystem Layout for Table “t”

hive> dfs -ls -R /user/hive/warehouse/t;
drwxr-xr-x   - ekoifman staff          0 2016-06-09 17:03 /user/hive/warehouse/t/base_0000022
-rw-r--r--   1 ekoifman staff        602 2016-06-09 17:03 /user/hive/warehouse/t/base_0000022/bucket_00000
drwxr-xr-x   - ekoifman staff          0 2016-06-09 17:06 /user/hive/warehouse/t/delta_0000023_0000023_0000
-rw-r--r--   1 ekoifman staff        611 2016-06-09 17:06 /user/hive/warehouse/t/delta_0000023_0000023_0000/bucket_00000
drwxr-xr-x   - ekoifman staff          0 2016-06-09 17:07 /user/hive/warehouse/t/delta_0000024_0000024_0000
-rw-r--r--   1 ekoifman staff        610 2016-06-09 17:07 /user/hive/warehouse/t/delta_0000024_0000024_0000/bucket_00000

Compactor

Compactor 是一组在 Metastore 内运行的后台进程，用于支持 ACID 系统。它由 Initiator、Worker、Cleaner、AcidHouseKeeperService 和其他一些组件组成。

Delta File Compaction

随着操作修改表，会创建越来越多的增量文件，需要对其进行压缩以保持足够的性能。压缩分为三种类型：minor、major 和rebalance。

minor 采用一组现有的增量文件，并将它们重写为每个存储桶的单个增量文件。（将所有的增量文件合并压缩成每个存储桶一个增量文件）
major 采用一个或多个增量文件和存储桶的基本文件，并将它们重写为每个存储桶的新基本文件。主要压实成本更高，但更有效。（将基础文件和增量文件合并成新的基础文件）
有关重新平衡压缩的更多信息可以在这里找到：重新平衡压缩

所有压缩都是在后台完成的。minor 和major 不会阻止数据的并发读取和写入。重新平衡压缩使用排它写锁，因此它可以防止并发写入。压缩后，系统会等待旧文件的所有读取器完成，然后删除旧文件。

Initiator

该模块负责发现哪些表或分区需要压缩。应使用 hive.compactor.initiator.on 在 Metastore 中启用此功能。下面的“事务的新配置参数”表中有几个 *.threshold 形式的属性，用于控制何时创建压缩任务以及执行哪种类型的压缩。每个压缩任务处理 1 个分区（如果表未分区，则处理整个表）。如果给定分区的连续压缩失败次数超过 hive.compactor.initiator.failed.compacts.threshold，则该分区的自动压缩调度将停止。有关详细信息，请参阅配置参数表。

Worker

每个 Worker 处理一个压缩任务。压缩是一个 MapReduce 作业，其名称采用以下形式：<主机名>-compactor-.

.。每个worker将作业提交到集群（通过 hive.compactor.job.queue 如果已定义）并等待作业完成。 hive.compactor.worker.threads 确定每个 Metastore 中的 Worker 数量。 Hive仓库中的Worker总数决定了并发compaction的最大数量。

Cleaner

清理不需要的增量文件的模块。

AcidHouseKeeperService

此过程查找在 hive.txn.timeout 时间内未检测到的事务并中止它们。系统假设发起事务的客户端停止心跳崩溃并且其锁定的资源应该被释放。

SHOW COMPACTIONS

此命令显示有关当前运行的压缩和最近的压缩历史记录（可配置的保留期）的信息。此历史记录显示自 HIVE-12353 起可用。

另请参阅 LanguageManual DDL#ShowCompactions 了解有关此命令输出的更多信息和 NewConfigurationParametersforTransactions/Compaction History 了解影响此命令输出的配置属性。系统保留每种类型的最后 N 个条目：failed、succeeded、attempted （其中 N 可以为每种类型配置）。

Transaction/Lock Manager

添加了一个名为“事务管理器”的新逻辑实体，它合并了之前的“数据库/表/分区锁管理器”概念（hive.lock.manager，默认为 org.apache.hadoop.hive.ql.lockmgr.zookeeper.ZooKeeperHiveLockManager）。事务管理器现在还负责管理事务锁。默认的 DummyTxnManager 模拟旧 Hive 版本的行为：没有事务并使用 hive.lock.manager 属性为表、分区和数据库创建锁管理器。新添加的 DbTxnManager 使用 DbLockManager 管理 Hive 元存储中的所有锁/事务（事务和锁在服务器故障时是持久的）。这意味着启用事务后，ZooKeeper 中以前的锁定行为将不再存在。为了避免客户端死亡并导致事务或锁悬空，锁持有者和事务发起者会定期向元存储发送心跳。如果在配置的时间内未收到心跳，锁定或事务将被中止。

从 Hive 1.3.0 开始，DbLockManger 继续尝试获取锁的时间长度可以通过 hive.locknumretires和hive.lock.sleep.Between.retries控制 .。当DbLockManager无法获取锁时（由于存在竞争锁），它将后退并在一段时间后重试。为了支持短时间运行的查询并且同时不会压垮元存储，DbLockManager 将在每次重试后将等待时间加倍。初始回退时间为 100 毫秒，并受 hive.lock.sleep. Between.retries 限制。 hive.lock.numretries 是重试给定锁定请求的总次数。因此，获取锁的调用将阻塞的总时间（给定 100 次重试和 60 秒睡眠时间的值）为 (100ms + 200ms + 400ms + … + 51200ms + 60s + 60s + … + 60s) = 91m： 42秒：300毫秒。

有关此锁管理器使用的锁的更多详细信息。

请注意，DbTxnManager 使用的锁管理器将获取所有表上的锁，甚至是那些没有“transactional=true”属性的表。默认情况下，对非事务表的插入操作将获取排他锁，从而阻止其他插入和读取。虽然技术上是正确的，但这与 Hive 传统的工作方式（即没有锁管理器）不同。为了向后兼容，提供了 [hive.txn.strict.locking.mode](http://configuration properties/#hive.txn.strict.locking.mode) （见下表），这将使该锁管理器获取共享锁非事务表上的插入操作。这会恢复以前的语义，同时仍然提供锁管理器的好处，例如防止表在读取时被删除。请注意，对于事务表，insert 始终会获取共享锁，因为这些表在存储层实现了 MVCC 架构，即使存在并发修改操作也能够提供强读一致性（快照隔离）。

Configuration

必须正确设置这些配置参数才能在 Hive 中打开事务支持：

Client Side

hive.support.concurrency – true
hive.enforce.bucketing – true (Not required as of Hive 2.0)
hive.exec.dynamic.partition.mode – nonstrict
hive.txn.manager – org.apache.hadoop.hive.ql.lockmgr.DbTxnManager

Server Side (Metastore)

hive.compactor.initiator.on – true (See table below for more details)
hive.compactor.cleaner.on – true (See table below for more details)
hive.compactor.worker.threads – a positive number on at least one instance of the Thrift metastore service

以下部分列出了影响 Hive 事务和压缩的所有配置参数。另请参阅上面的限制和表属性如下。

New Configuration Parameters for Transactions

系统中添加了许多新的配置参数以支持事务。

Configuration key	Values	Location	Notes
hive.txn.manager	Default: org.apache.hadoop.hive.ql.lockmgr.DummyTxnManagerValue required for transactions: org.apache.hadoop.hive.ql.lockmgr.DbTxnManager	Client/ HiveServer2	DummyTxnManager replicates pre Hive-0.13 behavior and provides no transactions.DummyTxnManager 复制 Hive-0.13 之前的行为并且不提供事务。
hive.txn.strict.locking.mode	Default: true	Client/ HiveServer2	In strict mode non-ACID resources use standard R/W lock semantics, e.g. INSERT will acquire exclusive lock. In non-strict mode, for non-ACID resources, INSERT will only acquire shared lock, which allows two concurrent writes to the same partition but still lets lock manager prevent DROP TABLE etc. when the table is being written to (as of Hive 2.2.0).在严格模式下，非 ACID 资源使用标准 R/W 锁语义，例如 INSERT 将获取独占锁。在非严格模式下，对于非 ACID 资源，INSERT 将仅获取共享锁，这允许对同一分区进行两个并发写入，但仍然允许锁管理器在写入表时阻止 DROP TABLE 等操作（从 Hive 2.2.0)。
hive.txn.timeout	Default: 300	Client/ HiveServer2/Metastore	如果客户端未发送心跳，则声明事务中止的时间（以秒为单位）。至关重要的是，该属性对于所有组件/服务都具有相同的值。 $^5$
hive.txn.heartbeat.threadpool.size	Default: 5	Client/HiveServer2	The number of threads to use for heartbeating (as of Hive 1.3.0 and 2.0.0).用于检测信号的线程数（从 Hive 1.3.0 和 2.0.0 开始）。
hive.timedout.txn.reaper.start	Default: 100s	Metastore	Time delay of first reaper (the process which aborts timed-out transactions) run after the metastore starts (as of Hive 1.3.0). Controls AcidHouseKeeperServcie above.第一个收割机（中止超时事务的进程）的时间延迟在 Metastore 启动后运行（从 Hive 1.3.0 开始）。控制上面的 AcidHouseKeeperServcie。
hive.timedout.txn.reaper.interval	Default: 180s	Metastore	Time interval describing how often the reaper (the process which aborts timed-out transactions) runs (as of Hive 1.3.0). Controls AcidHouseKeeperServcie above.描述收割机（中止超时事务的进程）运行频率的时间间隔（从 Hive 1.3.0 开始）。控制上面的 AcidHouseKeeperServcie。
hive.txn.max.open.batch	Default: 1000	Client	Maximum number of transactions that can be fetched in one call to open_txns().1一次调用 open_txns(). $^1$ 可以获取的最大交易数量
hive.max.open.txns	Default: 100000	HiveServer2/ Metastore	Maximum number of open transactions. If current open transactions reach this limit, future open transaction requests will be rejected, until the number goes below the limit. (As of Hive 1.3.0 and 2.1.0.)未结交易的最大数量。如果当前未结交易达到此限制，则未来的未结交易请求将被拒绝，直到数量低于该限制。（从 Hive 1.3.0 和 2.1.0 开始。）
hive.count.open.txns.interval	Default: 1s	HiveServer2/ Metastore	Time in seconds between checks to count open transactions (as of Hive 1.3.0 and 2.1.0).对打开的事务进行计数的检查之间的时间（以秒为单位）（从 Hive 1.3.0 和 2.1.0 开始）。
hive.txn.retryable.sqlex.regex	Default: “” (empty string)	HiveServer2/ Metastore	Comma separated list of regular expression patterns for SQL state, error code, and error message of retryable SQLExceptions, that’s suitable for the Hive metastore database (as of Hive 1.3.0 and 2.1.0).For an example, see Configuration Properties.用于 SQL 状态、错误代码和可重试 SQLException 的错误消息的逗号分隔正则表达式模式列表，适用于 Hive 元存储数据库。
hive.compactor.initiator.on	Default: falseValue required for transactions: true (for exactly one instance of the Thrift metastore service)	Metastore	Whether to run the initiator thread on this metastore instance. Prior to Hive 1.3.0 it’s critical that this is enabled on exactly one standalone metastore service instance (not enforced yet).As of Hive 1.3.0 this property may be enabled on any number of standalone metastore instances.是否在此元存储实例上运行启动器线程。在 Hive 1.3.0 之前，必须在一个独立元存储服务实例上启用此功能（尚未强制执行）。从 Hive 1.3.0 可以在任意数量的独立元存储实例上启用此属性。
hive.compactor.cleaner.on	Default: falseValue required for transactions: true (for exactly one instance of the Thrift metastore service)	Metastore	Whether to run the cleaner thread on this metastore instance.Before Hive 4.0.0 Cleaner thread can be started/stopped with config hive.compactor.initiator.on. This config helps to enable/disable initiator/cleaner threads independently是否在此 Metastore 实例上运行 Cleaner 线程。在 Hive 4.0.0 之前，可以使用配置 hive.compactor.initiator.on 启动/停止 Cleaner 线程。此配置有助于独立启用/禁用启动器/清理器线程
hive.compactor.worker.threads	Default: 0Value required for transactions: > 0 on at least one instance of the Thrift metastore service	Metastore	How many compactor worker threads to run on this metastore instance.2在此元存储实例上运行多少个压缩器工作线程。 $^2$
hive.compactor.worker.timeout	Default: 86400	Metastore	Time in seconds after which a compaction job will be declared failed and the compaction re-queued.以秒为单位的时间，之后压缩作业将被声明失败并重新排队。
hive.compactor.cleaner.run.interval	Default: 5000	Metastore	Time in milliseconds between runs of the cleaner thread. (Hive 0.14.0 and later.)清洁器线程运行之间的时间（以毫秒为单位）。（Hive 0.14.0 及更高版本。）
hive.compactor.check.interval	Default: 300	Metastore	Time in seconds between checks to see if any tables or partitions need to be compacted.3检查是否需要压缩任何表或分区的时间间隔（以秒为单位）。 $^3$
hive.compactor.delta.num.threshold	Default: 10	Metastore	Number of delta directories in a table or partition that will trigger a minor compaction.表或分区中将触发次要压缩的增量目录数。
hive.compactor.delta.pct.threshold	Default: 0.1	Metastore	Percentage (fractional) size of the delta files relative to the base that will trigger a major compaction. 1 = 100%, so the default 0.1 = 10%.增量文件相对于将触发主要压缩的基础的百分比（分数）大小。 1 = 100%，因此默认 0.1 = 10%。
hive.compactor.abortedtxn.threshold	Default: 1000	Metastore	Number of aborted transactions involving a given table or partition that will trigger a major compaction.涉及将触发主要压缩的给定表或分区的中止事务数。
hive.compactor.aborted.txn.time.threshold	Default: 12h	Metastore	Age of table/partition’s oldest aborted transaction when compaction will be triggered. Default time unit is: hours. Set to a negative number to disable.触发压缩时表/分区最旧的中止事务的年龄。默认时间单位是：小时。设置为负数即可禁用
hive.compactor.max.num.delta	Default: 500	Metastore	Maximum number of delta files that the compactor will attempt to handle in a single job (as of Hive 1.3.0).4压缩器在单个作业中尝试处理的增量文件的最大数量（从 Hive 1.3.0 开始）。 $^4$
hive.compactor.job.queue	Default: “” (empty string)	Metastore	Used to specify name of Hadoop queue to which Compaction jobs will be submitted. Set to empty string to let Hadoop choose the queue (as of Hive 1.3.0).用于指定将向其提交压缩作业的 Hadoop 队列的名称。设置为空字符串以让 Hadoop 选择队列（从 Hive 1.3.0 开始）。
Compaction History
hive.compactor.history.retention.succeeded	Default: 3	Metastore	Number of successful compaction entries to retain in history (per partition).要保留在历史记录中的成功压缩条目数（每个分区）。
hive.compactor.history.retention.failed	Default: 3	Metastore	Number of failed compaction entries to retain in history (per partition).要保留在历史记录中的失败压缩条目数（每个分区）。
hive.compactor.history.retention.attempted	Default: 2	Metastore	Number of attempted compaction entries to retain in history (per partition).要保留在历史记录中的尝试压缩条目数（每个分区）。
hive.compactor.initiator.failed.compacts.threshold	Default: 2	Metastore	Number of of consecutive failed compactions for a given partition after which the Initiator will stop attempting to schedule compactions automatically. It is still possible to use ALTER TABLE to initiate compaction. Once a manually initiated compaction succeeds auto initiated compactions will resume. Note that this must be less than hive.compactor.history.retention.failed.给定分区连续失败的压缩次数，之后启动器将停止尝试自动安排压缩。仍然可以使用ALTER TABLE来启动压缩。一旦手动启动的压缩成功，自动启动的压缩将恢复。请注意，该值必须小于 hive.compactor.history.retention.failed。
hive.compactor.history.reaper.interval	Default: 2m	Metastore	Controls how often the process to purge historical record of compactions runs.控制清除压缩历史记录的进程运行的频率。

$^1$ hive.txn.max.open.batch 控制同时打开 Flume 或 Storm 等流代理的事务数量。然后，流代理将该数量的条目写入单个文件（每个 Flume 代理或 Storm Bolt）。因此，增加此值会减少流代理创建的增量文件的数量。但它也会增加 Hive 在任何给定时间必须跟踪的打开事务的数量，这可能会对读取性能产生负面影响。

$^2$ 工作线程生成 MapReduce 作业来执行压缩。他们自己不进行压实。一旦确定需要压缩，增加工作线程的数量将减少表或分区的压缩时间。随着更多 MapReduce 作业在后台运行，它还会增加 Hadoop 集群的后台负载。每次压缩一次可以处理一个分区（如果未分区，则可以处理整个表）。

$^3$ 减小该值将减少需要压缩的表或分区开始压缩所需的时间。然而，检查是否需要压缩需要对自上次主要压缩以来已在其上完成事务的每个表或分区多次调用 NameNode。所以减小这个值会增加NameNode的负载。

$^4$ 如果压缩器检测到非常多的增量文件，它将首先运行几个部分次要压缩（当前是顺序的），然后执行实际请求的压缩。

$^5$ 如果该值不同，则活动事务可能会被确定为“超时”并因此被中止。这将导致诸如“没有这样的事务…”、“没有这样的锁…”之类的错误

Configuration Values to Set for INSERT, UPDATE, DELETE

除了上面列出的新参数之外，还需要设置一些现有参数以支持 INSERT … VALUES、UPDATE、 和 DELETE。

Configuration key	Must be set to
hive.support.concurrency	true (default is false)
hive.enforce.bucketing	true (default is false) (Not required as of Hive 2.0)
hive.exec.dynamic.partition.mode	nonstrict (default is strict)

Configuration Values to Set for Compaction

如果系统中的数据不属于 Hive 用户（即 Hive 元存储运行的用户），则 Hive 将需要以拥有数据的用户身份运行才能执行压缩。如果您已经设置 HiveServer2 来模拟用户，那么唯一需要做的额外工作就是确保 Hive 有权从运行 Hive 元存储的主机模拟用户。这是通过将主机名添加到 Hadoop 的core-site.xml文件中的hadoop.proxyuser.hive.hosts来完成的。如果您尚未执行此操作，则需要将 Hive 配置为充当代理用户。这需要您为运行 Hive 元存储的用户设置密钥表，并将hadoop.proxyuser.hive.hosts和hadoop.proxyuser.hive.groups添加到 Hadoop 的core-site.xml文件中。请参阅有关您的 Hadoop 版本的安全模式的 Hadoop 文档（例如，对于 Hadoop 2.5.1，它位于 Hadoop in Secure Mode)。

Compaction pooling

有关压缩池的更多信息可以在这里找到：压缩池

Table Properties

如果要在 ACID 写入（插入、更新、删除）中使用表，则必须在该表上设置表属性“transactional=true”，从 Hive 0.14.0。请注意，一旦通过 TBLPROPERTIES (“transactional”=“true”) 将表定义为 ACID 表，它就无法转换回非 ACID 表，即更改 TBLPROPERTIES (“transactional”=“false”) 是不允许。另外，hive.txn.manager必须设置为org.apache.hadoop.hive.ql.lockmgr.DbTxnManager 在 hive-site.xml 中或在运行任何查询之前的会话开始时。如果没有这些，插入将以旧样式完成； HIVE-11716 之前将禁止更新和删除。由于 HIVE-11716，不允许在没有 DbTxnManager 的情况下对 ACID 表进行操作。但是，这不适用于 Hive 0.13.0。

如果表所有者不希望系统自动确定何时压缩，则可以设置表属性“NO_AUTO_COMPACTION”。这将阻止所有自动压缩。手动压缩仍然可以使用 Alter Table/Partition Compact 语句来完成。

创建或更改表时，使用 TBLPROPERTIES 子句设置表属性，如创建表中所述，并且 Hive 数据定义语言的更改表属性部分。 “transactional”和“NO_AUTO_COMPACTION”表属性在 Hive 版本 0.x 和 1.0 中区分大小写，但从版本 1.1.0 开始不区分大小写 (HIVE-8308)。

从 Hive 1.3.0 和 2.1.0 开始，可以通过 TBLPROPERTIES 设置更多与压缩相关的选项。它们可以通过 CREATE TABLE 在表级别设置，并通过请求级别设置更改表/分区紧凑。这些用于覆盖仓库/表范围的设置。例如，要覆盖 MR 属性以影响压缩作业，可以在 CREATE TABLE 语句中或通过 ALTER TABLE 显式启动压缩时添加compactor.=。 =<值>将在压缩 MR 作业的 JobConf 上设置。类似地，“tblprops.=”可用于设置/覆盖由集群上运行的代码解释的任何表属性。最后，compactorthreshold.=可用于覆盖上面以.threshold结尾的“事务的新配置参数”表中的属性，并控制系统何时触发压缩。例子：

示例：在表级别的 TBLPROPERTIES 中设置压缩选项

CREATE TABLE table_name (
  id                int,
  name              string
)
CLUSTERED BY (id) INTO 2 BUCKETS STORED AS ORC
TBLPROPERTIES ("transactional"="true",
  "compactor.mapreduce.map.memory.mb"="2048",     -- specify compaction map job properties
  "compactorthreshold.hive.compactor.delta.num.threshold"="4",  -- trigger minor compaction if there are more than 4 delta directories
  "compactorthreshold.hive.compactor.delta.pct.threshold"="0.5" -- trigger major compaction if the ratio of size of delta files to
                                                                   -- size of base files is greater than 50%
);

示例：在请求级别设置 TBLPROPERTIES 中的压缩选项

ALTER TABLE table_name COMPACT 'minor' 
   WITH OVERWRITE TBLPROPERTIES ("compactor.mapreduce.map.memory.mb"="3072");  -- specify compaction map job properties
ALTER TABLE table_name COMPACT 'major'
   WITH OVERWRITE TBLPROPERTIES ("tblprops.orc.compress.size"="8192");         -- change any other Hive table properties

需要关注的
重新平衡压缩

锁相关。

你可能感兴趣的:(hive,hadoop,数据仓库)

C++11中的std::function
文章转载自：http://www.jellythink.com/archives/771看看这段代码先来看看下面这两行代码：std::functiononKeyPressed;std::functiononKeyReleased;这两行代码是从Cocos2d-x中摘出来的，重点是这两行代码的定义啊。std::function这是什么东西？如果你对上述两行代码表示毫无压力，那就不妨再看看本文，就当温
ETL可视化工具 DataX -- 简介( 一) dazhong2012 软件工具数据仓库 datax ETL
引言DataX系列文章：ETL可视化工具DataX–安装部署(二)ETL可视化工具DataX–DataX-Web安装(三)1.1DataX1.1.1DataX概览DataX是阿里云DataWorks数据集成的开源版本，在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、
AWS 管理秘籍（一）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/cf1c4e1db999839ba88fc56df4011156译者：飞龙协议：CCBY-NC-SA4.0序言AWS平台的增长速度非常快，正在被各行各业广泛采用。正如俗话所说，朋友不会让朋友建立数据中心。不管从哪个角度看，按需计算、网络和存储的模式将持续存在。尤其是当你看到AWS平台在功能和增强方面的更新速度时，很难再去反对站在巨人的肩膀上，尤其是
AWS Terraform 架构指南（二）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/8b2d222956a050c7632b9eee086dadcf译者：飞龙协议：CCBY-NC-SA4.0第七章：7在项目中实现Terraform您准备好开始使用Terraform开发您的AWS基础设施了吗？在本章中，您将学习Terraform的基础知识，并了解如何在AWS中部署您的第一个模板。我们将介绍选择合适的AWS提供商和选择满足您项目需求的
Hive简介
文章目录Hive简介Hive特点Hive和RDBMS的对比Hive的架构Hive的数据组织Hive数据类型Hive简介1、Hive由Facebook实现并开源2、是基于Hadoop的一个数据仓库工具3、可以将结构化的数据映射为一张数据库表4、并提供HQL(HiveSQL)查询功能5、底层数据是存储在HDFS上6、Hive的本质是将SQL语句转换为MapReduce任务运行7、使不熟悉MapRedu
精益敏捷之道（一）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/0b2addbef6e2afb0ce49d44d7300959a译者：飞龙协议：CCBY-NC-SA4.0前言“精益敏捷之道：通过价值流管理释放企业潜力”一书源于首席作者塞西尔·‘加里’·鲁普与尊敬的同事理查德·克纳斯特、史蒂夫·佩雷拉和艾尔·沙洛韦的合作努力。他们的目标是为IT专家、商业专业人士以及各行业和组织的领域专家提供一本关于现代精益敏捷和
Python DevOps 实用指南（一）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/0228db3442938136abc9262d5596d201译者：飞龙协议：CCBY-NC-SA4.0序言欢迎阅读本书！让我们来谈谈本书的内容以及你将从中学到的东西。本书涉及两件事：DevOps和Python。它讲述了这两者是如何相互作用的——无论你称它们为实体、哲学、框架，或者其他任何名称。本书将帮助你在技术层面上理解Python，同时也在概
Python 取证学习指南第二版（一）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/46c71d4b3d6fceaba506eebc55284aa5译者：飞龙协议：CCBY-NC-SA4.0前言在编写《学习Python取证》一书时，我们有一个目标：以一种方式教授Python在取证中的应用，使得没有编程经验的读者可以立即跟随并开发出可以用于案件工作中的实用代码。但这并不意味着本书仅适合Python新手；在整个过程中，我们会逐步让读者
Python 取证学习指南第二版（三）
原文：annas-archive.org/md5/46c71d4b3d6fceaba506eebc55284aa5译者：飞龙协议：CCBY-NC-SA4.0第七章：模糊哈希哈希是DFIR中最常见的处理过程之一。这个过程允许我们总结文件内容，并分配一个代表文件内容的独特且可重复的签名。我们通常使用MD5、SHA1和SHA256等算法对文件和内容进行哈希。这些哈希算法非常有价值，因为我们可以用它们进行
低版本hive(1.2.1)UDF实现清除历史分区数据 ༺水墨石༻ hive hive UDF hive hadoop 数据仓库
目标：通过UDF实现对表历史数据清除入参：表名、保留天数N一、pom文件4.0.0com.examplehive-udf-example1.0-SNAPSHOTjarhive-udf-exampleHiveUDFfordeletingpartitionsbydateUTF-81.81.8org.apache.hivehive-exec1.2.1org.apache.hivehive-metasto
shell脚本实现Hive库表迁移 docsz hive Linux shell
1、获取hive所有库的建表语句#获取hive所有库的建表语句#!/bin/bashmkdir-p~/hive/tables/tablesDDL#获取库名hive-e"showdatabases;">~/hive/databases.txtsed-i'1,3d'~/hive/databases.txtsed-i'$d'~/hive/databases.txtcat~/hive/databases.
python基于Hadoop的NBA球员大数据分析与可视化系统
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
大数据技术之集群数据迁移
dfs.namenode.rpc-address.nameservice1.namenode30hadoop104:8020dfs.namenode.rpc-address.nameservice1.namenode37hadoop106:8020dfs.namenode.http-address.nameservice1.namenode30hadoop104:9870dfs.namenode.
HIVE（二） 2301_78012738 hive 数据仓库
目录访问HIVE的三种方式DDLDML数据操作向表中装载数据数据导出常用函数Like和RLike分组Join排序分区表和分桶表访问HIVE的三种方式启动Hive命令，CtrlC退出客户端，执行测试语句，与sql一致[wyc@hadoop102hive]$bin/hive经验小结：在hive中执行语句报错：ExecutionError,returncode2fromorg.apache.hadoop
debian 安装 mysql5.7 你会忘记吃饭吗 debian 运维
cd/usr/local/src:wgethttps://downloads.mysql.com/archives/get/p/23/file/mysql-server_5.7.29-1debian10_amd64.deb-bundle.tartar-xvfxx.tarcdxx:执行dpkg-imysql-community-client_5.7.29-1debian10_amd64.deb返回S
HTB academy -- Linux Privilege Escalation --Service-based Privilege Escalation 网络安全小吗喽 linux 服务器网络安全测试工具
VulnerableServices#!/bin/bash#screenroot.sh#setuidscreenv4.5.0localrootexploit#abusesld.so.preloadoverwritingtogetroot.#bug:https://lists.gnu.org/archive/html/screen-devel/2017-01/msg00025.html#HACKTH
Python 强化学习算法实用指南（三）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/e3819a6747796b03b9288831f4e2b00c译者：飞龙协议：CCBY-NC-SA4.0第十一章：理解黑盒优化算法在前几章中，我们研究了强化学习（RL）算法，从基于价值的方法到基于策略的方法，以及从无模型方法到基于模型的方法。在本章中，我们将提供另一种解决序列任务的方法，那就是使用一类黑盒算法——进化算法（EA）。EAs由进化机制
安全运维的 “五层防护”：构建全方位安全体系 KKKlucifer 安全运维
在数字化运维场景中，异构系统复杂、攻击手段隐蔽等挑战日益突出。保旺达基于“全域纳管-身份认证-行为监测-自动响应-审计溯源”的五层防护架构，融合AI、零信任等技术，构建全链路安全运维体系，以下从技术逻辑与实践落地展开解析：第一层：全域资产纳管——筑牢安全根基挑战云网基础设施包含分布式计算（Hadoop/Spark）、数据流处理（Storm/Flink）等异构组件，通信协议繁杂，传统方案难以全面纳管
Python 强化学习算法实用指南（二）
原文：annas-archive.org/md5/e3819a6747796b03b9288831f4e2b00c译者：飞龙协议：CCBY-NC-SA4.0第六章：学习随机优化与PG优化到目前为止，我们已经探讨并开发了基于价值的强化学习算法。这些算法通过学习一个价值函数来找到一个好的策略。尽管它们表现良好，但它们的应用受限于一些内在的限制。在本章中，我们将介绍一类新的算法——策略梯度方法，它们通过
ftp文件服务器有连接数限制,查看ftp服务器连接数命令赵承铭 ftp文件服务器有连接数限制
查看ftp服务器连接数命令内容精选换一换本章节适用于MRS3.x之前版本。Loader支持以下多种连接，每种连接的配置介绍可根据本章节内容了解。obs-connectorgeneric-jdbc-connectorftp-connector或sftp-connectorhbase-connector、hdfs-connector或hive-connectorOBS连接是Loa“数据导入”章节适用于
android nodejs cike110120
本文参照了http://www.blogjava.net/jelver/articles/143082.html，http://www.blogjava.net/athrunwang/archive/2011/09/28/359680.html，《androidSDK开发范例大全(第2版)》上次做了一个demo，试验如何用node.js响应getpost请求，http请求使用的浏览器。我现在正在学
CYW43: 无线网络开发套件指南阮曦薇Joe
CYW43:无线网络开发套件指南cyw43ARCHIVED--movedintothemainEmbassyrepoathttps://github.com/embassy-rs/embassy项目地址:https://gitcode.com/gh_mirrors/cy/cyw43项目介绍CYW43是一个基于Rust的开源项目，专门用于驱动CypressCYW43xx系列WiFi和蓝牙芯片。它提供
spring-data-jpa+spring+hibernate+druid配置
参考链接：http://doc.okbase.net/liuyitian/archive/109276.htmlhttp://my.oschina.net/u/1859292/blog/312188最新公司的web项目需要用到spring-data-jpa作为JPA的实现框架，同时使用阿里巴巴的开源数据库连接池druid。关于这两种框架的介绍我在这里就不多赘述。直接进入配置页面：spring的配置
Hive 事务表(ACID)问题梳理
文章目录问题描述分析原因什么是事务表概念事务表和普通内部表的区别相关配置事务表的适用场景注意事项设计原理与实现文件管理格式参考博客问题描述工作中需要使用pyspark读取Hive中的数据，但是发现可以获取metastore，外部表的数据可以读取，内部表数据有些表报错信息是：AnalysisException:org.apache.hadoop.hive.ql.metadata.HiveExcept
Hive适用语法 `whyYa hive hadoop 数据仓库
一、日期处理函数总结1.trunc()–取日期中当月第一天trunc(‘2022-12-05’,‘MM’)--取当月第一天2022-12-01trunc(‘2022-12-05’,‘Q’)--季度中的第一天2022-10-01trunc(‘2022-12-03’,‘YEAR’)–取当年第一天20222.last_day()–取当月最后一天last_day(‘2022-12-03’)3.month(
debian安装docker Sahas1019 debian docker eureka
debian安装docker/dev/null对于Debian11(bullseye)或更新版本：echo\"deb[arch=$(dpkg--print-architecture)signed-by=/usr/share/keyrings/docker-archive-keyring.gpg]https://download.docker.com/linux/debian\$(lsb_relea
Ubuntu22.04安装cudnn详细步骤大鹏的NLP博客深度学习 cudnn
下载指定版本的cudnnhttps://developer.nvidia.com/rdp/cudnn-archive#a-collapse804-111安装sudodpkg-icudnn-local-repo-ubuntu2204-8.9.7.29_1.0-1_amd64.deb根据上步提示：sudocp/var/cudnn-local-repo-ubuntu2204-8.9.7.29/cudnn
Docker安装部署MySQL+Canal+Kafka+Camus+HIVE数据实时同步是小南啊_- Java java centos docker kafka hadoop
因为公司业务需求要将mysql的数据实时同步到hive中，在网上找到一套可用的方案，即MySQL+Canal+Kafka+Camus+HIVE的数据流通方式，因为是首次搭建，所以暂时使用伪分布式的搭建方案。一、安装docker安装docker的教程网上一搜一大把,请参考：centos下docker安装教程二、docker安装MySQL安装教程网上也有很多，请参考:docker安装MySQL1.开启
assembly : maven assembly打包报错：maven to create assembly : unable to obtain archiver for extension 九师兄工具-maven
原因是没有添加org.apache.maven.plugins<artifactId
【面试系列】C++ 高频面试题野老杂谈全网最全IT公司面试宝典 c++面试编程语言
欢迎来到我的博客，很高兴能够在这里和您见面！欢迎订阅相关专栏：⭐️全网最全IT互联网公司面试宝典：收集整理全网各大IT互联网公司技术、项目、HR面试真题.⭐️AIGC时代的创新与未来：详细讲解AIGC的概念、核心技术、应用领域等内容。⭐️全流程数据技术实战指南：全面讲解从数据采集到数据可视化的整个过程，掌握构建现代化数据平台和数据仓库的核心技术和方法。文章目录C++初级面试题及其详细解答1.解释C
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多