jiadebin890724

Cloudera Impala官方文档中文翻译-2（Using Impala to Query HBase Tables）

Using Impala to QueryHBase Tables（利用impala查询HBase Tables）

默认情况下，impalatable使用存储在HDFS中的数据文件，这种存储方式适用于批量数据加载和查询（bulk loads and query）。相反，HBase可以对用于OLTP风格的负载的数据进行高效率查询，比如查找单个row或者一个range的values。

对于impala用户来说，HBase是key-value存储形式的数据库，value包含多个fields。Key在impala table中被map到某一个column，而value的各个fields被map到impala table的其他columns。

Overview of Using HBasewith Impala（概览）

使用impala withHBase时：

l 使用Hive shell创建table

A、可以使用STORED BY

‘org.apache.hadoop.hive.hbase.HBaseStorageHandler ‘语句

B、直接把impala table map到一个已有的HBase table中

l Map到HBase row key的impala column必须是string类型的

l 由于impala和hive共享metastore，一旦在hive中创建table后，在impalashell中使用INVALIDATE METADATA语句刷新即可看到新的table

l 在impala中查询HBase数据时，尽量使用WHERE从句定位单个key或者一个key range，这样可以提高查询效率，全表scan对于HBase效率很低

确保impala user具有对HBasetable的read/write权限。

Configuring HBase for Usewith Impala（配置）

HBase在Impala Box之外工作，没有强制需要的配置。

为了避免在HBase不可用的情况下，impala启动或者更新元数据的延迟，Cloudera建议设置timeoutvalue在/etc/impala/conf/hbase-site.xml中（在非Cloudera Manager的环境下才需要）：

<property>
  <name>hbase.client.retries.number</name>
  <value>3</value>
</property>
<property>
  <name>hbase.rpc.timeout</name>
  <value>3000</value>
</property>

目前，ClouderaManager并不提供仅针对impala的HBase特有配置文件，所以你在Cloudera Manager中进行的任何的HBase配置更改都会在所有的HBase applications中生效。因此，这个timeout配置不建议在cloudera manager中设置。

Supported Data Types forHBase Columns（针对HBase列支持的数据类型）

为了弄清Impalacolumn数据如何映射到HBase中的字段（field），你应该有一些关于HBase的背景知识。在Hive shell中利用CREATE TABLE语句设置映射关系。见theHive wiki作为起点，Examples of Querying HBase Tables from Impala作为例子。

HBase作为一种“bitbucket”进行工作，它并不强制要求对key或者value字段输入值，所有的强制输入都是在Impala这边进行的。

为了在impala查询HBase时获得最好的性能，大多数查询会在WHERE中的column对应的row key进行比较操作。当在Hive shell中创建table时，把映射为HBase row key列的那一列设置为STRING类型。Impala可以把针对某个column的条件测试（例如操作符=, <, BETWEEN, 和IN）翻译成HBase中的快速查找，但是这个优化（predicate push down即谓词下推）仅当列为STRING类型时才有效。

从Impala 1.1开始，Impala也支持读写在HiveCREATE TABLE语句中定义的二进制类型的列，即在Hive table中使用#binary定义（通常简写为#b）。定义数值column为二进制类型通常可以降低其在HBase table中的空间占用。

切记Row key列定义成string类型的，这样可以进行快速查找。其他列可以为binary类型的，这样可以节省存储空间。

Performance Considerationsfor the Impala-HBase Integration（性能考虑）

为了理解HBase上进行SQL查询的性能特点，你应该有一些相关的背景知识。可以以 the Hive wiki为起点，因为Impala与Hive共享同一个metastore，所以Hive table到HBase table的列映射信息也适用于Impala。

Impala使用HBaseclient API通过JNI来查询HBase的数据。查询不直接读HFiles。额外的通信开销使得选择将数据存储在HBase还是HDFS变得很重要，同时构造高效的查询可以高效地获取HBase数据也变得很重要。

l 使用HBase table用来进行singlerow或者一个range of rows的查询，而不是scan entire table的query（如果query中不包含WHERE从句，说明很可能它对于HBase table是低效率的）

l 如果你做一个join查询，在一个大的facttable上做汇总操作，然后将结果与一个小维度的table进行join操作，考虑使用Impala存储fact table，并且HBase存储这个小维度table（因为Impala在这种情况下会对HBase table进行全表scan，而不是做single-row的HBase查找，基于这个join column，只有在HBase table足够小的情况下，全表扫描才不至于时间过长，这样才不会出现查询性能瓶颈）

Query predicates（谓词、判断）用来表示row key的start和stop key，从而限制了lookup操作的scope。如果row key不对应string类型的列，那么通常是无法正确排序的，因为comparison操作无法正常进行。

Non-key列的谓词判断被发送到HBase作为SingleColumnValueFilters进行scan，提供一些性能提升。这种情况下，HBase比在impala中使用相同的谓词返回更少的行（？这句没看懂）。尽管non-key列谓词的使用会有一些性能提升，但是这种提升与使用row-key谓词的情况相比还是微不足道的。因为这种情况下，HBase要扫描的总行数依然是没有限制的。只要有row key的predicate，那么HBase就能快速定位并返回那一行，相反的是，如果只有non-key的predicate，那么即使查询结果只有一行，HBase也要进行全表scan。

Interpreting EXPLAINOutput for HBase Queries（理解EXPLAIN语句的输出）

例如，这有一些针对Impalatable（已经映射到HBase table）的查询。例子中展示了除了EXPLAIN语句的输出，还可以看到根据哪些信息可以预知该查询针对HBase table是否是高效的查询。

第一列（cust_id）在CREATEEXTERNAL TABLE语句中被指定为key列，将该列声明为STRING类型对于性能来说是很重要的；其他列例如BIRTH_YEAR, NEVER_LOGGED_ON也声明为STRING，而不是它们本来的INT和BOOLEAN类型，因为Impala可以在HBasetable中更高效地优化这些类型。为了比较，我们将YEAR_REGISTERED这列声明为INT类型，来展示针对这一列的filtering是低效的。

describe hbase_table;
Query: describe hbase_table
+-----------------------+--------+---------+
| name                  | type   | comment |
+-----------------------+--------+---------+
| cust_id               | string |         |
| birth_year            | string |         |
| never_logged_on       | string |         |
| private_email_address | string |         |
| year_registered       | int    |         |
+-----------------------+--------+---------+

关于使用row key列等值比较条件进行单行查询是性能最好的例子：

explain select count(*) from hbase_table where cust_id = '[email protected]';
+------------------------------------------------------------------------------------+
| Explain String                                                                     |
+------------------------------------------------------------------------------------+
| Estimated Per-Host Requirements: Memory=1.01GB VCores=1                            |
| WARNING: The following tables are missing relevant table and/or column statistics. |
| hbase.hbase_table                                                                  |
|                                                                                    |
| 03:AGGREGATE [MERGE FINALIZE]                                                      |
| |  output: sum(count(*))                                                           |
| |                                                                                  |
| 02:EXCHANGE [PARTITION=UNPARTITIONED]                                              |
| |                                                                                  |
| 01:AGGREGATE                                                                       |
| |  output: count(*)                                                                |
| |                                                                                  |
| 00:SCAN HBASE [hbase.hbase_table]                                                  |
|    start key: [email protected]                                                |
|    stop key: [email protected]\0                                               |
+------------------------------------------------------------------------------------+

另外一类高效查询是针对rowkey列的一个range查找，使用SQL操作符例如>, <, =, BETWEEN。下面例子也包好一个non-key列的等值test，因为这一列也是STRING类型。Impala可以HBase执行这个test，体现在hbase filter中（见下面的output），在HBase中进行filtering比将数据全部传给impala再在impala这边进行filtering更高效。

explain select count(*) from hbase_table where cust_id between 'a' and 'b'
  and never_logged_on = 'true';
+------------------------------------------------------------------------------------+
| Explain String                                                                     |
+------------------------------------------------------------------------------------+
...

| 01:AGGREGATE                                                                       |
| |  output: count(*)                                                                |
| |                                                                                  |
| 00:SCAN HBASE [hbase.hbase_table]                                                  |
|    start key: a                                                                    |
|    stop key: b\0                                                                   |
|    hbase filters: cols:never_logged_on EQUAL 'true'                                |
+------------------------------------------------------------------------------------+

这样的查询是低效的：如果Impala必须评估一些predicates，因为Impala必须scan整个HBase table。Impala只能把关于STRING类型column的predicate下推给HBase处理，而下例中是INT类型，故output中最下面的predicate：这一行表示这个等值test会在数据都传输给impala之后才能进行：（即explain输出的predicate：语句不会在HBase中执行，这一点与hbase filters、start key、stop key不同）

explain select count(*) from hbase_table where year_registered = 2010;
+------------------------------------------------------------------------------------+
| Explain String                                                                     |
+------------------------------------------------------------------------------------+
...

| 01:AGGREGATE                                                                       |
| |  output: count(*)                                                                |
| |                                                                                  |
| 00:SCAN HBASE [hbase.hbase_table]                                                  |
|    predicates: year_registered = 2010

这样的查询也是低效的：如果key列与任何非常量值进行比较。这里，即使key column是STRING类型的，并且使用=操作符，Impala也必须scan整个HBase table，因为key column是与另外一列的value进行比较，而不是一个常量：

explain select count(*) from hbase_table where cust_id = private_email_address;
+------------------------------------------------------------------------------------+
| Explain String                                                                     |
+------------------------------------------------------------------------------------+
...

| 01:AGGREGATE                                                                       |
| |  output: count(*)                                                                |
| |                                                                                  |
| 00:SCAN HBASE [hbase.hbase_table]                                                  |
|    predicates: cust_id = private_email_address                                    |
+------------------------------------------------------------------------------------+

当前，针对row key的OR，IN语句test没有优化成直接的查找，这个限制未来可能会被解决。所以请每次check EXPLAIN的output来观察你的query是否是一个对于HBase table来说高效的查询。

explain select count(*) from hbase_table where
  cust_id = '[email protected]' or cust_id = '[email protected]';
+----------------------------------------------------------------------------------------+
| Explain String                                                                         |
+----------------------------------------------------------------------------------------+
...

| 01:AGGREGATE                                                                           |
| |  output: count(*)                                                                    |
| |                                                                                      |
| 00:SCAN HBASE [hbase.hbase_table]                                                      |
|    predicates: cust_id = '[email protected]' OR cust_id = '[email protected]' |
+----------------------------------------------------------------------------------------+

explain select count(*) from hbase_table where
  cust_id in ('[email protected]', '[email protected]');
+------------------------------------------------------------------------------------+
| Explain String                                                                     |
+------------------------------------------------------------------------------------+
...

| 01:AGGREGATE                                                                       |
| |  output: count(*)                                                                |
| |                                                                                  |
| 00:SCAN HBASE [hbase.hbase_table]                                                  |
|    predicates: cust_id IN ('[email protected]', '[email protected]')      |
+------------------------------------------------------------------------------------+

拆分成单个针对单行的查询，然后在application中合并结果，或者combine单行查询使用UNION ALL关键词：

select count(*) from hbase_table where cust_id = '[email protected]';
select count(*) from hbase_table where cust_id = '[email protected]';

explain
  select count(*) from hbase_table where cust_id = '[email protected]'
  union all
  select count(*) from hbase_table where cust_id = '[email protected]';
+------------------------------------------------------------------------------------+
| Explain String                                                                     |
+------------------------------------------------------------------------------------+
...

| |  04:AGGREGATE                                                                    |
| |  |  output: count(*)                                                             |
| |  |                                                                               |
| |  03:SCAN HBASE [hbase.hbase_table]                                               |
| |     start key: [email protected]                                            |
| |     stop key: [email protected]\0                                           |
| |                                                                                  |
| 10:MERGE                                                                           |
...

| 02:AGGREGATE                                                                       |
| |  output: count(*)                                                                |
| |                                                                                  |
| 01:SCAN HBASE [hbase.hbase_table]                                                  |
|    start key: [email protected]                                                |
|    stop key: [email protected]\0                                               |
+-------------------------------------------

总结：

即尽量使用string类型的列，尽量使用WHERE限制key的范围，这样避免将所有数据传输到impala中进行查找。

Impala只能把针对STRING类型列的predicates下推到HBase中去，但是对于其他类型比如INT型的column的predicate，只能是在impala这边做过滤，所以必须对HBase进行全表scan。

如果key column不是和常量值进行比较，那么也是低效的，也要进行全表扫描，比如select count(*) from hbase_table where cust_id =private_email_address。

Configuration Options forJava HBase Applications（配置参数）

如果你有一个HBaseJava application调用了 org.apache.hadoop.hbase.client.Scan的setCacheBlocks或者setCaching方法，你也可以使用Impala查询参数来设置这些值来控制HBaseregion server的内存压力。例如，当在HBase中进行查询并导致全表scan是，你可以通过关闭HBASE_CACHE_BLOCKS设置并指定一个很大的值给HBASE_CACHING来降低内存占用并且加速查询。

设置这些参数，在impala-shell中执行如下命令：

-- Same as calling setCacheBlocks(true) or setCacheBlocks(false).
set hbase_cache_blocks=true;
set hbase_cache_blocks=false;

-- Same as calling setCaching(rows).
set hbase_caching=1000;

或者更新impalad的默认文件/etc/default/impala，并且设置HBASE_CACHE_BLOCKSand/or HBASE_CACHING in the -default_query_options setting forIMPALA_SERVER_ARGS。细节请参考Modifying Impala Startup Options。

Note：在Impala 2.0或者更新版本中，这些选项是可设置的，通过JDBC或者ODBC接口，使用SET语句。

Use Cases for QueryingHBase through Impala（用例）

Impala查询HBase table的通常情景：

l 在impala中保存大的facttables，在HBase中保存smaller dimension tables。Fact tables使用Parquet或者其他类型的二进制格式（针对scan操作进行优化的）文件存储。Join操作scan这个大的impala fact table，并且使用高效的single-row lookup来交叉引用HBase中的table。即大表和小表join时，用impala扫描大表，结果作为join过滤条件传给HBase，以快速定位对应的row。

l 使用HBase存储快速增长的counter数据，比如一个webpage已经被访问了多少次，一个user已经发起了多少次连接等。HBase对于捕捉这种变化无常的data是非常有效的，因为它的append-only存储机制对于把每个change写入disk非常高效，并且一个query总是返回最新的value。

l 在HBase中存储非常wide的table。Wide table可能有几千个columns，通常记录着某个项目的很多属性。这些table通常是sparse的，大部分列的值是NULL或者0、false、空字符串等。例如某个网站服务的用户作为一个row，他可能仅仅用过其中的几个服务，通常的query是：查找一个single row，提取出所有列的信息，而不是做sum、averge等impala中常见的操作。

比如impala table中存储着某个网站的流量信息（一张大表），impala选出了浏览该网站的50个user，现在如果要看这些user的属性的话，我们只需与HBase中存储的user table进行join，这样只需scan这50个rows，而不必扫描全表。

Loading Data into an HBaseTable（加载数据到HBasetable中）

Impala中可以对HBase表insert单行，因为插入单行操作对于HBase本来就是有效的，但是对于存储在HDFS中的其他impala table，insert单行是不行的，因为这样会产生很多小文件，必须批量插入。

Impala中没有update语句，但是使用相同的rowkey进行insert时可以起到update的效果，因为相同的row key插入时会覆盖原来的value。

Limitations andRestrictions of the Impala and HBase Integration（二者集成的限制和束缚）

l Impala中的DROP TABLE语句执行后，HBase中的table没有remove，只是impala中的remove了

l Hive中支持INSERT OVERWRITE语句，可以清空整个table，然后插入新数据，但是impala里不支持对于HBase table的这类语句，你只能插入新行或者使用相同的row key更新原有行

l Impala中对HBase table执行CREATE TABLE LIKE语句时，在HBase中发生的是产生一个对旧表的别名，并没有完全复制出一个新表，所以应该避免使用此语句

l 在impala中使用INSERT…SELECT语句向HBasetable中插入数据时，首先插入的行数可能比SELECT出来的少，因为各个行可能有key列值相同的，那样就只会产生一列结果，其次，无法保证多个相同key的rows插入时，由于后来的row会替换已有row的值，这样就没法保证最终插入的row的值是最新的了，谨慎使用。

Examples of Querying HBaseTables from Impala（查询实例）

1、首先在HBase中创建一个表，HBase中创建的table是“enabled”状态，在hbaseshell中dropping：他们之前必须执行disable ‘table_name’语句；

$ hbase shell
...
create 'hbasealltypessmall', 'bools', 'ints', 'floats', 'strings'
quit

2、在hive中创建外部表指向HBasetable，注意用来做key的列最好使用string类型，其他类型也可以，但是lookup的速度要慢很多，string最快；

下例中创建了一个外部表映射到hbase table中。由于是一个外部表，所以在impala或者Hive中drop之后，原始的hbase table并没有删除。STORED BY语句目前在Impala中还不支持，所以需要在Hive shell中使用CREATE TABLE语句执行。WITH SERDEPROPERTIED语句声明了第一列（id）代表row key列，并且映射其余列到HBase列簇中。

$ hive
...
hive> CREATE EXTERNAL TABLE hbasestringids (
  id string,
  bool_col boolean,
  tinyint_col tinyint,
  smallint_col smallint,
  int_col int,
  bigint_col bigint,
  float_col float,
  double_col double,
  date_string_col string,
  string_col string,
  timestamp_col timestamp)
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES (
  "hbase.columns.mapping" =
  ":key,bools:bool_col,ints:tinyint_col,ints:smallint_col,ints:int_col,ints:\
  bigint_col,floats:float_col,floats:double_col,strings:date_string_col,\
  strings:string_col,strings:timestamp_col"
)
TBLPROPERTIES("hbase.table.name" = "hbasealltypessmall");

Note：在Hive中创建table之后，下次connectto impala时要执行INVALIDATE METADATA table_name语句，以便让impala知道这个新的table。

Without a String Row Key

本例中定义lookupkey column为INT类型，而不是STRING类型。

Note：尽管这样定义可以，但是Cloudera强烈建议使用STRING类型作为key列，因为这样lookup操作更快。

再次，执行CREATETABLE语句在Hive中，然后切换到Impala和impala-shell中执行查询：

$ hive
...
CREATE EXTERNAL TABLE hbasealltypessmall (
  id int,
  bool_col boolean,
  tinyint_col tinyint,
  smallint_col smallint,
  int_col int,
  bigint_col bigint,
  float_col float,
  double_col double,
  date_string_col string,
  string_col string,
  timestamp_col timestamp)
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES (
  "hbase.columns.mapping" =
  ":key,bools:bool_col,ints:tinyint_col,ints:smallint_col,ints:int_col,ints:bigint_col,floats\
   :float_col,floats:double_col,strings:date_string_col,strings:string_col,strings:timestamp_col"
)
TBLPROPERTIES("hbase.table.name" = "hbasealltypessmall");

Example Queries

一旦建立了与HBasetable的映射关系，你就可以执行查询了。例如：

# if the row key is mapped as a string col, range predicates are applied to the scan
select * from hbasestringids where id = '5';

# predicate on row key doesn't get transformed into scan parameter, because
# it's mapped as an int (but stored in ASCII and ordered lexicographically)
select * from hbasealltypessmall where id < 5;

Dify应用-工作流三眼桥墩 AI大模型人工智能 AIGC 人工智能生成内容 Dify
目录DIFY工作流参考DIFY工作流2025-1-15老规矩感谢参考文章的作者,避免走弯路。2025-1-15方便容易上手在dify的一个桌面上,添加多个节点来完成一个任务。每个工作流必须有一个开始和结束节点。节点之间用线连接即可。每个节点可以有输入和输出输出类型有,字符串,文件和json。每个节点就当成一个函数就ok。参考【1】Dify开发工作流
2023第十四届蓝桥杯Python大学生A组真题？（真题+附链接）大C爱编程蓝桥杯职场和发展
第十四届蓝桥杯大赛软件赛省赛Python大学A组试题A:特殊日期本题总分：5分【问题描述】记一个日期为yy年mm月dd日，统计从2000年1月1日到2000000年1月1日，有多少个日期满足年份yy是月份mm的倍数，同时也是dd的倍数。【答案提交】这是一道结果填空的题，你只需要算出结果后提交即可。本题的结果为一个整数，在提交答案时只填写这个整数，填写多余的内容将无法得分。试题B:分糖果本题总分：5
JVM 常见知识点总结南波塞文 JVM 虚拟机 JVM
文章目录一、类加载篇1.1类加载过程1.2类加载器分类1.3双亲委派机制二、JVM内存结构篇2.1JVM内存结构2.2对象的创建过程2.3强软弱虚引用三、垃圾回收篇3.1如何判断对象是否死亡3.2哪些对象可以作为gcroots3.3垃圾回收算法3.4MinorGC和FullGC的区别3.5HotSpot为什么分为新生代和老年代3.6常见的垃圾收集器3.7详细介绍CMS垃圾回收器四、JVM调优篇4.
Windows系统启动MongoDB报错无法连接服务器佚名猫数据库 windows mongodb 服务器
文章目录发现问题解决办法发现问题1）、先是发现执行mongo命令，启动报错：error:MongoNetworkError:connectECONNREFUSED127.0.0.1:27017；2）、再检查MongoDB进程tasklist|findstrmongo发现没有进程；3）、然后执行启动MongoDB服务命令netstartMongoDB报错服务名无效4）、便win+R输入service
Firefly-LLaMA2-Chinese - 开源中文LLaMA2大模型伊织产研 Firefly-LLaMA2 LLaMA-2
文章目录关于模型列表&数据列表训练细节增量预训练&指令微调数据格式&数据处理逻辑增量预训练指令微调模型推理权重合并模型推理部署关于github:https://github.com/yangjianxin1/Firefly-LLaMA2-Chinese本项目与Firefly一脉相承，专注于低资源增量预训练，既支持对Baichuan2、Qwen、InternLM等原生中文模型进行增量预训练，也可对L
Meta Llama 3 使用 Hugging Face 和 PyTorch 优化 CPU 推理 lichunericli 人工智能 pytorch llama
原文地址：meta-llama-3-optimized-cpu-inference-with-hugging-face-and-pytorch了解在CPU上部署Meta*Llama3时如何减少模型延迟2024年4月19日万众期待的Meta第三代Llama发布了，我想确保你知道如何以最佳方式部署这个最先进的（SoTA）LLM。在本文中，我们将重点讨论如何执行只权重量化（WOQ）来压缩8B参数模型并改
opengauss的备份和恢复 OctopusMonster opengauss
一、物理备份和恢复（gs_basebackup只能全备）1.1备份：gs_basebackup-h127.0.0.1-p5432-D***（指定ip、端口、备份目录等）1.2异机恢复（原始的数据目录改名保留）：停库：gs_ctlstop-D/opt/software/openGauss/data/single_node（数据目录自行替换）将原始的数据文件目录进行备份改名为single_node_o
git使用小记 OctopusMonster git
一、常用命令1.1环境（centos为例）：yum-yinstallgitgitconfig--globaluser.name"***"gitconfig--globaluser.email"***"mkdirgit_dir&&cdgit_dirgitclone***1.2修改代码：gitcheckoutmaster切到主分支gitpull拉取最新代码gitbranchdev创建开发分支gitch
税后工资计算c语言小工具 OctopusMonster c语言开发语言
微信小程序上很多用于计算术后工资的小程序，各个的算出的结果有差异，很难辨别哪个比较准确。若当年工资存在涨薪或者社保基数有调整，网上小工具更是无法计算。这里用c代码自己实现一个，每个月的税前工资和缴纳系数自己调节，可算出准确结果。gongzi.c#includeintmain(){//以下数组分别代表税前工资、社保基数、公积金计数。工资以20000为例，社保和公积金以10000为例intaShuiq
【Docker项目实战】使用Docker部署LinkWarden书签服务江湖有缘 Docker部署项目实战合集 docker 容器运维
【Docker项目实战】使用Docker部署LinkWarden书签服务一、LinkWarden介绍1.1LinkWarden简介1.2主要特点1.3主要使用场景二、本次实践规划2.1本地环境规划2.2本次实践介绍三、本地环境检查3.1检查Docker服务状态3.2检查Docker版本3.3检查dockercompose版本四、下载LinkWarden镜像五、部署LinkWarden应用5.1创建
vLLM-prefix浅析（System Prompt，大模型推理加速） javastart aigc 大模型 prompt prompt transformer 性能优化 AIGC
原文：vLLM-prefix浅析（SystemPrompt，大模型推理加速）简介本文浅析了在大模型推理加速方面一个非常优秀的项目vLLM的一个新特性Prefix。在Prompt中有相同前缀时可以提高吞吐量降低延迟，换句话说可以省去这部分相同前缀在自注意力阶段的重复计算。更新2024.1.18：Prefix已经合并到主分支上了！如果你的vLLM不能使用也许是时候升级一下体验下新功能哩！https:/
1001. 【USACO题库】1.1.2 Greedy Gift Givers 贪婪的送礼者 2025黄锦豪 usaco题库算法
题目描述由NP（2≤NP≤10）个名字互不相同的朋友组成的小组决定互送金钱作为礼物。每个人都有可能送给其他某些或所有朋友一些钱，也有些人可能很吝啬，谁也不给。同样，每个人也可能收到、或者没收到其他朋友的钱。你的目标是推算出每个人“净赚”了多少（收到的钱比送出的钱多多少）。送礼的规则可能与你想象的不同。每个人都要去银行（或任何其他资金来源）取一定数量的钱来送礼，然后把这些钱平均分给所有要送礼的人。过
如何使用Llama-2-7b-chat-hf模型进行对话生成娄泳含
如何使用Llama-2-7b-chat-hf模型进行对话生成Llama-2-7b-chat-hf项目地址:https://gitcode.com/mirrors/NousResearch/Llama-2-7b-chat-hf引言在当今的数字化时代，自然语言处理（NLP）技术的发展日新月异，对话生成模型作为其中的重要组成部分，已经在多个领域展现出巨大的应用潜力。无论是智能客服、虚拟助手，还是教育辅导
本地部署，edge-tts文本转语音解决方案 DaGod123 一键部署AI大模型语音识别人工智能文字转语音
目录什么是edge-tts？主要特点应用场景优势开始使用edge-tts命令行安装edge-tts库：docker安装未来展望总结https://github.com/rany2/edge-ttshttps://github.com/rany2/edge-tts随着科技的进步，文本转语音（TTS）技术正变得越来越重要，它在教育、娱乐、客户服务等多个领域得到了广泛应用。微软的edge-tts是一款基
轻松学会安装和使用达梦数据库键走偏锋数据库数据库 dba database
1.1.创建dm的安装用户组、安装用户、改密码创建用户并修改密码groupadddinstalluseradd-gdinstall-m-d/home/dmdba-s/bin/bashdmdbapasswddmdba1.2.创建工作目录mkdir/dm8ll-ld/dm8发现/dm8是属于root用户组的，这就是正确的1.3.为dmdba用户赋予/dm8目录的权限chown-Rdmdba:dinst
va_start() - va_end() - va_arg() - va_copy() - va_list - Handle variable argument list (处理可变参数列表) Yongqiang Cheng C va_start va_end va_arg va_copy va_list 处理可变参数列表
va_start{}-va_end{}-va_arg{}-va_copy{}-va_list-Handlevariableargumentlist{处理可变参数列表}1.可变参数列表1.1.`#include`1.2.可变参数的限制2.macro`va_start()`2.1.Parameters2.2.ReturnValue2.3.Example3.macro`va_end()`3.1.Para
OpenGL Shading Language - Built-In Functions (内置函数) Yongqiang Cheng Vulkan OpenGL Built-In Functions 内置函数
OpenGLShadingLanguage-Built-InFunctions{内置函数}1.Introduction2.CommonFunctionsReferencesOpenGLShadingLanguageDocumentationhttps://docs.vulkan.org/glsl/latest/index.htmlBuilt-InFunctionshttps://docs.vulk
pip 安装 numpy 报错 AttributeError: module ‘pkgutil‘ has no attribute ‘ImpImporter‘ 小郎碎碎念我恨BUG Linux运维 pip numpy python
conda环境下pip安装numpy1.x版本，报如下错误File"C:\Users\UserName\AppData\Local\Temp\pip-build-env-_lgbq70y\overlay\Lib\site-packages\pkg_resources\__init__.py",line2191,inregister_finder(pkgutil.ImpImporter,find_o
将Python程序打包为Windows可执行文件格式 CherylNatsu Python 技术文档 python windows extension microsoft parsing exe
花一天时间随便找了几篇文章入门Python，并且写了几个Python小程序想和朋友分享一下顺便推荐这个很棒的编程语言，但是遗憾的是朋友的电脑没有安装Python，而且还是用Windows系统，所以最好的办法是把Python程序转换为Windows上的可执行文件。首先要下载“适当版本“的Python：http://www.python.org/getit/还需要一个叫py2exe的程序：http:/
JVM - 内存划分、类加载、GC 机制、常见参数、简单调优陈亦康面试总结 jvm 面试
目录前言一、JVM内存划分二、类加载2.1、类加载是在干什么？2.2、类加载的过程2.3、何时触发类加载？2.4、双亲委派模型（重点考察）2.4.1、什么是双亲委派模型？2.4.2、涉及到的类加载器2.4.3、详细过程图解三、GC（垃圾回收机制）3.1、STW问题（StopTheWorld）3.2、GC回收哪部分内存？3.3、垃圾对象的判定算法3.3.1、引用计数法（非JVM采取的办法）3.3.2
蓝桥杯真题 - 翻转 - 题解 ExRoc 蓝桥杯算法 c++
题目链接：https://www.lanqiao.cn/problems/3520/learning/个人评价：难度1星（满星：5）前置知识：无整体思路贪心，除了第一位跟最后一位，其它字符，每当S[i]≠T[i]S[i]\neqT[i]S[i]=T[i]时，能换则换；为什么可以贪心？因为如果某段连续的数字为101101101或者010010010，在被修改之后变为111111111或者00000
Ubuntu安装docker 张3蜂软件安装部署开源 linux ubuntu docker eureka
snapinstalldocker#version27.2.0,oraptinstallpodman-docker#version3.4.4+ds1-1ubuntu1.22.04.2aptinstalldocker.io#version24.0.7-0ubuntu2~22.04.1我应该安装哪一个，部署企业级应用?在部署企业级应用时，选择合适的容器化工具非常重要。以下是针对你提到的三种选项的分析和
IP协议格式 Bug退退退123 tcp/ip 网络网络协议 ip
在传输层中有两个重要的协议，分别为UDP和TCP。UDP追求高效的效率，TCP追求更可靠的传输。但是这两个协议都太极端了，有没有一个协议可以在保证可靠性的同时又不失较高的效率。针对上面的问题，网络层的IP协议是更好的解决方案。IP协议的报文格式如下图：1、版本IP协议分为IPv4和IPv6两个版本，现在基本上使用的都是IPv4协议，但有些软件也支持IPv6协议。2、首部长度与TCP协议一样，由于有
IP协议特性 Bug退退退123 tcp/ip 网络服务器
在网络层中，最重要的协议就是IP协议，IP协议也有几个特性，重要的有地址管理和路由选择。1、地址管理由于IPv4地址为4个字节，所以最多可以支持42亿个地址，但在现在，42亿明显不够用了。这就衍生出下面几个机制。1）动态分配IP对于大部分IP地址，并不是一天24小时全在使用，而是会使用一段时间，空闲一段时间，对于这种情况，我们可以将处于空闲状态的IP地址分给其他人使用，这样一个IP地址就可以代表多
字节启动AGI长期研究计划，代号Seed Edge 大力财经 agi edge 前端
1月23日，据媒体报道，字节豆包大模型团队已在内部组建AGI长期研究团队，代号“SeedEdge”，鼓励项目成员探索更长周期、具有不确定性和大胆的AGI研究课题。接近字节的知情人士透露，SeedEdge的目标是探索AGI的新方法，代号名中Seed是豆包大模型团队名称，Edge代表最前沿的AGI探索。SeedEdge鼓励跨模态、跨团队合作，为项目成员提供宽松的研究环境，实行采用更长周期的考核方式，以
Hugging Face Transformers and Meta Llama Yongqiang Cheng Large Language Model (LLM)Hugging Face Transformers Meta Llama
HuggingFaceTransformersandMetaLlama1.Transformers1.1.`src/transformers/models`1.2.`src/transformers/models/llama`2.MetaLlama2.1.Llama32.2.Llama22.3.LlamaCookbook:TheOfficialGuidetobuildingwithLlamaMod
蓝桥杯真题 - 三国游戏 - 题解 ExRoc 蓝桥杯算法 c++
题目链接：https://www.lanqiao.cn/problems/3518/learning/个人评价：难度2星（满星：5）前置知识：贪心整体思路先假设魏蜀吴中的某一个势力最终获胜的情况下，如何求出事件发生的最大数量，最后枚举三个势力获胜的情况取最大值就是答案；假设魏国最终胜利，那最好是让已发生的事件中AiA_iAi的和尽可能大于Bi+CiB_i+C_iBi+Ci的和，大得越多越优先选择让
数据结构——使用C语言折半查找要向着光数据结构——使用C语言学习数据结构 c语言开发语言
1.递归结构折半查找intBSearch(inta[],intx,intlow,inthigh){intmid;if(low>high)return-1;mid=(low+high)/2;if(a[mid]==x)returnmid;elseif(x>a[mid])returnBSearch(a,x,mid+1,high);elsereturnBSearch(a,x,low,mid-1);}2.循
python 开发app 三希 python 开发语言
在Python中开发应用程序（通常指的是移动应用）有多种方法。以下是两种常见的技术栈：KivyKivy是一个开源Python库，用于快速开发跨平台的触控应用。它支持Android、iOS、Windows、MacOS和Linux。以下是使用Kivy开发的基本步骤：1.安装Kivy:在命令行中使用pip安装Kivy：pipinstallkivy2.创建你的应用:创建一个简单的Python文件，比如ma
ElasticSearch技术解析与实战读书笔记 zhangyankun_csdn 搜索引擎 elasticsearch
第一章Elasticsearch入门1.1Elasticsearch是什么1.2全文搜索Lucene倒排索引1.3基础知识1.3.1Elasticsearch术语及概念索引词term：能够被索引的精确值，索引词可以通过term查询进行准确搜索文本text：一段普通的非结构化文字，通常文本会被分析成一个个的索引词分析analysis：将文本转换为索引词的过程，依赖于分词器集群cluster：一个或多
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&