为少

分布式 PostgreSQL 集群(Citus)，分布式表中的分布列选择最佳实践

确定应用程序类型

在 Citus 集群上运行高效查询要求数据在机器之间正确分布。这因应用程序类型及其查询模式而异。

大致上有两种应用程序在 Citus 上运行良好。数据建模的第一步是确定哪些应用程序类型更接近您的应用程序。

概览

多租户应用	实时应用
有时 `schema` 中有几十个或数百个表	表数量少
一次与一个租户（公司/商店）相关的查询	具有聚合的相对简单的分析查询
用于服务 `Web` 客户端的 `OLTP` 工作负载	摄取大量几乎不可变的数据
为每个租户分析查询提供服务的 `OLAP` 工作负载	通常围绕着一个大的事件表

示例和特征

多租户应用

这些通常是为其他公司、帐户或组织服务的 SaaS 应用程序。大多数 SaaS 应用程序本质上是关系型的。它们具有跨节点分布数据的自然维度：只需按 tenant_id 分片。

Citus 使您能够将数据库扩展到数百万租户，而无需重新构建应用程序。您可以保留所需的关系语义，例如 联接、外键约束、事务、ACID 和一致性。

示例：为其他企业托管店面的网站，例如数字营销解决方案或销售自动化工具。
特征：与单个租户相关的查询，而不是跨租户加入信息。这包括为 Web 客户端提供服务的 OLTP 工作负载，以及为每个租户提供分析查询的 OLAP 工作负载。在您的数据库模式中拥有数十或数百个表也是多租户数据模型的一个指标。

使用 Citus 扩展多租户应用程序还需要对应用程序代码进行最少的更改。我们支持流行的框架，如 Ruby on Rails 和 Django。

实时分析应用

需要大规模并行性、协调数百个内核以快速获得数值、统计或计数查询结果的应用程序。通过跨多个节点对 SQL 查询进行分片和并行化，Citus 可以在一秒钟内对数十亿条记录执行实时查询。

示例: 需要亚秒级响应时间的面向客户的分析仪表板。
特征: 几张表，通常以设备、站点或用户事件的大表为中心，并且需要大量摄取大部分不可变的数据。涉及多个聚合和 GROUP BY 的相对简单（但计算量大）的分析查询。

如果您的情况类似于上述任何一种情况，那么下一步就是决定如何在 Citus 集群中对数据进行分片。如概念部分所述，Citus 根据表分布列的哈希值将表行分配给分片。数据库管理员对分布列的选择需要与典型查询的访问模式相匹配，以确保性能。

选择分布列

Citus 使用分布式表中的分布列将表行分配给分片。为每个表选择分布列是最重要的建模决策之一，因为它决定了数据如何跨节点分布。

如果正确选择了分布列，那么相关数据将在相同的物理节点上组合在一起，从而使查询快速并添加对所有 SQL 功能的支持。如果列选择不正确，系统将不必要地缓慢运行，并且无法支持跨节点的所有 SQL 功能。

本节提供两种最常见的 Citus 方案的分布列提示。最后，它深入探讨了 共置(co-location)，即节点上理想的数据分组。

多租户应用

多租户架构使用一种分层数据库建模形式在分布式集群中的节点之间分布查询。数据层次结构的顶部称为 tenant id，需要存储在每个表的列中。Citus 检查查询以查看它们涉及的 tenant id，并将查询路由到单个 worker 节点进行处理，特别是保存与 tenant id 关联的数据分片的节点。运行将所有相关数据放置在同一节点上的查询称为 Table Co-Location。

下图说明了多租户数据模型中的共置(co-location)。它包含两个表，Accounts 和 Campaigns，每个表都由 account_id 分配。阴影框代表分片，每个分片的颜色代表哪个 worker 节点包含它。绿色分片一起存储在一个 worker 节点上，蓝色分片存储在另一个节点上。请注意，当将两个表限制为相同的 account_id 时，Accounts 和 Campaigns 之间的 join 查询如何将所有必要的数据放在一个节点上。

要在您自己的 schema 中应用此设计，第一步是确定在您的应用程序中构成租户的内容。常见实例包括公司(company)、帐户(account)、组织(organization)或客户(customer)。列名称类似于 company_id 或 customer_id。检查您的每个查询并问自己：如果它有额外的 WHERE 子句将所有涉及的表限制为具有相同 tenant id 的行，它会起作用吗？多租户模型中的查询通常以租户为范围，例如销售或库存查询将在某个商店内进行。

最佳实践

按公共 tenant_id 列对分布式表进行分区。 例如，在租户是公司的 SaaS 应用程序中，tenant_id 可能是 company_id。
将小型跨租户表转换为引用表。 当多个租户共享一个小信息表时，将其作为参考表分布。
限制按 tenant_id 过滤所有应用程序查询。 每个查询应一次请求一个租户的信息。

阅读多租户应用程序指南，了解构建此类应用程序的详细示例。

实时应用

虽然多租户架构引入了分层结构并使用数据共置(data co-location)来路由每个租户的查询，但实时架构依赖于其数据的特定分布属性来实现高度并行处理。

我们在实时模型中使 “entity id” 作为分布列的术语，而不是多租户模型中的租户 ID。典型的实体是用户(users)、主机(hosts)或设备(devices)。

实时查询通常要求按日期(date)或类别(category)分组的数字聚合。Citus 将这些查询发送到每个分片以获得部分结果，并在 coordinator 节点上组装最终答案。当尽可能多的节点做出贡献并且没有单个节点必须做不成比例的工作时，查询运行速度最快。

最佳实践

选择具有高基数的列作为分布列。 为了比较，订单表上的 status 字段具有 新(new)、已付款(paid) 和 已发货(shipped) 值，是分布列的一个糟糕选择，因为它只假设这几个值。不同值的数量限制了可以保存数据的分片数量以及可以处理数据的节点数量。在具有高基数的列中，最好另外选择那些经常用于 group-by 子句或作为 join 键的列。
选择分布均匀的列。 如果您将表分布在偏向某些常见值的列上，则表中的数据将倾向于在某些分片中累积。持有这些分片的节点最终会比其他节点做更多的工作。
将事实表和维度表分布在它们的公共列上。 您的事实表只能有一个分布 key。在另一个 key 上 join 的表不会与事实表位于同一位置。根据 join 的频率和 join 行的大小，选择一个维度来共同定位。
将一些维度表更改为引用表。 如果维度表不能与事实表共存，您可以通过将维度表的副本以引用表的形式分发到所有节点来提高查询性能。

阅读实时仪表板指南，了解构建此类应用程序的详细示例。

时间序列数据

在时间序列工作负载中，应用程序在归档旧信息的同时查询最近的信息。

在 Citus 中建模时间序列信息的最常见错误是将时间戳本身用作分布列。基于时间的散列分布将看似随机的时间分布到不同的分片中，而不是将时间范围保持在分片中。但是，涉及时间的查询通常会参考时间范围（例如最近的数据），因此这样的哈希分布会导致网络开销。

最佳实践

不要选择时间戳作为分布列。 选择不同的分布列。在多租户应用程序中，使用租户 ID，或在实时应用程序中使用实体 ID。
改为使用 PostgreSQL 表分区。 使用表分区将一个按时间排序的数据大表分解为多个继承表，每个表包含不同的时间范围。在 Citus 中分发 Postgres 分区的表会为继承的表创建分片。

阅读 Timeseries Data 指南，了解构建此类应用程序的详细示例。

表共置

关系数据库因其巨大的灵活性和可靠性而成为许多应用程序的首选数据存储。从历史上看，对关系数据库的一个批评是它们只能在一台机器上运行，当数据存储需要超过服务器改进时，这会产生固有的限制。快速扩展数据库的解决方案是分发它们，但这会产生其自身的性能问题：join 等关系操作需要跨越网络边界。共置(Co-location) 是一种策略性地划分数据的做法，将相关信息保存在同一台机器上以实现高效的关系操作，但利用整个数据集的水平可扩展性。

数据共存的原理是数据库中的所有表都有一个共同的分布列，并以相同的方式跨机器分片，使得具有相同分布列值的行总是在同一台机器上，即使跨不同的表也是如此。只要分布列提供了有意义的数据分组，就可以在组内执行关系操作。

Citus 中用于 hash 分布表的数据共存

PostgreSQL 的 Citus 扩展在能够形成数据库的分布式数据库方面是独一无二的。Citus 集群中的每个节点都是一个功能齐全的 PostgreSQL 数据库，Citus 在顶部添加了单个同构数据库的体验。虽然它没有以分布式方式提供 PostgreSQL 的全部功能，但在许多情况下，它可以通过托管在单台机器上充分利用 PostgreSQL 提供的功能，包括完整的 SQL 支持、事务和外键。

在 Citus 中，如果分布列中值的哈希值落在分片的哈希范围内，则将一行存储在分片中。为了确保共置，即使在重新平衡操作之后，具有相同哈希范围的分片也始终放置在同一个节点上，这样相等的分布列值始终位于跨表的同一个节点上。

我们发现在实践中运行良好的分布列是多租户应用程序中的租户 ID。例如，SaaS 应用程序通常有许多租户，但它们所做的每个查询都是特定于特定租户的。虽然一种选择是为每个租户提供 database 或 schema，但它通常成本高昂且不切实际，因为可能有许多跨用户的操作（数据加载、迁移、聚合、分析、schema 更改、备份等）。随着租户数量的增加，这变得更难管理。

共置的实际示例

考虑以下表格，这些表格可能是多租户 Web 分析SaaS 的一部分：

CREATE TABLE event (
  tenant_id int,
  event_id bigint,
  page_id int,
  payload jsonb,
  primary key (tenant_id, event_id)
);

CREATE TABLE page (
  tenant_id int,
  page_id int,
  path text,
  primary key (tenant_id, page_id)
);

现在我们要回答可能由面向客户的仪表板发出的查询，例如：“返回租户六中所有以‘/blog’开头的页面在过去一周的访问次数。”

使用常规 PostgreSQL 表

如果我们的数据位于单个 PostgreSQL 节点中，我们可以使用 SQL 提供的丰富的关系操作集轻松地表达我们的查询：

SELECT page_id, count(event_id)
FROM
  page
LEFT JOIN  (
  SELECT * FROM event
  WHERE (payload->>'time')::timestamptz >= now() - interval '1 week'
) recent
USING (tenant_id, page_id)
WHERE tenant_id = 6 AND path LIKE '/blog%'
GROUP BY page_id;

只要此查询的工作集适合内存，这是许多应用程序的合适解决方案，因为它提供了最大的灵活性。但是，即使您还不需要扩展，考虑扩展数据模型的影响也会很有用。

按 ID 分布表

随着租户数量和为每个租户存储的数据的增长，查询时间通常会增加，因为工作集不再适合内存或 CPU 成为瓶颈。在这种情况下，我们可以使用 Citus 跨多个节点分片数据。分片时我们需要做出的第一个也是最重要的选择是分布列。让我们从一个天真的选择开始，将 event_id 用于事件表，将 page_id 用于页表：

-- naively use event_id and page_id as distribution columns

SELECT create_distributed_table('event', 'event_id');
SELECT create_distributed_table('page', 'page_id');

鉴于数据分散在不同的 worker 中，我们不能像在单个 PostgreSQL 节点上那样简单地执行 join。相反，我们需要发出两个查询：

跨页表的所有分片（Q1）：

SELECT page_id FROM page WHERE path LIKE '/blog%' AND tenant_id = 6;

跨事件表的所有分片（Q2）：

SELECT page_id, count(*) AS count
FROM event
WHERE page_id IN (/*…page IDs from first query…*/)
  AND tenant_id = 6
  AND (payload->>'time')::date >= now() - interval '1 week'
GROUP BY page_id ORDER BY count DESC LIMIT 10;

之后，应用程序需要组合这两个步骤的结果。

回答查询所需的数据分散在不同节点上的分片中，每个分片都需要被查询：

在这种情况下，数据分布会产生很大的缺陷：

查询每个分片的开销，运行多个查询
Q1 的开销返回许多行给客户端
Q2 变得非常大
需要在多个步骤中编写查询，组合结果，需要在应用程序中进行更改

相关数据分散的一个潜在好处是查询可以并行化，Citus 会这样做。但是，这只有在查询的工作量远远大于查询许多分片的开销时才有用。通常最好避免直接从应用程序中进行如此繁重的工作，例如通过预先聚合数据。

按租户分布表

再次查看我们的查询，我们可以看到查询需要的所有行都有一个共同的维度：tenant_id。仪表板只会查询租户自己的数据。这意味着，如果同一租户的数据始终位于单个 PostgreSQL 节点上，那么我们的原始查询可以由该节点通过对 tenant_id 和 page_id 执行 join 来一次性回答。

在 Citus 中，具有相同分布列值的行保证在同一个节点上。分布式表中的每个分片实际上都有一组来自其他分布式表的位于同一位置的分片，这些分片包含相同的分布列值（同一租户的数据）。从头开始，我们可以创建以 tenant_id 作为分布列的表。

-- co-locate tables by using a common distribution column
SELECT create_distributed_table('event', 'tenant_id');
SELECT create_distributed_table('page', 'tenant_id', colocate_with => 'event');

在这种情况下，Citus 可以回答您将在单个 PostgreSQL 节点上运行而无需修改 (Q1) 的相同查询：

SELECT page_id, count(event_id)
FROM
  page
LEFT JOIN  (
  SELECT * FROM event
  WHERE (payload->>'time')::timestamptz >= now() - interval '1 week'
) recent
USING (tenant_id, page_id)
WHERE tenant_id = 6 AND path LIKE '/blog%'
GROUP BY page_id;

由于使用了 tenantid 过滤器和 tenantid 上的 join，Citus 知道可以使用包含特定租户数据的一组位于同一位置的分片来回答整个查询，而 PostgreSQL 节点可以在一个步骤中回答该查询，从而支持完整的 SQL 支持。

在某些情况下，查询和表 schema 需要进行少量修改，以确保 tenant_id 始终包含在唯一约束和 join 条件中。但是，这通常是一个简单的更改，并且避免了在没有共置的情况下所需的大量重写。

虽然上面的示例只查询一个节点，因为有一个特定的 tenant_id = 6 过滤器，但共置还允许我们在所有节点上有效地执行对 tenant_id 的分布式 join，尽管存在 SQL 限制。

共置意味着更好的功能支持

Citus 通过共置解锁的功能的完整列表如下：

对一组位于同一位置的分片上的查询的完整 SQL 支持
多语句事务支持对一组位于同一位置的分片进行修改
通过 INSERT..SELECT 聚合
外键
分布式外部联接(outer join)
Pushdown CTEs(要求 PostgreSQL >=12 )

数据共置是一种强大的技术，可以为关系数据模型提供水平扩展和支持。使用分布式数据库迁移或构建应用程序的成本（通过共置实现关系操作）通常大大低于迁移到限制性数据模型（例如 NoSQL）的成本，并且与单节点数据库不同，它可以随着规模的大小而横向扩展您的业务。有关迁移现有数据库的更多信息，请参阅过渡到多租户数据模型。

查询性能

Citus 通过将传入查询分解为多个在工作分片上并行运行的片段查询（“任务”）来并行化传入查询。这使 Citus 可以利用集群中所有节点的处理能力以及每个节点上的单个核心的处理能力来进行每个查询。由于这种并行化，您可以获得集群中所有核心的计算能力的累积性能，与单个服务器上的 PostgreSQL 相比，查询时间显着减少。

Citus 在规划 SQL 查询时采用了两阶段优化器。第一阶段涉及将 SQL 查询转换为它们的交换和关联形式，以便它们可以下推并在工作线程上并行运行。如前几节所述，选择正确的分布列和分布方法允许分布式查询规划器对查询应用多种优化。由于网络 I/O 减少，这会对查询性能产生重大影响。

Citus 的分布式执行器然后将这些单独的查询片段发送到 PostgreSQL worker 实例。分布式规划器和执行器都有几个方面可以调整以提高性能。当这些单独的查询片段被发送给 worker 时，查询优化的第二阶段就开始了。worker 只是运行扩展的 PostgreSQL 服务器，他们应用 PostgreSQL 的标准计划和执行逻辑来运行这些片段 SQL 查询。因此，任何有助于 PostgreSQL 的优化也有助于 Citus。PostgreSQL 默认带有保守的资源设置；因此优化这些配置设置可以显着缩短查询时间。

我们在文档的查询性能调优部分讨论了相关的性能调优步骤。

Django-Multitenant，分布式多租户数据库项目实战(Python/Django+Postgres+Citus)
分布式 PostgreSQL 集群(Citus)官方示例 - 时间序列数据

你可能感兴趣的:(分布式 PostgreSQL 集群(Citus)，分布式表中的分布列选择最佳实践)

能源行业非结构化数据管理创新案例研究 CaritoB 非结构化数据管理非结构化数据管理
在能源行业，非结构化数据的管理正逐渐成为提升企业竞争力和运营效率的关键。从油气勘探的日志、图像到电力行业的监控视频、设备运行记录，这些非结构化数据蕴含着巨大的价值。然而，传统的数据管理方法难以应对非结构化数据的复杂性和规模。能源行业非结构化数据管理的挑战（一）数据存储与分布能源行业的非结构化数据通常分布在不同的地理位置和系统中。例如，油气田的勘探数据可能存储在野外设备中，而电力变电站的监控视频可能
非结构化数据管理中的标签体系构建方法 CaritoB 非结构化数据管理非结构化数据管理
在数字化转型的浪潮中，非结构化数据如文档、图片、音频、视频等，因其格式多样、内容丰富，成为企业数据资产的重要组成部分。然而，这些数据的管理也面临着诸多挑战，尤其是如何有效地组织和检索这些数据。一、标签体系的重要性标签体系是非结构化数据管理的核心，它通过为数据添加标签，实现数据的分类、检索和分析。一个有效的标签体系可以帮助企业快速定位所需数据，提高数据的利用效率，同时也有助于数据的安全管理和合规性控
非结构化数据的“汇、存、管、用”之道探究 CaritoB 数据库大数据人工智能
摘要随着信息技术的飞速发展，非结构化数据作为数字时代的重要资产，其管理与利用成为企业与社会关注的焦点。本文系统探究了非结构化数据的“汇、存、管、用”之道，为数据的有效治理与价值挖掘提供了新视角。在汇集方面，我们深入剖析了非结构化数据的多元来源与高效采集技术，强调了数据源多样性与采集效率的重要性。存储策略方面，探讨了存储介质与格式选择对数据管理的影响，并引入了数据压缩与去重技术以优化存储效能。管理挑
如何设置HTTP请求中的参数？数据小爬虫@ http 网络协议网络
在Java中设置HTTP请求的参数是爬虫开发中的一个常见任务。这可以通过多种方式实现，具体取决于你使用的库。以下将展示如何使用ApacheHttpClient和Java11+的HttpClient设置HTTP请求中的参数。一、使用ApacheHttpClient设置请求参数（一）添加依赖如果你使用的是Maven，可以在pom.xml文件中添加以下依赖：org.apache.httpcomponen
如何使用Java爬虫处理API接口返回的JSON数据？小爬虫程序猿 API java json 开发语言
处理API接口返回的JSON数据是Java爬虫开发中的一个常见任务。在Java中，有多个库可以帮助我们解析JSON数据，其中最流行的是Jackson和Gson。以下是使用这两个库处理JSON数据的基本步骤和示例代码。使用Jackson处理JSONJackson是一个功能强大的JSON处理库，它不仅可以将JSON字符串解析为Java对象，还可以将Java对象转换为JSON字符串。添加Jackson依
Python 中字符串的操作倾听醉梦语 python 学习学习方法
字符串（string）是Python中的基础数据类型之一，表示一系列有序的字符集合。它是不可变的，也就是说，一旦创建，字符串的内容就不能被修改。以下是字符串的关键知识点及相关操作总结：1.字符串的定义字符串通过单引号''或双引号""定义。my_str="myloveandmylife"2.通过下标索引访问字符串可以通过下标访问字符串中的某个字符。正索引从0开始，负索引从-1开始表示从末尾向前访问。
凤凰架构：构建可靠的大型分布式系统邱燕义
凤凰架构：构建可靠的大型分布式系统【下载地址】凤凰架构构建可靠的大型分布式系统凤凰架构：构建可靠的大型分布式系统项目地址:https://gitcode.com/Open-source-documentation-tutorial/7e46b项目介绍在当今数字化时代，大型分布式系统已成为企业级应用的核心。然而，构建一个既可靠又高效的分布式系统并非易事。为了帮助开发者、架构师和系统工程师应对这一挑战
【愚公系列】《鸿蒙原生应用开发从零基础到多实战》006-TypeScript 中的元组愚公搬代码 harmonyos typescript 华为
标题详情作者简介愚公搬代码头衔华为云特约编辑，华为云云享专家，华为开发者专家，华为产品云测专家，CSDN博客专家，CSDN商业化专家，阿里云专家博主，阿里云签约作者，腾讯云优秀博主，腾讯云内容共创官，掘金优秀博主，亚马逊技领云博主，51CTO博客专家等。近期荣誉2022年度博客之星TOP2，2023年度博客之星TOP2，2022年华为云十佳博主，2023年华为云十佳博主，2024年华为云十佳博主等
玩转顺序表：用 C 语言实现数据的插入与删除赔罪数据结构 c语言开发语言
目录顺序表的定义插入元素删除元素查找元素主函数打印顺序表完整代码总结在这篇博客中，我们将探讨如何使用C语言实现一个简单的顺序表（也称为动态数组），并实现一些基本操作，包括插入、删除和查找元素。顺序表是一种线性数据结构，具有固定的大小，适合存储相同类型的元素。顺序表的定义首先，我们定义顺序表的结构。顺序表由一个数组和一个表示当前长度的变量组成。#defineMaxSize50//定义顺序表的最大容量
语义向量模型全解：从基础到现在的deepseek中的语义向量主流模型来自于狂人人工智能语言模型
一、语义向量模型：自然语言处理的基石语义向量模型（SemanticVectorModel）是自然语言处理（NLP）的核心技术，它将词汇、句子或文档映射为高维向量，在数学空间中量化语义信息。通过向量距离（如余弦相似度）衡量语义的相似性，支撑了搜索引擎、情感分析、机器翻译等实际应用。1.1发展简史1980s~2000s：基于统计的浅层模型，如TF-IDF（直接表征词的重要性）、LSA（通过矩阵分解降维
基于Ubuntu+vLLM+NVIDIA T4高效部署DeepSeek大模型实战指南来自于狂人 python 人工智能 pytorch 语言模型
一、前言：拥抱vLLM与T4显卡的强强联合在探索人工智能的道路上，如何高效地部署和运行大型语言模型（LLMs）一直是一个核心挑战。尤其是当我们面对资源有限的环境时，这个问题变得更加突出。原始的DeepSeek-R1-32B模型虽然强大，但在T4显卡上遭遇了显存溢出的问题，这限制了其在实际应用中的潜力。为了解决这一难题，我们转向了官方提供的优化版本——DeepSeek-R1-Distill-Qwen
Kotlin Flow常用用法 tangweiguo03051987 Kotlin语法 kotlin 前端开发语言
KotlinFlow是Kotlin编程语言中的一个强大特性，用于处理异步数据流。它是Kotlin协程库的一部分，旨在以声明式和响应式的方式处理异步数据流。Flow的设计与协程无缝集成，使得异步编程更加简单和直观。suspendfunmain(){//创建Flow的几种方法valflow=flow{emit(1)emit(2)emit(3)emit(4)emit(5)}.collect{printl
Sass 教程 shengyin714959 笔记 sass 前端 css
Sass(英文全称：SyntacticallyAwesomeStylesheets)是一个最初由HamptonCatlin设计并由NatalieWeizenbaum开发的层叠样式表语言。Sass是一个CSS预处理器。Sass是CSS扩展语言，可以帮助我们减少CSS重复的代码，节省开发时间。Sass完全兼容所有版本的CSS。Sass扩展了CSS3，增加了规则、变量、混入、选择器、继承、内置函数等等特
Composer的报错及解决办法代码之旅 composer android android studio
Composer是一个用于管理PHP项目依赖关系的工具，它使得项目的依赖包安装、更新和管理变得简单和高效。然而，在使用Composer的过程中，有时候会遇到一些报错。本文将介绍一些常见的Composer报错，并提供相应的解决办法。“Yourrequirementscouldnotberesolvedtoaninstallablesetofpackages.”这个错误通常发生在安装或更新依赖包时，表
inux下的du命令用于估算文件和目录的磁盘使用情况 luoluosheng07 linux linux 运维服务器
du（DiskUsage）命令是Linux中的一个常用工具，用于估算文件和目录的磁盘使用情况。以下是详细的讲解，包括常用选项和示例：基本语法du[选项][文件或目录]常用选项-a：显示所有文件和目录的磁盘使用情况，而不仅仅是目录。-h：以人类可读的格式显示大小（例如：K、M、G）。-s：仅显示每个参数的总大小，而不显示子目录的大小。-c：在输出的最后添加一个总计行。-dN：显示目录深度为N级的使用
uniapp实现点击图片预览放大，长按下载图片 luoluosheng07 uniapp uni-app 前端
1.使用uniapp中的uni.previewImageAPI预览图片2.使用uniapp中的uni.downloadFileAPI下载图片3.使用uniapp中的uni.saveImageToPhotosAlbumAPI将图片保存到相册exportdefault{data(){return{}},methods:{previewImage(e){varcurrent=e.target.datas
Qt是不是经常写个QWidget输入参数？南瓜大师-阿亮 Qt Function qt 开发语言 C++
发现Qt自带的一个输入控件QInputDialog类QInputDialog类提供了一个简单方便的对话框，用于从用户获取单个值。输入值可以是字符串、数字或列表中的项。必须设置一个标签来告诉用户他们应该输入什么。提供了五个静态方便函数:getText()、getMultiLineText()、getInt()、getDouble()和getItem()。所有的函数都可以以类似的方式使用boolok;
mysql-bin.index_mysqlbin.index是什么文件张太学 mysql-bin.index
匿名用户1级2016-06-01回答今天发现/usr/local/mysql/var下很多mysql-bin.000001、mysql-bin.000002文件，GOOGLE之。。这是数据库的操作日志，例如UPDATE一个表，或者DELETE一些数据，即使该语句没有匹配的数据，这个命令也会存储到日志文件中，还包括每个语句执行的时间，也会记录进去的。这样做主要有以下两个目的：1：数据恢复如果你的数据
java，深拷贝和浅拷贝水w java java 开发语言拷贝
在Java中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是对象拷贝的两种方式，主要区别在于它们如何处理对象的内部引用。目录一、浅拷贝（ShallowCopy）实现方式二、深拷贝（DeepCopy）实现方式1、手动深拷贝2、通过序列化实现深拷贝深拷贝中的注意事项深拷贝的应用场景总结一、浅拷贝（ShallowCopy）浅拷贝是指仅拷贝对象的基本类型字段和引用类型字段的引用，而不是引用
耳机与音频基础知识 Hush_NUIST 音视频音频
1.评价耳机音质时所谓的低频、中频和高频分别指的是什么在评价耳机音质时，高频（Highs）、低频（Lows）和中频（Mids）分别指的是声音频谱中不同的部分：低频：这部分通常指的是声音频谱中的低端，大约在20Hz到250Hz之间。低频对应于我们可以听到的最低音调，通常与音乐中的低音和节奏部分相关，如贝斯和鼓等乐器的声音。低频响应好的耳机能够提供深沉、有力且不失真的低音。中频：中频通常覆盖了250H
QT状态机框架斜阳日落 qt 开发语言
一、介绍Qt中的状态机框架为我们提供了很多的API和类，使我们能更容易的在自己的应用程序中集成状态动画。这个框架是和Qt的元对象系统机密结合在一起的。比如，各个状态之间的转换是通过信号触发的，状态可被配置为用来设置QObject对象的属性以及调用其方法。可以说Qt中的状态机就是通过Qt自身的事件系统来驱动的。同时，状态机中的状态图是分层次的。一些状态可以被嵌套到另一些状态里，当前的状态机配置是由当
基于规则的分词李昊哲小课人工智能大数据数据分析 python 人工智能中文分词自然语言处理
基于规则的分词基于规则或词典的分词方法是一种较为机械的分词方法，其基本思想如下。将待分词语句中的字符串和词典逐个匹配。找到匹配的字符串则切分，不匹配则减去边缘的某些字符。从头再次匹配，直至匹配完毕或者没有找到词典的字符串而结束。基于规则分词主要方法如下。正向最大匹配法（MaximumMatchMethod，MM法）。逆向最大匹配法（ReverseMaximumMatchMethod，RMM法）。双
从0实现二叉树的存储与遍历 c++逐梦人算法深度优先数据结构蓝桥杯 c++
1.1链式存储第⼀⾏⼀个整数n，表⽰结点数。之后n⾏，第⾏两个整数l、r，分别表⽰结点i的左右⼦结点编号。若l=0则表⽰⽆左⼦结点，同理。#includeusingnamespacestd;constintN=1e5+10;intl[N];intr[N];intmain(){intn=0;cin>>n;for(inti=1;i>l[i]>>r[i];}return0;}2.二叉树的遍历2.1深度优
PTA: jmu-ds- 顺序表删除重复元素悦悦子a啊 C语言PTA习题算法 c++数据结构
设计一个算法，从顺序表中删除重复的元素，并使剩余元素间的相对次序保存不变。输入格式:第一行输入顺序表长度。第二行输入顺序表数据元素。中间空格隔开。输出格式：数据之间空格隔开，最后一项尾部不带空格。输出删除重复元素后的顺序表。你需要实现的函数有下面三个：函数接口定义：voidCreateSqList(List&L,inta[],intn);//创建顺序表voidDispSqList(ListL);/
探索multiparty：简化Node.js中的文件上传处理管展庭
探索multiparty：简化Node.js中的文件上传处理multipartyAnode.jsmoduleforparsingmultipart-formdatarequestswhichsupportsstreams2项目地址:https://gitcode.com/gh_mirrors/mu/multiparty在当今这个高度数字化的时代，文件上传功能已成为Web应用的标配。无论是图片分享平
Word转换为PDF后图片失真的解决办法尚多伶Molly
Word转换为PDF后图片失真的解决办法word转换为pdf后图片失真的解决办法项目地址:https://gitcode.com/Resource-Bundle-Collection/a2746简介在日常工作和学习中，我们经常需要将Word文档转换为PDF格式以便于分享和打印。然而，许多用户在转换过程中发现，PDF中的图片质量明显下降，甚至出现失真现象。本文将详细介绍如何解决Word转换为PDF后
智能对讲机：5G+AI赋能下的石油工业新“声”态 AORO_BEIDOU 5G 人工智能信息与通信科技安全网络
在浩瀚的能源版图上，中国正以非凡的“深度”探索着石油资源的奥秘。随着5G技术的不断成熟与普及，曾经“满山遍野找信号”的石油工人，如今已步入了一个全新的通信时代。在这个时代里，智能对讲机成为了连接指挥中心与一线工人的桥梁，不仅极大地提升了工作效率，更推动了我国能源产业的高质量发展。AOROM55G智能对讲机智能对讲机，这一基于5G手机通信网络打造的集群对讲设备，彻底改变了传统对讲机的使用方式。它不仅
134. 加油站 HKkuaidou 算法数据结构 c语言
在一条环路上有n个加油站，其中第i个加油站有汽油gas[i]升。你有一辆油箱容量无限的的汽车，从第i个加油站开往第i+1个加油站需要消耗汽油cost[i]升。你从其中的一个加油站出发，开始时油箱为空。给定两个整数数组gas和cost，如果你可以按顺序绕环路行驶一周，则返回出发时加油站的编号，否则返回-1。如果存在解，则保证它是唯一的。示例1:输入:gas=[1,2,3,4,5],cost=[3,4
深度学习算法模型：从原理到未来 YDH_AlwaysRunning 深度学习
近年来，人工智能（AI）技术以前所未有的速度改变着人类生活，而深度学习的崛起无疑是这场技术革命的核心驱动力。从手机中的语音助手到医学影像的智能诊断，从自动驾驶汽车到生成式AI创作的诗歌和画作，深度学习算法模型正逐渐渗透到社会的每个角落。本文将从基本原理出发，解析典型模型的运作机制，探讨其应用现状与发展趋势，带您全面认识这一改变世界的技术。一、深度学习的基本原理：让机器学会"思考"1.1神经网络的生
Python 正则表达式偶尔也有风_ python 正则表达式
正则表达式正则表达式（RegularExpression，简称正则或RegExp）是一种强大的文本模式匹配工具，被广泛应用于字符串的搜索、替换、验证等场景。Python的re库为正则表达式提供了丰富的支持，使得开发者能够在处理文本数据时更加高效和灵活。本文将深入探讨Python中的re库，包括基本语法、常见用法、高级技巧以及一些最佳实践，旨在帮助读者更全面地理解和运用正则表达式。什么是正则表达式？
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo