字节数据平台

LAS Spark+云原生：数据分析全新解决方案

更多技术交流、求职机会，欢迎关注字节跳动数据平台微信公众号，回复【1】进入官方交流群

随着数据规模的迅速增长和数据处理需求的不断演进，云原生架构和湖仓分析成为了现代数据处理的重要趋势。在这个数字化时代，企业面临着海量数据的挑战和机遇，而构建可扩展、灵活且高效的数据分析平台成为了迫切的需求。

文章主要介绍了火山引擎湖仓一体分析服务 LAS（下文以 LAS 指代）基于 Spark 的云原生湖仓分析实践，利用 Spark 的强大功能和云原生技术的优势，构建高效、可扩展、灵活的数据分析平台，满足现代企业对数据洞察的迫切需求，为企业提供了强大的解决方案。文末更有专属彩蛋，新人优惠购福利，等着你来解锁！

本篇文章提纲如下：

Spark on K8S
Kyuubi：Spark SQL Gateway
CatalogService：湖仓一体元数据架构实践
LAS Batch Scheduler：云原生批处理调度器
UIService：云原生 Spark History Server
Falcon：Remote Shuffle Service
总结

Spark on K8S

作为当今云原生基础设施的事实标准，Kubernetes 在 LAS Spark 中扮演着重要的角色。我们首先分享下 LAS Spark 基于 Kubernetes 的实践优化工作。

Kubernetes（常简称为 k8s）是一个开源的容器编排平台，用于自动化部署、扩展和管理容器化应用程序。它提供了一个强大的容器编排和管理系统，可以简化应用程序的部署、扩展和管理过程。

Kubernetes 最初由 Google 开发，并于 2014 年开源。它基于 Google 内部的 Borg 系统的经验和技术，并吸收了社区的贡献和反馈，逐渐成为容器编排领域的事实标准。

Kubernetes 的架构是高度可扩展化的，它由一组核心组件和插件组成。开发者可以通过插件机制扩展和增强 Kubernetes 的功能。Kubernetes 被广泛应用于云原生应用程序的部署和管理。它提供了强大的功能和灵活性，使开发人员和运维团队能够更轻松地构建、部署和管理容器化应用程序，并实现高可用性、可扩展性和弹性伸缩等目标。

火山引擎 LAS 借助 Kubernetes 作为基础架构，结合一系列经过深度自研的可扩展插件，成功打造了 Serverless Spark 的能力，从而实现了云原生湖仓一体服务能力。

LAS Spark 采用了 Spark Operator 在 Kubernetes 上管理每个 Spark 作业的执行。Operator 是 Kubernetes 的一种扩展机制，它利用自定义资源（custom resource）来管理应用程序及其组件。Operator 遵循 Kubernetes 控制器的设计理念。

Operator 模式的概念允许在不修改 Kubernetes 核心代码的情况下，通过为自定义资源关联控制器来扩展集群的功能。Operator 充当了 Kubernetes API 的客户端，同时也是自定义资源的控制器。

部署 Operator 的常见方法是将自定义资源及其关联的控制器添加到集群中。与部署容器化应用程序类似，控制器通常运行在控制面板（Control Panel）之外，例如可以将控制器作为 Deployment 在集群中运行。

Spark Operator 的作用是将 Spark 作业描述为自定义资源，用户或程序可以通过纯 Kubernetes 接口的方式提交Spark 作业并查看作业的运行状态。这使得管理 Spark 作业与管理其他 Kubernetes 资源一样简单，将 Spark 作业转化为标准的 Kubernetes 作业负载类型。

用户或程序通过 SparkApplication CRD（custom resource definition）向 Kubernetes 集群提交一个 Spark 作业。Spark Operator 订阅了集群中所有 SparkApplication 的状态更新，通过调用 spark-submit 向 Kubernetes 集群提交作业，并维护对应 Spark 作业的整个生命周期。

实际上，火山引擎 LAS 在底座上使用的是火山的容器服务 VKE（Volcengine Kubernetes Engine）。VKE 是基于 Kubernetes 的企业级容器云管理平台。

通过在 VKE 上构建云原生集群，LAS Spark 提供了多租户隔离的运行环境。在逻辑层面，LAS 通过队列的设计实现了用户资源的切分，而在物理层面，则通过容器的隔离策略保障了租户作业运行时的隔离能力。

更进一步，LAS 基于火山引擎 VCI（Volcengine Container Instance）提供了沙箱容器安全隔离的能力。VCI 是一种 Serverless 和容器化的计算服务，可与容器服务 VKE 托管版无缝集成，提供 Kubernetes 编排能力。

LAS 在 VKE/VCI 的基础上构建了潮汐 Quota 的能力，通过对集群层面资源用量的整体监控，实现了资源的削峰填谷。基于 VCI POD 粒度的弹性执行能力，LAS 会在后续进一步增强弹性扩缩容的能力，在 Spark 作业粒度提供完全无损的实时弹性扩缩容能力。

Kyuubi：Spark SQL Gateway

基于前面的介绍，我们已经成功实现了 Spark 的云原生化。为了进一步实现 Spark 的输出能力，LAS Spark 利用 Apache Kyuubi 封装了完整的 Spark 引擎功能。Kyuubi 是一个分布式和多租户网关，主要用于在数据仓库和数据湖上提供入口服务。它能满足企业内不同大数据场景的需求，如 ETL、BI 报表等。Kyuubi 提供了标准的 ODBC/JDBC 接口，使用户能够使用 SQL 语言查询各种数据源。它具备多租户、安全性和高可用性等特性，使其适用于高并发的企业级大数据查询分析等场景。

Server Discovery/Load Balance：使用 ZK/ETCD 进行服务发现和负载均衡，客户在提交作业的过程中会通过ZK/ETCD 的负载均衡策略路由到一台 KyuubiServer 上管理作业执行。
Servers：支持多个 KyuubiServer，启动过程中会注册到 ZK/ETCD，方便进行服务发现和负载均衡。多个 Server也实现了冷备的 HA。
Engine Discovery：客户端请求在 KyuubiServer 中会通过 Engine Discovery 找到自己的 Engine，然后将请求提到对应的 Engine 中。
Engines：具体的执行引擎，例如 Spark、Trino 等引擎。

LAS 基于 Kyuubi 构建了 Spark 的近实时查询分析能力，有效的支持了多租户、高并发场景。Kyuubi 支持Connection、User、Group 等不同级别的隔离能力，通过和 LAS 租户队列能力的结合，充分实现了资源隔离，确保了不同租户的 Spark 任务之间的资源公平分配。基于 Kyuubi，LAS 提供了简单易用的接口，用户可以通过 JDBC/ODBC 客户端或者 LAS Console 进行交互，可以轻松地在 LAS 上运行 Spark SQL 查询。

为了能够适配更多类型的引擎（比如 Presto），LAS 在 Kyuubi 之外进行了深度的自研扩展，提供了统一 SQL 的能力（code name：ByteQuery），并在解析层完成了大量的优化。在这里由于篇幅有限，我们后续再给大家做进一步分享。

CatalogService：湖仓一体元数据架构实践

作为湖仓一体分析服务，LAS 面临的下一个挑战是如何为 Spark 引擎屏蔽元数据的差异性。为了解决这个问题，LAS 自研了统一的元数据服务 CatalogService。CatalogService 提供与 HMS（Hive Metastore）兼容的接口，并为所有查询引擎提供统一的元数据视图，解决了异构数据源的元数据管理问题。

CatalogService 整体分三层，第一层是 Catalog Federation，提供统一的视图和跨地域的数据访问能力。以及提供了对源数据请求的路由能力，可以根据元数据请求的类型，支持通过 Mapping 的方式，来路由不同的服务请求对应的底层元数据服务实例。

第二层是 CatalogService 下层的具体元数据服务的实现，比如 Hive MetaStore Service，ByteLake MetaStore Service 以及其他元数据服务。这些元数据服务与 CatalogService 进行对接，以统一向上层引擎提供元数据服务。

最后一层是 MetaStore 的存储层，它通过插件式的方式来提供不同的存储引擎，来满足上层不同元数据服务实例的存储要求。

LAS Batch Scheduler：云原生批处理调度器

Spark 作业提交到 Kubernetes 集群之后，如何高效的进行资源调度成为 LAS Spark 需要解决的下一个课题。Kubernetes default-scheduler 最初是为了容器编排服务设计的，虽然社区后续也做了大量的改进，但是在调度功能和吞吐性能上并不是批处理作业的最佳选择。因此，LAS 在云原生的基础上完善了 Spark 作业的资源调度能力。

LAS Batch Scheduler 提供了Gang Scheduling，FIFO/Fair Scheduling，min/maxQuota，优先级抢占，超卖，CPU/GPU混合调度等批处理作业依赖的所有调度能力，并通过全局调度缓存提升了批处理调度的性能。在架构上，我们采用了组合模式的设计，具有高度的扩展性，方便在后续基于批处理调度器进行进一步的改进。

针对不同规模 Spark 作业的执行特点，LAS 在 Batch Scheduler 的基础上，实现了服务态 workload 层面的资源 Quota 实时打通，从而实现服务态热启动的中小规模 Spark 作业和冷启动的大规模 Spark 作业在租户队列层面能够实现实时 Quota 共享。此外，LAS在多租户、安全性、实时弹性等等方面进行了众多优化，我们会在后续合适的机会再做进一步的展开。

UIService：云原生 Spark History Server

在完成资源调度之后，Spark 作业正式进入执行阶段。在 Spark 作业的执行阶段，LAS 进行了大量的优化工作，其中的详细内容将在其他专题分享文章中展开介绍。而在本文中，我们将重点分享 LAS 自主研发的全新云原生 Spark 历史服务—— UIService。相比开源的 SHS（Spark History Server），UIService 存储占用和访问延迟均降低 90% 以上。

原生的 Spark History Service 建立在 Spark 事件（Spark Event）体系之上，在 Spark 任务运行期间会产生大量包含运行信息的 SparkListenerEvent，例如 ApplicationStart / StageCompleted / MetricsUpdate 等等，都有对应的 SparkListenerEvent 实现。所有的 event 会发送到 ListenerBus 中，被注册在 ListenerBus 中的所有 listener 监听。其中 EventLoggingListener 是专门用于生成 event log 的监听器。它会将 event 序列化为 Json 格式的 event log 文件，写到文件系统中（如 HDFS）。

在 History Server 侧，核心逻辑在 FsHistoryProvider 中。FsHistoryProvider 会维持一个线程间歇扫描配置好的 event log 存储路径，遍历其中的 event log 文件，提取其中概要信息（主要是 appliaction_id, user, status, start_time, end_time, event_log_path），维护一个列表。当用户访问 UI，会从列表中查找请求所需的任务，如果存在，就完整读取对应的 event log 文件，进行解析。解析的过程就是一个回放过程（replay）。Event log 文件中的每一行是一个序列化的 event，将它们逐行反序列化，并使用 ReplayListener 将其中信息反馈到 KVStore 中，还原任务的状态。

无论运行时还是 History Server，任务状态都存储在有限几个类的实例中，而它们则存储在 KVStore 中，KVStore 是 Spark 中基于内存的 KV 存储，可以存储任意的类实例。前端会从 KVStore 查询所需的对象，实现页面的渲染。

原生的 Spark History Service 存在以下问题：

存储空间开销大

Spark 的事件体系非常详细，导致 event log 记录的事件数量非常大，对于 UI 显示来说，大部分 event 是无用的。并且 event log 一般使用 Json 明文存储，空间占用较大。

回放效率差，延迟高

History Server 采用回放解析 event log 的方式还原 Spark UI，有大量的计算开销，当任务较大就会有明显的响应延迟，大型作业结束之后，用户可能要等十几分钟甚至半小时才能通过 History Server 看到作业历史，非常影响用户体验。

扩展性差

History Server 的 FsHistoryProvider 在回放解析文件之前，需要先扫描配置的 event log 路径，遍历其中的 event log，将所有文件的元信息加载到内存中，这使得原生服务成为了有状态的服务。因此每次服务重启，都需要重新加载整个路径，才能对外服务。每个任务在完成后，也需要等待下一轮扫描才能被访问到。难以方便的进行水平扩展。

非云原生

Spark History Server 并非是云原生的服务，不同租户的 workload 差异很大，在公有云场景下改造和维护成本高。

为了解决前面的几个问题，我们尝试对 History Server 进行改造。

无论运行中 Spark Driver 还是 History Server，都是通过监听 event，将其中包含的任务变化信息反映到几种 UI 相关的类的实例中，然后存入 KVStore 供 UI 渲染。也就是说，KVStore 中存储着 UI 显示所需的完备信息。对于 History Server 的用户来说，绝大多数情况下我们只关心任务的最终状态，而无需关心引起状态变化的具体 event。因此，我们可以只将 KVStore 持久化下来，而不需要存储大量冗余的 event 信息。此外，KVStore 原生支持了 Kryo 序列化，性能明显于 Json 序列化。我们基于此思想重写了一套新的 History Serve 系统，命名为 UIService。

我们将 KVStore 中和 UI 相关的所有类实例，我们将这些类统称为 UIMeta 类。具体包括 AppStatusStore 和SQLAppStatusStore 中的信息（如下所列）。我们定义一个类 UIMetaStore 来抽象，一个 UIMetaStore 即一个任务所有 UI 信息的集合。

类似于 EventLoggingListener，为 UIMeta 开发了专用的 Listener —— UIMetaLoggingListener，用于监听事件，写 UIMeta 文件。

和 EventLoggingListener 进行对比：EventLoggingListener 每接受一个 event 都会触发写，写的是序列化的 event；而 UIMetaLoggingListener 只会被特定的 event 触发，目前是只会被 stageEnd，JobEnd 事件触发，但每次写操作是批量的写，将上一阶段的 UIMetaStore 的信息完整地持久化。

我们使用 UIMetaProvider 替换原先的 FsHistoryProvider，主要区别在于：

将读取 event log 文件和回放生成 KVStore 的流程改为读取 UIMetaFile，反序列化出 UIMetaStore。
去掉了 FsHistoryProvider 的路径扫描逻辑；每次 UI 访问，根据 appid 和路径规则，直接去读取 UIMetaFile 解析。这使得 UIService 无需预加载所有文件元信息，不需要随着任务数量增加提高服务器配置，方便了水平扩展。

通过构建 UIService，我们极大的节省了 Spark UI 相关 event 的存储空间，并有效的提升了 UI 访问延迟性能，在架构上我们也基于 UIService 实现了多租户访问隔离，云原生和弹性伸缩能力。

Falcon：Remote Shuffle Service

除了 UIService 之外，Shuffle 层面的优化也是一个值得重点分享的课题。Shuffle 是 Spark 作业中用于连接上下游数据交互的过程。提供 Shuffle 能力的服务称为 Shuffle Service。最初，Spark 内部实现了基于哈希的 Shuffle Service，后来引入了基于排序的 Shuffle Service。尽管 Spark 内部不断对 Shuffle 机制进行迭代和改进，但由于存储和计算之间的耦合限制，Spark 内部实现的 Shuffle 机制在某些场景下可用性受到限制。

为了解决这个问题，业界提出了将 Shuffle Service从Spark 中独立出来的 Shuffle 设计，通常称为 Remote Shuffle Service（RSS）。 RSS 允许 Shuffle Service 在 Spark 之外运行，解耦了存储和计算，提供更好的可用性和性能。

Falcon 是 LAS 上的 Remote Shuffle Service，采用高可用及存算分离的架构。它能够支持 Spark 引擎进行远程 Shuffle 数据的读取和写入，并可在云环境中部署和应用。

Falcon 实现了在 Reducer 端聚合数据的能力，解决了 Shuffle 阶段碎片读的问题，这大大降低了对磁盘 IOPS 的依赖，减少了 Spark Executor 运行时 OOM（内存溢出）的风险，保障了大 Shuffle 作业的稳定性。此外，Falcon 还提供了 Tiered Storage（分层存储）能力，根据作业规模的不同选择不同介质（内存/SSD/HDD）存储 Shuffle 数据，进一步提升了中小规模作业执行性能。

在 Falcon上，LAS 提供了 CRC 校验方案，以保障 Shuffle 数据的稳定性，避免了因为数据丢失导致的执行正确性问题。

总结

以上就是本文想要与大家分享的 LAS Spark 在云原生湖仓分析服务中的实践和优化内容。无论是面对大规模数据处理、实时分析还是复杂的人工智能任务，基于 Spark 的云原生湖仓分析实践为企业提供了一种强大的解决方案。通过本篇实践指南，希望能够帮助读者深入理解云原生湖仓一体分析服务 LAS 基于 Spark 引擎的一系列设计和实践，并在实际项目中应用 Spark 和云原生技术，为企业的数据驱动决策和创新提供支持。

考虑到篇幅限制，本文未能对许多实践细节进行详尽展开。我们会在后续的专题文章中对其进行更深入的解读。感兴趣的读者可以继续关注我们的后续分享。

湖仓一体分析服务 LAS（Lakehouse Analytics Service）是面向湖仓一体架构的 Serverless 数据处理分析服务，提供字节跳动最佳实践的一站式 EB 级海量数据存储计算和交互分析能力，兼容 Spark、Presto 生态，帮助企业轻松构建智能实时湖仓。新人优惠来袭！赠送给所有新人用户的专属福利来啦，LAS 数据中台新人特惠 1 元秒杀活动最新上线！更有超多叠加优惠等你来抢！感谢大家一直以来对我们的支持与厚爱，我们会一如既往地为您带来更好的内容。（点击链接，可顺滑体验）

链接：zjsms.com/jVCr5bp/

第5节课：HTML5 新标签——构建更智能的网页结构学问小小谢 HTML学习 html5 前端学习
目录语义化标记的重要性新标签详解````````````实践：使用HTML5新标签构建网页结语随着HTML5的推出，网页开发者们获得了一套新的强大工具——语义标签。这些标签不仅帮助我们更好地组织内容，还使得网页更易于搜索引擎优化（SEO）和辅助技术访问。本节课将深入探讨HTML5中的新语义标签，包括、、、、和，并强调使用这些标签进行语义化标记的重要性。语义化标记的重要性在HTML5之前，我们通常使
如何写一份合格的大数据简历（附简历模板）教程 itLeeyw573 老板必点的高分简历 sqlite oracle mysql sql zookeeper kafka big data
一、简历的重要性简历是求职者给招聘者的第一印象，一份合格的简历能够快速让招聘者了解你的基本信息、工作经历、技能特长等，从而决定是否给予你面试机会。它是开启理想工作大门的钥匙，所以一定要重视起来。【编辑/下载】：大数据开发简历范文二、简历结构基本信息：包含姓名、性别、联系方式（电话、邮箱）、求职意向。姓名要突出显示，联系方式务必准确无误，求职意向明确且具体，比如“Java开发工程师”，让招聘者一眼就
深入探索SQL中修改表字段属性的技巧与策略不一样的信息安全数据库 oracle sql
摘要在SQL中，修改表字段属性是一项常见的数据库管理任务。用户可以调整字段的数据类型、长度、默认值或注释，而无需更改字段名称。例如，varchar类型可转换为mediumtext或text，NVARCHAR2类型可转换为NCLOB。若需同时变更字段名称及其属性，亦可通过特定SQL语句实现。此外，修改字段的默认值同样可行。这些操作有助于优化数据库结构，提升数据存储和查询效率。关键词SQL修改字段,数
用SpringBoot+mysql+html实现ATM 系统总结与扩展 SAFE20242034 #一 SpringBoot spring boot mysql html
这里写目录标题ATM系统总结与扩展项目概述主要功能模块1.用户注册2.用户登录3.账户查询4.存款与取款5.转账6.修改密码7.销户系统改进建议功能扩展技术优化完整代码实现数据库表设计后端代码（SpringBoot示例）1.Account实体类2.AccountRepository接口3.AccountController类前端代码（HTML+JavaScript示例）实际开发与部署步骤**1.开
Invocation of init method failed； nested exception is java.sql.SQLException: com.mysql.cj.jdbc.Drive weixin_42277889 mysql java sql
代码更新后连不上数据库，前天都还可以，现在不行了，一直报错mysql没有。Pom文件全局搜也灭有。一开始是查不到的，但是实际上pom文件中引入了，maven没有更新。。。。
基于 Spring 的本地事务管理可儿·四系桜 java 数据库
1.什么是本地事务？本地事务是指在单一数据库系统内执行的一组操作，这些操作要么全部完成，要么全部不执行，是一个不可分割的工作单元。本地事务具有ACID特性：原子性（Atomicity）：事务中的所有操作都作为一个整体提交或回滚；如果事务的一部分失败，则整个事务都会被撤销。一致性（Consistency）：事务将数据库从一个一致状态转换到另一个一致状态，确保数据的完整性和规则得到遵守。隔离性（Iso
python多线程并发加速 AI算法网奇 python宝典 mysql python基础数据库
目录python多线程并发加速多线程例子打印线程号，进程号由于Python的全局解释器锁（GIL）限制，在CPU密集型任务中多线程的效果并不理想，但对于I/O密集型任务，多线程仍然是有效的。python多线程并发加速python多线程并发遍历数据库，然后查询历史记录，然后分析数据查询100ms，这时需要3分钟，加了并发处理后，需要1.2分钟后来数据库加了索引，需要6秒就可以了，总结：加索引能带来3
Python语言的安全开发慕璃嫣包罗万象 golang 开发语言后端
Python语言的安全开发引言在信息技术迅速发展的今天，网络安全问题愈发凸显。随着Python语言的广泛应用，尤其是在数据分析、人工智能、Web开发等领域，其安全问题越来越受到重视。Python作为一门高效且易于学习的编程语言，虽然在开发过程中为我们提供了很多便利，但如果忽视了安全性，将可能导致严重的安全漏洞和数据泄露等问题。因此，本文将围绕Python语言的安全开发展开讨论，重点分析常见的安全问
React 19 深度剖析：从架构升级到性能优化九情丶 react.js 架构性能优化
React19深度剖析：从架构升级到性能优化目录React19架构升级新特性深度解析性能优化最佳实践高级功能应用工程化实践迁移策略实战案例常见问题解决1.React19架构升级1.1新一代并发渲染引擎React19采用全新的并发渲染架构，显著提升了应用性能：//新的并发模式配置constroot=createRoot(document.getElementById('root'),{concurr
DM数据库体系结构详解 weixin_46474599 达梦数据库
数据库体系结构分成四个部分，分别是DM逻辑结构，DM物理存储结构，DM内存结构，管理DM线程。DM逻辑结构：1.DM数据库和实例的联系与区别（1）DM数据库指的是磁盘上存放在DM数据库中的数据的集合，一般包括：数据文件、日志文件、控制文件以及临时数据文件等。（2）实例一般是由一组正在运行的DM后台进程/线程以及一个大型的共享内存组成。简单来说，实例就是操作DM数据库的一种手段，是用来访问数据库的内
DM数据库体系结构介绍星星有泪了数据库
1、DM逻辑结构DM数据库为数据库中的所有对象分配逻辑空间，并存放在数据文件中。在DM数据库内部，所有的数据文件组合在一起被划分到一个或者多个表空间中，所有的数据库内部对象都存放在这些表空间中。同时，表空间被进一步划分为段、簇和页（也称块）。通过这种细分，可以使得DM数据库能够更加高效地控制磁盘空间的利用率。下图显示了这些数据结构之间的关系。在DM8中存储的层次结构如下：数据库由一个或多个表空间组
MongoDB 大俗大雅，上来问分片真三俗 -- 4 分什么分 Austindatabases mongodb 数据库
开头还是介绍一下群，如果感兴趣PolarDB,MongoDB,MySQL,PostgreSQL,Redis,OceanBase,SqlServer等有问题，有需求都可以加群群内有各大数据库行业大咖，可以解决你的问题。加群请联系liuaustin3，（共2710人左右1+2+3+4+5+6+7+8+9）(123456群均已爆满，7群400+，开8群9群)这是MongoDB宣传周的第五篇，这周真漫长，
大数据技术在数据安全治理中的应用罗思付之技术屋综合技术探讨及方案专栏大数据
摘要面对新形势下的数据安全治理挑战，顺应数据安全领域的技术发展趋势，针对大型国企在数据安全治理实际应用中突出的关键权限人员识别问题，提出了一种基于图算法的关键权限人员识别技术。该技术可以发现系统中潜在的权限影响因素，并可从多个角度衡量不同含义的权重影响力，识别结果可解释性强。针对数据安全治理中的用户与实体行为异常检测问题，提出一种基于生成对抗网络的用户与实体行为异常检测方法，实验结果表明，所提方法
为什么LabVIEW适合软硬件结合的项目？ LabVIEW开发 LabVIEW开发案例 LabVIEW开发案例
LabVIEW是一种基于图形化编程的开发平台，广泛应用于软硬件结合的项目中。其强大的硬件接口支持、实时数据采集能力、并行处理能力和直观的用户界面，使得它成为工业控制、仪器仪表、自动化测试等领域中软硬件系统集成的理想选择。LabVIEW的设计哲学强调模块化、可视化和易于操作，使开发者能够快速实现复杂的软硬件交互系统，同时提供了强大的数据分析与可视化功能。通过与多种硬件平台的兼容，LabVIEW能够为
数据库索引(1) 比特知识工坊 MySQL专栏数据库 adb
数据库索引1.索引介绍索引是一种特殊的数据库结果，由数据表中的一列或多列组合而成，可以用来快速查询数据表中某一些特定值的记录。通过索引，查询数据是不用读完记录的所有信息，而只是查询索引列。否则，数据库系统将读取每条记录的所有信息进行匹配。可以把索引必做新华字典的音序表。例如，要查‘‘库’’字，如果不使用音序，就需要从字典的400页中逐页来找，但是，如果提取拼音出来，构成音序表，就只需要从10多页的
DM数据库体系架构小蜗牛_ 数据库
目录一、逻辑存储结构二、物理存储结构三、内存结构3.1内存池3.2缓冲区3.3排序区3.4哈希区四、管理DM线程一、逻辑存储结构DM数据库为数据库中的所有对象分配逻辑空间，并存放在数据文件中。在DM数据库内部，所有的数据文件组合在一起被划分到一个或者多个表空间中，所有的数据库内部对象都存放在这些表空间中。同时，表空间被进一步划分为段、簇和页（也称块）。通过这种细分，可以使得DM数据库能够更加高效地
mybatis项目@Insert注解批量插入数据库执子手吹散苍茫茫烟波 mysql 框架 mybatis annotations mysql
entitypackagecom.fanyu.mybatis.entity;/***CreatedwithIntelliJIDEA.**@Auther:cloudonthesun*@Date:2021/4/2615:59*@Description:*/publicclassTeacher{privateIntegerid;privateStringname;privateStringsex;pri
flask搜索mysql_数据库|Flask实现简单搜索功能科技松鼠会 flask搜索mysql
数据库|Flask实现简单搜索功能2021-01-16问题描述用Flask实现简单搜索功能主要是通过form的方式传值，再到数据库中查询。下面是数据库的内容，主要是实现对content进行模糊匹配。图1数据库内容解决方案1.首先打开pycharm，构建一个最简单的flask应用。#search.pyfromflaskimportFlaskapp=Flask(__name__)@app.route(
Mybatis-Flex的魅力星空宇航员 mybatis 数据库
目录一、Mybatis-Flex是什么？二、Mybatis-Flex的有什么特点？三、Mybatis-Flex和同类框架对比1）功能对比2）性能对比1.测试单条数据2.测试列表(List)数据查询3.分页查询4.数据更新总结四、Mybatis-Flex支持的数据库类型五、入门案例1.创建数据库2.创建SpringBoot项目，并添加Maven依赖3.对SpringBoot项目进行配置4.编写实体类
利用长尾关键词优化SEO策略提升网站流量的实用建议老陈头聊SEO 其他
内容概要在当今数字营销的环境中，网站流量的获取是一项至关重要的任务。随着搜索引擎优化（SEO）技术的发展，长尾关键词逐渐被越来越多的网站管理员和内容创作者所重视。长尾关键词一般指的是那些较长且具体的搜索词组，虽然搜索量相对较少，但通常具有更高的转化率和更低的竞争度。因此，理解和利用长尾关键词，将为提升网站流量提供了有效手段。“要想在竞争激烈的网络环境中脱颖而出，主动挖掘和应用长尾关键词，将为您带来
[疯狂Java]正则表达式：捕获组、反向引用、捕获组命名 Lirx_Tech 疯狂Java笔记疯狂Java 正则表达式捕获组反向引用捕获组命名
1.捕获组及其编号：1)捕获组之前讲过，就是匹配到的内容，按照()子表达式划分成若干组；2)例如正则表达式：(ab)(cd(ef))就有三个捕获组，没出现一对()就是一个捕获组3)捕获组编号规则：i.引擎会对捕获组进行编号，编号规则是左括号(从左到右出现的顺序，从1开始编号；ii.例如：2.反向引用：1)捕获组的作用就是为了可以在正则表达式内部或者外部（Java方法）引用它；2)如何引用？当然是通
APL语言的正则表达式慕璃嫣包罗万象 golang 开发语言后端
APL语言中的正则表达式引言APL（AProgrammingLanguage）是一种高层次的编程语言，以其简洁的符号和强大的数组处理能力著称。虽然其主要用途通常集中在数值计算和数据处理，但APL也提供了对字符串操作的支持。在这方面，正则表达式作为一种强大的字符串处理工具，能够帮助程序员更高效地进行模式匹配和文本处理。因此，了解APL语言中的正则表达式的使用方法，对于从事数据分析、文本处理等工作的程
阿里巴巴大数据系统体系架构大连赵哥大数据架构
数据应用层：这是最顶层，面向不同的用户群体提供服务，包括对内（公司内部使用）、对平台（平台用户）、对商家（商家使用）、对公众（普通消费者）。数据服务与基础工具层：这一层提供了一些基础服务和工具，例如：OneService：可能是一种服务或工具，用于统一数据服务。TDDL+MySQL：TDDL是淘宝分布式数据层的缩写，与MySQL结合使用，提供数据库服务。HBase：一个分布式列存储系统，适合于存储
新站如何快速获得搜索引擎收录？百度网站快速收录搜索引擎
本文来自：百万收录网原文链接：https://www.baiwanshoulu.com/8.html新站想要快速获得搜索引擎收录，需要采取一系列有针对性的策略。以下是一些具体的建议：一、网站内容优化高质量原创内容：确保网站内容原创、独特且有价值，满足搜索引擎和用户的需求。定期更新内容，保持网站的活跃度和吸引力。关键词布局：在标题、正文、图片alt标签等位置合理分布关键词，提高网页的相关性。避免关键
Redis与MySql的区别 GugarF95 redis mysql 数据库
Redis和MySQL是两种不同类型的数据库系统，它们在数据存储方式、性能特点、适用场景等方面存在诸多区别，以下是详细介绍：数据存储类型MySQL：是一种关系型数据库管理系统（RDBMS），以表格的形式组织数据，表由行和列组成，每行代表一个记录，每列代表一个属性。通过定义表结构，包括字段类型、长度、是否为主键等约束条件，来存储结构化数据，如用户信息表、订单表等。支持复杂的数据关系，如一对一、一对多
SQL刷题快速入门(一) L~river 算法刷题 sql oracle 数据库刷题笔试
其他章节：SQL刷题快速入门（二）SQL刷题快速入门（三）SQL（StructuredQueryLanguage，结构化查询语言）是用于管理和操作关系型数据库的一种标准计算机语言。SQL最初由IBM在20世纪70年代开发，并且自1986年以来，它已经被美国国家标准协会（ANSI）和国际标准化组织（ISO）作为标准发布。SQL的主要用途包括：数据查询：通过SELECT语句从数据库中检索数据。数据更新
MySQL UNION 操作详解 lsx202406 开发语言
MySQLUNION操作详解引言在数据库操作中，UNION是一个非常重要的概念，它允许我们在一个查询中合并多个SELECT语句的结果集。UNION操作通常用于将来自不同表的数据合并在一起，或者将同一表中的数据按照不同的条件进行合并。本文将详细介绍MySQL中的UNION操作，包括其语法、使用场景以及注意事项。UNION语法UNION语法的基本格式如下：SELECTcolumn_name(s)FRO
996引擎 - NPC-添加NPC引擎自带形象笑虾 996引擎 996引擎
996引擎-NPC-添加NPC引擎自带形象截图参考添加NPC参考资料截图参考添加NPC编辑NPC表：Envir\DATA\cfg_npclist.xls1.1.需要临时隐藏NPC时可以在id前加//1.2.如果NPC朝向不对，可以调整dir列。（按8方向，上是0顺时针数。我这里给的4）1.3.形象代码：NPC代码、怪物编号（官网好像显示不太正常，直接看：996M2引擎帮助文档.chm也行）1.4.
C#使用实体类Entity Framework Core操作mysql入门：从数据库反向生成模型2 处理连接字符串初级代码游戏 dotnet和C#数据库 mysql EntityFramework
初级代码游戏的专栏介绍与文章目录-CSDN博客我的github：codetoys，所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。这些代码大部分以Linux为目标但部分代码是纯C++的，可以在任何平台上使用。源码指引：github源码指引_初级代码游戏的博客-CSDN博客本文接上一篇：C#使用实体类EntityFrameworkCore操作mysql入门：从数据库反向生成模型-C
【云原生】Docker搭建开源翻译组件Deepl使用详解小码农叔叔 linux与容器实战 docker部署翻译组件 docker部署deepl docker搭建deepl java对接deepl 翻译组件使用
目录一、前言二、微服务项目使用翻译组件的场景2.1多语言用户界面2.2业务逻辑中的翻译需求2.3满足实时通信的要求2.4内容管理系统2.5个性化推荐系统2.6日志和监控三、开源类翻译组件解决方案3.1国内翻译组件方案汇总3.1.1百度翻译3.1.2腾讯翻译3.1.3阿里翻译(通用版)3.1.4华为翻译3.1.5小牛翻译3.1.6有道翻译3.1.7火山翻译3.1.8讯飞翻译3.2国外翻译组件方案汇总
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl