登峰大数据

《Data Lakehouse in Action》学习笔记--第2章 Data LakeHouse架构概述

深思熟虑的架构是任何健壮的信息技术(IT)系统的基石，data lakehouse也不例外。上一章阐述了现代数据分析平台的必要性。还讨论了data lakehouse的演变。本章将重点讨论data lakehouse的关键元素。

本章将从描述data lakehouse的系统上下文开始。然后，研究与data lakehouse交互的参与者和系统。

我们将讨论由7层组成的data lakehouse的逻辑架构。然后，本章将深入研究data lakehouse架构的各个组件，并对每个组件进行详细阐述。本章的最后一节将重点讨论为实现data lakehouse提供框架的五个神圣的架构原则。

总而言之，本章涵盖以下主题:

data lakehouse系统上下文
data lakehouse逻辑架构
架构原则

Data LakeHouse系统上下文

系统上下文关系图显示了与系统交互的不同实体。在下图中是一个data lakehouse的系统上下文：

图2.1 data lakehouse系统上下文图

上图显示了与Data LakeHouse交互的关键实体(系统或参与者)。与Data LakeHouse的交互有两个部分，如下所示:

数据提供者：向Data LakeHouse提供数据的系统或参与者
数据使用者：使用来自Data LakeHouse的数据的系统或参与者

让我们详细检查这些实体。

数据提供者

数据提供者是将数据接入到Data LakeHouse的任何系统或参与者。任何生成数据的系统都是潜在的数据提供者。这里列出了一些典型的数据提供者:

软件操作系统：任何生成数据的系统都是潜在的数据提供者。通常，在线事务处理(OLTP)系统生成和存储事务性数据。这些系统中的数据以高度规范化的方式存储在关系数据库中。由于数据是高度规范化的，因此该设计被优化以有效地捕获和更新事务。这样的系统不适合分析。 OLTP系统在所有组织中都很普遍，并构成了大多数结构化数据存储。然而，并不是所有的操作数据都是关系型的。另一种形式的操作性数据存储包括Not-Only SQL (NoSQL)数据库。 NoSQL数据库中的数据不是表格式的。它的设计目的是将数据存储在一个灵活的模式中，其结构可以根据输入数据类型快速调整。这些数据库以各种格式存储数据，包括键值对、图和JSON。
文本数据：对于非结构化数据/文档，文本数据是最主要的非结构化数据类型。这类数据包括文档和纯文本，比如手写的笔记。 自然语言处理(NLP)是人工智能(AI)的一个已建立的分支，我们可以从文本数据中提取宝贵的见解。人工智能算法分析文本的能力正变得越来越复杂。
流数据：数据不只是静止的。有一类处于运动中的数据。流数据是指在固定时间内从系统中不断传输的数据。流数据包括来自物联网(IoT)设备的遥测数据，来自社交媒体平台(Twitter、Facebook (Meta)、YouTube、点击流、游戏等)的持续反馈，来自金融交易平台的连续数据，以及传输位置信息的地理空间服务。如果进行实时分析，这类数据将满足一系列用例，如复杂事件处理(CEP)、情感分析、关键字检测等。
媒体数据：媒体数据包括与语音、视频和图像相关的各种数据结构。我们可以使用音频数据来实现语音识别、语音到文本翻译和实时语音翻译等用例。媒体数据还包括视频和图片，我们可以使用它们来执行广泛的用例。卷积神经网络(CNN)等人工智能算法已经发展到比人类更能识别图像中的物体。随着大量视频和图像数据的出现，人工智能技术正被用于实现从目标检测到自动驾驶汽车的高级用例。

我们已经看到了典型的数据提供者和这些类型的数据可以实现的用例场景。现在，让我们关注谁是使用来自Data LakeHouse的数据的利益相关者。

下表总结了关键的数据提供者、数据类型和被实现的典型用例:

图2.2 典型的数据提供者和用例

接下来，让我们看看谁将使用这些数据。

数据使用者

一旦数据被接入到Data LakeHouse，各种利益相关方将以原始或转换后的形式使用它。这些利益相关者将从Data LakeHouse中提取用于特定目的的数据。每个消费者都有使用Data LakeHouse的个人动机。一个架构良好的Data LakeHouse应该能够满足每一个涉众的需求。让我们看看一些典型的用户和系统，他们使用来自Data LakeHouse的数据，如下所示:

数据科学家：我们看到使用Data LakeHouse的第一类人是数据科学家，他们从Data LakeHouse中提取数据，以测试他们可能想要证明或反对的各种假设。数据科学家研究各种类型的数据：结构化的、非结构化的、原始的和处理过的。 Data LakeHouse需要能够确保数据对于特定用途是容易识别的，用户必须精通许多编程语言和技术，包括Python、R和结构化查询语言(SQL)，架构需要为这个用户提供正确的平台来创建和测试他们的模型。
数据分析师：使用Data LakeHouse的第二类人是分析师。他们主要是业务驱动的，寻求业务问题的答案，并且精通报表工具或基于SQL的语言。他们主要处理处理过的数据，他们的日常工作包括执行业务分析。通过查询、聚合和切片数据(主要是清理和处理的数据)来完成这项任务。 Data LakeHouse应该迎合这样的用户，为他们提供一个平台，进行有效和无缝的数据分析。
管理人员：第三类大量使用Data LakeHouse的人是管理人员，他们需要定期的报表以进行业务决策。他们深入研究那些按特定业务需求处理过数据。他们可能是半技术通，可能需要一个使用商业智能(BI)工具创建报表或分析的地方。这些人通常通过报表系统获取他们所需的报表。
报表系统：Data LakeHouse的其他关键用户是报表系统。报表系统间接地迎合了希望订阅预定的、临时的或自助报表的人员。此外，可能还有其他类型的报表系统是为了监管报表。这些系统定期从Data LakeHouse中提取数据，然后存储报表以便交付。
下游应用系统：当数据从上游应用程序接入到Data LakeHouse时，下游应用程序也会使用处理过的信息。这些应用程序可能是OLTP系统，也可能是另一个数据仓库或数据湖，其任务与企业Data LakeHouse(EDL)不同。通常，用于下游消费的数据要么定期从Data LakeHouse中提取，要么使用一种可行的机制将数据推送到目的地。
基于应用程序编程接口(API)的系统：Data LakeHouse还需要能够以API的形式公开数据。 Data LakeHouse处理各种类型的数据，需要服务于多个内部和外部系统。虽然紧密耦合的交付机制可能适用于特定的使用者，但基于API的数据使用是一种可伸缩且实用的选择。此外，基于API的系统还可以公开不属于组织的外部涉众所使用的数据。
数据共享系统：数据共享系统代表了一种新型的数据消费机制。当数据作为数据市场的一部分被消费或共享时，就会使用这种机制。当需要就数据使用的特定条款达成一致时，也可以使用数据共享机制。

下表总结了数据使用者的主要动机和典型需求:

图2.3 典型的数据使用者和用例

所以，现在我们知道谁可能在使用我们的lakehouse，让我们开始考虑如何建造它。

Data LakeHouse逻辑架构

我们讨论了Data LakeHouse系统上下文。现在让我们开始开发Data LakeHouse逻辑架构。逻辑架构关注集成以满足特定功能需求(FR)和非功能需求(NFR)的组件。它被抽象到一个与技术无关的级别，并专注于组件功能。逻辑架构主要关注以下两种需求:

FR是实现特定业务或领域驱动的行为的需求。这些类型的需求是由任务和特定业务功能的需求驱动的。
NFR是一种需求，它指定了需要满足的标准，以便系统在特定的环境中发挥作用。例如，典型的NFR包括预期完成特定查询的时间、数据加密的需求，等等。

一个架构良好的系统可以确保它的架构能够满足NFR，而不会有太多的权衡。下图描述了Data LakeHouse的逻辑架构:

图2.4 Data LakeHouse逻辑架构

如上图所示，Data LakeHouse架构有七个层，它们交织在一起形成了一个架构良好的Data LakeHouse。现在让我们详细研究每一层。

数据接入层

要详细说明的第一层是数据接入层，也叫数据摄取/摄入层。这一层是Data LakeHouse的外部数据提供者之间的集成点。有两种类型的数据接入服务，如下图所示:

图2.5 数据接入服务的类型(译者注：这就需要一个流批一体的ETL工具译者当前使用的是Streamsets流批一体ETL工具)

这里有更详细的解释:

批量数据接入服务：批量接入指的是定期将数据接入到Data LakeHouse。接入的频率从几分钟到几天不等。周期频率取决于许多因素，包括NFR、数据源生成数据的能力，以及数据源推送数据或允许服务拉取数据的能力。典型的软件操作系统需要将数据推入或拉入Data LakeHouse。在分批地接入数据时，需要考虑的一个关键问题是接入数据的源系统的可用性以及接入批次数据的大小。这两个因素都将影响数据如何被接入到Data LakeHouse。
实时数据接入服务：实时数据接入服务允许数据在生成时被拉入(pull)Data LakeHouse。实时数据是一种恒定的数据流，因此必须识别感兴趣的数据并将其拉入Data LakeHouse进行存储或实时处理。实时接收通常由队列服务(如Kafka)组成，它可以将实时流分组并临时存储为接收队列。流服务还用于通过更改数据捕获(CDC)持续捕获数据库中的数据更改。在接收流数据时，与流数据吞吐量相关的考虑和与延迟相关的需求变得很重要。

数据湖层

一旦数据接入层接入数据，就需要将其送到存储中，并且需要对其执行各种转换，以供使用。最后，将数据落在数据湖中。可以在这里看到这一层的可视化表示:

图2.6 数据湖层的数据存储类型

数据湖层有四种重要的存储类型，如下所示:

原始数据：原始数据存储是存储从数据提供者获取的数据。顾名思义，数据以其自然形式存储在原始数据存储中。因此，数据与源格式、结构和内容是一致的。原始数据存储可以将数据生成位置与Data LakeHouse解耦。
中间数据：当数据经过Data LakeHouse并进行转换时，中间数据集被创建。这些中间数据集可以是暂时的，也可以是持久的。这些数据集可以存储在数据湖层，可以加速数据处理。中间数据还使数据处理管道不受完全重启的影响。
处理数据：一旦数据被转换，我们就可以将结果数据集存储在数据湖中。然后可以将该数据集用于服务或分析目的。经过处理的数据适用于下游消费。然而，在数据湖层中处理的数据提供了相对便宜的存储成本。它还允许数据科学家和分析人员使用处理过的数据进行实验或分析，而不会给服务层带来额外的开销。
存档数据：用于洞察的数据通常都很热门。热数据是指用于存储数据的存储技术可以保证更好的吞吐量和可访问性。然而，并不是所有的数据都需要是热的。不用于分析但需要存储的数据可以转移到更便宜的存储技术。这种数据称为归档数据。

数据处理层

需要对数据进行转换或处理，以便对其进行消费。数据处理服务执行将接收到的数据转换为可以提供给涉众的形式的工作。可以在这里看到这一层的可视化表示:

图2.7 数据处理服务的类型

有两种类型的数据处理服务，如下所述:

批量数据处理服务：批量数据处理服务周期性地处理数据，无需终端用户交互。数据首先落在原始数据区。一旦数据进入原始数据区，批处理服务将获取原始数据并执行所需的转换。批量数据处理服务需要随需应变，并且可以根据需要进行扩展。
流数据处理服务：另一种处理是流数据处理。捕获实时流数据并对其进行处理，而不需要将数据落盘或存储在磁盘上。所有的流处理都在内存中进行，数据几乎是实时转换的。典型的流数据处理服务还具有消息队列层，该层捕获数据流，并将它们排队以供进一步处理。当数据流被接收和处理时，原始数据作为一条路径被发送到数据湖存储器进行存储。另一条路径进行实时处理，并将输出发送给下游消费。最后，转换后的数据也被推入数据湖层进行持久存储。

接下来，让我们讨论一下数据服务层。

数据服务层

一旦数据被处理，就可以用于下游的消费。这些信息可以提供给不同的涉众，他们都有适合自己需要的需求。可以在下图中看到组成这一层的服务:

图2.8 数据服务服务的类型

一般来说，有四种类型的数据服务，概述如下:

数据仓库服务：第一种类型的数据服务是数据仓库服务。数据仓库服务提供经过清理和转换的数据，这些数据可以用于多种用途。首先，它用作报表和BI层。其次，它是一个用于业务或数据分析的数据查询平台。第三，它作为一个存储库来存储需要在线可用的历史数据。最后，它还充当其他下游数据集市转换数据的来源，这些数据集市可能满足特定的部门需求。
实时数据服务：第二种服务是提供实时数据。实时数据服务用于为各种下游应用程序提供服务。这类应用的几个例子是移动系统，实时数据提供给下游应用，如客户关系管理(CRM)系统，网站或移动应用的推荐引擎，以及实时异常值检测系统，如欺诈检测。实时数据服务以多种技术格式显示，如果服务正确，会增加巨大的业务价值。
基于API的数据服务：用于共享数据的第三种服务是基于API的数据服务。 API是一种接口，它允许应用程序使用一组简单的命令与外部服务进行交互。数据也可以作为API交互的一部分。由于数据公开给多个外部服务，因此基于API的方法可以扩展到与外部服务安全地共享数据。通过API提供的数据是JSON格式的，因此使用API提供数据的技术应该能够支持JSON格式。例如，NoSQL数据库可以存储这样的数据。
数据共享服务：第四种服务是数据共享服务。数据共享数据服务共享来自组织或其他组织中的多个数据源的数据，数据格式和大小不限。这种类型的服务提供共享数据所需的控制，并允许创建数据共享策略。它还支持以结构化的方式共享数据，并对如何共享数据和如何使用数据提供了完整的可见性。数据共享系统使用API进行数据共享。

数据分析层

数据分析层包括从数据中提取洞察力的服务。它们是分析师、数据科学家和BI用户创建报表、执行分析和试验AI/ML模型的游乐场。你可以在下面的图中看到这一层的服务:

图2.9 数据分析服务的类型

在数据分析层有三种类型的服务，概述如下:

分析沙盒服务：分析沙盒是一个数据科学家和分析师可以部署他们的工具进行数据实验的游乐场。沙盒应该为基于SQL的分析和开发ML模型提供不同种类的工具。该层还应该与数据湖层和数据服务层无缝集成。这一层应该按需启动和关闭工具集，以促进快速实验。
人工智能和机器学习(AI-ML)服务：AI和机器学习服务是现代数据分析平台的重要组成部分。 AI-ML服务允许数据科学家构建、训练和部署可用于生产的AI-ML模型。这一层还提供了维护和监控此类模型的框架。此外，它还提供了团队在构建这些模型时进行协作的能力。该服务应该能够根据需要向上或向下扩展，并且应该能够促进自动模型部署和操作。
商业智能(BI)服务：BI服务从企业数据仓库(EDW)时代就已经出现了。在Data LakeHouse架构中，它们实现了相同的功能。该服务需要用于创建报表、执行数据可视化和促进自助BI的工具和技术。主要侧重于创建不同的表格或可视化视图，以显示当前和历史操作视图。

数据治理层

垃圾输入、垃圾输出 的原则也适用于Data LakeHouse。 Data LakeHouse中的数据需要得到适当的管理，这一层负责管理。你可以在这里看到它的可视化表示:

图2.10 数据治理服务的类型

四个组件有助于确保Data LakeHouse不会变成数据沼泽。这些措施概述如下:

数据策略管理：第一个组件不是技术组件——它是一组数据策略和标准。数据策略是一组描述控制Data LakeHouse中数据的标准、安全性、完整性、质量和使用的规则的语句。
数据编目和管理服务：数据编目和管理是组织数据目录以便易于识别的过程。该服务确保所有源系统数据、数据湖和数据仓库中的数据、数据处理管道以及从Data LakeHouse提取的输出都被适当地编目。把数据编目服务看作是数据领域的Facebook----一个获取所有data lakehouse内容的可视化信息的地方，包括关于数据之间关系的信息，以及数据经过的一系列转换的血缘关系。
数据质量服务：在Data LakeHouse中存储或接入的任何数据都必须有一个数据质量评分，以确定数据的可靠性和可用性。有许多参数决定了数据的质量。其中一些参数包括数据的完整性、数据的一致性和数据的准确性。数据质量服务确保数据是完整、一致和准确的。

数据安全层

Data LakeHouse架构的最后一层是数据安全层。数据安全性本身就很重要，其重要性再怎么强调也不为过。你可以在下图中看到组成这一层的服务:

图2.11 数据安全服务的类型

数据安全层有四个关键组成部分，如下:

IAM (Identity and Access Management 身份和访问管理)服务：对Data LakeHouse的访问必须是安全的，并根据需要进行。 IAM服务充当访问Data LakeHouse的大门。 IAM服务可以保证访问Data LakeHouse的授权和鉴权的安全性和可靠性。它提供了对恶意登录尝试的防御，并通过基于风险的访问控制、身份保护工具和健壮的身份验证选项保护凭证——而不会影响生产效率。
数据加密服务：数据加密是一种对信息进行编码的安全方法，只有用户使用正确的加密密钥才能访问或解密。当数据存储在云中时，数据加密是必不可少的。有许多不同的算法可用于加密数据。加密为静态存储的数据提供数据保护。它可以防止各种类型的网络攻击，并保护敏感数据。组织对数据治理和遵从性工作的需求也可能需要数据加密。因此，数据安全层需要有根据需要对数据进行加密和解密的工具。
数据屏蔽(Masking)服务：许多数据子集需要被屏蔽，以保护个人的身份或隐私。这种类型的数据包括电子邮件、社会识别号码、信用卡号码等。数据屏蔽是一种创建隐藏的但可读的数据版本的方法。其目标是保护敏感数据，同时在不需要实际数据时提供功能性替代方案。数据安全层需要一些工具来屏蔽这些敏感数据，并根据需要将其解除屏蔽。
网络安全服务：Data LakeHouse中的数据需要随时进行安全保护。应该控制对数据的访问，以拒绝任何未经授权的访问。还需要确保外部网络和Data LakeHouse之间的数据流动是安全的。网络安全服务提供这些功能。

本节概述了Data LakeHouse架构的七个层。第3章到第7章将详细介绍这些层。本章将详细阐述每一层，并列出在实践中使用的常见模式。

现在让我们继续讨论我们需要应用的架构原则。

完整版PDF格式，请到知识星球下载：

《Data Lakehouse in Action》学习笔记--前言(文章末尾有福利)

lesson11：Python的字典及方法你的电影很有趣 windows python
目录前言一、字典的定义与核心价值创建方式：二、核心特性：键的规则与无序性演变1、键的不可变性与唯一性2、无序性与Python版本差异三、常用操作与方法全解析四、与列表/元组的对比：数据结构选型指南五、高级应用技巧六、避坑指南：常见错误与最佳实践总结前言在Python的“数据结构工具箱”中，字典（Dictionary）无疑是最灵活、最强大的工具之一。无论是存储用户信息、解析JSON数据，还是实现缓存
C语言实现扫雷游戏：从经典玩法到代码构建
文章目录C语言实现扫雷游戏：从经典玩法到代码构建一、游戏简介：经典玩法回顾二、扫雷游戏的设计与实现2.1整体设计思路与技术选型核心技术栈多文件分工2.2棋盘设计：核心数据结构棋盘尺寸与扩展设计双棋盘机制2.3核心功能实现1.棋盘初始化与打印2.随机布置地雷3.地雷排查与数字计算2.4游戏流程控制4.排查逻辑完整实现三、功能扩展：提升游戏体验四、总结C语言实现扫雷游戏：从经典玩法到代码构建扫雷作为一
深度学习超参数优化（HPO）终极指南：从入门到前沿
摘要：在深度学习的实践中，模型性能的好坏不仅取决于算法和数据，更在一半程度上取决于超参数的精妙设置。本文是一篇关于超参数优化（HyperparameterOptimization,HPO）的综合性指南，旨在带领读者从最基础的概念出发，系统性地梳理从经典到前沿的各类优化方法，并最终落地于实用策略和现代工具。无论您是初学者还是资深从业者，都能从中获得宝贵的见解。第一部分：夯实基础——HPO的核心概念1
【PTA数据结构 | C语言版】将表达式树转换成中缀表达式
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目请编写程序，读入两个操作数和一个操作符，建立表达式树，输出中缀表达式。输入格式：输入给出2个整数和一个字符，依次为表达式的第1、2个操作数，和操作符。输出格式：在一行中输出中缀表达式，其中左右子表达式各用一对圆括号()括起，两对括号中间输出操作符。表达式中没有任何空格。输入样例：12+输出样例：(1)+(2)代码#include#incl
frida objection注入时frida.core.RPCException: ReferenceError: ‘ObjC‘ is not defined解决马戏团小丑 java android
最新的17.0.xx版本frida进行objection注入时会报错PSC:\Users\19583>objection-gcom.example.hellojniexploreC:\Users\19583\AppData\Local\Programs\Python\Python312\Lib\site-packages\objection\utils\update_checker.py:7:Us
Hadoop与云原生集成：弹性扩缩容与OSS存储分离架构深度解析
Hadoop与云原生集成的必要性Hadoop在大数据领域的基石地位作为大数据处理领域的奠基性技术，Hadoop自2006年诞生以来已形成包含HDFS、YARN、MapReduce三大核心组件的完整生态体系。根据CSDN技术社区的分析报告，全球超过75%的《财富》500强企业仍在使用Hadoop处理EB级数据，其分布式文件系统HDFS通过数据分片（默认128MB块大小）和三副本存储机制，成功解决了P
C#——在WinForm中打开Excel文件，或打开Excel应用显示数据木林森先生 C#Excel excel c#开发语言
目录一、如何在WinForm中打开Excel文件二、打开Excel文件的代码详解三、如何向Excel中插入数据四、如何设置Excel里的单元格格式五、如何设置Excel里的页面格式一、如何在WinForm中打开Excel文件步骤：1、添加引用“MiscrosoftExcel16.0ObjectLibrary”，并导出命名空间：usingMicrosoft.Office.Core;usingExce
JFinal项目demo，实现多数据源，数据迁移，从一张表，将数据添加到另外的一张表苦荞_ java 开发语言
一、废话今天项目经理给了我一个任务，就是需要将一个数据库中字典表的数据，相对应的添加到另外一张表中，这里将有数据的字典表成为dict嘛，需要添加数据的表为test表，我写的demo中表名也是这样的。当然呢，最开始我也是手动写SQL语句添加数据，搞了一两个字典数据，就着不住了，实际项目中的字典表数据是非常多的。一个字典类型有的就上千条数据，我一想，像我楞个加，得加到什么时候去。先想到的就是在原项目中
sqlite加密问题：怎么样打开这个通过sha512加密的sqlite数据库文件？ bug菌¹ 全栈Bug调优(实战版)sqlite c++sqlite加密数据库文件
本文收录于《全栈Bug调优(实战版)》专栏，主要记录项目实战过程中所遇到的Bug或因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！全文目录：问题描述解决方案1.**理解SQLite的加密扩展**2.**确认加密实现方式**3.**根据SHA-512的加密逻辑调整代码**4.**解决方案步骤****方
Tcpdump使用
一介绍tcpdump，是Linux/Unix系统下强大的网络抓包工具，能够捕获和分析网络流量。用简单的语言概括就是dumpthetrafficonanetwork，是一个运行在linux平台可以根据使用者需求对网络上传输的数据包进行捕获的抓包工具，windows平台有sniffer等工具，tcpdump可以将网络中传输的数据包的“包头”全部捕获过来进程分析，其支持网络层、特定的传输协议、数据发送和
介绍一款 MRI&CT 图像预处理强大工具--FSL Tina姐吖
FSL是什么？全名是：FMRIB'sSoftwareLibraryFMRIB是英国牛津大学脑功能磁共振成像中心，FSL则是他们开发的一个软件库。由StephenSmith教授开发，发布于2000年适用于所有操作系统用于结构MRI、功能MRI（任务、静息）、扩散MRI的分析MRI,CT数据的预处理和分析MRI,CT数据的查看具体地，可以分为以下4类功能1结构MRI配准:linear(FLIRT)&n
druid oracle不同版本分页,JFinal4.3 框架总结（三）铁扇不是公举 druid oracle不同版本分页
7持久层——ActiveRecordActiveRecord模式的核心是：一个Model对象唯一对应数据库表中的一条记录，而对应关系依靠的是数据库表的主键值。因此，ActiveRecord模式要求数据库表必须要有主键。当数据库表没有主键时，只能使用Db+Record模式来操作数据库。JFinal的前端提交的formBean与数据库查询的JavaBean可以使用的是同一个Model对象，Model对
java的db是什么_java db 北斗星再亮 java的db是什么
关于javadb的搜索结果问题关于DB+RECORD操作oracle数据库的问题?报错@JFinal你好，想跟你请教个问题：我操作oracle数据库，插入一条记录Recorduser=newRecord().set("userid",...爱吃鱼的程序员2020-06-2220:22:060浏览量回答数1回答为什么不用分页查询是为了导出Excel使用的，前台页面的分页查询没有问题将jvm内存调大点
JFinal极速开发框架使用笔记(三) 分析Model和ActiveRecord weixin_33905756 java 数据库测试
JFinal框架的一些新发现的用法：在JFinal框架中，实体类并不需要设置属性，更不需要配置getset方法就可以很方便的操作数据库，如果需要设置或者获取属性，可以直接使用一下方式：Useruser=newUser().set("id","MY_SEQ.nextval").set("age",18);user.save();//获取id值Integerid=user.get("id");但是，如
Mysql中使用树的设计 tongle_deng mySql
Mysql中使用树的设计原来一直使用id与parent_id结合的办法设计树，最近发现有些问题：1、查询此结点下所有子结点的需求。2、查询此结点上所有父结点的需求。这些需求在oracle和sqlserver中可以使用一些办法在数据库端进行处理，但在mysql中处理就稍显麻烦，在sqlite中基本无解。所以想办法重新设计一下就显的很有必要的了。添加两列：structure_nodevarchar(1
layUI树形组件出现偶尔加载不出来的情况 suoh's Blog ❤️❤️--layui ❤️❤️--vue2核心技术栈 layui树形结构无法加载 treeList加载不出来 layui树形组件不显示
用vue自带的nextTick函数强制执行树形结构nextTick()，是将回调函数延迟在下一次dom更新数据后调用，简单的理解是：当数据更新了，在dom中渲染后，自动执行该函数this.$nextTick(()=> { this.render(this.data); })
Jfinal+SQLite java工具类复制mysql表数据到 *.sqlite 秋林辉 sqlite java mysql
处理了时间类型packagechangeDataBase;importjava.sql.*;importjava.util.ArrayList;importjava.util.Iterator;importjava.util.List;publicclassMySQLToSQLiteMigration{privatestaticfinalStringMYSQL_URL="jdbc:mysql://
Jfinal+duckDB 秋林辉 java 前端数据库
com.jfinaljfinal3.6org.duckdbduckdb_jdbc1.2.2.0@OverridepublicvoidconfigPlugin(Pluginsme){//配置DuckDB数据源DruidPlugindruidPlugin=newDruidPlugin("jdbc:duckdb:E:/DUCKDB/DuckDB/hrls.duckdb","","","org.duckd
JSON全面解析：轻量级数据交换的核心技术新人码农11111 json python
目录JSON的本质特征⚙️序列化：数据到字符串的转换反序列化：字符串到数据的还原实际应用场景⚠️常见陷阱与解决方案最佳实践建议在当今数据驱动的时代，JSON（JavaScriptObjectNotation）已成为最流行的轻量级数据交换格式。本文将深入剖析JSON的核心特性及其在Python中的应用，帮助开发者高效处理数据序列化与反序列化。JSON的本质特征JSON采用纯文本格式，具有跨平台、易读
后仿之debug记录风之子npu 后仿单片机嵌入式硬件
在此记录一下在实际工作中碰到的在后仿过程中碰见的一些问题：1.数据采样失败原因1：iodelay增加不足；解决办法：根据sdc修正iodelay数值，同时参考后端PR的timingreport，修正delay；原因2：glitch导致采样失败，zerodelay期间，虽然在波形中看到信号变化时瞬时的，但是同一个timingslot中因为器件自身的原因，导致信号在同一个timingslot中其实变化
容器化技术：Kubernetes（k8s）、Pod、Docker容器人工干智能 Docker的高级知识 kubernetes docker 容器
三个相关的容器化技术Kubernetes（k8s）、Pod、Docker容器在容器化技术领域各自扮演着不同的角色，它们之间既存在区别又相互联系。Kubernetes（k8s）定义：Kubernetes是一个开源的容器编排平台，用于自动化部署、扩展和管理容器化应用程序。功能：提供了强大的工具和功能，如服务发现、负载均衡、自动伸缩、滚动更新等，帮助用户更高效地管理复杂的容器环境。架构：基于控制论和反馈
React 开发（一）：入门 - 从 0 到 1 的学习之旅全栈探索者chen react react.js 学习前端前端框架程序人生开发语言 javascript
React开发（一）：入门-从0到1的学习之旅1.前言在前端开发领域，React是一个备受推崇的JavaScript库，广泛应用于构建用户界面。它的组件化架构、虚拟DOM和高效的更新机制使得开发复杂的应用变得更加简洁和高效。在这篇文章中，我们将从零开始学习React，了解它的基本概念和如何搭建第一个项目。2.什么是React？React是一个用于构建用户界面的JavaScript库，由Facebo
SQLite数据库文件损坏的可能几种情况（一）界忆人工智能数据库 SQLite 数据库 sqlite c++
返回：SQLite—系列文章目录上一篇：SQLiteC/C++接口详细介绍sqlite3_stmt类（十三）下一篇：SQLite使用的临时文件（二）概述SQLite数据库具有很强的抗损坏能力。如果应用程序崩溃，或操作系统崩溃，甚至电源故障发生在事务中间，部分写入的事务应在下次自动回滚将访问数据库文件。恢复过程已完全完成自动，不需要用户采取任何行动或应用程序。尽管SQLite可以抵抗数据库损坏，但它
Jfinal 使用Druid对Sqlserver数据库配置文件中的密码项进行加密解密实现迟到的微笑 java web Jfina Druid
由于最近业务表较多，导致我好久没写博客了，今天为大家奉上一篇sqlserver配置文件如何加密和解密。网上看了下有mysql的我是sqlserver的忠实用户，居然没有sqlserver的，我瞬间不淡定了，决定写一篇帮助萌新。首先我们需要一个jar包，网上有，我就不提供下载地址了。第二步就是需要用这个jar来对密码进行加密了。网上有很多是下面这样的写法。这种写法对于懒惰的我来说就是一种折磨。我使用
2020-04-29 eMAGMA 基于基因的关联分析（Part1）程凉皮儿
输入数据准备本教程要求eMAGMA文件,软件(MAGMA)和辅助文件都在同一个目录下如果你的文件在不同的目录上，请在命令行加入路径信息cd/path/yourworkingfolder/eMAGMA解压缩软件包及辅助文件：magma_v1.07b.zip,NCBI37.3.zip和MDD2018_excluding23andMe(下载自PGCwebsite).unzip[filename].zip
AI+Python赋能！长时序植被遥感动态分析全攻略：从物候提取到生态评估梦想的初衷~ 土壤植被遥感人工智能遥感植被土壤
在遥感技术与人工智能深度融合的2025年，AI大模型正重塑长时序植被遥感数据分析范式。从Landsat/Sentinel卫星数据的智能化去云处理，到MODIS植被产品的AI辅助质量控制，以ChatGPT、DeepSeeK为代表的大模型技术已成为提升遥感数据处理效率与精度的核心工具——尤其在长时序植被动态监测、物候期精准提取、时空变异归因分析及生态环境质量评估等领域，展现出传统方法难以企及的技术优势
sqlite数据库字段类型鹿灏楷silves python web sql sqlite3 django python 数据库
数据库字段类型：字符型字段topic=models.CharField(max_length=)#需要传入参数，设置字符串的最长长度email=models.EmailTield()#电子邮箱字段，在CharField基础上，增加了邮箱的正则验证a=models.SlugField()#仅含有字母下划线数字和连字符的字符串url=models.URLField()#url字段，默认长度200字符f
前端学习笔记：React.js中state和props的区别和联系
文章目录1.`props`（属性）定义用途示例2.`state`（状态）定义用途示例3.核心区别4.常见使用场景props的场景state的场景5.交互模式父组件修改子组件状态子组件通知父组件6.最佳实践总结在React.js中，state和props是两个核心概念，用于管理组件的数据和数据流。它们的设计目的不同，但共同构成了React组件的状态管理系统。1.props（属性）定义外部传入的数据：
SQLite可视化管理工具汇总班力勤程序员 sqlite jvm 数据库
截至2012/9/14最新版本SQLiteSpy1.9.1–28Jul2011单文件，界面设计紧凑，较稳定,功能较少，创建表与添加数据均需sql语句，快捷键教方便，作为数据浏览和修改工具极佳，视图编码为utf-8，对gbk2312显示乱码。能满足一般的应用，但没有导出数据表功能，同时只能打开一个数据库文件不支持二进制字段编辑2、SQLiteStudio（推荐）开源免费单文件http://sqlit
全栈Todo应用实战：从零到一的本地部署与深度解析
全栈Todo应用实战：从零到一的本地部署与深度解析前言在现代Web开发中，全栈应用已成为主流。本文将以一个经典的Todo（待办事项）应用为例，详细记录从项目下载、环境配置、后端启动、数据库交互到前端运行的完整流程。我们将深入探讨在此过程中遇到的一个典型问题——CORS与API请求失败，并提供从“快速修复”到“最佳实践”的解决方案。这不仅是一份操作指南，更是一次宝贵的实战经验总结。你将从本博客中学到
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul