lijiangJava

开源大数据引擎：Greenplum 数据库架构分析

Greenplum 数据库是最先进的分布式开源数据库技术，主要用来处理大规模的数据分析任务，包括数据仓库、商务智能（OLAP）和数据挖掘等。自2015年10月正式开源以来，受到国内外业内人士的广泛关注。本文就社区关心的Greenplum数据库技术架构进行介绍。

一. Greenplum数据库简介

大数据是个炙手可热的词，各行各业都在谈。一谈到大数据，好多人认为就是Hadoop。实际上Hadoop只是大数据若干处理方案中的一个。现在的SQL、NoSQL、NewSQL、Hadoop等等，都能在不同层面或不同应用上处理大数据的某些问题。而Greenplum数据库做为一个分布式大规模并行处理数据库，在大多数情况下，更适合做大数据的存储引擎、计算引擎和分析引擎。

Greenplum数据库也简称GPDB。它拥有丰富的特性：

第一，完善的标准支持：GPDB完全支持ANSI SQL 2008标准和SQL OLAP 2003 扩展；从应用编程接口上讲，它支持ODBC和JDBC。完善的标准支持使得系统开发、维护和管理都大为方便。而现在的 NoSQL，NewSQL和Hadoop 对 SQL 的支持都不完善，不同的系统需要单独开发和管理，且移植性不好。

第二，支持分布式事务，支持ACID。保证数据的强一致性。

第三，做为分布式数据库，拥有良好的线性扩展能力。在国内外用户生产环境中，具有上百个物理节点的GPDB集群都有很多案例。

第四，GPDB是企业级数据库产品，全球有上千个集群在不同客户的生产环境运行。这些集群为全球很多大的金融、政府、物流、零售等公司的关键业务提供服务。

第五，GPDB是Greenplum（现在的Pivotal）公司十多年研发投入的结果。GPDB基于PostgreSQL 8.2，PostgreSQL 8.2有大约80万行源代码，而GPDB现在有130万行源码。相比PostgreSQL 8.2，增加了约50万行的源代码。

第六，Greenplum有很多合作伙伴，GPDB有完善的生态系统，可以与很多企业级产品集成，譬如SAS，Cognos，Informatic，Tableau等；也可以很多种开源软件集成，譬如Pentaho,Talend 等。

二. Greenplum架构

2.1 平台架构

图（1）是Greenplum数据库平台概括图。平台分为四个层次，我们依次从下往上看。

MPP核心架构

GPDB是大规模无共享的处理架构，后面会专门介绍；
先进的并行优化器是性能突出的关键之一。GPDB有两个优化器，一个是基于PostgreSQL planner的优化器；一个是全新开发的ORCA优化器。ORCA是Greenplum 5年以前启动的全新项目，这个优化器经过几年的开发和测试之后，最近已经成为GPDB企业版本的默认优化器。
GPDB的存储引擎支持多态存储，一个表的数据可以根据访问模式的不同使用不同的存储方式。存储方式对用户透明，执行查询时，不用关心待访问的数据使用的存储模式，优化器会自动选择最佳查询计划。
分布式数据库中，某些操作（例如跨节点关联）需要多个节点间进行数据交换。GPDB的并行数据库流引擎，可以根据数据的特点，例如分布方式、数据量等选择最合适的数据流操作符。目前GPDB支持两种数据流操作符：重分发（Redistribution）和广播（Broadcast）。重分发根据数据的哈希值重新分发到各个数据节点上，适用于数据量大的情况；广播则将数据发送给所有数据节点，适用于数据量较小的情况，例如维度表。
软件交换机是GPDB的一个重要组件，软件交换机可以在各个数据节点间及与主节点间建立可靠的UDP数据通讯机制，是实现高效数据流的核心。
Scatter/Gather 流引擎是专为并行数据加载和导出而设计，Scatter指数据通过并行加载服务器并行分散到各个数据节点，Gather指数据在 GPDB内部可以根据分布策略按需并行分发。

服务层

GPDB支持多级容错机制和高可用：
o 主节点（Master）高可用：为了避免主节点单点故障，可以设置一个主节点的副本（称为 Standby Master），他们之间通过流复制技术实现同步复制。当主节点发生故障时，从节点成为主节点，处理用户请求并协调查询执行。它们之间通过心跳检测故障。
o 数据节点（Segment）高可用：每个数据节点都可以配备一个镜像，它们之间通过文件操作级别的同步实现数据的同步复制（称为filerep技术）。数据节点上建议使用RAID5磁盘，以进一步提高数据的高可用。故障检测进程（ftsprobe）定期发送心跳给各个数据节点。当某个节点发生故障时，GPDB会自动进行故障切换。
o 网络高可用：为了避免网络的单点故障，每个主机配置多个网口，并使用多个交换机避免网络故障时造成整个服务不可用。
在线扩展：数据量增大，现有集群不能满足需求时，可以对GPDB数据库进行动态扩展。扩展过程中，业务可以继续运行，不需要宕机。
任务管理是指对资源的管理和使用情况的管理。

产品特性

数据加载在后面会专门介绍。
数据联邦是比较有意思的，最近“数据湖泊”这个词非常火热，数据湖泊的目的是不需再对数据像以前那样经过定制，生成特定的业务报表；而是保存原始数据，什么时候想分析就从原始数据上直接处理。GBDB可以实现数据湖泊（我们称之为数据联邦），它能访问和处理数据中心里面的所有数据，不管你的数据是在Hadoop、在文件系统上、还是在其他数据库中，Greenplum可以使用一个SQL在保证ACID的前提下访问所有数据。
GPDB即支持行存，也支持列存。还为不需更新的数据存储和处理进行了专门的优化。
支持多种压缩方法，包括QuickLZ，Zlib，RLE 等。
支持多级分区表，分区支持多种模式，包括范围，列表等。
支持B树、位图和GiST 等索引
GPDB认证机制支持多种方式，包括LDAP和Kerberos等。通过访问控制列表（ACL），可以实现灵活的基于角色的安全控制。
扩展语言支持：GPDB 支持使用多种流行语言实现用户自定义函数（UDF，类似于Oracle的存储过程），包括 Python，R，Java，Perl，C/C++ 等。
地理信息处理：通过集成PostGIS，GPDB支持对地理信息进行存储和分析。
内建数据挖掘算法库：通过MADLib（现在是Apache孵化项目）算法库，可以内建几十种常见的数据分析和挖掘算法到GPDB数据库中，包括逻辑回归，决策树，随机森林等。不需要写任何算法代码，通过SQL就可以使用其中的所有算法。
文本检索：通过GPText扩展，GPDB可以支持高效灵活丰富的全文检索功能。与 MADLib 合用，可以进行并行文本分析和挖掘。

客户端访问和工具

通过psql命令行工具可以访问GPDB数据库的所有功能，此外还提供了ODBC、JDBC、OLEDB、libpq等应用编程接口。

数据库或者数据集群的管理工具非常重要，GPDB提供了图形化的管理工具GPCC（Greenplum Command Center），帮你管理状态，监控资源使用情况。

Greenplum Workload Manager是刚刚发布的新产品，用以实现基于规则的资源管理。它支持自定义规则，当某个SQL满足规则描述的条件时会执行某些操作。比如你可以定义规则自动取消消耗CPU资源达50%以上的查询。

2.2 大规模并行处理（MPP）无共享架构

MPP 是Greenplum数据库最突出的特色。现在很流行MPP这个词，我们可以看一下它是什么意思。下边图（2）中，主节点有两个，一个是主节点，一个是从主节点。通过软交换机制，也就是通过高速网络，主节点连到数据节点。每个数据节点有自己的CPU，自己的内存，自己的硬盘，他们唯一共享的就是网络。这也是称为无共享架构的原因。这种架构的好处是集群是分布式的环境，数据可以分布在很多节点上进行并行处理，可以做到线性扩展。

在分布式数据库中，性能好坏的最重要因素是数据分布是否均匀。如果数据分布不均匀，有的节点上数据非常多，有的节点数据很少，这样会出现短板效应，整个SQL的效率不会很好。Greenplum支持多种数据分布的策略，默认使用主键或者第一个字段进行哈希分布，还支持随机分布。除了横向上数据可以按节点分布之外，在某个节点上还可以对数据进行分区。分区的规则比较灵活，可以按照范围分区，也可以按照列表值分区，如图（3）。

2.3 并行查询计划和执行

下面是个简单的SQL，如图（4），从两张表中找到2008年的销售数据。图中右边是这个SQL的查询计划。从生成的查询计划树中看到有三种不同的颜色，颜色相同表示做同一件事情，我们称之为分片/切片（Slice）。最下层的橙色切片中有一个重分发节点，这个节点将本节点的数据重新分发到其他节点上。中间绿色切片表示分布式数据关联（HashJoin）。最上面切片负责将各个数据节点收到的数据进行汇总。

然后看看这个查询计划的执行，如图（5）。主节点（Master）上的调度器（QD）会下发查询任务到每个数据节点，数据节点收到任务后（查询计划树），创建工作进程（QE）执行任务。如果需要跨节点数据交换（例如上面的HashJoin），则数据节点上会创建多个工作进程协调执行任务。不同节点上执行同一任务（查询计划中的切片）的进程组成一个团伙（Gang）。数据从下往上流动，最终Master返回给客户端。

2.4 多态存储

上面介绍了GPDB的特点和SQL执行计划以及执行过程，那数据在每个节点上到底怎么样存储？

Greenplum提供称为“多态存储”的灵活存储方式。多态存储可以根据数据热度或者访问模式的不同而使用不同的存储方式。一张表的不同数据可以使用不同的物理存储方式，如图（6）。支持的存储方式包含：

行存储：行存储是传统数据库常用的存储方式，特点是访问比较快，多列更新比较容易。
列存储：列存储按列保存，不同列的数据存储在不同的地方（通常是不同文件中）。适合一次只访问宽表中某几个字段的情况。列存储的另外一个优势是压缩比高。
外部表：数据保存在其他系统中例如HDFS，数据库只保留元数据信息。

2.5 大规模并行数据加载

作为一个数据库，一定会保存和处理数据。那数据来源于什么地方？Oracle这样的数据库里面的数据多是客户生成的，譬如你银行转账、淘宝订单等。对于数据分析型的数据库，其源数据通常是在其他系统中，而且数据量很大。这样数据加载的能力就变得非常重要。Greenplum提供了非常好的数据加载方案，支持高速的加载各种数据源的不同数据格式的数据，如图（7）。

并行数据加载：因为是并行数据加载，所以性能非常好。Greenplum有叫DCA的一体机产品，第一代DCA可以做到10TB/小时；第二代为16TB/小时。第三代很快就要发布了，速度会更快。
数据源和数据格式：数据源支持Hadoop，文件系统，数据库，还有 ETL管理的数据。数据格式支持文本，CSV，Parquet，Avro等。

三. Greenplum核心组件

Greenplum 数据库包括以下核心组件：

解析器：主节点收到客户端请求后，执行认证操作。认证成功建立连接后，客户端可以发送查询给数据库。解析器负责对收到的查询SQL字符串进行词法解析、语法解析，并生成语法树。
优化器：优化器对解析器的结果进行处理，从所有可能的查询计划中选择一个最优或者接近最优的计划，生成查询计划。查询计划描述了如何执行一个查询，通常以树形结构描述。Greenplum最新的优化器叫 ORCA，关于 ORCA，可以从 ACM 论文中获得详细信息。（http://dl.acm.org/citation.cfm?id=2595637&dl=ACM&coll=DL&CFID=569750122&CFTOKEN=89888184）
调度器（QD）：调度器发送优化后的查询计划给所有数据节点（Segments）上的执行器（QE）。调度器负责任务的执行，包括执行器的创建、销毁、错误处理、任务取消、状态更新等。
执行器（QE）：执行器收到调度器发送的查询计划后，开始执行自己负责的那部分计划。典型的操作包括数据扫描、哈希关联、排序、聚集等。
Interconnect：负责集群中各个节点间的数据传输。
系统表：系统表存储和管理数据库、表、字段的元数据。每个节点上都有相应的拷贝。
分布式事务：主节点上的分布式事务管理器协调数据节点上事务的提交和回滚操作，由两阶段提交（2PC）实现。每个数据节点都有自己的事务日志，负责自己节点上的事务处理。

四、Greenplum开源

2015年3月份，Pivotal宣布了Greenplum的开源计划，经过6个月紧锣密鼓的工作，于10月27号正式开源。官方网站为http://greenplum.org。许可证书使用Apache 2许可证。

Greenplum 开源社区提供了运行环境沙盒以及使用教程，里面包含了Greenplum数据库的一些主要特性。从https://github.com/greenplum-db/gpdb-sandbox-tutorials 可以下载沙盒和教程。

有关Greenplum数据库使用和开发的任何问题都可以去邮件列表讨论：邮件列表有两个：[email protected] 和[email protected]。

源代码位于https://github.com/greenplum-db/gpdb，开源不到两个月就有1187个收藏，256个fork，超过150个pull request，其中136个pull request 已经关闭。贡献者中除了包含Pivotal的员工外，还有来自全球（包括中国、美国、日本和欧洲）的社区开发人员。关于从源代码编译和安装Greenplum数据库，可以参考：http://gpdb.rocks/gpdb/2015/10/29/how-to-build-gpdb.html

作者简介：姚延栋 Pivotal研发总监，2005年毕业于中科院软件所。曾在Sun
Microsystems、Symantec工作多年，2010年加入Greenplum（现在的Pivotal），负责中国研发团队。

Linux内核性能调优：让系统飞起来的秘籍深度Linux 性能优化 linux LInux内核 c++
在当今数字化时代，Linux系统凭借其强大的稳定性、开放性和灵活性，广泛应用于服务器、云计算、大数据等诸多领域。然而，随着业务量的不断增长和应用场景的日益复杂，Linux内核的性能面临着巨大挑战。哪怕是微小的性能瓶颈，都可能像滚雪球一样，在高负载运行时被无限放大，进而引发一系列严重问题。想象一下，一个电商网站在购物高峰期，由于Linux内核性能不佳，导致服务器响应迟缓。用户点击商品详情，页面却迟迟
三款顶级开源RAG (检索增强生成)工具：Verba、Unstructured 和 Neum XianxinMao 人工智能自然语言处理 RAG
三款顶级开源RAG(检索增强生成)工具：Verba、Unstructured和Neum概述随着企业对话式数据处理需求的提升，面临的挑战是数据隐私性和缺乏企业级解决方案。虽然类似LangChain能在短时间内构建RAG应用，但忽视了文档解析、多来源数据ETL、批量处理、访问控制等问题。此文评估了三款开源RAG工具的潜力，专为生产环境设计。Verba：理想的RAG选择Weaviate提供的Verba项
基于 Python 和 Django 的课程管理系统设计与实现赵谨言 python 论文经验分享毕业设计 python
标题:基于Python和Django的课程管理系统设计与实现内容:1.摘要摘要：本文介绍了基于Python和Django的课程管理系统的设计与实现。文章首先阐述了课程管理系统的背景和意义，接着详细描述了系统的设计与实现过程，包括系统架构、功能模块、数据库设计等。然后，通过实际应用案例展示了系统的运行效果和优势。最后，总结了系统的特点和创新点，并对未来的研究方向进行了展望。关键词：课程管理系统；Py
从零创建一个 Django 项目 m0_74825172 django python 后端
1.准备环境在开始之前，确保你的开发环境满足以下要求：安装了Python(推荐3.8或更高版本)。安装pip包管理工具。如果要使用MySQL或PostgreSQL，确保对应的数据库已安装。创建虚拟环境在项目目录中创建并激活虚拟环境，保证项目依赖隔离：#创建虚拟环境python-mvenvenv#激活虚拟环境#WindowsenvScriptsactivate#Linux/Macsourceenv/
云原生周刊：Prometheus 3.0 正式发布云计算
开源项目推荐Achilles-SDKAchilles-SDK是一个专为构建Kubernetes控制器而设计的开源开发工具包。它简化了控制器的开发流程，提供了强大的API和高效的抽象层，使开发者能够专注于业务逻辑的实现，而无需处理底层复杂性。Achilles-SDK支持快速构建高性能、可扩展的Kubernetes控制器，是开发Kubernetes原生应用和自动化操作的理想选择。KLKL是一个为终端提
《盘古大模型——鸿蒙NEXT的智慧引擎》人工智能深度学习
在当今科技飞速发展的时代，华为HarmonyOSNEXT的发布无疑是操作系统领域的一颗重磅炸弹，其将人工智能与操作系统深度融合，开启了智能新时代。而盘古大模型在其中发挥着至关重要的核心作用。赋予小艺智能助手超强能力在鸿蒙NEXT中，盘古大模型赋予了小艺智能助手更强的记忆、推理和规划能力，使其能够支持23类常用记忆类型，掌握万亿token的知识量。基于盘古大模型，小艺可以实现诸如将带有表格的图片转化
一步到位：购买适合 SEO 的域名全攻略后端
选择一个对SEO友好的域名不仅可以提高搜索引擎排名，还能增强品牌影响力。以下是简化优化后的购买流程：1.检查域名历史，确保无负面记录在购买域名前，务必确认它没有被封锁或拉黑，并且历史记录与您的行业相关：检查域名安全性和历史VirusTotal：查看域名是否被列为不安全。WebArchive：查看域名以前的用途，判断是否有不良记录或与您的行业冲突。GoogleTransparencyReport：检
智算中心建设热潮涌动 AI服务器赋能加速数据中心
在数字化浪潮汹涌的今天，人工智能新技术新发展日新月异。智算作为数字经济时代的新生产力，正逐步成为推动经济社会高质量发展的新引擎。智算中心：算力时代的“新基建”近年来，随着人工智能技术的迅猛发展和广泛应用，智能算力需求持续爆发，推动了智算中心的快速发展。2022年，随着国家“东数西算”工程启动，我国算力地图正式开始，形成八大枢纽、十大算力中心集群。据中国电信研究院发布的《智算产业发展研究报告（202
星环科技×恒生电子，联合打造反洗钱解决方案人工智能
随着反洗钱行为更具隐蔽性、多样性和跨区域性，金融机构的反洗钱能力也相应面临新一轮升级。将大数据技术应用于反洗钱领域，可借助大数据平台高效整合、分析海量客户身份信息和交易数据，保障反洗钱系统有效开展客户风险等级评定、可疑交易筛查、黑名单监测等工作，为反洗钱工作赋能。近日，星环科技与恒生电子联合发布反洗钱解决方案，系统覆盖金融机构全业务全客户全流程，满足客户尽调、大额可疑交易检测、名单筛查、自评估等各
Transwarp Data Studio 4.0 ：适应AI新时代实现三大能力提升人工智能
企业数据资产管理能力建设需要经历资源化、资产化和资本化三个阶段，对应数据底座建设、资产管理平台建设、流通运营平台建设三大任务。星环科技大数据开发工具TranswarpDataStudio，在此过程中发挥着承上启下的关键作用。近日，星环科技重磅发布大数据开发工具TranswarpDataStudio4.0版本，新版针对数据资产运营和语料管理的过程实现了三大能力提升。第一，提升了数据管理的广度：为应对
Node.js Express与MongoDB博客系统开发实战凯二七
本文还有配套的精品资源，点击获取简介：本项目采用Node.js及其Express框架，结合MongoDB非关系型数据库，构建一个基于RESTfulAPI的Web博客服务。通过CRUD操作实现文章的发布、阅读、编辑和删除功能。项目强调了Node.js的异步I/O和事件驱动特性，以及MongoDB处理大规模、复杂数据集的能力，适合进行毕业设计等综合性开发任务。1.Node.js技术介绍与应用Node.
Python怎么开发Unity Jacob Piao unity c#游戏引擎开发语言
你可以使用Python来开发Unity游戏引擎的脚本。要在Unity中使用Python，你需要安装一个能够将Python代码转换为可以在Unity中运行的C#代码的工具。有几种方法可以实现这一点：使用IronPython：IronPython是一个基于.NET的Python实现，它可以在Unity中直接运行Python代码。使用PyUnity：PyUnity是一个能够将Python代码转换为Uni
linux 监控开源软件,利用开源软件打造Linux应用软件平台之监控子系统呆呆小逗比 linux 监控开源软件
它山之石，可以攻玉。监控子系统是每一个高级应用软件平台必不可少的一个子系统，这个子系统应具备的基本功能包括：各进程的运行状态，系统资源的占用状况，重要配置文件的改变情况，重要目录的异动，常用服务的对外提供情况等。一种可行的实现方法是自己写一大堆的脚本，然后加入crond服务去定时做这些监控,另一条捷径是利用开源软件Monit。本文介绍如何利用Monit去快速构建一个具备上述功能的软件平台的监控子系
DuckDB-Wasm 库详解 maply Node.js wasm 前端 node.js 数据库 IndexedDB
DuckDB-Wasm详解DuckDB-Wasm是一种浏览器端实现的DuckDB数据库技术，旨在将DuckDB的强大功能移植到浏览器环境中，通过WebAssembly技术在浏览器内运行SQL查询。它为处理本地数据、快速分析和交互式数据探索提供了一种高效的解决方案，避免了服务器端依赖。1.DuckDB简介DuckDB是一个开源的列存储数据库，专注于在线分析处理（OLAP），特别适合处理中小型数据集。
音频可视化工具：audiovisualization 使用指南章雍宇
音频可视化工具：audiovisualization使用指南audiovisualizationWebAudioVisualization项目地址:https://gitcode.com/gh_mirrors/au/audiovisualization项目介绍音频可视化工具（audiovisualization）是一个基于开源原则构建的项目，它允许开发者在任何网站上实现炫酷的音频视觉效果。该项目灵
推荐一款令人惊艳的音频可视化工具：Audioscope 鲍爽沛David
推荐一款令人惊艳的音频可视化工具：Audioscope项目地址:https://gitcode.com/gh_mirrors/au/audioscope一、项目介绍在探索声音世界的过程中，我们总希望将那些无形的音波转化为直观可视化的形式。为此，今天我特别向大家介绍一个强大的开源项目——Audioscope。Audioscope是一个集多种音频可视化功能于一身的工具集合，它致力于呈现最为真实、精确的
AI-blog 开源项目教程尤琦珺Bess
AI-blog开源项目教程AI-blog项目地址:https://gitcode.com/gh_mirrors/aib/AI-blog1.项目的目录结构及介绍AI-blog项目的目录结构如下：AI-blog/├──README.md├──app/│├──__init__.py│├──main.py│├──config.py│├──models/││├──__init__.py││├──articl
推荐开源项目：SwiftUI-MVVM —— 让你的SwiftUI应用更易测试与管理马冶娆
推荐开源项目：SwiftUI-MVVM——让你的SwiftUI应用更易测试与管理项目地址:https://gitcode.com/gh_mirrors/sw/SwiftUI-MVVM1、项目介绍SwiftUI-MVVM是一个精心设计的开源项目，它引入了Model-View-ViewModel（MVVM）架构模式到Apple的最新界面构建框架SwiftUI中。项目的主要目标是实现数据流的最大可测试性
Nginx参数TCP_NODELAY详解及服务器应用 TechABC nginx tcp/ip 服务器
Nginx是一款高性能的开源Web服务器和反向代理服务器，在处理大量并发连接时表现出色。其中，TCP_NODELAY是Nginx中一个重要的参数，它对于提高服务器的性能和响应速度起到关键作用。本文将详细介绍TCP_NODELAY参数的含义、作用以及在服务器中的应用，并提供相应的源代码示例。TCP_NODELAY参数简介TCP_NODELAY是一个TCP协议的选项，用于控制是否启用Nagle算法。N
艾编程coding老师课堂笔记：SpringBoot源码深度解析艾编程前端技术 spring 编程语言
思想：有道无术，术尚可求，有术无道，止于术！Spring开源框架，解决企业级开发的复杂性的问题，简化开发AOP，IOCSpring配置越来多，配置不方便管理！Javaweb---Servlet+tomcat+Struct2SpringMVCSPRINGboot.....所有的技术框架：从一个复杂的场景慢慢的衍生出来一种规范！简单的配置！==SpringBoot：自动配置！==Springboot怎
Objective-C语言的数据库交互 Code花园包罗万象 golang 开发语言后端
Objective-C语言的数据库交互引言在现代应用程序开发过程中，数据库在数据存储和管理方面起着至关重要的作用。对于iOS应用开发者而言，掌握如何在Objective-C中与数据库交互显得尤为重要。本文将全面探讨Objective-C的数据库交互，包括SQLite的基本用法、数据模型的设计、常用的数据库操作及在实际应用中的综合示例。1.数据库基础在深入Objective-C的数据库交互之前，我们
Dexie.js内存管理技巧：在大型数据集操作中避免浏览器崩溃 maply 前端 Node.js javascript 前端 Dexie.js IndexedDB 数据库内存管理
Dexie.js内存管理技巧：避免浏览器崩溃在使用Dexie.js操作大型数据集时，如果不注意内存管理，可能会导致浏览器内存溢出（OOM，OutofMemory）或崩溃。因此，以下内存管理技巧可用于优化性能，减少内存使用，避免浏览器崩溃。1.避免一次性加载大量数据当数据量较大时，不要一次性加载整个数据集，否则会导致浏览器占用过多内存。IndexedDB是基于磁盘的数据库，Dexie.js提供了流式
springboot毕设基于java的在线学习交流平台程序+论文明思计算机毕设 spring boot 课程设计后端
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景随着互联网技术的飞速发展和全球教育资源的日益丰富，在线学习已成为人们获取知识、提升技能的重要途径。特别是在近年来，受各种因素影响，线上教育需求激增，促使在线学习交流平台不断涌现。这些平台旨在打破传统教育的时空限制，为学习者提供更加灵活、个性化的学习体验。然而，当前市场上的在线学
高级java每日一道面试题-2025年01月16日-框架篇[Mybatis篇]-说说Mybatis的缓存机制? java我跟你拼了 java每日一道面试题 java mybatis 缓存一级缓存二级缓存工作原理全局配置
如果有遗漏,评论区告诉我进行补充面试官:说说Mybatis的缓存机制?我回答:在Java高级面试中，MyBatis的缓存机制是一个重要的话题。MyBatis是一个流行的Java持久化框架，它提供了强大的数据库访问能力和灵活的SQL映射配置。为了提高查询性能并减少数据库访问次数，MyBatis引入了缓存机制。下面将对MyBatis的缓存机制进行详细解释：MyBatis缓存机制概述MyBatis的缓存
Centos Linux 离线安装 MySQL 5.7、使用MySQL 寒水馨软件解惑 mysql centos 数据库 linux
CentosLinux离线安装MySQL5.7、使用MySQL视频教程链接：https://www.bilibili.com/video/BV1Nv4y1m7u4/1.MySQL简介MySQL是一个开源的关系型数据库管理系统，由瑞典MySQLAB公司开发，属于Oracle旗下产品，适合个人和中小型企业使用。2.准备工作2.1.拥有一台CentosLinux机器参考文章：《VMware安装Cento
Cursor 一只爱笑的小燕子 ChatGPT html5 java 开发语言
一、什么是Cursor官网：Cursor|BuildFastCursor是一个开源的AI编程编辑器。开源地址https://github.com/pricing目前在国内是可以不需要其他东西，可以直接访问的。而且目「下面是官方的介绍：」Cursor是一个为AI编程而做的编辑器。它还处于早期阶段，但现在Cursor可以帮助你做一些事情。编写：使用Copilot更聪明的人工智能生成10-100行代码比
PostgreSQL 语法 lly202406 开发语言
PostgreSQL是一个功能强大的开源关系型数据库管理系统，它具有高度的可扩展性、稳定性和安全性，适用于各种规模的应用场景。以下是关于PostgreSQL语法的一些重要信息：数据库连接：使用psql命令可以连接到PostgreSQL数据库。连接时需要指定服务器地址、端口、用户名和数据库名称。例如：psql-h127.0.0.1-Udbuser-p5832-ddatabase【1†source】。
使用spring boot写一个学生管理系统 db_hkq_2039 spring boot 后端 java
目录前言二、博客地址三、实现步骤3.1创建SpringBoot项目3.2连接数据库3.3代码层级3.3.1model层3.3.2Repository层3.3.3service层3.3.4控制层controller3.3.5视图层3.3.6BootStrap4.1登录4.2增4.3删4.4查4.5改4.6分页总结前言学生管理系统是一种常见的应用程序，它可以用于管理学生、学院、班级等信息，是许多企业和
agentUniverse X 浙大太乙平台，开源共建招募令来啦，3万奖金等你拿！人工智能机器学习chatgpt
agentUniverse正式上线浙大太乙开源平台（https://www.taiyi.top），现发起有奖招募令，邀请大家一起参与到开源共建中来，见证AI应用落地的每一步。MaytheOpenSourceforcebewithyou！活动介绍本次活动设置15个任务，包括10个适合初学者的简单型问题（issue）和5个更具挑战性的复杂型问题，参与者可根据个人兴趣和技术水平自由选择认领，完成相应任务
搭建设计一个校园交友系统源码的过程，售后一对一+圈子全开源码教程+全面搭建指南前端小程序php
搭建设计一个校园交友系统源码是一个复杂但有趣的过程，以下是一个全面指南，旨在帮助你从头开始搭建一个功能齐全、安全可靠的校园交友系统。一、明确目标与需求目标用户：明确你的目标用户群体，如大学生、研究生等，了解他们的交友需求和偏好。功能需求：根据目标用户，列出所需功能，如用户注册与登录、个人资料展示、匹配推荐、聊天功能、动态发布等。二、技术选型后端技术：可以选择PHP等成熟的后端开发语言。PHP结合T
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置

开源大数据引擎：Greenplum 数据库架构分析

一. Greenplum数据库简介

二. Greenplum架构

三. Greenplum核心组件

四、Greenplum开源

你可能感兴趣的:(开源大数据引擎：Greenplum 数据库架构分析)