鲁边

Hive存储格式之RCFile详解，RCFile的过去现在和未来

我在整理Hive的存储格式和压缩格式，本来打算一篇发出来，结果其中一小节就有很多内容，于是打算写成Hive存储格式和压缩格式系列。
欢迎点击此处关注我的个人公众号，交流更多知识。

本节主要讲一下Hive存储格式最早的典型的列式存储格式RCFile。

综述

RCFile（Record Columnar File）文件格式是FaceBook开源的一种Hive的文件存储格式，遵循“首先水平分区，然后垂直分区”的设计理念。首先将数据水平分为几个行组，这样每一行数据就可以保证存储在同一个集群节点，然后对每个行组内数据进行垂直划分，按列存储。

下面通过文件存储结构来引入RCFile的详细介绍。文件存储结构主要有行存储结构，列存储结构和混合存储结构。

1.行存储存储结构

行存储（row-store）结构在传统的一刀切的数据库系统中占主导地位。使用这种结构，关系记录被组织在一个n元存储模型中。一个记录的所有字段都按它们出现的顺序依次填充。记录被连续地放置在一个磁盘页中。下图给出了一个示例，展示了如何在HDFS块中的行存储结构中放置表。

下图为HDFS block中基于行存储示意图

1.1 优点

行存储保证了相同记录的所有字段都在同一个集群节点，具备快速数据加载和动态负载的高适应能力。

1.2 缺点

在当查询仅仅针对所有列中少数几列时，它就不能直接定位到所需列而跳过不需要的列，不太满足快速的查询响应时间的要求。由于混合着不同数据域的列，行存储不易获得一个极高的压缩比。

尽管通过熵编码和利用列相关性的行存储可以有比列存储更好的数据压缩比，但这同样也会因为复杂的数据存储实现导致很高的数据解压缩开销。

2.列式存储存储结构

列式存储（column-group）是基于读取优化的数据仓库系统的面向列的存储模型，在列式存储中，一个关系被垂直划分为几个子集。有两种存储方案。

第一种是每一列放在一个子集中，常见一些实验系统中，我们称之为列存储（column-store）。

第二种是将每个关系的所有列组织成不同的列组，并且通常允许多个列组之间的列重复。Hbase的列簇设计就是一种类似方案，我们称之为列组（column-group）。

也就是说我们通常所说的列式存储其实是列组存储。

如下图，列A和列B存储在同一个列组中，而列C和列D存储在两个独立的列组中。

下图为HDFS block中基于列存储示意图

2.1 优点

列式结构使得在查询时能够直接读取需要的列而避免不必要的列的读取。

通过压缩同一数据域内的每个列，可以有一个更好的压缩比。

2.2 缺点

由于元组重构的高开销，不能提供基于Hadoop系统的快速查询处理能力。

缺点详细解释版本：列存储不能保证同一记录中所有的字段都位于同一个集群节点，如上图，一个记录的四个字段存储在三个HDFS块中，它们可能位于不同的节点。因此，查询一条完整的记录将导致多个集群节点之间的网络进行大量的数据传输，必然会慢。集群中过多的网络传输是一个集群增长的瓶颈，如果可能的话应该避免。

列组和物化视图类似（提前加载好查询数据），因此它可以避免记录重构的开销（同一个块中），但是，它不能满足快速适应动态工作负载的要求，除非将所有的查询可能都构建为列组，这会有极高的数据冗余。

关于物化视图，开源数据库postgresql 做了很好的支持，有机会单独开篇讲一讲。

3.RCFile存储思想-混合存储（PAX）

混合存储的核心，先水平分区，再垂直分区。

它采用了一种混合放置结构，旨在提高CPU缓存性能。对于来自不同列多个值的记录，PAX不是将这些字段值放在不同的磁盘页中，而是将它们放在单个磁盘页中，以保存用于记录重构的其他操作。

在每个磁盘页面中，PAX使用页面头来存储一个指向指针，该指针指向一个用来存储属于每个列的所有字段的迷你页面。

3.1 优点

与行存储区一样，PAX对各种动态查询工作负载具有很强的自适应能力。

3.2 缺点

由于PAX主要是为了提高加载数据集的CPU缓存利用率的性能，因此PAX不能直接满足高存储空间利用率和快速查询处理速度的要求，原因有以下三个方面：

PAX与数据压缩无关，仅仅提供了一个执行列级数据压缩的可能。而数据压缩对于缓存优化不是必需的，但对于大型数据处理系统非常重要。
PAX不能提高I/O性能，因为它不会改变页面的实际内容。这限制了我们实现在大规模增长的数据集上对大量磁盘扫描进行快速查询处理的目标。
受传统DBMS引擎中的页面级数据操作的限制，PAX使用一个固定的页面作为数据记录组织的基本单元。通过如此固定的大小，PAX无法有效地存储大型数据处理系统中不同的数据资源类型。

4.RCFile

RCFile应用了PAX中的“首先水平分区，然后垂直分区”的概念。结合了行存储和列存储的优点，从行存储的角度来看，RCFile保证了同一行数据位于同一节点，从列存储的角度来看，RCFile可以利用列级的数据压缩，并跳过不必要的列读取。

那么它是怎么做到的呢？我们且看下文，RCFile的五个特性。

4.1 数据组成

如下图，在每个HDFS块中，RCFile使用行组作为基本单位来组织数据。存储在HDFS块中的所有记录都被划分成了行组。对于一个表，所有的行组大小都相同。一个HDFS块只能有一个或者多个行组。

一个行组由三部分组成，第一部分是行组开头的同步标记，用于指向在一个HDFS块两个连续的行组。第二部分是行组的元数据头，存储此行组中有多少记录，每列有多少字节以及某列中每个字段中有多少字节等信息。第三部分是表数据，实际上是一个列存储区，同一列中所有字段都连续的存储在一起，如下图中，首先存储A列所有数据，然后存储B列所有数据。

HDFS block上RCFile存储示意图

4.2 数据压缩

RCFile在数据压缩上是将每个行组的元数据头部分和表数据部分分别压缩。

元数据头使用RLE算法进行压缩，方便快速查找数据元数据信息。

RLE算法详解，有空写（课本数据结构一书中有介绍）。

表数据部分没有作为一个整体进行压缩，而是将每一列都单独使用Gzip进行压缩，以获得更高的压缩比。

RCFile允许扩展可选择每一列根据不同数据类型和数据分布来使用不同的压缩算法，使其压缩达到最佳，这是RCFile的优化和发展方向。但似乎有点过于笨重。

4.3 数据写入

RCFile存储方式导致了它不支持数据修改，由此Hive使用RCFile存储是不支持数据更新，只支持数据覆盖或者数据追加模式。

4.4 数据读取和懒解压缩

上文提到表数据压缩使用Gzip，Gzip具有高压缩比，但是解压缩也有比较高的开销，那这个是如何避免的呢？

通过只读取给定查询的元数据头和行组中所需要的列（跳过不需要的列）并且结合懒解压缩方式（如果该行列数据没有所需要的字段值，则不解压缩该数据）来获得I/O优势，降低解压缩开销，本质上并没有提升I/O性能，只是少读了。

4.5 行组大小

合适的行组大小能够提升数据读取性能，降低数据存储。显然它由两个因素决定，压缩比和数据读取性能。

大的行组能够提升压缩比，降低表存储，但是可能会损害数据读取性能，小的行组能够提升数据读取性能，但是却损失了存储空间。

RCFile默认设置是4MB，用户可以通过参数调节行组大小。

需要说明的是，RCFile在map阶段从远端拷贝仍然是拷贝整个数据块，并且拷贝到本地目录后RCFile并不是真正直接跳过不需要的列，并跳到需要读取的列，而是通过扫描每一个row group的头部定义来实现的，但是在整个HDFS Block 级别的头部并没有定义每个列从哪个row group起始到哪个row group结束。所以在读取所有列的情况下，RCFile的性能反而没有SequenceFile高。

4.6 Hive使用RCFile示例：

-- 创建RCFile格式表
create table if not exists rcfile_temp(
	id int,
  name string,
  gender int,
  remark string
)
row format delimited fields terminated by ','
stored as rcfile;
-- 插入数据(自带压缩格式，就不需要使用压缩参数了)
insert overwrite table rcfile_temp
select * from rcfile_temp;

RCFile还提供了丰富的API，支持开发者进行二次引用，这里就不一一详述了。

下期预告，讲讲和RCFile的优化版ORC File，具体是怎样发扬了RCFile的优点，又是怎样解决了所有列读取的性能问题。

上一篇：什么是hive的静态分区和动态分区，它们又有什么区别呢？hive动态分区详解

按例，我的个人公众号：鲁边社，欢迎关注
点击此处关注我的个人公众号，交流更多知识。
后台回复关键字 hive，随机赠送一本鲁边备注版珍藏大数据书籍。

你可能感兴趣的:(Hadoop,hive,数据库和数据仓库,hive,hadoop,大数据)

Python vars() 函数：探索对象的内部程序员喵哥 Python python 开发语言
更多Python学习内容：ipengtao.comPython是一门具有强大而灵活的编程语言，可以访问和探索对象的内部属性。vars()函数是Python标准库中的一个强大工具，它可以获取对象的属性和属性值，并以字典的形式返回它们。在本文中，将深入研究vars()函数，探讨它的用途、示例和适用场景。前言在Python中，对象是一切。对象可以是数字、字符串、列表、字典、函数、类实例等等。每个对象都可
ShardingSphere技术解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
并发编程与MyBatis核心解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
2.4G收发SOC芯片 XL2417D，集成高性能2.4GHz射频收发器、32位MCU
XL2417D芯片是一款低功耗、高性能和高度集成的2.4GSoC芯片，带有蓝牙5.2BLE和2.4G收发器。它集成了高性能2.4GHz射频收发器、丰富的基带功能、32位MCU和各种外围IO。它支持128KB的flash和8KB的RAM，以实现可编程协议和配置文件，支持定制应用程序。XL2417D采用先进的55nmCMOS低泄漏工艺制造，降低BOM成本的同时简化了整个系统设计。丰富的外围设备包括10
python和C++相互调用使用妄想出头的工业炼药师 c++开发语言
结论：首选PyBind11：综合性能、易用性最佳（GitHub⭐48k+）优先考虑Cython：涉及大量科学计算或已有Cython代码避免Boost.Python（历史包袱重）和SWIG（配置复杂），除非维护旧项目。python调用C++接口C++调用python接口在C++中使用Python库，特别是使用pybind11，是一个非常强大的方法，可以让你在C++项目中轻松地利用Python的强大功
Spring MVC 架构详解 Java廖志伟 Java场景面试宝典 Spring MVC Web Application Development MVC Architecture
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
运维工程师发展路线 SZHCI 运维
一、运维工程师发展路线1.传统运维侧重点是解决具体的问题。要求具备扎实的底层的知识储备，如网络、linux、数据库、硬件设备调试、服务部署等。以及一定的故障处理能力和经验，能够快速解决问题，实施变更。能够处理突发故障，顺利完成服务的部署，变更的实施。2.云计算运维侧重点是开源技术方案的使用，为云服务的稳定提供保证。随着业务不断发展，服务器规模扩大，就需要具备大规模服务器的批量管理能力。要求对开源技
如何在 Ubuntu 22.04 上使用 LEMP 安装 WordPress 教程 vvw& 技术文章 Linux 开源项目推荐 ubuntu linux 运维服务器 wordpress LEMP php
简介：本教程旨在指导你如何在Ubuntu22.04上使用LEMP栈安装WordPress。WordPress是一个用PHP编写的开源内容管理系统。LEMP栈是Linux，NGINX，MySQL和PHP的缩写。WordPress非常用户友好，并提供了多种选项，例如不同的插件和具有精美设计的各种主题，使其成为用户最可定制的CMS。以下段落将介绍安装WordPress之前LEMP安装的所有步骤。在Ubu
【题解-Acwing】1057. 股票买卖 IV X CODE 算法练习题解算法动态规划状态机模型
题目：1057.股票买卖IV题目描述给定一个长度为NNN的数组，数组中的第iii个数字表示一个给定股票在第iii天的价格。设计一个算法来计算你所能获取的最大利润，你最多可以完成kkk笔交易。注意：你不能同时参与多笔交易（你必须在再次购买前出售掉之前的股票）。一次买入卖出合为一笔交易。输入格式第一行包含整数NNN和kkk，表示数组的长度以及你可以完成的最大交易笔数。第二行包含NNN个不超过10000
扩散模型（Diffusion Model）简介
参考：Diffusionmodel—扩散模型-CSDN博客；由浅入深了解DiffusionModel-知乎；https://arxiv.org/abs/2308.093881.概述扩散模型是一种生成模型。可用在视觉生成任务上，如图像超分辨率、去模糊、JPEG伪影移除、阴影移除、去雾/霾/雨等等。扩散模型分为前向（扩散）过程和逆过程。前向过程逐步为图像增加逐像素噪声，直到图像满足高斯噪声；逆
GC393低功耗双电压比较器：精准、高效的信号处理解决方案 Jason13510238356 芯麦信号处理单片机嵌入式硬件智能家居音响蓝牙音箱
芯片概述GC393是一款双通道精密电压比较器，具有低至±1mV的输入失调电压（典型值）和宽电源电压范围（单电源2V~36V/双电源±1V~±18V）。该芯片采用独立设计，输入共模范围包含地电平，特别适合电池供电设备和工业控制系统。核心特性超低功耗：静态电流仅0.4mA（5V供电时）高精度：输入失调电压：±1mV（典型值）输入偏置电流：25nA（典型值）宽电压兼容：支持TTL/DTL/ECL/MOS
【线上故障排查】缓存穿透攻击的识别与布隆过滤器（面试题 + 3 步追问应对 + 案例分析）程序员岳彬从项目到面试：Java 高频面试题场景化通关指南缓存 java 后端 spring boot linux redis
一、高频面试题问题1：什么是缓存穿透？它对系统的核心危害是什么？参考答案：缓存穿透指的是用户请求的数据在缓存和数据库中都不存在，导致请求直接绕过缓存打到数据库。核心危害是大量无效请求会耗尽数据库资源，比如CPU、内存或连接数，严重时可能引发数据库宕机，进而导致整个系统崩溃，影响服务可用性。第一步追问：缓存穿透和缓存雪崩有什么本质区别？参考答案：两者本质不同。缓存穿透是请求不存在的数据，攻击或逻辑漏
MySQL事务实现原理巴里巴气 MySQL知识记录 mysql 数据库
目录MySQL事务介绍事务基础及其实现原理回滚日志MVCC多版本并发控制事务的特性多个事务同时执行出现的三种现象四种隔离级别及其实现原理尽量不要使用长事务MySQL事务介绍要保证⼀组数据库操作，要么全部成功，要么全部失败事务是在存储引擎层实现的,MySQL是支持多存储引擎的系统,不是所有的存储引擎都支持事务,目前最常用的存储引擎InnoDB是支持事务的事务基础及其实现原理回滚日志回滚日志是一种用于
Rust 智能指针深入浅出
在Rust中，智能指针是管理内存的高级工具，它们不仅提供指针功能，还包含额外的元数据和能力（如所有权管理、引用计数等）。以下是Rust主要智能指针的全面解析：一、智能指针vs普通引用特性普通引用(&T)智能指针所有权只借用数据通常拥有数据所有权功能简单的内存访问附加管理逻辑内存位置可指向栈或堆通常管理堆内存元数据无包含额外元数据二、核心智能指针类型1.Box：堆分配的最简指针作用：在堆上分配值，栈
Gemini vs DeepSeek：Transformer 架构下的技术路线差异与企业级选择 charles666666 transformer 架构深度学习语言模型产品经理人工智能
一、引言：从商业价值切入Gemini和DeepSeek都基于Transformer架构，但在技术路线和应用场景上各有侧重。本文将解密同源Transformer下的技术分野，帮助企业做出更明智的大模型选型决策。二、Transformer核心机制精要Transformer架构是现代大语言模型的基础，其核心机制包括自注意力机制和前馈神经网络。自注意力机制使模型能够捕捉序列中元素的全局依赖关系，但也是GP
沃丰科技和印尼MAP集团战略合作，智能化服务印尼2.8亿消费者沃丰科技科技人工智能大数据
在东南亚零售市场风起云涌之际，印尼综合性零售巨头MAP集团与智能客户服务领域领军企业（Udesk）达成深度战略合作，共同启动一项具有里程碑意义的数字化转型工程——通过AI赋能MAP集团旗下客户忠诚度计划平台，为印尼2.8亿消费者打造全场景、个性化的智能客户服务体验。此次合作不仅标志着印尼零售业智能化升级的加速，更将重塑企业与消费者之间的情感连接。一.MAPClub：零售忠诚度战略要地MAP集团：在
布隆过滤器详解及使用：解决缓存穿透问题豪宇刘缓存哈希算法散列表
在现代应用开发中，缓存技术被广泛应用于提升系统性能和响应速度。然而，缓存系统也带来了一些新的挑战，如缓存穿透、缓存击穿和缓存雪崩等问题。一、什么是布隆过滤器？布隆过滤器是一种空间效率很高的概率型数据结构，用于判断一个元素是否在一个集合中。它的优点是高效且占用内存少，但有一定的误判率（即可能会错误地认为某个不在集合中的元素存在于集合中），不过它不会漏报（即如果一个元素确实不在集合中，布隆过滤器一定能
【无标题】Python ---Day2 复合类型之序列类型、映射类型和集合类型的学习！！！
系列文章目录文章目录系列文章目录前言一、复合类型初识1.1列表类型1.1.1列表创建1.1.2列表运算1.1.3列表访问1.1.3.1索引1.1.3.2反向索引1.1.3.3切片1.1.4列表操作1.1.4.1添加数据1.1.4.2修改数据1.1.4.3删除数据1.2元组类型1.2.1元组创建1.2.2元组操作1.2.2.2查看元组1.2.2.3解包技能1.2.3元组运算1.2.4元组不可变二、映
Linux 中的 .bashrc 是什么？配置详解 vvw& 技术文章 Linux linux chrome 运维服务器 ubuntu 后端 centos
如果你使用过Linux终端，那么你很可能接触过.bashrc文件。这个功能强大的脚本是个性化命令行环境并使其更高效运行的关键。在本文中，我们将向你介绍这个文件是什么，在哪里可以找到它，以及如何安全地编辑它。你还将学到一些实用技能，如创建省时的命令别名、编写强大的shell函数，以及自定义终端提示的外观。最后，我们还将介绍基本的最佳实践和常见错误，帮助你建立更高效、更强大的命令行工作流程。准备强烈简
使用工厂模式和策略模式实现布隆过滤器小菜0-o 策略模式
使用工厂模式和策略模式实现布隆过滤器的大概流程如下：定义布隆过滤器接口：首先定义一个布隆过滤器接口，包括添加元素和判断元素是否存在两个基本操作。实现具体的布隆过滤器类：创建一个具体的布隆过滤器类，实现布隆过滤器接口中的方法。在这个类中，需要定义布隆过滗器的数据结构（比如位数组）、大小等属性。定义哈希策略接口：定义一个哈希策略接口，包含计算哈希值的方法。实现具体的哈希策略类：创建多个具体的哈希策略类
深度解码：企业级 AI 选型中 Gemini 与 DeepSeek 的架构对决 charles666666 人工智能架构语言模型深度学习产品经理机器学习
开篇：技术选型会议中的认知困局当技术团队尝试评估基于MoE（专家混合）架构的Gemini1.5Pro和DeepSeek-V3时，决策者往往陷入认知混乱。尽管两者同属MoE架构，实际测试表现却大相径庭。这种混乱源于对参数规模的盲目崇拜。Gemini1.5Pro拥有1.5万亿参数，而DeepSeek-V3参数规模仅为前者的一半。但在实际企业场景测试中，DeepSeek在中文语义理解任务中的准确率却高出
java组件化设计_构建之路—谈谈组件化后端构建和实现
前言这一篇文章，准备了很久，构思了很久，草稿了很久。从个人编程至今，历经了C，C++，Java，到现如今的NodeJS。也后端到前端，再回到后端。更从学校里的学生信息管理系统到大型商业系统构建，是的，我曾一直以为编程也就是如此了，由瀑布模型，敏捷开发，设计模式等等组成的软件工程大致就是如此了。相信可能很多人也会有和我类似的想法，是否也都曾迷茫过？幸运的是，伴随着对前端的接触和深入，云雾散开。前端组
【机器学习-08】参数调优宝典：网格搜索与贝叶斯搜索等攻略云天徽上机器学习机器学习人工智能
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
来，C语言刷题(中)（保姆式详解）白子寰 C语言题集 c语言算法
目录关于VS2022调试技巧步骤一步骤二步骤三关于Debug和Release版本区别编程题1.计算求和2.水仙花数3.打印菱形4.喝汽水问题递归题组（1）关于递归的描述（2）打印一个整数的每一位（3）求阶层①递归方式②非递归方式(4)计算一个数的每位之和(5)n的k次方操作符讲解（1）进制位的转化（2）原码，反码，补码（3）按位异或^（4）按位或与&编程题（1）交换两个变量(2)统计二进制中1的个
常见代码试题
指针概念辨析指针-指针得到的是指针和指针值之间的元素个数整形指针解引用访问4个字节指针可以比较大小整形指针+1意味着向后偏移4个字节当使用free释放掉一个指针内容后，指针变量的值不会被更改，需要手动置NULL野指针是指向未分配或者已经释放的内存地址char*p="hello";中p指向字符串第一个元素地址数组指针是指针；指针数组是数组int*fun(inta,intb)与(int*)fun(in
KTO（Kahneman-Tversky Optimization）技术详解与工程实现 DK_Allen 大模型深度学习 pytorch 人工智能 KTO
KTO（Kahneman-TverskyOptimization）技术详解与工程实现一、KTO核心思想KTO是基于行为经济学前景理论（ProspectTheory）的偏好优化方法，突破传统偏好学习需要成对数据的限制，仅需单样本绝对标注（好/坏）即可优化模型。其创新性在于：损失函数设计：将人类对"收益"和"损失"的非对称心理反应量化数据效率：无需构建偏好对（y_w>y_l），直接利用松散标注二、KT
常见的网络攻击方式及防御措施神的孩子都在歌唱计算机网络原理网络运维服务器
常见的网络攻击方式及防御措施：全面解析网络安全威胁前言肝文不易，点个免费的赞和关注，有错误的地方请指出，看个人主页有惊喜。作者：神的孩子都在歌唱在信息化高速发展的今天，网络安全威胁无处不在，不论是个人用户、企业组织，甚至是政府部门，都面临着各种形式的网络攻击。今天，神唱就来带大家一起深入了解常见的网络攻击方式以及如何有效防御这些攻击。一.网络攻击的基本概念1.1什么是网络攻击？网络攻击是指攻击者通
使用Ora2Pg迁移Oracle数据到openGauss hid_clf-2oizpt7skaq oracle 数据库
下载及安装Ora2Pg1.下载说明PerlDBD：SearchtheCPAN-metacpan.org#只需在搜索输入框中输入模块的全名（例如：DBD::Oracle、DBD::Pg）Ora2Pg：Ora2Pg:MigratesOracletoPostgreSQL在Windows下，应该安装StrawberryPerl（StrawberryPerlforWindows）和操作系统对应的Oracle
AI应用工具流量留 AI开发人工智能
GammaAIPPT是一款强大的AI驱动的PPT制作工具，以下是其主要功能特点和应用场景：###功能特点-**一键生成PPT**：用户只需输入主题或导入文档，GammaAI会自动分析内容并生成相应的PPT。-**AI辅助内容创作**：提供AI生成的内容大纲，帮助用户快速构建演示文稿。-**丰富的模板和主题**：提供多种模板和主题，满足不同场景的需求。-**多格式导出**：支持将PPT导出为PDF、
MySQL 触发器中判断 NULL 值不生效？问题解析与解决方案
前言在MySQL数据库开发中，触发器是一个非常实用的功能，它能在数据表发生插入、更新或删除操作时自动执行指定的逻辑。但在实际使用中，很多开发者会遇到一个棘手的问题：当触发器中涉及NULL值判断时，预期的逻辑往往不生效。本文就来详细分析这一问题的原因，并提供具体的解决方案。一、问题现象：为什么NULL判断在触发器中“失灵”？先来看一个常见的错误示例。假设我们有一张user表，包含name（姓名）和a
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他