_zhj

论文学习——基于查询的workload预测（CMU）

一、简介

论文题目：Query-based Workload Forecasting for Self-Driving Database Management Systems

发表在2018SIGMOD，来自cmu的数据库组（这个组真的很厉害）

这篇论文主要讲数据库workload预测的问题。因为要实现数据库self-driving（如选择合适的时机在合适的列上自动创建索引），应该根据将要到来的查询对数据库进行优化，而不是根据过去一段时间的查询状态来优化。所以预测将来一段时间的workload十分重要。

二、主要内容

工作流程：

核心流程包括三部分，预处理、聚类和预测。

（一）预处理

1、首先，将原始sql语句抽象成模板，即把sql中的值替换为占位符号，具体替换的位置是：

（1）The values in WHERE clause predicates.

（2）The SET fields in UPDATE statements.

（3）The VALUES fields in INSERT statements. For batched INSERTs, QB5000 also tracks the number of tuples.

对以上结果再做额外处理，如空格、括号等。处理完后，形成一个通用的查询模板。

2、统计一个时间间隔内的各个模板对应的sql个数，然后把小的间隔合并成大的间隔，以节省空间。（还会保留一部分的原始sql，用于之后的优化评估。保留哪些语句采用的是reservoir sampling的方法）

3、继续合并：将语义相同的模板合并成在一起。本文使用启发式的方法近似的比较语义相同：访问相同的表，使用相同的谓语，返回相同的映射（该方法在获得比较好性能的同时还不丢失准确性）。

下面表是预处理完后，模板的个数：

语句数目减少最大的一步，但是依然还是很多，所以需要继续减少数量。

（二）聚类

1、聚类特征

有三类特征可以从模板中提取出来用于聚类分析：(1) physical, (2) logical, and (3) arrival rate history.

其中，前两个是别人使用的方法，本文使用第三种方法。

（1）physical：主要是资源消耗和DBMS执行查询时的各种运行指标。这种方法优点：可以为单个查询提供细粒度和准确的信息。缺点：与参数、硬件和其他查询有关，只要有一个发生改变，那么之前收集的数据无效，需重建模型。

（2）logical：query的解析树、执行计划、query中用到的column等。优点：不依赖于数据库参数配置和workload特点。缺点：从logical feature获取到的信息有限，所以聚类可能不是很准确。

（3）arrival rate history：历史到达率。如：现在有过去24小时的记录，以每一小时为间隔统计每个模板的到达率，那么每个模板都会有连续的24个到达率，把它作为这个模板的特征向量，共24维。

聚类是要把有相同到达率模式的模板聚在一起形成一个簇，这个簇的到达率是簇内所有模板到达率的算术平均，在之后进行预测时只使用聚类中心，不再使用原始模板，这样可以大大降低计算量。如下图所示：

其中，在聚类时使用的距离度量方式是cosine similarity（余弦相似度，取值在[-1, 1]之间，绝对值越大相关性越强），而不是欧式距离这类度量方式。（使用预先相似度可以更好的反应趋势吧，而不仅仅是大小关系）

2、聚类方法

本文使用的是DBSCAN聚类方法（该方法可以参考这里：传送门），不是原始的DBSCAN，而是根据当前需求做了下修改：原始DBSCAN在对一个点划分到某个簇的时候会计算当前点到簇中任意一个核心的距离并取其中最小的距离，但本文在划分时是基于当前点到聚类中心的距离。（作者也试过k-means聚类，但是当workload有很多小的簇，或者每个簇有不同的大小、密度时，会出现问题）

使用一个阈值ρ (0 ≤ ρ ≤ 1)来判断是否属于同一类，只有大于阈值时才是同一个类。

具体步骤：

（1）从还未划分的模板中拿出一个，跟已有簇的聚类中心计算相似度，如果大于阈值，则划分到该类中；然后用算术平均更新聚类中心；如果和所有的聚类中心的相似度都小于阈值，那么新建一个聚类。

（2）聚类中心发生改变后（加入、删除类中的模板会使聚类中心变化，新的到达率也会使其改变），检查簇中的所有点是否还满足阈值条件，如果不满足则去掉该模板，将这个模板用（1）中的方法重新归类。

（3）合并聚类中心：如果两个簇的聚类中心的相似度大于阈值，则合并这两个簇。

参考图如下：

除了周期性的执行以上3步，系统还会检测新的workload，如果未见过的模板超过一定数量，则会触发以上3步来适应workload变化。

3、聚类剪枝

虽然聚类后数目大量减少，但还存在一些小的类，它们包含的查询只占很少的比例，只会增加模型的噪声。在实际试验中只使用了最大的5个簇来建模，其中这5个簇包含了95%的查询。

（三）预测

1、模型

这部分是根据历史到达率，预测将来一段时间的查询到达率。文中对6种模型做了比较：

（上面的LR指的是Linear Regression）

从3个方面进行了比较：

Linear：输入输出之间是否有线性关系。

Memory：模型是否能够综合输入与它从历史数据中保存下的信息来预测未来。

Kernel：是否使用核函数，使用核函数即支持非线性分析。

通常，线性模型能够有效的避免过拟合，并且对计算资源和训练数据要求较低，在预测较近的未来时间时表现较好。具有记忆性的模型可以挖掘数据的动态行为信息，但是增加了训练的复杂性与模型对数据的依赖。

本文采用ENSEMBLE方法，将多个模型进行合并做平均预测。

（1）使用线性模型预测近期，使用LSTM预测较长时间的结果。结合方式（ENSEMBLE）是将LR和LSTM的结果取平均。

（2）ENSEMBLE无法预测尖刺现象，如每一年只出现一次的峰值。使用KR核回归的方式可以预测这种现象。

将以上两种方式混合（HYBRID）：当KR预测结果超过ENSEMBE一定倍数时（即预测到了尖刺），使用KR的结果，否则使用EMSEMBLE的结果。

2、Horizons和Intervals

Horizons：是模型能够预测多远

Intervals：模型预测多长时间间隔内的查询。如预测一分钟或一个小时内的查询数目。

三、实验

数据集，三个：

Admissions : An admissions website for a university’s graduate program. Students submit their application materials to programs in different departments. Faculties review the applications after the deadline and give their decisions.
BusTracker : A mobile phone application for live-tracking of the public transit bus system. It ingests bus location information at regular intervals from the transit system, and then helps users find nearby bus stops and get route information.
MOOC : A web application that offers on-line courses to people who want to learn or teach [3]. Instructors can upload their course materials, and students can check out the course content and submit their course assignments.

数据特点：

（一）聚类分析

1、聚类个数的选择

计算每个聚类查询总量占总查询总量的比例，发现最大的5个聚类查询比例占总数的95%以上，如下图所示：

2、top 5聚类的变化频率

比较相邻两天观察top5聚类是否发生变化，以及有几个聚类变了，如下图所示：

对于Admissions和BusTracker，90%以上的天数是只有小于等于1个模板发生变化。相比之下，MOOC有更多的模板发生变化，因为随业务更新会不断有新的查询出现。

（二）模型预测

1、不同模型对比

使用过去三周的查询到达率作为训练数据，预测长度是1小时。

评估：MSE

使用了6种单模型：LR, KR, ARMA, FNN, RNN, PSRNN，外加集成模型（LR+RNN）,混合模型（LR+RNN+KR），实验对比图如下：

结果对比：

（1）短期预测，LR效果更好一些。因为短期内的到达率和过去最近的到达率线性关系比较强，所以线性模型足够了，复杂的模型反而会过拟合。而长期预测，像RNN这样的复杂模型效果更好一点，当预测时间大于等于1天时，RNN要比LR效果好。

（2）ARMA很不稳定，有10%的结果取得最好表现，但也有38%的结果取得最差表现。原因是它对超参数比较敏感，而超参数的设置和数据集相关。

（3）一般情况下，FNN比RNN要差。因为FNN无法像RNN那样利用历史状态，也不没法保证像LR那样不过拟合。

（4）KR有19%的结果表现最好，但也有24%的结果表现最差。它对从未见过的输入表现较差。

（5）PSRNN表现比RNN差，该模型试图对初始化做优化，并从该优化的基础上提升效果，但是在训练集受限的场景下，该模型的效果不稳定，并且计算时间较长。

（6）集成模型有61%的结果表现最好，并且没有表现最差的结果，集成模型方差较低，更稳定。

2、HYBRID预测BusTracker

分别对1小时和1周进行预测，结果如下图：

可以看出，对1小时的预测更准一些。

3、对尖刺的预测

使用Admissions数据集，将训练数据到达率间隔设为1小时，预测2017-11-15到2017-12-31的到达率，结果如下图所示：

只有KR能够预测尖刺现象。

4、不同粒度的预测评估

细粒度可以预测的更准，但是模型训练时间增长。

（三）与自动索引选择结合测性能

文中没有介绍自动索引具体算法，但是这个算法会基于查询到达率选择在某些列上创建索引。

在两个数据集上做了实验，Admissions(MySQL)和BusTracker(PostgreSQL)。

保留原workload的主键和外键，删除所有二级索引。

比较三种方法：

1、AUTO：使用本文方法基于实时预测的到达率创建索引，一共进行了16个创建周期，创建了20个索引。

2、STATIC：基于全部查询历史，使用自动索引算法在开始时创建20个索引。

3、AUTO-LOGICAL：也是基于实时预测创建索引，不同之处在于特征不是使用到达率，而是使用逻辑特征（见聚类部分）

结果如图所示：

在刚开始的时候，AUTO方法比STATIC方法要差，因为刚开始时没有二级索引。到最后阶段，AUTO方法在吞吐量上提升28%，延迟上收益23%

AUTO-LOGICAL方法与AUTO相比也要差一些，文中提到两个原因：The first is that the SQL queries are insufficient for determining whether two templates will have similar impacts on the system. The second reason is that templates within the same logical feature cluster may have multiple arrival rate patterns (including anomalies like one-time queries); this makes it more difficult for the Forecaster to identify these patterns and predict the trends according to the cluster centers.

---------------------------------------

只看论文感觉有些细节还是不清晰，所以还是需要看下代码的，源码地址：https://github.com/malin1993ml/QueryBot5000

你可能感兴趣的:(机器学习,数据库)

机器学习，支持向量机svm和决策树xgboost介绍 suixinm 支持向量机机器学习决策树
支持向量机(SVM)和XGBoost都是非常强大且应用广泛的机器学习算法，但它们基于不同的原理，各有其优势和劣势，适用于不同的场景。以下是两者的主要区别和优劣势对比：1.核心思想与模型类型:SVM:核心思想:找到一个最优的超平面（在特征空间中），将不同类别的样本分隔开，并且使得该超平面到两类样本中最近的样本点（支持向量）的距离（间隔）最大化。核心是几何间隔最大化。模型类型:单个模型（虽然是核方法，
《JMS事务性会话彻底解析：消息监听中的 commit、rollback 和幂等设计》 G探险者 java 中间件分布式
大家好，我是G探险者！场景引入在实际项目中，我们常常面临以下挑战：监听MQ消息失败了，希望自动重试？消费MQ消息后，要写数据库，但中间报错了？消息处理必须要么成功要么失败，否则可能导致脏数据？消息是幂等的吗？可以重复投递处理吗？这些都需要事务性会话+容器回滚机制+幂等控制组合拳来解决。✅一、什么是JMS的事务性会话？事务性会话（transacted=true）是一种将消息的接收与处理放入事务中控制
跨届资源汇聚地：校友平台开启终身学习与职业互助新模式 IDZSY0430 学习大数据运维开发用户运营流量运营
引言在知识经济时代，“校友”二字早已超越单纯的情感符号，演变为蕴含巨大潜能的资源网络。传统校友关系受限于时空隔阂与信息壁垒，难以实现深度互动与资源共享。如今，依托智能化校友平台，一个打破届别、跨越地域的终身学习与职业互助新生态正加速形成，成为驱动个体成长与社群繁荣的核心引擎。一、资源整合：构建校友生态系统的数字基石校友平台的底层逻辑在于系统性整合碎片化资源，为跨届协作奠定量化基础：动态校友数据库平
袋鼠数据库工具 7.99.1 版已上线
袋鼠数据库工具是一款AI驱动的热门数据库系统客户端(MariaDB/MySQL/Oracle/PostgreSQL/Redis/SQLite/SQLServer/...)，支持建表、查询、模型、同步、导入导出等功能，支持Windows/Mac/Linux等操作系统，致力于打造一款好用、好玩、开发友好的开发者工具。重点特性介绍这个版本继续完善Redis支持，实现了Redis用户管理支持，实现了数据格
《Redis可扩展：轻松应对数据增长与流量高峰》猕员桃 redis 数据库缓存
Redis可扩展：轻松应对数据增长与流量高峰在数字化时代，企业业务不断发展，数据规模呈爆炸式增长，流量高峰也频繁出现。面对这样的挑战，数据库的可扩展性成为关键因素。Redis凭借出色的可扩展能力，成为众多开发者应对数据增长与流量高峰的得力工具。接下来，我们将深入剖析Redis实现可扩展的核心技术与策略，探究它是如何在复杂多变的业务场景中保持高效运行的。一、水平扩展：数据分片的力量1.1数据分片的核
新手向:从零开始MySQL超详细安装、配置与使用指南 nightunderblackcat 基础环境配置 mysql 数据库
什么是MySQL？一句话解释：MySQL是全球最流行的开源关系型数据库，像淘宝、Facebook等大型网站都在使用它存储数据！它采用表格形式管理数据（类似Excel），支持SQL语言进行数据操作。第一步：安装MySQL（多系统详解）Windows系统下载安装包：访问官网：https://dev.mysql.com/downloads/mysql/选择MySQLInstallerMSI（Window
Redis 实现消息队列雾缘枯 redis 数据库缓存
一、为什么选择Redis作为消息队列？在分布式系统架构中，消息队列是实现异步通信和解耦的核心组件。Redis作为一个高性能的内存数据库，凭借其卓越的速度和丰富的数据结构，成为轻量级消息队列的理想选择：1.1核心优势超高性能：10万+QPS的处理能力毫秒级延迟：内存操作带来的极致响应速度丰富数据结构：多种队列实现模式可选零外部依赖：无需额外中间件，降低运维复杂度持久化支持：可配置持久化保证消息可靠性
mongoose中数组循环查询find结果的同步实现 shuhaha mongoose mongoose find 数组查询同步
在项目中，mongoose的find方法查询是异步查询的，所以得到的结果是异步的结果，看下面的例子。根据试卷的id号查找对应试卷中的试题，找到试题id后找到试题信息。加入试题数据库信息如下：{"_id":ObjectId("59dc79ddcf9bb828c4689284"),"quesType":"1","quesStem":"第1单选","quesAns":"A","quesAla":"第1单
基于flask+vue框架的法律咨询公司管理信息系统的分析与设计[开题+论文+程序]-计算机毕设 zhihao508 flask vue.js 课程设计
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容研究背景随着社会的快速发展和法律意识的普遍增强，法律咨询服务需求日益增长，成为现代社会不可或缺的服务之一。传统法律咨询模式受限于时间、地域及信息不对称等问题，难以满足广大客户高效、便捷的服务需求。与此同时，法律咨询公司内部管理也面临挑战，如客户信息管理混乱、律师资源分配不
Redis 与其他数据库的比较 jarenyVO redis 数据库 redis 缓存
Redis与其他数据库的比较以下是Redis与传统关系型数据库及其他NoSQL数据库的对比列表：Redisvs关系型数据库(MySQL/Oracle)对比维度Redis关系型数据库数据模型键值对、丰富数据结构（String/Hash/Set等）表结构，严格的行列模型持久化可配置（RDB快照/AOF日志）默认持久化，WAL日志+数据文件事务支持简单事务（无回滚）ACID事务，支持复杂回滚查询能力仅支
对比2个数据库：google Cloud Firestore 和 supabase waterHBO 数据库云端数据库
帮我对比一下：CloudFirestore和supabase尤其是，是否免费，注册难度，是否需要银行卡注册，我没有国外的银行卡（我在中国大陆）。以及免费额度是多少，上手难度，即，学习曲线因为我平时一般是写小项目，我的数据库一般使用json或是sqlite3第1个回答好问题！下面是CloudFirestore（Firebase）和Supabase的全面对比，特别关注了中国大陆用户关心的注册、费用、学
基于vue框架的宠物店管理系统的设计与实现4czn0（程序+源码+数据库+调试部署+开发环境）系统界面在最后面。小光学长数据库
系统程序文件列表项目功能：用户,商品分类,服务类型,商品信息,商品订单,宠物服务,服务预约,服务评价,商品咨询开题报告内容基于Vue框架的宠物店管理系统的设计与实现开题报告一、引言随着宠物行业的蓬勃发展，宠物店作为宠物产品与服务的重要提供者，其管理效率和服务质量直接关系到顾客的满意度和店铺的竞争力。传统的管理方式往往依赖于手工记录和纸质文档，这种方式不仅效率低下，而且容易出错，难以满足现代宠物店日
基于vue框架的CIA报价平台的设计与实现1xv02（程序+源码+数据库+调试部署+开发环境）系统界面在最后面。
系统程序文件列表项目功能：用户,供应商,产品分类,产品信息,在线咨询,资质申请开题报告内容基于Vue框架的CIA报价平台的设计与实现开题报告一、选题背景随着市场竞争的日益激烈，企业对于成本控制与效率提升的需求愈发迫切。在采购与供应链管理领域，传统的手工报价方式不仅耗时耗力，还难以保证报价的准确性和时效性，给企业的运营带来了不小的挑战。特别是针对复杂多变的采购需求，如何快速、准确地生成报价，同时有效
SQL规范检查独步秋风 Mysql mysql sql 规范检查
序号规则规则等级数据库类型1Update/Delete需要带上where条件errorMysql2不允许使用Truncatetable语句errorMysql3Update/Delete不允许带limit条件errorMysql4Update/Delete不允许带orderby条件errorMysql5不使用“SELECT*”这样的语句errorMysql6不使用DML广播语句errorMysql
Flask + GPT 实践红鼻子时代 flask项目 flask gpt python
一、前言本篇文章会介绍从零开始构建一个基于Flask+GPT的小项目的过程。总共有四个版本的迭代，包括：1、调用GPT接口并渲染到前端页面；2、使用Flask提供的session来实现登录和登出功能；3、用SQLAlchemy管理数据库，实现用户注册和登录；4、记录和分页查看用户与GPT的对话历史。二、项目环境与依赖Python版本：建议3.7+Flask：最常用的PythonWeb框架之一ope
【C#】两个list根据某个元素比较差集 weixin_30594001 c#
1.今天突然跟前端有一点小小的分歧，传输数据和数据库里的数据做比对，该前端做处理还是后端，(并不是都不愿意做，相反，都愿意在自己那端处理==)2.最后终于归结我这了，好久之前做过list比对，记得刚写代码的时候，两个list比对？那就无限foreach呗，当然实现是能实现，这就很影响比对效果和代码的整洁度了。3.接下来，我回忆起来了我之前写过的一个比较方法，拿出来记录一下//重写比较方法publi
java+vue+SpringBoo智慧旅游系统（程序+数据库+报告+部署教程+答辩指导）
源代码+数据库+LW文档（1万字以上）+开题报告+答辩稿ppt+部署教程+代码讲解+代码时间修改工具技术实现开发语言：后端：Java前端：vue框架：springboot数据库：mysql开发工具JDK版本：JDK1.8数据库：mysql数据库工具：Navicat开发软件：idea主要角色及功能介绍本次系统的用例图做出了十分明确的功能划分，在设计时可以有很好的设计思路进行设计和延展。（1）管理员用
【力扣数据库知识手册】数据库优化 soso（找工作版数据库八股数据库
系统的吞吐量瓶颈往往出现在数据库的访问速度上，因为数据是放在磁盘上的，读写速度无法和内存相比。数据库结构优化在数据库设计中，需要考虑数据冗余，查询和更新的速度、字段的数据类型是否合理等多方面的内容。将字段很多的表分解成多个表。如果有些字段的使用频率很低，可以将这些字段分离出来。增加中间表。对于经常要联合查询的表，通过建立中间表以提高查询效率，具体地，将需要通过联合查询的数据插入到中间表中，然后将原
【力扣数据库知识手册】关于redis soso（找工作版数据库八股数据库 redis
Key-Value数据库（键值数据库）是一种非关系型数据库（NoSQL），它使用简单的键值对(key-value)方式来存储数据，是最简单的数据库模型之一。Redis定义全称为RemoteDictionaryServer，本质上是一个Key-Value类型的内存数据库，整个数据库统统加载在内存当中进行操作，定期通过异步操作把数据库数据写入磁盘或把修改操作写入追加的记录文件，并且在此基础上实现Mas
数据库连接池优化深度解析后端
在Java企业级应用中，数据库连接池作为数据库访问的核心组件，其性能直接影响系统的整体吞吐量与稳定性。本文从连接池核心参数、性能调优策略、监控与故障诊断及面试高频问题四个维度，结合主流连接池实现（HikariCP、Druid）与工程实践，系统解析数据库连接池的优化方法与最佳实践。一、连接池核心原理与关键参数1.1连接池工作流程1.2关键参数解析（以HikariCP为例）参数作用推荐值maximum
Oracle应急处理：Oracle RAC 集群节点进程通信出现报错
小亦平台会持续给大家科普一些Oracle数据库的应急处理方案，运维朋友们可以在往期文章中查看更多案例。问题概述•核心问题：监控日志中出现IPCSENDTimeout错误。•主要现象：RAC集群监控日志中报告了Inter-ProcessCommunication(IPC)发送超时错误。问题分析IPCSENDTimeout错误通常表明OracleRAC集群中节点间进程通信（IPC）出现了问题。IPC是
机器学习在智能仓储中的应用：库存管理与物流优化 Blossom.118 机器学习与人工智能机器学习人工智能深度学习机器人 sklearn tensorflow cnn
最近研学过程中发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面开始对正文内容的介绍。随着电子商务的蓬勃发展，仓储和物流行业面临着前所未有的挑战和机遇。智能仓储通过整合先进的信息技术，如物联网（IoT）、大数据和机器学习，能够实现从货物入库到出库的全流程
【自然语言处理-NLP】文本预处理技术云博士的AI课堂哈佛博后带你玩转机器学习深度学习自然语言处理人工智能 NLP 深度学习数据预处理 NLP数据预处理机器学习
以下内容将从基本概念到实用代码分步骤、分场景地详细介绍NLP常见文本预处理方法及其背后的思想。如果无法从外部导入数据，我们会模拟一份简易文本数据（如字符串列表），并在此基础上演示预处理代码及详细解释，确保在常规Python环境下可以运行。一、文本预处理的常见需求和作用在自然语言处理（NLP）任务（如机器学习、深度学习、大模型开发）中，原始文本数据通常会包含各种噪声，例如：多余的空格、换行符、特殊符
分享一些 SQL 优化工具王宇帆avalanche sql 数据库
一、数据库自带的性能监控和分析工具MySQL：MySQLEnterpriseMonitor：这是MySQL官方推出的一款企业级监控工具，它提供了全面的数据库性能监控和管理功能。功能特点：可以实时监控MySQL服务器的各种关键性能指标，如查询响应时间、吞吐量、连接数、缓存命中率等。它还能深入分析SQL查询的执行计划，帮助用户找出性能瓶颈和优化点。通过直观的图形界面，管理员可以轻松了解数据库的运行状态
pgsql处理文档类型数据_PostgreSQL数据类型
http://blog.csdn.net/neo_liu0000/article/category/797059第六章数据类型6.1概述PostgreSQL提供了丰富的数据类型。用户可以使用CREATETYPE命令在数据库中创建新的数据类型。PostgreSQL的数据类型被分为四种，分别是基本数据类型、复合数据类型、域和伪类型。基本数据类型是数据库内置的数据类型，包括integer、char、va
centos7下docker安装postgresql+postgis
环境:centos7/docker最初直接拉取的postgresql数据，在导入.bakup文件时始终会报错，最后才想到该数据库默认不带postgis空间组件###一、拉取镜像这里我们拉取postgres和gis组合的镜像目前组合的版本有如下几个-11.0-2.5-10.0-2.4-9.6-2.4这里以拉取postgresqlv11.0和postgisv2.5的镜像为例dockerpullkart
PostgreSQL数据类型总结渝州居士 PostgreSQL postgresql 数据库
PostgreSQL数据库相比其他数据库，支持更多的数据类型，包括常用的数值类型、字符串类型、日期/时间类型外，还有几何类型、网络地址类型、xml类型和json类型，且还可以使用CREATETYPE自行添加数据类型，本文主要介绍PostgreSQL数据库主要的数据类型1.数值类型常用数值类型如下表所示：名称别名存储大小范围描述与其他数据库对比smallintint22字节-225~215-1有符号
探秘高效数据库备份利器：pg_probackup 郦岚彬Steward
探秘高效数据库备份利器：pg_probackuppg_probackuppg_probackup是一个开源的PostgreSQL备份和恢复工具，用于在PostgreSQL中进行在线备份和恢复操作。-功能：PostgreSQL备份和恢复工具；在线备份；恢复操作。-特点：易于使用；轻量级；支持多种编程语言；高性能。项目地址:https://gitcode.com/gh_mirrors/pg/pg_pr
Squirrel：通用SQL、NoSQL客户端 antui1957
安装配置数据库配置驱动配置连接如果你的工作中，需要使用到多个数据库，又不想在多种客户端之间切换来切换去。那么就需要找一款支持多数据库的客户端工具了。如果你要连接多个关系型数据库，你就可以使用NavicatPremium。但是如果你有使用到NOSQL（譬如HBase、MongoDB等），还是建议使用SquirrelSQLClient。1、安装下载地址：http://squirrel-sql.sour
postgresql增量备份系列二 pg_probackup necessary653 postgresql postgresql 数据库
已经很久没有发文章了，主要是最近工作上的内容都不适合发文章公开。可能往后文章发表也不这么频繁了，不过大家有问题我们可以交流。之前有写过PG增量备份的其他工具使用方法，pg_probackup也是应用比较多的PG备份工具。一.pg_probackuppg_probackup是一个用于管理PostgreSQL数据库集群备份与恢复的实用工具，截止2.5.15版本，支持PostgreSQL11-16及以上
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他