wiselyman

利用Kettle实现遗留数据库迁移

阅读更多

1. `Kettle`的简单介绍

Kettle(现名Data Integration)是一款使用Java编写的功能强大的ETL(Extract Transform and Load)工具，支持关系型数据库(PostgreSQL、MySQL、Oracle等)、非关系型数据库(MongoDB、ElasticSearch等)以及文件之间的大规模数据迁移。

2. 常用组件

Kettle提供了极为丰富的组件库，下面列举的是它的一些常用组件,以及对组件的常用参数进行简单介绍，详细的参数说明可参考Kettle的帮助文档。

2.1 `Table input`

指定数据库表作为输入。

Step name: 步骤名称,Kettle的每一个组件即一个步骤，可为该步骤取一个别名
Connection: 指定数据库连接
SQL: 编写SQL，从该数据库表中筛选出符合条件的数据

2.2 `Table output`

指定数据库表作为输出

Step name: 步骤名称
Connection: 指定数据库连接
Target schema: 输出的数据库表模式
Target table: 指定输出的数据库表
Use batch update for inserts: 是否使用批处理进行插入
Database fields: 配置字段映射关系
- Table field: 输出的数据库表字段
- Stream field: 流字段(流入该组件的数据字段)

2.3 `Sort rows`

按照某字段进行排序

Step name: 步骤名称
Fields:
- Fieldname: 排序的字段名
- Ascending: 排序方式

2.4 `Merge join`

将不同来源数据进行融合，类似于SQL中的join，注意: 该组件接收的数据必须按照join字段按照相同规则进行排序，否则join后的数据会有丢失。

Step name: 步骤名称
First Step: 需要融合的一组数据
Second Step: 需要融合的另一组数据
Join Type: 融合的类型
Keys for 1st step: First Step中进行融合的字段
Keys for 2nd step: Second Step中进行融合的字段

2.5 `Add sequence`

读取指定的序列值

Step name: 步骤名称
Name of value: 序列值别名
Use DB to get sequence: 是否使用数据库序列
Connnection: 数据库连接
Schema name: 数据库模式名称
Sequence name: 序列名

2.6 `Modified Java Script Value`

支持编写JavaScript脚本，用于实现必要的业务逻辑

Step name: 步骤名称
Java script functions: 提供了一些JavaScript函数
Java script: 脚本编辑窗口
Fields: 可将脚本中的定义的变量映射出去

3. 在实际场景中的应用

在软件开发中，经常会遇到这样的场景: 新开发的系统即将替换老系统，而老系统庞大的数据需迁移到新系统中，但数据结构与新系统不完全兼容，下面通过一个简单的例子来介绍Kettle是如何处理这些老数据，完成数据迁移任务的。

3.1 老数据结构

company公司表:
district区域表:

该表存储了省市区，通过parent_id进行关联
company_district公司区域表:
employee员工表:
employee_company员工公司表:

3.2 新数据结构

company公司表:

对比老数据company表，新的company表中新增了district、city、province字段，他们可以从老数据company_district表和district表中取得；contact字段对应tel字段；addr对应address。
employee员工表:

对比老数据employee表，新的employee表中新增company_id字段且有外键约束;sex字段由原来的1、2变更为男、女

3.3 数据迁移

由于employee有外键关联company，因此先迁移company表数据，新的company表需新增old_id字段来保存老的company表的id，用于员工关联公司。

3.3.1 `company`表

数据迁移前的分析：

company表数据来源于三张表：company、company_district、district，因此需要三个Table input组件。

company和company_district需进行join，join的结果还需和district进行join，因此需要两个Merge Join组件。

使用Merge join组件之前需进行排序，因此需要三个Sort rows组件

新的company表的id来源于自增长序列，因此需要一个Add sequence组件。

最后将结果导入新的company表，因此需要一个Table output组件。

打开Kettle，点击File->new->Transformation,新建一个转换流程
点击左侧DesignTab页,将Table input组件拖拽至右侧转换流程窗口，在组件上右键点击edit,弹出该组件的编辑窗口，设置步骤名称、数据库连接和SQL语句，如下图所示:

将company和company_district数据进行left join，join之前需按照join字段排序，将Sort rows组件拖拽至右侧转换流程窗口，并进行编辑，如下图所示:
将Merge Join组件拖拽至右侧，并进行编辑，如下图所示:
将company和company_districtMerge Join的结果和district数据分别进行排序，同上面步骤
将两者进行join，同上面步骤
添加Add sequence组件，并进行编辑，如下图所示:
添加Table output组件，并进行编辑，如下图所示:
整体流程如下图所示:
点击启动按钮执行整个流程，直至所有步骤右上角出现绿色的箭头，company表便完成了迁移。

3.3.2 `employee`表

数据迁移前的分析:

employee表数据来源三张表: 老的employee、老的employee_company和新的company，因此需要三个Table input组件

老的employee和employee_company需进行join，join的结果还需和新的company进行join，因此需要两个Merge join组件和三个Sort rows组件。

新的employee表的id来源于自增长序列，因此需要一个Add sequence组件。

新的employee表的sex字段存储的是'男/女'，而不是'1/2'，因此需要一个Modified Java Script Value组件进行简单处理。

最后将结果导入新的employee表，因此需要一个Table output组件。

与company的数据迁移类似，添加三个Table input组件，并进行编辑
分别将employee和employee_company按照join字段进行统一排序
将排序的结果进行join
分别将新的company和join之后的结果按照join字段进行统一排序
将排序的结果进行join
编写脚本，转换sex字段
读取新的employee序列值
输出到新的employee表中
整体流程如下图所示:
点击启动按钮执行整个流程，直至所有步骤右上角出现绿色的箭头，employee表便完成了迁移。

3.4 结果

company表
employee表

至此，便完成了老数据的迁移。

4. 遇到的问题

在Kettle使用过程中会发现，当需要进行迁移的数据量较为庞大时(千万级)，常常会出现内存溢出的问题，解决方法是将Kettle内存调高些: 打开spoon.sh文件，找到PENTAHO_DI_JAVA_OPTIONS="-Xms1024m -Xmx2048m -XX:MaxPermSize=256m"，将其修改为PENTAHO_DI_JAVA_OPTIONS="-Xms16384m -Xmx32768m -XX:MaxPermSize=16384m"，重启即可。

源码地址: http://www.wisely.top/2018/02/26/etl-kettle/

你可能感兴趣的:(利用Kettle实现遗留数据库迁移)

java快速入门之判断与循环天启互联网工作室 java 开发语言
一、流程控制语句在一个程序执行的过程中，各条语句的执行顺序对程序的结果是有直接影响的。所以，我们必须清楚每条语句的执行流程。而且，很多时候要通过控制语句的执行顺序来实现我们想要的功能。1.1流程控制语句分顺序结构判断和选择结构(if,switch)循环结构(for,while,do…while)二、判断语句：if语句2.1if语句格式1格式1：if(关系表达式){语句体;}执行流程：①首先计算关系
OpenBayes 一周速览｜微软 Phi-4 发布，降低更多成本实现高效推理；Terra 时空数据集上线
公共资源速递5个数据集：Terra多模态时空数据集ChineseCouplets中文对联数据集AqueousSolubility无机化合物数据集HumanLikeDPODataset大模型对话微调数据集SentimentandEmotionAnalysisDataset情感情绪分析数据集4个教程：一键部署Phi-4Docling：文档解析神器一键部署QVQ-72B-preview铅笔素描风格文生图
轻量级限流算法的实现，拿走即用！程序员
引言在后端服务里，流量控制是确保系统稳定运行的关键之一。今天给大家介绍一个非常简单的漏桶限流算法的实现，很轻量级，无需任何第三方依赖。packagewin.liyufan.im;importjava.util.HashMap;importjava.util.Iterator;importjava.util.Map;/***漏桶算法*/publicclassRateLimiter{privatest
淘宝店铺详情API接口的开发、应用与收益前端后端运维数据挖掘api
淘宝作为中国最大的电商平台之一，拥有海量的商品和店铺数据。为了更好地利用这些数据，淘宝开放平台提供了丰富的API接口，允许开发者通过调用接口获取淘宝平台上的商品和店铺信息。本文将深入探讨淘宝店铺详情API接口的开发、应用及其带来的收益，并提供示例代码以供参考。一、淘宝店铺详情API接口的开发1.注册淘宝开放平台账号首先，开发者需要在淘宝开放平台注册一个开发者账号。注册过程涉及填写个人信息或企业信息
AI生成前端页面：解放前端开发，拥抱AI时代的高效前端
在数字时代，效率是企业和个人的核心竞争力。而对于前端开发人员来说，重复性工作和繁琐的代码编写常常成为效率提升的瓶颈。幸运的是，随着人工智能技术的飞速发展，一个新的时代已经到来——AI代码生成器（例如ScriptEcho）的出现，正以前所未有的方式改变着前端开发的格局。本文将探讨人工智能在日常应用中的广泛影响，并着重介绍如何利用AI技术，例如ScriptEcho，来提升前端开发效率，从而更好地应对当
Vue 3.5 中的 useId：深入解析与应用实践程序员
随着Vue3.5的发布，开发者们迎来了许多新特性和改进。其中，useId是一个备受关注的工具函数，它为开发者提供了一种简单而高效的方式来生成唯一的ID。本文将深入解析useId的实现原理、使用场景以及在实际项目中的应用实践。一、什么是useId？useId是Vue3.5中引入的一个CompositionAPI函数，用于生成唯一的ID。它的主要用途是为组件或DOM元素分配唯一的标识符，避免在SSR（
技术选型指南：Web、原生、混合开发的对比前端
随着移动互联网的飞速发展，开发者在选择应用开发方式时，经常面临纯Web开发、原生开发和混合开发的技术决策。每种开发方式都有其独特的优势和适用场景，开发者需根据项目需求、性能要求及跨平台能力做出合适的选择。本文将详细分析这三种开发方式的特点、实现原理及适用场景，同时推荐一些开源框架，并讲解微信小程序的实现方式。我们还将通过简单的代码示例，帮助大家更直观地理解这些技术。一、纯Web开发定义：纯Web开
FORCE 原动力大会｜火山引擎边缘云亮点干货先知晓！人工智能边缘计算机器人
AI技术战场上，唯快不破？在经历了早期的热闹之后，AI大模型的能力和价值维度已经不再浮于表面。IDC最新发布的《中国智算服务市场（2023下半年）跟踪》报告显示，受国内生成式AI技术飞速发展的影响，GenAI（生成式AI）IaaS市场在2023年实现爆发式增长，在AI+云计算领域有双向积累的公司获得先发优势。火山引擎一跃成为GenAIIaaS领域市场份额最大的云厂商。只有真正实现大模型的深度融合，
React 19新特性探索：提升性能与开发者体验程序员
React作为最受欢迎的JavaScript库之一，不断推出新版本以应对日益复杂的应用需求。React19作为最新的版本，引入了一系列令人兴奋的新特性和改进，旨在进一步提升应用的性能、开发效率和用户体验。本文将深入探讨React19的新特性，包括异步操作管理、文档元数据和样式表支持、ServerComponents与服务器端渲染等，帮助开发者更好地理解和利用这些新特性来构建更强大、更高效的Reac
传感器融合(UWB+IMU+超声波)，使用卡尔曼滤波器和3种不同的多点定位算法(最小二乘、递归最小二乘和梯度下降)研究（Matlab代码实现）科研_研学社算法 matlab 开发语言
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述一、引言二、传感器介绍（一）UWB（超宽带）（二）IMU（惯性测量单元）（三）超声波传感器三、定位算法（一）卡尔曼滤波器（二）多点定位算法1.最小二乘法2.递归最小二乘法3.梯度下降法四、系统架构五、实验设计六、结果与讨论七、结论2运行结果3参考文献
探索AI API版本管理与流式传输实现 qwe54165a4wd 人工智能 java 数据库 python
在现代软件开发中，API版本管理是一个关键的主题，尤其是在涉及到AIAPI的场景。API版本的变更会影响到服务的稳定性和功能的兼容性。因此，理解API版本管理的基本原理和具体实现，对于开发者来说至关重要。技术背景介绍API版本管理涉及到如何在不破坏现有客户端代码的情况下，逐步引入新的功能和改进。这对于AI服务尤为重要，因为AI模型和算法的更新频率相对较高。本文将重点介绍AIAPI版本的管理原则，并
OpenBayes 一周速览｜一键部署Qwen2.5-Coder，0编程经验实现代码生成自由！
公共资源速递5个数据集：Coil-100图像数据集Muharaf手写阿拉伯文数据集CollectiveActivity集体活动视频数据集MultimodalSpectroscopic化学多模光谱数据集CDFSOD-benchmark跨域小样本对象检测基准数据集3个教程：一键部署Qwen2.5-CoderInkSight将手写文字数字化DemoGLM-4-Voice端到端中英语音对话模型访问官网立即
论文阅读：Deep Bilateral Learning for Real-Time Image Enhancement-google-hdrnet-slicing SetMaker 论文阅读
项目地址:https://gitcode.com/google/hdrnethdrnet作为超分领域的经典文章，由google提出主要用来用轻量化的方法来实现高分辨率的图像生成，hdrnet结合cnn可以让更高分辨率的图像部署在板端。如图所示，原始图像比如4k图像，首先分为两个主要模块：grid和guide。grid就是对应图上面的那一条特征提取网络，具体来说，原始图像经过下采样之后，默认256分
弹性云在业务环境中的实际应用和优势有什么服务器
在当今这个瞬息万变的商业时代，企业面临着前所未有的挑战与机遇。为了保持竞争力并实现持续增长，企业不仅需要创新的产品和服务，还需要一个灵活、高效且成本可控的IT基础设施来支撑其业务运营。正是在这样的背景下，弹性云作为云计算技术的核心优势之一，正逐步成为企业业务环境中的关键组成部分。一、弹性云的实际应用弹性云的最大特点在于其能够根据业务需求的实时变化，动态地调整计算资源、存储资源和网络资源。这种高度灵
深入剖析Vue的provide与inject：如何实现跨层级数据共享后端
引言在Vue开发中，provide与inject是两个非常有用的特性，它们常用于父子组件关系之外的跨层级数据传递。相比于props和$emit的传统方式，provide和inject可以更轻松地在多个组件之间传递数据，尤其是在深层嵌套的组件树中。它们在Vue2.2版本首次引入，Vue3中也得到了进一步的优化。尽管provide和inject的使用看起来非常简单，但其背后隐藏了复杂的实现原理。在这篇
6、ListView详解：构建可滚动的列表 piplab666 flutter ui
在移动应用开发中，经常需要展示大量数据，如新闻列表、商品列表等。Flutter提供了丰富的滚动视图控件，其中最基础也是最常用的就是ListView。本篇博客将深入探讨ListView的各种属性、类型以及性能优化技巧，帮助您更好地利用这一重要工具。1.什么是ListView？ListView是Flutter中的滚动视图控件，用于展示一个可滚动的列表。它可以在垂直方向（默认）或水平方向滚动，内部包含一
小明，谈谈Vue组件动态加载有哪些方式程序员
动态加载组件可以显著提高应用的性能，优化用户体验，尤其是在大型应用中，合理的组件加载策略尤为重要。本文将探讨几种在Vue中实现组件动态加载的具体方案。1.异步组件Vue允许将组件定义为异步组件，从而在需要时动态加载它们。这可以通过使用import()函数来实现，具体示例如下：constAsyncComponent=()=>import('./components/MyComponent.vue')
小明，谈谈你对Vue nextTick的理解程序员
一、nextTick的实现细节在Vue中，nextTick是一个重要的异步操作工具，用于在DOM更新完成后执行回调函数。其实现依赖于微任务机制，以确保操作在下一个“事件循环”中执行。以下是nextTick的具体实现过程：任务队列：当调用nextTick时，Vue会将回调函数存入一个数组（任务队列）中。每次触发数据变化时，这个队列会被处理。微任务调度：Vue首先尝试使用Promise.resolve
小明，谈谈你对Vue 虚拟dom的理解程序员
Vue.js的虚拟DOM（VirtualDOM）是为了提高前端性能和开发体验而引入的一种技术。Vue.js虚拟DOM的大致实现虚拟DOM的定义虚拟DOM是一种JavaScript对象，它用来描述用户界面（UI）的结构和内容。每个虚拟DOM节点（VNode）代表一个真实的DOM元素或组件实例。//VNode示例constvnode={tag:'div',data:{id:'app'},childre
StarRocks on AWS Graviton3，实现 50% 以上性价比提升大数据数据库数据湖云计算云服务
在数据时代，企业拥有前所未有的大量数据资产，但如何从海量数据中发掘价值成为挑战。数据分析凭借强大的分析能力，可从不同维度挖掘数据中蕴含的见解和规律，为企业战略决策提供依据。数据分析在营销、风险管控、产品优化等领域发挥着关键作用,帮助企业提高运营效率、优化业务流程、发现新商机、增强竞争力。低成本高效率的完成对海量数据的分析，及时准确的释放数据价值，已成为企业赢得竞争优势的利器。StarRockson
2017-SIGGRAPH-Google,MIT-(HDRNet)Deep Bilateral Learning for Real-Time Image Enhancements WX Chen HDR技术深度学习神经网络机器学习
双边网格本质上是一个可以保存边缘信息的3维的数据结构。对于一张2维图片,在2维空间中增加了一维代表像素的强度slice操作(上采样)BilateralGuidedUpsampling这篇文章用双边网格实现图像的操作算子的加速。算法的核心思想是将一幅高分辨率的图像通过下采样转换成一个双边网格,在双边网格中每个格子就是一个图像的仿射变换算子,它的原理是在空间与值域相近的区域内,相似输入图像的亮度经算子
一篇文章掌握WebService服务、工作原理、核心组件、主流框架 java15655057970 服务器前端 linux
目录1、WebService定义解决问题：2、WebService的工作原理2.1实现一个完整的Web服务包括以下步骤2.2调用方式3、WebService的核心组件3.1XML3.2SOAP3.3WSDL3.4UDDI4、主流框架4.1AXIS(已淘汰)4.2XFire4.3CXF5、Soap协议详解1.Soap协议是什么2.认识Soap3.结论4.SOAP小总结6、WSDL详解1.types2
MySQL面试题泰山小张只吃荷园 mysql 数据库 java 面试后端
MySQL目录1.MySQL中的数据排序是怎么实现的？2.那怎么去优化ORDERBY呢？3.MySQL中的ChangeBuffer是什么?有什么作用？4.详细描述一下一条SQL语句在MySQL中的执行过程5.MySQL的存储引擎有哪些？6.MySQL的索引有哪些？7.MySQLInnoDB引擎中的聚集索引和非聚集索引有什么区别?8.MySQL索引的最左前缀匹配原则是什么?9.MySQL的覆盖索引是
通达信Python语言接口：如何轻松获取并高效利用？ cda2024 python 开发语言
在量化投资和股票分析领域，Python已经成为不可或缺的工具。然而，如何将Python与国内最流行的股票交易软件之一——通达信相结合，成为许多投资者和开发者关心的问题。本文将详细介绍如何获取通达信的Python语言接口，并提供一些实用的技巧和示例代码，帮助你在量化交易中更上一层楼。什么是通达信Python接口？通达信Python接口是通达信官方提供的一个API，允许用户通过Python脚本调用通达
OpenBayes 一周速览｜微软 Phi-4 发布，降低更多成本实现高效推理；Terra 时空数据集上线
公共资源速递5个数据集：Terra多模态时空数据集ChineseCouplets中文对联数据集AqueousSolubility无机化合物数据集HumanLikeDPODataset大模型对话微调数据集SentimentandEmotionAnalysisDataset情感情绪分析数据集4个教程：一键部署Phi-4Docling：文档解析神器一键部署QVQ-72B-preview铅笔素描风格文生图
2025年全球及中国金刚线开方机行业头部企业市场占有率及排名调研报告过953 人工智能大数据
金刚线开方机是一种利用金刚线切割技术，专门用于对硅锭进行精确开方处理的自动化设备。该设备通过高碳钢丝或钨丝作为母线，电镀以金刚石磨料，实现高速、高效率的切割过程，从而确保硅片的几何精度和表面光洁度。金刚线开方机以其卓越的切割速度、低能耗和环保特性，在光伏行业中替代了传统的砂浆切割方式，大幅提升了生产效率和硅片质量。凭借其在切割精度、稳定性和操作便捷性上的优势，金刚线开方机已成为光伏材料加工领域的重
Python从0到100（七十三）：Python OpenCV-OpenCV实现手势虚拟拖拽是Dream呀 python opencv 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Flutter ListView进阶：如何实现根据索引值滚动到列表特定位置 md_1008 flutter javascript 前端
在Flutter开发中，ListView是一个非常常用的组件，它允许我们展示一系列的项目。然而，有时候我们需要根据特定的索引值滚动到ListView中的某个项目位置，以便提供更好的用户体验。本文将详细介绍如何在Flutter中实现这一功能。一、基础准备首先，我们需要确保我们的ListView是可滚动的。在Flutter中，常用的可滚动ListView包括ListView、ListView.buil
基于WebService的面向服务架构研究 huaqianzkh 软件架构设计架构
摘要随着信息技术的快速发展，企业信息化已成为提升竞争力的关键手段。然而，企业在信息化过程中，往往形成了多个独立的业务系统，这些系统之间的信息交互困难，形成了“信息孤岛”。为了解决这个问题，基于WebService的面向服务架构（SOA）应运而生。本文首先介绍了WebService技术和SOA的基本概念，然后详细阐述了基于WebService的SOA架构的设计和实现方法，并通过一个具体案例展示了该架
期末python试卷（1）泰山小张只吃荷园 python 网络开发语言开源汇编程序人生学习方法
目录一、判断题二、选择题三、填空题一、判断题1.Python是一种解释型、面向对象的编程语言。2.Python中的变量名只能由字母、下划线、数字组成，且不能以数字开头。3.Python中多分支可使用IF-ELIF和SWITCH-CASE语句来实现。4.表达式中包含多个运算符时，计算顺序取决于运算符的结合顺序和优先级。5.x=’Tom’，那么执行语句x+=’Tom’之后，x的id不变。6.Pytho
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他