SpriCoder

数据集成-3-数据集成框架

1. 数据集成概述

1.1. 数据集成的必要性

历史数据的价值
异构环境数据源
1. 不同时期、不同的公司、不同的工具、不同的平台
2. 购买供应上应用包的数量日益增加
3. 冗余数据、垃圾数据，数据一致性问题
企业需要将内部数据进行发布和交换
大数据和虚拟化的催化剂

1.2. 数据集成的概念

对各种异构数据提供统一的表示、存储和管理, 以实现逻辑或物理上有机地集中
1. 集成是指维护数据源整体上的数据一致性、提高信息共享利用的效率
2. 透明的方式是指用户不必再考虑底层数据模型不同、位置不同等问题,能够通过一个统一的查询界面实现对网络上异构数据源的灵活访问
以一种统一的数据模式描述各数据源中的数据,屏蔽它们的平台、数据结构等异构性,实现数据的无缝集成
数据样例
1. 运动的数据：数据治理、数据质量管理、集成
2. 集成为通用格式——数据转换
3. 数据从一个系统迁移到另一个系统
4. 在组织内部移动数据
5. 从非结构化数据中抽取信息
6. 将处理移动到数据段。
简单场景：在下图的PPT下面

上图中是最全的一个场景
1. 主数据：决定数据类
2. 描述数据：描述数据的信息

1.3. 数据集成的特征

分布性：网络传输的性能和安全性
自治性：在不通知集成系统的前提下改变自身的结构和数据
异构性：运行环境、数据模型和数据语义

1.4. 数据集成的分类

批处理数据集成：将数据以成组的方式从源应用周期性地传输到目标应用
实时数据集成：为了完成一个业务事务处理而需要即时地贯穿多个系统的接口
大数据集成
数据虚拟化：使用多种数据集成技术以对多种数据源和技术的数据进行实时整合,而不仅仅结构化数据

1.4.1. 批处理数据集成

数据转换方法：松散集成, 通过转换工具实现应用系统之间的数据转换和交换,较低层次的集成
数据聚合方法：借助于中间件系统构造一个虚拟的全局数据模式, 是一种集中式管理、分布式存储的较高层次的集成模式
析取、转换和装载(ETL)：通过对异构数据源中的数据进行分析、转换和装载, 建立一个数据仓库,面向企业决策的数据集成方法

1.4.1.1. 数据转换方法

DBMS自带的转换、迁移工具
1. Oracle的Migration Workbench
2. Microsoft SQL Server的DTS
3. 通用性不强
应用系统内部集成的转换工具
1. 系统与其他应用系统之间的数据接口
2. 两种规范，EDI
通用的、集成的数据转换工具

1.4.1.2. 数据聚合方法

将多个数据库集成为一个统一的数据库视图
利用中间件集成异构数据源,不需要改变原始数据的存储和管理方式
中间件系统位于异构数据源和应用程序之间
1. 向下协调各数据库系统
2. 向上为访问集成数据的应用系统提供统一的全局数据模式和数据访问的通用接口

1.4.1.3. ETL方法

从多个数据源中抽取数据, 然后进行数据转换和加载, 最终得到统一的、完备的数据仓库
原来分散的应用系统仍然独立运作, 原来存在的异构数据源仍然为各自的应用系统提供数据服务
1. 不会破坏企业原有的应用架构, 比较适合于大量数据的迁移
2. 可以提供复杂的数据转换功能
3. 可以集成多种数据源和复杂的商业规则, 能容忍数据在时间上的延迟

1.5. 数据集成开发生命周期

项目范围：数据移动的基本需求、基本设置
概要设置：要和数据拥有者以及安全团队谈判持续到达一个可以接受的方案
（被盖住了）

1.6. 关键问题

集成范围问题：一方面权限有限
数据资源所有权问题
全局模式问题：A、B、C三种数据源如何合并的问题
模式映射问题：冲突的规则如何进行确认
数据动态集成问题

1.7. XML在数据集成中的作用

定义结构的好处
1. 标准可以指定
2. 方便进行管理
SHA法：进行文件生成

1.8. 基于XML的异构数据集成

2. 元数据与数据映射

3. 数据库访问接口

3.1. 固有调用VS. 访问接口

数据库引擎带有自己的包含用于访问数据库的APl函数的动态链接库,应用程序可利用操纵数据库
1. 执行效率
2. 不通用
访问接口：透明连接
1. 网络透明
2. 服务器透明
3. 语言透明

3.2. 主流的数据访问技术

ODBC
OLE DB
ADO
JDBC
Hibernate

3.2.1. ODBC (Open DataBaseConnectivity )

应用程序：执行处理并调用ODBC API函数,以及提交SQL语句并检索结果
驱动程序管理器：根据应用程序需要加载/卸载驱动程序,处理ODBC函数调用,或把他们传送到驱动程序
驱动程序：处理ODBC函数调用,提交SQL请求到一个指定的数据源,并把结果返回到应用程序
数据源：包含了数据库位置和数据库类型等信息,实际上是一种数据连接的抽象

3.2.1.1. ODBC的API

核心级
1. 最基本的功能：分配、释放环境句柄、数据库连接、执行SQL语句等
2. 满足最基本的应用程序要求
扩展1级：增加一些函数,可在应用程序中动态了解表的模式,可用的概念模型类型等
扩展2级
1. 主关键字和外来关键字的信息、表和列的权限信息、数据库中的存储过程信息等
2. 游标和并发控制功能

3.2.1.2. ODBC接口函数

分配和释放内存
连接
执行SQL语句
接收结果
事务控制
错误处理和其他事项

3.2.1.3. 工作流程

调用驱动程序管理器,把目标数据源对相应的驱动程序调入动态连接库;
根据SQL语句,调用动态连接库中若干个相应的ODBC函数;
执行ODBC函数,把SQL语句以字符串的形式传到数据源处;
数据源执行所收到的SQL语句,把结果返回应用程序。

3.2.1.3.1. SQL语句的执行

main()
{
  ASD asd;/*说明asd是一个环境型变量*/
  LZJ lzj;/*说明lzj是一个连接型变量*/
  JDK jdk;/*说明jdk是一个语句句柄变量*/
  RETCODE retcode;/*说明retcode是一个返回变量*/
  SQLAllocEnv(&asd);/*分配一个环境句柄*/
  SQLAllocConnect(asd,&lzj);/*分配一个连接句柄*/
  SQLConnect(lzj,"学生",SQL_NTS,NULL,0,NULL,0);/*连接数据源*/
  SQLAllocStmt(lzj,&jdk);/*分配一个语句句柄*/
  retcode=SQLExecDirect(jdk,"SELECT*FROMS",SQL_NTS);/*执行语句*/
  ……/*结果集处理*/
  SQLDisconnect(lzj);/*断开数据源*/
  SQLFreeStmt(jdk,SQL_DROP)/*释放一个语句句柄*/
  SQLFreeConnect(lzj);/*释放一个连接句柄*/
  SQLFreeEnv(asd);/*当应用完成后,释放环境句柄*/
}

3.2.1.3.2. 执行SQL语句的函数

SQL语句预备函数：SQLPrepare(jdk,szSqlStr,cbSqlStr)。其中,参数hstmt是一个有效的语句句柄,参数szSqlStr和cbSqlStr分别表示将要执行的SQL语句的字符串及其长度
SQL语句执行函数：SQLExecute(jdk)。其中参数jdk是一个有效的语句句柄
SQL语句查询结果的获取：

while(RETCODE_IS_SUCCESSFUL(retcode){
  retcode=SQLFetch(jdk);
  if(RETCODE_IS_SUCCESSFUL(retcode){
    do{
      rcGetData=SQLGetData(jdk,1,SQL_C_CHAR,szBuffer,sizeof(szBuffer),&cbValue);
      DISPLAY_MEMO(szBuffer,cbValue);/*显示*/
    }while(rcGetData!=SQL_NO_DATA_FOUND);
  }
}

3.2.1.4. ODBC数据库独立性

ODBC是为最大的互用性而设计的，要求一个应用程序有用相同的源代码（不用重新编译或重新链接）访问不同的数据库管理系统(DBMS)的能力
ODBC定义了一个标准的调用层接口（CLI）。包含X/Open和ISO/IEC的CLI规范中的所有函数，并提供应用程序普遍需要的附加函数
每个支持ODBC的DBMS需要不同的库或驱动程序，驱动程序实现ODBC API中的函数。当需要改变驱动程序时，应用程序不需要重新编译或者重新链接，只是动态加载新的驱动程序，并调用其中的函数即可。如果要同时访问多个DBMS系统，应用程序可加载多个驱动程序
如何支持驱动程序取决于操作系统，例如，在Windows操作系统上，驱动程序是动态链接库（DLL）

3.2.1.5. DBMS特有功能的支持

ODBC为所有DBMS功能都定义了公共接口。这些DBMS功能比多数DBMS支持的更多，但只要求驱动程序实现这些功能的一个子集
ODBC定义了API和SQL语法一致层，它规定驱动程序应支持的基本功能
ODBC还提供两个函数（SQLGetInfo和SQLGetFunctions）返回关于驱动程序和DBMS能力的一般信息及驱动程序支持的函数列表。因此，应用程序可以检查DBMS支持的特殊功能

3.2.2. OLE DB

基于COM的数据存储对象，与ODBC 属于底层的数据库编程接口，对ODBC进行了扩展，可以访问非关系型数据库源
OLEDB对ODBC进行了两个方面的扩展
1. 提供了一个数据库编程的OLE接口，即COM
2. 提供了一个可用于关系型和非关系型数据源的接口
ODBC数据源是OLEDB的子集：ODBC OLE DB Provider
OLEDB只针对C++的API

3.2.2.1. OLE DB中的COM对象

数据源（Data Source）：对应于一个数据提供者，负责管理用户权限，建立与数据源的连接等初始操作
会话（Session）：提供事务控制机制
命令（Command）：执行各种数据操作，如查询命令、修改
行集（RowSet）：数据的抽象表示，是应用程序的操作对象

3.2.3. ActiveX Data Object（ADO）

建立在OLE DB之上,为操作OLE DB数据源提供了一套高层次自动化接口。ADO实际上是一个OLE DB客户程序，使用ADO的应用程序要间接地使用OLE DB
提供了一种数据库编程对象模型，简化OLE DB，属高层的数据库接口，适用的编程语言更多

3.2.3.1. ADO（ActiveX Data Objects）

一种与编程语言无关的面向对象的编程接口

3.2.3.2. ADO对象

3.2.4. JDBC

3.2.4.1. JDBC VS. ODBC

ODBC并不适合在Java中直接使用
完全精确地实现从C代码ODBC到JavaAPI写的ODBC的翻译也并不令人满意
ODBC并不容易学习，它将简单特性和复杂特性混杂在一起，甚至对非常简单的查询都有复杂的选项；而JDBC刚好相反，它保持了简单事物的简单性，但又允许复杂的特性
JDBC这样的JavaAPI对于纯Java方案来说是必须的

3.2.4.2. 四种JDBC驱动

基于JDBC-ODBC桥的java驱动
基于数据源本地驱动程序的虚拟java驱动
基于网络驱动协议的java驱动
纯java驱动

3.2.4.3. 常用的JDBC接口/类

Java.sql.Driver：驱动程序实现的接口，提供连接数据库的基本方法
Java.sql.DriverManager：管理JDBC驱动程序，提供获取连接对象的方法，建立于数据库的连接
Java.sql.Connection：用于Java应用程序与数据库建立通信的对象，通过它进而创建Statement对象，执行SQL语句
Java.sql.Statement：对SQL语句进行封装的特定对象，用来执行SQL语句进行数据库操作
Java.sql.ResultSet：用于封装SQL语句查询的结果，是一个包含数据库记录的特殊对象

3.2.4.4. 直接连接数据库的步骤

建立数据源
装载驱动程序
建立连接
建立语句对象
执行SQL语句
查询结果处理
获取元数据
关闭对象
处理异常和警告

3.2.4.5. 示例

connection con=DriveManager.GetConnection("jdbc:odbc:people","examle","password");
//建立与数据库的连接
Statement stmt=con.createstatement();
//建立语句对象
ResultSet rs=stmt.executeQuery("SELECT a,b,c FROM Table1");
//运行SQL语句，返回数据//库操作结果
while(rs.next()){
  intx=getInt("a");//获得数据库表记录a项的值
  strings=getstring("b");//获得数据库表记录b项的值
  floatf=getFloat("c");//获得数据库表记录c项的值
}

3.2.5. Hibernate

一种Java语言下的对象关系映射解决方案，一种自由、开源的软件
用来把对象模型表示的对象映射到基于SQL的关系模型结构中去，为面向对象的领域模型到传统的关系型数据库的映射，提供了一个使用方便的框架
不仅管理Java类到数据库表的映射，还提供数据查询和获取数据的方法

3.2.5.1. Hibernate API中的接口

提供访问数据库的操作（如保存、更新、删除和查询对象）的接口：Session、Transaction和Query
用于配置Hibernate的接口：Configuration
回调接口，使应用程序接收Hibernate内部发生的事件，并作出相关的回应：Interceptor、Lifecycle和Validatable
用于扩展Hibernate的功能的接口，如UserType、CompositeUserType和IdentifierGenerator接口。需要时应用程序可以扩展这些接口。

3.2.5.2. 个核心接口

Hibernate内部封装了JDBC、JTA和JNDI
Configuration接口：配置hibernate，根启动hibernate，创建SessionFactory对象
SessionFactory接口：初始化hibernate，充当数据存储源的代理，创建Session对象
Session接口：负责保存、更新、删除、加载和查询对象
Transaction：管理事务
Query和Criteria接口：执行数据库查询

3.2.5.3. 使用Hibernate的步骤

创建Hibernate的配置文件
创建持久化类
创建对象-关系映射文件
通过Hibernate API编写访问数据库的代码

4. 元数据与数据映射

4.1. 数据编码

字符集
ASCII
汉字编码
Unicode
UTP-8
编码之间的关系

4.1.1. 字符集

Samuel F.B.Morse在1838年到1854年间发明了电
Braille代码：一种6位代码，它把字符、常用字母组合、常用单字和标点进行编码
Telex、Baudot以及CCITT #2代码都是包括字符和数字的5位代码
6位字符码系统BCDIC（Binary-Coded Decimal Interchange Code），8位EBCDIC IBM大型主机
美国信息交换标准码ASCII，1967年
DBCS：double-byte character set
Unicode解决方案

4.1.2. ASCII

7个位所能提供的128个编码位置
94个图形字符码和34个控制字元码
1. 图形字符包括52个大小写英文字母﹑10个阿拉伯数字﹑9个标点符号﹑6个括号，以及17个其它符号，编码范围从33到126
2. 控制字符则包括10个传输控制字符、6个版面调整字符、4个设备控制字元、4个信息分隔字符和10个特殊控制字符，其编码为0～32和127
扩展ASCII

4.1.3. 汉字编码

GB2312 ：小于127的字符的意义不变，两个大于127的字符连在一起表汉字7000
1. 高字节从0xA1用到0xF7，把01-87加上0xA0
2. 低字节从0xA1到0xFE，把01-94加上0xA0
GBK：GB2312的扩展，主要扩展了繁体中文字的支持27000
GB18030：解决汉字、日文假名、朝鲜语和中国少数民族文字组成的大字符集计算机编码问题。总编码空间超过150万个编码位，收录了27484个汉字
BIG5：13,053个中文字，高位字节的编码范围0xA1-0xF9，低位字节的编码范围0x40-0x7E及0xA1-0xFE

4.1.4. Unicode

Universal Multiple-Octet Coded Character Set的简称，支持世界上超过650种语言的国际字符集
Unicode允许在同一服务器上混合使用不同语言组的不同语言
由一个名为Unicode 学术学会(Unicode Consortium)的机构制订的字符编码系统，支持现今世界各种不同语言的书面文本的交换、处理及显示
Unicode是一种在计算机上使用的字符编码，为每种语言中的每个字符设定了统一且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求
Unicode通过增加一个高字节对ISO Latin-1字符集进行扩展，当这些高字节位为0时，低字节就是ISO Latin-1字符
Unicode中不同部分的字符都同样基于现有的标准，便于转换
中国、日本和韩国的象形文字（总称为CJK）占用了从0x3000到0x9FFF的代码
Unicode只有一个字符集，没有歧
Unicode在制订时没有考虑与任何一种现有的编码方案保持兼容

4.1.5. 通用转换格式UTF-8

用ASCII表示的字符使用UNICODE并不高效
网络通讯时数据高低位的解读方式，核对双方对于高低位的认识是否是一致，标志符FEFF，EFBBBF for UTF-8。Byte Order Mark

UNICODE UTF-8
00000000 -0000007F 0xxxxxxx
00000080 -000007FF 110xxxxx 10xxxxxx
00000800 -0000FFFF 1110xxxx 10xxxxxx 10xxxxxx

以转换后第1字节起头连续设为"1"的标记位的数目表示转换成几个字节，第2～第4字节起头两个位被设为10当做识别

4.1.6. 一个例子

联通的内码
1. c1 1100 0001
2. aa 1010 1010
3. cd 1100 1101
4. a8 1010 1000
UTF8编码
1. 0000 0000 0110 1010：j
2. 0000 0011 0110 1000

4.2. 元数据在集成中的作用

中央集线器确保Oracle电子商务套件与3个老的ERP系统之间一致的数据映射
大量的企业数据要么深锁在数据库中，要么就被封闭在应用中
随着企业跨应用组合不同的功能，这些数据模型也被混合在一起
对数据而言，始终存在一种上下文关系甚至当一个字段为空白时，不同应用会对它的含意做出不同的假设

4.3. 什么是元数据

data about data
通过一组属性或元素来描述特定的资源
元数据模型提供了描述一类资源的具体对象时所有规则的集合
1. 描述资源属性的术语：元数据元素
2. 关系、结构约束、语法表示等
提供规范、普遍的描述方法和检索工具，为分布的、由多种资源组成的信息体系提供整合的工具与纽带

4.4. DBMS的元数据

某个数据库中的表和视图的个数以及名称
某个表或者视图中列的个数以及每一列的名称、数据类型、长度、精度、描述等
某个表上定义的约束
某个表上定义的索引以及主键/外键的信息

4.5. SQL Server系统表与元数据

4.6. 元数据的分类

从元数据的作用角度
1. 描述型元数据
2. 结构型元数据
3. 管理型元数据
从信息系统的角度
1. 业务元数据
2. 技术元数据
3. 操作元数据

4.6.1. 业务元数据

Title="Metadata Demystified"
Creator="Brand, Amy"
Subject="metadata"
Description="Presents an overview ofmetadataconventions inpublishing."
Publisher="NISO Press"
Date="2003-07"
Type="Text"
Format="application/pdf"
Identifier="http://www.niso.org/standards/resources/Metadata_Demystified.pdf"
Language="en"

4.7. 元数据的层次

分层管理是解决复杂问题的一种思路。将资源按照一定的层次进行分类，便于管理
元数据可应用于不同层次，可以定义全局的元数据，也可以定义某一层次资源的元数据
可以在"计算机图书"类中加上"相关编程语言"这样一个属性

4.8. 元数据的功能

描述和发现资源
管理资源集合
保存数字化资源
提供数据互操作和数据转换方面的信息

4.8.1. 描述和发现资源

允许通过相关的标准来发现资源
标识资源
把相似的资源放在一起
识别不一样的资源
提供定位（位置）信息

4.8.2. 保存数字化资源

以一种统一和稳定的方式描述和组织存储在不同介质上的信息
创建描述性元数据的一个重要原因就是要使相关信息的发现更加容易
元数据是确保未来资源将存在并持续被访问的关键
通过资源发现，元数据可以有助于电子资源的组织，使交互操作和遗产资源集成，提供数据标识和支持存档和保存变得更加容易

4.8.3. 数据互操作

采用元数据来描述一个资源，允许资源在提升交互操作性的途径下被人和机器所理解
交互操作就是在多个不同硬件和软件平台、数据结构和接口的系统之间最小内容和功能丢失的交换数据的能力
利用被定义的元数据模式，被共享的协议和元数据模式之间的关联，跨网络的资源可以被无缝的查询

4.9. 元数据管理

元数据创建
元数据存储
元数据交换
元数据集成
元数据监督
元数据优化

4.10. 元数据管理的五种成熟度

第一级随机状态
第二级发现
第三级管理控制
第四级优化
第五级自动化

4.11. Resource Description Framework

一个用于描述Web 上的资源的框架
针对数据的模型以及语法，供不同的用户来交换和使用
使用XML 编
W3C 语义网络活动的组成部分，是一个W3C 推荐标准(2004 年2 月)
1. 描述购物项目的属性，如价格以及可用性
2. 描述Web 事件的时间表
3. 描述有关网页的信息，比如内容、作者以及被创建和修改的日期
4. 描述网络图片的内容和等级
5. 描述针对搜索引擎的内容

4.11.1. RDF 规则

RDF 使用属性和属性值来描述资源
1. 资源是可拥有URI 的任何事物，比如"http://www.w3school.com.cn/rdf"
2. 属性是拥有名称的资源，比如"author" 或"homepage属性值是某个属性的值，比如"David" 或http://www.w3school.com.cn
3. 描述资源"http://www.w3school.com.cn/rdf" 的RDF 文档


<RDF>
  <Description about="http://www.w3school.com.cn/RDF">
    <author>Davidauthor>
    <homepage>http://www.w3school.com.cnhomepage>
  Description>
RDF>

4.11.2. RDF 陈述

资源、属性和属性值的组合形成一个陈述
陈述：“The author of http://www.w3school.com.cn/rdf is David.”
1. 主体：http://www.w3school.com.cn/rdf
2. 谓语：author
3. 客体：David

4.11.3. RDF 陈述

4.11.4. 标准的资源描述框架

描述所有元数据格式,解决元数据互操作性
1. XML以一种标准化的方式来建立数据表示的结构
2. RDF明确表达元数据的语义、句法和结构
采用RDF Schema为RDF资源的属性和类型提供词汇表

4.12. 元数据映射

信息系统的整合与交互性问题
1. 同一领域的元数据标准
2. 不同领域不同专业
元数据标准映射：元数据分析、建立元数据对应关系字典、编制转换程序
非实时映射：将源元数据系统的数据映射到目标元数据系统
实时映射：根据元数据映射表建立转换接口

4.13. 元数据映射表

元数据语义映射描述元数据标准中元素的对应关系
1. 一对一关系
2. 一对多关系
3. 多对一关系
4. 无对应关系
元数据取值内容的映射关系
1. 数据类型、取值范围、受控词汇
2. 文本和数值类型间或文本和日期类型
3. 自由文本和受控词，不同的受控词汇表

4.14. 元数据匹配差异

必备元素与可选元素的差异
可重复元素与不可重复元素的差异
子元素差异
元素层次错位

4.15. 元数据映射局限性

元素之间无法完全映射，信息丢失
随着元数据格式数量的增多，映射的工作量将大大增加

4.16. 基于XSLT实现元数据映射

4.17. 实施步骤

盘点各系统的数据库,提取出元数据,设计出Schema确定其编码属性
开发适配器,将源信息从关系数据库向XML文件转换
确定集成信息的映射规则和编码属性的对照关系,利用XSLT实现源XML 文件向目标文件转换
集成目标XML文件中的资源信息

4.18. 数据异构冲突

命名冲突
1. 同名异义、异名同义
2. 全局命名映射
格式异构
1. 类型转换函数
类型冲突
1. 同一种数据类型精度不同
2. 取舍

5. ETL技术

5.1. Extraction-Transformation-Loading

原本是构建数据仓库的一个环节：将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成，最后加载到数据仓库或数据集市中，成为联机分析处理、数据挖掘的基础
ETL是BI项目重要的一个环节,BI项目中，通常情况下ETL会花掉整个项目的1/3的时间
ETL也越来越多地应用于一般信息系统中数据的迁移、交换和同步

5.2. 数据仓库

为决策支持服务的面向主题的、集成的并随时间变化的、相对稳定的数据集合
面向主题：数据仓库中的数据按照主题进行组织
集成：从多个数据源将数据集合到数据仓库中，并集成为一个整体；
稳定：数据仓库中的数据通常是历史数据，很少进行更新；
时变：数据仓库中的所有数据都有特定的时间标识.

5.3. 数据仓库、ODS和数据库的比较

5.4. 数据仓库概念模型

5.5. 数据仓库的结构

5.6. 数据分析方法

切片和切块(Slice and Dice)：多维数据结构中,按二维进行切片,按三维进行切块,可得到所需要的数据。如在"城市、产品、时间"三维立方体中进行切块和切片,可得到各城市、各产品的销售情况
钻取(Drill)：钻取包含向下钻取(Drill-down)和向上钻取(Drill-up)/上卷(Roll-up)操作，钻取的深度与维所划分的层次相对应
旋转(Rotate)/转轴(Pivot)：通过旋转可以得到不同视角的数据

5.6.1. 切片、切块

5.6.2. 钻取

5.6.3. 旋转

5.7. 数据仓库的体系结构

5.8. 数据仓库的元数据

管理元数据
1. 所有建立使用DW的信息，源数据库
2. 综合数据、维、层次信息
3. 预定义的查询、报表和数据组织、分段
4. 数据抽取、清洗、转换的规则
业务元数据
1. 业务流程、数据的所有关系和存取控制策略
操作元数据
1. 运行时管理信息
2. 即时数据信息、监测信息

5.9. 数据仓库的数据组织

虚拟存储
1. 语义层工具转换
2. 适用理想状况
基于关系表存储
1. 模型定义、数据抽取
多维数据库存储
1. 多维数据文件存储数据
2. 维索引管理

5.10. 维表（星型）

5.11. 维表（雪花型）

5.12. 数据仓库组成部分

数据源
数据抽取（extraction）、转换（transformation）和转载（load）工具
数据建模工具
核心仓储（Central Repository）
数据仓库的目标数据库
前端数据访问和分析工具
数据仓库管理工具

5.13. 体系结构

5.14. 数据集成领域中ETL

数据的差异性更大, 不仅是结构化数据, 可能还涉及到半结构数据和无结构数据, 并实现某些情况下的相互转换
数据抽取、转换和加载操作往往不在同一个地方, 在抽取和加载之间需要进行数据的远程传输
抽取和加载两个操作可能是完全独立的, 分别属于不同的企业或部门,具有高度的自治性
在数据仓库中一般只进行数据的增加,而数据集成应用可能还涉及到数据的删除和修改, 保证抽取方和加载方数据的一致性

5.15. ETL的过程

抽取、转换和加工、装载
节点代表操作：过滤，转变，传输，压缩，加密等
增量、转换、调度和监控等处理

5.15.1. 数据的抽取

与目标数据库系统相同的数据源：建立链接关系就可以写Select语句直接访问
与目标数据库系统不同的数据源
1. 通过程序接口来完成
2. 将数据导出成txt或者是xls文件，然后再将这些源系统文件导入到ODS中
文件类型数据源(txt, xls)
全量抽取和增量抽取：增量更新的问题

5.15.2. 数据的清洗

数据格式不一致、数据输入错误、数据不完整
源数据和目标数据需要进行数据模式或语义映射的转换
在数据库中进行数据加工
1. 利用数据库本身提供的SQL、函数
2. 在SQL查询语句中添加where条件进行过滤
3. 重命名字段名与目的表进行映射
4. substr函数、case条件判断
ETL引擎：以组件化的方式实现数据转换：字段映射、数据过滤、数据清洗、数据替换、数据计算、数据验证、数据加解密、数据合并、数据拆分等

5.15.3. 数据装载

将转换后的数据装载到目标库
最佳方法取决于所执行操作的类型以及需要装入多少数据
目的库是关系数据库有两种装载方式
1. 直接SQL语句进行insert、update、delete操作，进行了日志记录并且可恢复
2. 采用批量装载方法，如bcp、bulk、关系数据库特有的批量装载工具或api，批量装载操作易于使用，并且在装入大量数据时效率较高

5.16. ETL中的关键技术

增量复制
数据的清洗转换

5.16.1. 增量复制

触发器
时间戳
快照方式
日志法

5.16.1.1. 控制表法（触发器）

插入、修改、删除建trigger，每当源表中的数据发生变化，就被相应的触发器将变化的数据写入一个临时表
控制表（变化表名、操作、主键、时间戳）

Create trigger tri_insert_teacher on teacher
  For insert
    As
      Begin
        Declare @KeyId in
        Select @ KeyId = id from inserted
        Insert into Record values(teacher,"insert",@KeyId ,getdate())
End

5.16.1.2. 时间戳

一种基于快照比较的变化数据捕获方式
在源表上增加一个时间戳字段，系统中更新修改表数据的时候，同时修改时间戳字段的值
当进行数据抽取时，通过比较系统时间与时间戳字段的值来决定抽取哪些数据
有的数据库的时间戳支持自动更新，即表的其它字段的数据发生改变时，自动更新时间戳字段的值
不支持时间戳的数据库则触发器方式

5.16.1.3. 快照方式

快照是数据在某个时刻的一个备份
在上次发送时保留其快照, 在当前发送时, 可以通过比较当前数据与上次发送时的快照, 得到数据的增加、删除和修改情况
将二者的区别按照要求发送出去

5.16.1.4. 根据主键判断

当前实视图为New，上次发送时的快照为Old, t为当前实视图中的一条记录
1. 若 $t_{key} \in New_{key}$ 但 $t_{key} \notin Old_{key}$ , 则t是增加数据
2. 若 $t_{key}\in Old_{key}$ 但 $t_{key} \notin New_{key}$ , 则t是删除数据
3. 当 $t_{ny} \not = \emptyset$ 时, 若 $t_{key}\in New_{key}$ 且 $t_{key}\in Old_{key}$ , 但 $t_{ny}\in New_{ny}$ 且 $t_{ny} \notin Old_{ny}$ , 或者 $t_{ny}\in Old_{ny}$ 且 $t_{ny} \notin New_{ny}$ , 则t是修改数据

5.16.2. 数据的清洗转换

过滤不符合要求的数据，将过滤的结果交给业务主管部门，确认是否过滤掉还是由业务单位修正之后再进行抽取
数据清洗是一个反复的过程，注意不要将有用的数据过滤掉，对于每个过滤规则认真进行验证，并要用户确认
数据转换主要进行不一致的数据转换、数据粒度的转换，以及一些商务规则的计算

5.16.2.1. 数据清洗

不完整的数据：一些应该有的信息缺失，如供应商的名称、客户的区域信息缺失、业务系统中主表与明细表不能匹配等；过滤出来写入不同Excel文件向客户提交，要求在规定的时间内补全
错误的数据：业务系统不够健全，在接收输入后没有进行判断直接写入后台数据库造成的，比如数值数据输成全角数字字符、日期格式不正确、日期越界等；需要去业务系统数据库用SQL的方式挑出来，交给业务主管部门要求限期修正，修正之后再抽取
重复的数据：将重复数据记录的所有字段导出，让客户确认并整理

5.16.2.2. 姓名常见的错误和变化

5.16.2.3. 数据质量问题示例

5.16.3. 清理、匹配、标准化

5.16.4. 数据匹配与合并

5.17. 数据转换

不一致数据转换：将不同业务系统的相同类型的数据统一，如同一个供应商在结算系统的编码是XX0001,而在CRM中编码是YY0001，这样在抽取过来之后统一转换成一个编码
数据粒度的转换：业务系统一般存储非常明细的数据，而目标数据是用来分析的，不需要非常明细的数据
商务规则的计算：不同的企业有不同的业务规则、不同的数据指标，这些指标有时需要在ETL中将这些数据指标计算后存储在目标数据库中，以供分析使用

5.18. ETL的三种实现方法

借助ETL工具：Oracle的ODI,SQL server 的SQL Server Integration Service：可以快速建立ETL工程，屏蔽了复杂的编码任务，提高的速度，降低的难度，但是缺少灵活
SQL方式实现：灵活，提高ETL运行效率，但是编码复杂，对技术要求比较
ETL工具和SQL相结合

5.19. 提高ETL的性能

如果条件允许利用数据中转区对运营数据进行预处理，保证集成与加载的高效性
如果ETL的过程是主动"拉取"，而不是从内部"推送"，其可控性将大为增强
ETL之前应制定流程化的配置管理和标准协议
关键数据标准至关重要

5.20. 实施ETL的例子

往oracle数据库中插入excel文件中的数据

6. 基于XML的数据集成

整个系统位于异构数据源和应用程序之间,向下协调各种数据源,向上为访问集成数据的应用提供了统一的模式和访问的通用接
数据抽取层
中介层
用户接口层

6.1. 系统结构

6.2. 数据抽取层

处于系统的最低层,是系统的数据提供者
提取和集成分布在多个异构数据源(数据库,知识库及构件库) 上的数据
采用Wrapper (包装器) 技术实现将一个从中介层得到的查询,翻译成能在经过封装的数据源上执行的操作,将查询结果抽取并打包到一个XML 文档,最后将该文档返回给中介层

6.3. 中介层

一方面对上接受用户通过DOM(Document Object Model ,文档对象模型客户端API 向系统提交的或应用程序发出的查询,将其转换成对XML 的查询,并将查询结果返回给用户或应用程序
另一方面对下将XML 查询分发给各个包装器,并将查询结果通过DTD 说明再转换成XML 格式

6.4. 用户接口层

用户接口层(User Interface Layer) 在中介层之上,负责将用户的查询命令提交给中介层,获得并解释查询结果,并将结果显示给用户
定义了XML文档的逻辑结构,访问及操作方法。由于数据显示与内容分开,XML 定义的数据允许指定不同的显示方式,使数据更合理的表现出来
本地的数据能够以客户配置,使用者选择或其他标准决定的方式动态的表现出来

你可能感兴趣的:(数据集成课程笔记,big,data,大数据)

WPF中的ComboBox控件几种数据绑定的方式互联网打工人no1 wpf c#
一、用字典给ItemsSource赋值（此绑定用的地方很多，建议熟练掌握）在XMAL中：在CS文件中privatevoidBindData(){DictionarydicItem=newDictionary();dicItem.add(1,"北京");dicItem.add(2,"上海");dicItem.add(3,"广州");cmb_list.ItemsSource=dicItem;cmb_l
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Linux MariaDB使用OpenSSL安装SSL证书 Meta39 MySQL Oracle MariaDB Linux Windows ssl linux mariadb
进入到证书存放目录，批量删除.pem证书警告：确保已经进入到证书存放目录find.-typef-iname\*.pem-delete查看是否安装OpenSSLopensslversion没有则安装yuminstallopensslopenssl-devel开启SSL编辑/etc/my.cnf文件（没有的话就创建，但是要注意，在/etc/my.cnf.d/server.cnf配置了datadir的，
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
4.C_数据结构_队列荣世蓥数据结构数据结构
概述什么是队列：队列是限定在两端进行插入操作和删除操作的线性表。具有先入先出(FIFO)的特点相关名词：队尾：写入数据的一段队头：读取数据的一段空队：队列中没有数据，队头指针=队尾指针满队：队列中存满了数据，队尾指针+1=队头指针循环队列1、基本内容循环队列是以数组形式构成的队列数据结构。循环队列的结构体如下：typedefintdata_t;//队列数据类型#defineN64//队列容量typ
vue项目element-ui的table表格单元格合并酋长哈哈 vue.js elementui javascript 前端
一、合并效果二全部代码exportdefault{name:'CellMerge',data(){return{tableData:[{id:'1',name:'王小虎',amount1:'165',amount2:'3.2',amount3:10},{id:'1',name:'王小虎',amount1:'162',amount2:'4.43',amount3:12},{id:'1',name:'
python tif转png Python与遥感 python 开发语言
importosfromosgeoimportgdalimportnumpyasnpfromPILimportImage#提取432三波段fromspectralimport*#输入文件夹路径defget_img(dataset_img):width=dataset_img.RasterXSize#获取行列数height=dataset_img.RasterYSizebands=dataset_i
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Vue中table合并单元格用法 weixin_30613343 javascript ViewUI
地名结果人名性别{{item.name}}已完成未完成{{item.groups[0].name}}{{item.groups[0].sex}}{{item.groups[son].name}}{{item.groups[son].sex}}exportdefault{data(){return{list:[{name:'地名1',result:'1',groups:[{name:'张三',sex
uniapp map组件自定义markers标记点以对_ uni-app学习记录 uni-app javascript 前端
需求是根据后端返回数据在地图上显示标记点，并且根据数据状态控制标记点颜色，标记点背景通过两张图片实现控制{{item.options.labelName}}exportdefault{data(){return{storeIndex:0,locaInfo:{longitude:120.445172,latitude:36.111387},markers:[//标点列表{id:1,//标记点idin
放松的一天 4da9b7687fa0
20190325总结起床07:20图片发自App睡觉:23:00天气:晴今日任务清单学习·信息·阅读•水滴阅读Day40Alice’sAdventuresinWonderlandChapter6.2图片发自App•BBC跟读训练营Day24图片发自App图片发自App图片发自App•潘多拉口语训练营Day6Wow.Whatabigboy!•文化知识学习今日无•阅读时间地狱健康·饮食·锻炼•饮食目标
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
vue + Element UI table动态合并单元格我家媳妇儿萌哒哒 element UI vue.js 前端 javascript
一、功能需求1、根据名称相同的合并工作阶段和主要任务合并这两列，但主要任务内容一样，但要考虑主要任务一样，但工作阶段不一样的情况。（枞向合并）2、落实情况里的定量内容和定性内容值一样则合并。（横向合并）二、功能实现exportdefault{data(){return{tableData:[{name:'a',address:'1',age:'1',six:'2'},{name:'a',addre
Python实现TIFF 文件转换为 PNG 和 JPG 格式 sand&wich python 开发语言
在日常的图像处理工作中，可能会遇到需要将TIFF格式的图像转换为其他格式的情况，例如PNG和JPG。下面，本文将介绍如何使用Python和GDAL库实现这一功能。准备工作在开始之前，请确保已经安装了必要的库：GDAL（GeospatialDataAbstractionLibrary）可以使用以下命令安装GDAL：pipinstallgdal代码实现以下是一个将TIFF文件转换为PNG文件的示例代码
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
使用datepicker和uploadify的冲突解决（IE双击才能打开附件上传对话框） zhanglb12
在开发的过程当中，IE的兼容无疑是我们的一块绊脚石，在我们使用的如期的datepicker插件和使用上传附件的uploadify插件的时候，两者就产生冲突，只要点击过时间的插件，uploadify上传框要双才能打开ie浏览器提示错误Missinginstancedataforthisdatepicker解决方案//if(.browser.msie&&'9.0'===.browser.version
golang获取用户输入的几种方式余生逆风飞翔 golang 开发语言后端
一、定义结构体typeUserInfostruct{Namestring`json:"name"`Ageint`json:"age"`Addstring`json:"add"`}typeReturnDatastruct{Messagestring`json:"message"`Statusstring`json:"status"`DataUserInfo`json:"data"`}二、get请求的
【Java】已解决：org.springframework.jdbc.datasource.lookup.DataSourceLookupFailureException 屿小夏 java 开发语言
文章目录一、分析问题背景问题背景描述出现问题的场景二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项已解决：org.springframework.jdbc.datasource.lookup.DataSourceLookupFailureException在使用Spring框架进行开发时，数据源的配置和使用是非常关键的一环。然而，有时候我们可能会遇到org.springframewo
el-table实现全选整表，单元一页复选框功能周bro vue.js elementui javascript 前端
全选整表单选一页0":popper-append-to-body="false":total="tableData.length":page-size="pageObj.pagesize":page-sizes="[10,50,100]"layout="total,sizes,prev,pager,next"@size-change="handleSizeChange"@current-chang
Vue + Express实现一个表单提交九旬大爷的梦
最近在折腾一个cms系统，用的vue+express，但是就一个表单提交就弄了好久，记录一下。环境：Node10+前端：Vue服务端：Express依赖包：vueexpressaxiosexpress-formidableelement-ui（可选）前言：axiosget请求参数是：paramsaxiospost请求参数是：dataexpressget接受参数是req.queryexpresspo
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
Kubernetes部署MySQL数据持久化沫殇-MS Kubernetes MySQL数据库 kubernetes mysql 容器
一、安装配置NFS服务端1、安装nfs-kernel-server：sudoapt-yinstallnfs-kernel-server2、服务端创建共享目录#列出所有可用块设备的信息lsblk#格式化磁盘sudomkfs-text4/dev/sdb#创建一个目录：sudomkdir-p/data/nfs/mysql#更改目录权限：sudochown-Rnobody:nogroup/data/nfs
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
使用input[type=file]遇上的一些问题刘圣凯
项目遇到一个需要，如下image.png功能大致就是添加图片，展示出来，然后在用户点击提交的时候把图片传给后台，在和后台交涉之后，决定在用户选择图片之后转成formdata传给后台，后台返回一个url，提交的时候将url返回给后台/**转formdata*/varformdata=newFormData();formdata.append("file1",$("#pic")[0].files[0]
[转载] NoSQL简介 weixin_30325793 大数据数据库运维
摘自“百度百科”。NoSQL，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关系数据库在应付web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。虽然NoSQL流行语
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h