在企业信息化建设的过程中,由于缺乏统一规划和总体布局,往往形成多个信息孤岛。信息孤岛使数据的一致性无法得到保证,信息无法共享和反馈,需要重复多次的采集和输入。信息孤岛是企业信息化一个重要的负面因素,其主要原因既有技术因素也有管理因素,还有业务流程和标准方面的因素。如何将众多的信息孤岛联系起来,以便让不同的系统乏间交互信息,是当前很多企业都面临的一个问题。
此时集成技术应运而生,集成包括软硬件及网络的集成,软件层次的集成技术——企业应用集成(Enterprise Application Integration,EAI)。
EAI技术可以消除信息孤岛,它将多个企业信息系统连接起来,实现无缝集成,使它们就像一个整体一样。EAI是伴随着企业信息系统的发展而产生和演变的,企业的价值取向是推动EAI技术发展的原动力,而EAI的实现反过来也驱动企业竞争优势的提升。
包括表示集成、数据集成、控制集成、应用集成等,适用于大多数实施电子商务的企业及企业之间的应用集成,在做数据集成前必须首先对数据进行标识并编成目录。数据集成是白盒集成,表示集成和控制集成是黑盒集成。
EAI所连接的应用包括各种电子商务系统、ERP、CRM、SCM、OA、数据库系统和数据仓库等。从单个企业的角度来说,EAI可以包括表示集成、数据集成、控制集成和业务流程集成等多个层次和方面。当然,也可以在多个企业之间进行应用集成。
企业集成平台是一个支持复杂信息环境下信息系统开发、集成、协同运行的软件支撑环境,包括硬件、软件、软件工具和系统。基本功能包括:
表示集成,也称为界面集成,这是比较原始和最浅层次但又是常用的集成。将用户界面作为公共的集成点,把原有零散的系统界面集中在一个新的界面中,统一入口。其模型如图
表示集成是黑盒集成,无须了解程序与数据库的内部构造。常用的集成技术主要有屏幕截取和输入模拟技术。表示集成通常应用于默下几种情况:
表示集成的实现是很简单的,也是很不彻底的,只是一层外装修,而额外多出来的集成界面也将可能成为系统的性能瓶颈。
应用集成和业务过程集成的基础。把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。ETL、数据仓库、联邦数据库都可视为数据集成。
为了完成控制集成和业务流程集成,必须首先解决数据和数据库的集成问题。在集成之前,必须首先对数据进行标识并编成目录,另外还要确定元数据模型,保证数据在数据库系统中分布和共享。因此,数据集成是白盒集成,其模型如图
有很多不同的中间件工具可以用于数据集成。例如,批量文件传输,即以特定的或是预定的方式在原有系统和新开发的应用系统之间进行文件传输;用于访问不同类型数据库系统的ODBC(Open DataBase Connectivity,开放数据库互连)标准接口:向分布式数据库提供连接的数据库访问中间件技术等。通常在以下情况下,将会使用数据集成:
相对而言,数据集成比表示集成要更加灵活。但是,当业务逻辑经常发生变化时,数据集成就会面临困难。
某企业欲对内部的数据库进行数据集成。如果集成系统的业务逻辑较为简单,仅使用数据库中的单表数据即可实现业务功能,这时采用主动记录方式进行数据交换与处理较为合适,将该表包装为记录;如果集成系统的业务逻辑较为复杂,并需要通过数据库中不同表的连接操作获取数据才能实现业务功能,这时采用数据映射方式进行数据交换与处理较为合适。
也称为功能集成、应用集成、API集成,是在业务逻辑层上对应用系统进行黑盒集成的。控制集成的集成点存于程序代码中,集成处可能只需简单使用公开的API就可以访问,当然也可能需要添加附加的代码来实现。控制集成是黑盒集成,其模型如图
实现控制集成时,可以借助于远程过程调用、远程方法调用、面向消息的中间件、分布式对象技术和事务处理监控器来实现。控制集成与表示集成、数据集成相比,灵活性、复杂度更高。表示集成和数据集成适用的环境下,都适用于控制集成。但是,由于控制集成是在业务逻辑层进行的,其复杂度更高一些。而且,很多系统的业务逻辑部分并没有提供API,这样,集成难度就会更大。
也叫过程集成,超越数据和系统,它由一系列基于标准的、统一数据格式的工作流组成。当进行业务流程集成时,企业必须对各种业务信息的交换进行定义、授权和管理,以便改进操作、减少成本、提高响应速度。
业务流程集成不仅要提供底层应用支撑系统之间的互连,同时要实现存在于企业内部的应用之间,本企业和其他合作伙伴之间的端到端的业务流程的管理,它包括应用集成、B2B集成、自动化业务流程管理、人工流程管理、企业门户,以及对所有应用系统和流程的管理和监控等。
其他集成:
市场上主流的集成模式有3种,分别是:
在数据集成层面、信息集成技术仍然是必选的方案。信息集成采用的主要数据处理技术有:数据复制、数据聚合、和接口集成等。其中接口集成仍然是一种主流的技术。通过一种集成代理的方式实现集成,即为应用系统创建适配器作为自己的代理,适配器通过其开放或私有的接口,将信息从应用系统中提取出来,并通过开发接口与外界系统实时交互。而加入适配器的结构支持一定的标准,将极大的简化集成的复杂度,并有助于标准化,这也是面向接口集成方法的主要优势来源。标准化的适配器技术可以使企业从第三方供应商获取适配器,从而使集成技术简化。
实际上是一种过程流集成的思想,不需要处理用户界面开发、数据库逻辑、事务逻辑等。而只是处理系统之间的过程逻辑,与核心业务逻辑相分离。
在结构上,面向过程的集成方法在迷信爱那个接口的集成方法之上,定义另外的过程逻辑层;而在该层的底层,应用服务器、消息中间件提供支持数据传输和跨域过程协调的基础服务。对于提供集成代理、消息中间件以及应用服务器的厂商来说,提供用于业务过程集成是对其产品的重要扩展,也是目前应用集成市场的重要需求。
基于SOA和web技术的应用集成,是业务集成技术上的一次重要变化,被认为是新一代的应用集成技术。集成的对象是一个web服务或者是封装成web服务的业务处理。web服务技术由于是基于最广为接受的、开放的技术标准,支持服务接口描述和服务处理的分离、服务描述的集中化存储和发布、服务的自动查找和动态绑定以及服务的组合,称为新一代面向服务的应用程序的构件和应用系统集成的基础设施。
指企业在不同应用系统之间实现数据共享,即实现数据在不同数据格式和存储方式之间的转换、来源不同、形态不一、内容不等的信息资源进行系统分析、辨清正误、消除冗余、合并同类,进而产生具有统一数据形式的有价值信息的过程。企业信息集成是一个十分复杂的问题,按照组织范围来分,分为企业内部和外部信息集成。按集成内容,企业内部的信息集成一般可分为以下四个方面:
数据集成
为了完成应用集成和过程集成,必须首先解决数据和数据库的集成问题。在集成之前,必须首先对数据进行表示并编成目录,另外还需要确定元数据类型,保证数据在数据库系统中的分布和共享。
数据集成的模式包括:
控制集成
这种集成能够为两个应用中的数据和函数提供接近实时的集成。应用集成在底层的网络集成和数据集成的基础上,实现异构应用系统之间应用层次上的互操作。
应用集成的主要模式包括:
不同分类下有不同的技术
企业门户,Enterprise Portal。
分类
EP实施的关键问题
有5类
Web服务,简称WS,随着Internet应用逐渐成为一个B2B应用平台,应用集成所面临的问题也日益突出:各种构件之间的“战争”、各种编程语言之间的“战争”、防火墙的阻挡、互操作协议的不一致等。Web服务定义一种松散的、粗粒度的分布计算模式,使用标准的HTTP/S协议传送XML表示及封装的内容。
Web服务的典型技术包括:
Web服务的主要目标是跨平台的可操作性,适合使用WS的情况:
在某些情况下,Web服务也可能会降低应用程序的性能。不适合使用Web服务的情况如下:
J2EE(Java 2 Platform Enterprise Edition)是由Sun公司主导、各厂商共同制定并得到广泛认可的工业标准。业界各主要中间件厂商如IBM、Oracle都在积极地促进该标准的推广和应用。完整的J2EE技术规范由4部分组成:J2EE平台、J2EE应用编程模型、J2EE兼容测试套件、J2EE参考实现。J2EE应用服务器运行环境包括构件(Component)、容器(Container)及服务(Services)三部分。构件是表示应用逻辑的代码;容器是构件的运行环境;服务则是应用服务器提供的各种功能接口,可以同系统资源进行交互。
微软的.NET是基于一组开放的互联网协议而推出的一系列的产品、技术和服务。.NET开发框架在通用语言运行环境基础上,给开发人员提供完善的基础类库、数据库访问技术及网络开发技术,开发者可以使用多种语言快速构建网络应用。.NET开发通用语言运行环境(Common Language Runtime)处于.NET开发框架的最低层,是该框架的基础,它为多种语言提供统一的运行环境、编程模型,大大简化应用程序的发布和升级、多种语言之间的交互、内存和资源的自动管理等等。基础类库(Hase Class Library)给开发人员提供一个统一的、面向对象的、层次化的、可扩展的编程接口,使开发人员能够高效、快速地构建基于下一代互联网的网络应用。
国际工作流管理联盟,Workflow Management Coalition,WfMC给出的定义,工作流是一类能够完全或者部分自动执行的业务过程,它根据一系列过程规则,使文档、信息或任务能够在不同的执行者之间传递和执行。工作流是一种能够实现过程集成的技术。
工作流就是工作流程的计算模型,即将工作流程中的工作如何前后组织在一起的逻辑和规则在计算机中以恰当的模型进行表示并对其实施计算。工作流要解决的主要问题是:为实现某个业务目标,在多个参与者之间,利用计算机,按某种预定规则自动传递文档、信息或者任务。
如果用户的业务流程经常发生改变,那么首先应想到工作流技术。
作用:
数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。首先,数据仓库用于决策支持,面向分析型数据处理;其次,数据仓库是对多个异构数据源(包括历史数据)的有效集成,集成后按主题重组,且存放在数据仓库中的数据一般不再修改。与操作型数据库相比,数据仓库的主要特点如下:面向主题、集成、相对稳定、反映历史变化
共享数据库是一种重要的企业应用集成方式,它通常将应用程序的数据存储在一个共享数据库中,通过制定统一的数据库模式来处理不同应用的集成需求。共享数据库为不同的应用程序提供统一的数据存储与格式定义,能够在一定程度上缓解数据语义不一致的问题,但无法完全解决该问题。在共享数据库集成中,多个应用程序可能通过共享数据库频繁地读取和修改相同的数据,这会使数据库成为一个性能瓶颈。共享数据库集成方式的一个重要限制来自外部的已封装应用,这些封装好的应用程序只能采用自己定义的数据库模式,调整和集成余地较小。