九大数据仓库方案特点比较
2024-07-21 02:09:22
供稿:网友
九大数据仓库方案特点比较
中国电子设备系统工程研究所 王建新 刘东波
ibm、oracle、sybase、ca、ncr、informix、microsoft、和sas等有实力的公司相继(通过收购或研发的途径)推出了自己的数据仓库解决方案,bo和brio等专业软件公司也在前端在线分析处理工具市场上占有一席之地。下面针对这些数据仓库解决方案的性能和特点做分析和比较。
1.ibmibm公司提供了一套基于可视数据仓库的商业智能(bi)解决方案,包括:visual warehouse(vw)、essbase/db2 olap server 5.0、ibm db2 udb,以及来自第三方的前端数据展现工具(如bo)和数据挖掘工具(如sas)。其中,vw是一个功能很强的集成环境,既可用于数据仓库建模和元数据管理,又可用于数据抽取、转换、装载和调度。essbase/db2 olap server支持“维”的定义和数据装载。essbase/db2 olap server不是rolap(relational olap)服务器,而是一个(rolap和molap)混合的holap服务器,在essbase完成数据装载后,数据存放在系统指定的db2 udb数据库中。
严格说来,ibm自己并没有提供完整的数据仓库解决方案,该公司采取的是合作伙伴战略。例如,它的前端数据展现工具可以是business objects的bo、lotus的approach、cognos的impromptu或ibm的query management facility;多维分析工具支持arbor software的essbase和ibm(与arbor联合开发)的db2 olap服务器;统计分析工具采用sas系统。
2.oracleoracle数据仓库解决方案主要包括oracle express和oracle discoverer两个部分。oracle express由四个工具组成:oracle express server是一个molap (多维olap)服务器,它利用多维模型,存储和管理多维数据库或多维高速缓存,同时也能够访问多种关系数据库;oracle express web agent通过cgi或web插件支持基于web的动态多维数据展现;oracle express objects前端数据分析工具(目前仅支持windows平台)提供了图形化建模和假设分析功能,支持可视化开发和事件驱动编程技术,提供了兼容visual basic语法的语言,支持ocx和ole;oracle express analyzer是通用的、面向最终用户的报告和分析工具(目前仅支持windows平台)。oracle discoverer即席查询工具是专门为最终用户设计的,分为最终用户版和管理员版。
在oracle数据仓库解决方案实施过程中,通常把汇总数据存储在express多维数据库中,而将详细数据存储在oracle关系数据库中,当需要详细数据时,express server通过构造sql语句访问关系数据库。但目前的express还不够灵活,数据仓库设计的一个变化往往导致数据库的重构。另外,目前的oracle 8i和express 之间集成度还不够高,oracle 8i和express之间需要复制元数据,如果oracle discoverer(或bo)需要访问汇总数据,则需要将汇总数据同时存放在oracle和express中,系统维护比较困难。值得注意的是,刚刚问世的oracle 9i把olap和数据挖掘作为重要特点。
3.sybasesybase提供的数据仓库解决方案称为warehouse studio,包括数据仓库的建模、数据抽取与转换、数据存储与管理、元数据管理以及可视化数据分析等工具。其中,warehouse architect是powerdesigner中的一个设计模块,它支持星形模型、雪花模型和er模型;数据抽取与转换工具包括powerstage、replication server、carleton passport,powerstage是sybase提供的可视化数据迁移工具。
adaptive server enterprise是sybase企业级关系数据库,adaptive server iq是sybase公司专为数据仓库设计的关系数据库,它为高性能决策支持系统和数据仓库的建立作了优化处理,sybase iq支持各种流行的前端展现工具(如cognos impromptu、business objects、brio query等);数据分析与展现工具包括powerdimensions、englishwizard、infomaker、powerdynamo等,powerdimensions是图形化的olap分析工具,它支持smp和多维缓存技术,能够集成异构的关系型数据仓库和分布式数据集市,从而形成单一的、新型的多维模式;数据仓库的维护与管理工具包括warehouse control center、sybase central、distribution director,其中warehouse control center是为数据仓库开发人员提供的元数据管理工具。
sybase提供了完整的数据仓库解决方案quick start datamart,具有良好的性能,并支持第三方数据展现工具。从quick start datamart的名称不难看出,它尤其适合于数据集市应用。另外,sybase可以提供面向电信、金融、保险、医疗保健这4个行业的客户关系管理(crm)产品,在这4个产品中,有80%的功能是共性的,有20%的功能需要sybase与合作伙伴针对不同需求共同开发。
4.informixinformix于1998和1999年相继收购了国际上享有盛誉的数据仓库供应商red brick system和数据管理软件供应商ardent,并提供了完整、集成的数据仓库解决方案。该解决方案还包括一个“快速启动”咨询服务,能够帮助用户快速完成数据仓库或数据集市的开发。informix产品能够集成microsoft iis或netscape enterprise/fasttrack服务器,从而支持基于web的数据仓库应用。
informix没有提供自己的报表和数据挖掘工具,但他们与brio和sas公司建立了战略联盟,并推出了“informix商务智能联盟计划”。该计划以informix为主,结合brio的前端数据分析和报表功能,以及sas的数据挖掘功能,形成了一个“bi中心”打包方案。
(今年4月informix software已被ibm公司收购,此举将给ibm公司数据库及数据仓库产品,从技术和市场占有率上带来极大的提升。)
5.caca于1999年收购了platinum technology公司后,得到了完整的数据仓库解决方案,包括:erwin数据仓库设计工具、infopump数据转换与抽取工具、infobeacon rolap服务器、forest&trees前端数据展现工具、provision系统监视与作业调度工具和decisionbase元数据管理工具等。
与informix解决方案相似,ca解决方案也提供了数据仓库建模、元数据管理、数据抽取与转换、基于关系数据库的在线分析服务器、系统监视与作业调度、前端数据展现等功能,同时还支持web应用。不同之处是informix提供了专门为数据仓库设计的高性能目标数据库(red birck),而ca解决方案则提供odbc接口,并将数据存储在第三方关系数据库(如oracle、sybase、sql server、informix和ibm db2等)中,其性能要打一些折扣,但开放性要好些。另外,ca的olap服务器目前只能与microsoft的iis web服务器集成。
6.ncr teradatancr teradata是高端数据仓库市场最有力的竞争者,主要运行在ncr worldmark smp硬件的unix操作系统平台上。1998年,该公司也提供了基于windows nt的teradata,试图开拓数据集市(data mart)市场。总的来看,ncr的产品性能很好,teradata数据仓库在100gb、300gb、1tb和3tb级的tpcd指标测试中均创世界纪录。但是,ncr产品的价格相对较高,中小企业用户难以接受。
7.microsoftmicrosoft将olap功能集成到microsoft sql server 7.0中,提供可扩充的基于com的olap接口。它通过一系列服务程序支持数据仓库应用。数据传输服务dts(data transformation services)提供数据输入/输出和自动调度功能,在数据传输过程中可以完成数据的验证、清洗和转换等操作,通过与microsoft repository集成,共享有关的元数据;microsoft repository存储包括元数据在内的所有中间数据;sql server olap services支持在线分析处理;pivottable services提供客户端olap数据访问功能,通过这一服务,开发人员可以用vb或其他语言开发用户前端数据展现程序,pivottable services还允许在本地客户机上存储数据;mmc(microsoft management console)提供日程安排、存储管理、性能监测、报警和通知的核心管理服务;microsoft office 2000套件中的access和excel可以作为数据展现工具,另外sql server还支持第三方数据展现工具。
8.sassas公司在20世纪70年代以“统计分析”和“线性数学模型”而享誉业界,90年代以后,sas公司也加入了数据仓库市场的竞争,并提供了特点鲜明的数据仓库解决方案,包括30多个专用模块。其中,sas/wa(warehouse administrator)是建立数据仓库的集成管理工具,包括定义主题、数据转换与汇总、更新汇总数据、元数据管理、数据集市的实现等;sas/mddb是sas用于在线分析的多维数据库服务器;sas/af提供了屏幕设计功能和用于开发的scl(屏幕控制语言);sas/itsv(it service vision)是it服务的性能评估和管理的软件,这些it服务包括计算机系统、网络系统、web服务器和电话系统等。sas系统的优点是功能强、性能高、特长突出,缺点是系统比较复杂。
9.business objectsbusiness objects(bo)是集查询、报表和olap技术为一身的智能决策支持系统。它使用独特的“语义层”技术和“动态微立方”技术来表示数据库中的多维数据,具有较好的查询和报表功能,提供钻取(drill)等多维分析技术,支持多种数据库,同时它还支持基于web浏览器的查询、报表和分析决策。虽然bo在不断增加新的功能,但从严格意义上说,bo只能算是一个前端工具。也许正因为如此,几乎所有的数据仓库解决方案都把bo作为可选的数据展现工具。
虽然国内有很多大学和研究机构从事数据仓库技术的研究,但到目前为止,国内基本上没有成熟的数据仓库解决方案。