您现在的位置是:首页 > IT基础架构 > 软件与服务 >

一种有效的数据仓库定制应用方式

2009-10-30 22:26:00作者: 来源:

摘要本文介绍了如何利用DELPHI中的数据仓库组件开发数据仓库应用系统,为用户提供一种有效的定制的数据仓库应用方式,利用此组件可进行灵活的多维数据分析。 ...

0 引 言

    信息技术的迅速发展已将我们从简单的批处理、联机事务处理(OLTP)的信息处理时代,带入了联机分析处理(OLAP)、数据仓库和数据挖掘的信息分析时代。数据仓库在短短的几年内已经从一种单纯的理论研究发展成信息管理与信息系统开发领域中一种实用性极强的技术。这一发展具有其内在的动力和外在的推动。数据仓库在创建成功以后,用户可以直接登录数据仓库进行操作。但是已经习惯联机事务处理的大多数用户还缺乏数据仓库的使用经验,他们往往希望能以一种类似OLTP的方式使用数据仓库。但要缺乏计算应用能力的用户熟练使用ORACLE或SQLSERVER等数据仓库工具所提供的联机事务分析功能,也具有一定的难度。因此在数据仓库的应用中,尤其是数据仓库应用的早期,为用户提供一种定制的数据仓库应用方式,是解决这一矛盾的关键。用户通过定制的数据仓库应用工具,可以逐步地增加数据仓库的应用能力。很显然,这种定制的应用方式和用户已经熟悉的业务处理方式相一致。也就是说,应该利用开发传统的业务处理系统的方式开发这种数据仓库的定制应用模式。值得令人高兴的是,INPRISE的DELPHI为我们提供了数据仓库设计组件,这对于数据仓库应用系统的设计十分方便。DELPHI中的数据仓库组件可以很方便地完成数据仓库定制应用和OLAP。

1 数据仓库的创建

    前大多数业务处理系统的数据存储是利用关系数据库,特别是ORACLE和SQLSERVER,而这两种数据库都包含大量的数据仓库创建和管理功能。图一是数据仓库创建和使用过程。


图一 数据仓库创建和使用过程


    ORACLE和SQLSERVER都提供了数据的提取和加载工具。如SQLSERVER中的数据复制工具和数据导出工具(DTS)。DELPHI中也可以利用数据库引擎管理器(BDE),ODBC管理器和数据库转换器(DATA PUMP)等工具对SQL SEVER、ORACLE等数据库和数据仓库中的数据进行提取与加载。再经过数据的清理和数据变换可生成高质量数据。

2 DELPHI中数据仓库组件的使用

    作为信息系统常用的开发工具DELPHI提供了以DECISIONCUBE组件组为主的数据仓库开发工具。由于越来越多的信息系统开始采用DELPHI进行开发,因此,利用DECISIONCUBE组件组开发出的数据仓库应用系统与业务系统具有十分良好的同一平台作业能力。

    DELPHI中的数据仓库组件有决策立方体(DECISIONCUBE)组件、决策查询(DECISIONQUERY)组件、决策源(DECIS10NS0URCE)组件、决策中枢(DECISIONPIVOT)组件、决策栅格(DECISIONGRID)组件和决策图表(DECISONGRAPH)组件。

    DECISION CUBE组件组可与数据库基本表进行连接,反映数据的变化情况,对数据表进行数据统计、分析和图形显示。DECISION CUBE组件组的应用十分灵活,而且功能十分强大,是一个良好的数据仓库应用系统开发控件。利用这些组件所开发出来的应用系统,能使数据仓库真正用于对管理决策提供支持。而且可将数据仓库应用系统与业务信息系统的开发整合在一起,使数据仓库的应用与业务系统构成一个整体,不必另行设计和开发系统。

    用DELPHI进行数据仓库应用系统的开发,需要依靠DECISION CUBE组件组的各种组件的相互配合(如图二)。其中DECISIONQUERY组件处于与数据仓库的进行交互的底层。DECISIONCUBE组件主要对DECISONQUERY组件从数据仓库所取的数据进行分析,并且将其转变为一个多维表的结构,然后通过DECISIONSOURCE组件提交给DECISIONGRID,DECISIONPIVOT和DECISIONGRAPH,DECISIONSOURCE在数据仓库的应用中起到了一个桥梁的作用。DECISIONPIVOT组件主要用于对数据仓库中数据进行导航,它提供一些简单明了的按钮,便于用户对数据进行操作。DECISIONGRID组件主要用于对数据的分析结果进行显示,还可改变数据显示区的颜色,以及数据的行、列排放方式,即实现多维数据集的旋转分析。DECISIONGRAPH组DECISIONPIVOT组件DECISIONGRID组件DECISIONGRAPH组件件用来将所分析的数据以可视化的方式进行显示,有利于用户对数据进行直观的分析。


图二DECISION CUBE组件组流程


3 应用实例

    笔者在某电力企业年金管理系统和某国防科技动员信息系统中均运用了DELPHI中的数据仓库组件开发数据仓库的定制应用,得到了用户的一致好评,利用数据仓库组件可以灵活的进行多维数据分析,多维数据分析是指以多维形式组织起来的数据采取切片、切块、旋转、钻取等各种分析动作,以求剖析数据,使最终用户能从多个角度、多个侧面的观察数据库中的数据,从而深人地了解包含在数据中的信息和内涵。

    使用步骤如下:

    (1)放置数据仓库组件在FORM窗体上。
    (2)建立数据仓库的连接。
    (3)设置DECISIONQUERY的数据库的属性,同时设置维(DIMENSIONS)和汇总项目(SUMMARIES),这步是关键。
    (4)设置DECISIONCUBE的数据集为DECISIONQUERY,设置DECISIONSOURCE的DECISIONCUBE为DECISIONCUBE,设置DECISIONGRID,DECISIONPIVOT和DECISIONGRAPH的DECISIONSOURCE为DECISIONSOURCE。

    激活数据集,就可以进行多维数据分析,按下每个维的按钮,可以让它在表格和图表中出现或不出现,即任意选择显示的维,可以进行切片分析。右击每一维的按钮弹出的菜单中都有钻取和旋转的功能,而且右击表格中的维的值弹出的菜单中也有钻取的功能。

4 结束语

    虽然定制的数据仓库应用模式能满足一定的需要,能为管理决策者提供一些辅助决策,但却不能发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。缺乏挖掘数据背后隐藏的知识的手段。而这些正是数据挖掘要解决的问题,这就是目前数据挖掘研究如火如茶的原因。最近,Gartner Group的一次高级技术调查将数据挖掘和人工智能列为”未来三到五年内将对工业产生深远影响的五大关键技术”之首,并且还将并行处理体系和数据挖掘列为未来五年内投资焦点的十大新兴技术前两位,可见数据挖掘的重要性。将OLAP技术、数据挖掘技术与数据仓库的庞大数据相结合,是未来的方向。


(本文不涉密)
责任编辑:

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们