您现在的位置是:首页 > IT基础架构 > 软件与服务 >

联机分析处理在决策支持系统中的作用

2009-11-11 21:08:00作者: 来源:

摘要本文分析了传统数据库和决策支持系统中存在的问题,讨论了联机分析处理技术在决策支持系统中的应用...

1 概 述

近年来,由于联机分析处理(OLAP)在数据处理方面具有独特的快速性、可分析性、多维性和信息性而越来越多的被应用到决策支持系统中,另一方面,由于各种信息急剧增加,数据库规模日益扩大,发掘有价值的潜在信息变得越来越重要,目前的决策支持系统还不能对大量、综合且动态集成的数据进行分析处理,很难对海量数据进行访问,更难以实现高效多维分析正是由于联机分析处理技术(OLAP)的兴起,为决策支持系统的开发带来了新的机会,它们相互结合,更好的解决了目前决策支持系统存在的问题。

2 联机分析处理(OLAP)

OLAP是多维数据存储,它通常将三维立方体的数据进行切片来显示三维的某一个方面。OLAP的多维分析突破了物理的三维概念它采用了旋转、嵌套、切片、钻取和三维可视化技术并在屏幕上展示多维视图的结构,使用户直观地理解和分析数据以及进行决策支持。

(1)定义:单纯的联机事物处理(OLAP)不能满足对信息的渴求,发展形成了联机分析处理.联机分析处理是共享多维信息的,针对特定问题的联机数据访问和分析的快速软件技术。“多维”是OLAP的核心部分,是主题的基础,是对主题的一种类型划分。OLAP采集的与“多维”有关的信息才是用户关心的焦点,这是一个四维关于“度量”项线的问题。这种数据分析迎合了人的思维模式,使分析人员能够迅速、一致,交互地从多个角度、多个侧面来剖析反映某企业多维特性的数据,使人们在观察数据时减少混淆与错误,发现致据后面有价值的信息可以更好充分利用决策支持系统,为企业、为决策者提供帮助。

(2)解释:联机分析处理的多维数据分析,对数据立方体和超立方体的多维数据分析主要有切块、切片、旋转、钻取分析动作,目的是进行跨维、跨层次的计算和建模。在多维数据结构中,按二维进行切片,按某一维进行切块,对片或块或整个多维数据库在维数不变的前提下通过改变维的层次或位置,进行数据钻取和旋转。过程中先按某一维切块得到关注的内容,然后钻取数据到达适当的综合层次,再通过旋转动作更换数据观察角度,选取重要的数据进行切片分析。各个过程可能有一定的重复,如此经过切片、切块、旋转、钻取就要以形成数据新的观察角度和综合层次,就可能提取出有价值的信息,得到知识。

3 建立OLAP数据结构的方法

为适应企业决策支持系统的需要,Microsoft SQL ServerTMOLAP Services是徽软公司推出的面向OLAP的高性能工具。OLAP解决了原有关系数据库无法解决的一些问题,以此,通过一个简化的工程实例来介绍OLAP数据结构的建立。

3.1 生成立方体数据结构

首先需要在工程中引用Microsoft Decidion Support Objects Micrsoft ActiX Data Objects,建立立方体数据结构首先是建立数据对象,这需要连接到OLAP服务器上建立一个数据库对象。Connect方法的作用是连接OLAP服务器,其参数是被连接的O-LAPServer的名称。

然后为创建的iCube数据库对象dsoDB建立数据源,这里指定新建的数据源书称为iCube,连接的数据库为此程序同目录下的iCube.mdb。

数据源建立后,要开始为立方体建立维结构。这里只给出ObjectLage维的建立方法,另外两个维的建立方法与之相似。首先要为dosDB创建一个维对象,并为它指定数据原和引用表名,然后按照Level的层次顺序分别为此维对象建立Level。在建立时要用MemberKeyColumn属性指定Level在引用表中对应的字段,并用ColumnType属性指定此字段的类型。

接着为立方体建立框架。首先要用dsoDB建立一个立方体对象,然后将建立的数据源和维派加到此立方体中,并使用MDStore的JoinClause属性指定来旅事实表名及主键间的关联。

建立立方体数据结构的最后一步是建立度量。Maesure的SourceClumn的属性指定了此度量在事实表中对应的字段名,SourceColumnType属性为此字段的类型。AggregateFuntion周性指定了用来计算度量的聚集方式。

3.2 为立方休设计聚集的方法

在OLAP中使用顶计算的滚集来提高查询性能,预计算得聚集的比例越高,查询的响应速度越快。但是聚集的存储需要大盆的硬盘空间,因而需要在策集消耗硬盘空间与系统响应速度之间进行协调。下面通过为上面建立的立方休设计聚集来说明通过程序自动设计策集的方法:首先要为立方体的分区建立一个PartitionAnalyzer对象,并进行设计初始化,其中daoPartition.OlapMode应指定为立方休的存储方式,在这里将它指定为MOLAP。

下面的工作就是在聚集占用硬盘空间与系统响应速度之间进行协调。当程序自动进行这种分配时,应该获取当时硬盘空间大小及可行的预期查询响应速度参数,再很据这些参数来进行具体的协调工作。

当设计的聚集满足覆盖20%的查询而退出循环之后,还需要将此设计的聚集应用到立方休的分区中。然后关闭dsoPartitionAnalyzer对象,并对分区进行更新。

4 总 结

本文介绍了DSS系统中对OLAP的使用,通过实例分析,以Microsoft SQL ServerTMOLAP Services软件的开发,OLAP的数据结构来说明OLAP的特点,本文同时对联机分析处理做了定义和解释,为OLAP在决策支持系统中的应用提供了理论依据。


(本文不涉密)
责任编辑:

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们