您现在的位置是:首页 > IT基础架构 > 软件与服务 >
商业智能——发觉数据金矿的工具
摘要商业智能(Business Inteligence,简称BI)的概念最早是Gartner Group于1996年提出来的。当时将商业智能定义为一类由数据仓库I或数据集市)、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的,以帮助企业决策为目的技术及其应用。...
一、商业智能概念提出的背景和定义
商业智能(Business Inteligence,简称BI)的概念最早是Gartner Group于1996年提出来的。当时将商业智能定义为一类由数据仓库I或数据集市)、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的,以帮助企业决策为目的技术及其应用。目前,商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。这里所谈的数据包括来自企业业务系统的订单、库存、交易账目.客户和供应商资料来自企业所处行业和竞争对手的数据,以及来自企业所处的其他外部环境中的各种数据。而商业智能能够辅助的业务经营决策,既可以是操作层的,也可以是战术层和战略层的决策。为了将数据转化为知识,需要利用数据仓库,联机分析处理(OLAP)工具和数据挖掘等技术。因此,从技术层面上讲.商业智能不是什么新技术,它只是数据仓库,OLAP和数据挖掘等技术的综合运用。
为此,把商业智能看成是一种镪决方案应该比较恰当。BI的关键是从许多来自不同的企业运作系统的数据中.提取出有用的数据,进行清理以保证数据的正确性,然后经过抽取(Extraction),转换(Transformation)和装载(Load),即ETL过程,合并到一个企业级的数据仓库里,从而得到企业数据的一个全局视图在此基础上利用合适的查询和分析工具、数据挖掘工具。OLAP工具等对其进行分析和处理(这时信息变为辅助决策的知识),最后将知识呈现给管理者.为管理者的决策过程提供支持。因此,BI是涉及一个很宽领域的.集收集、合并、分析和提供信息存取功能为一身的解决方案,包括ETL软件,数据仓库、数据集市,数据查询和报告,多维/联机数据分析,数据挖掘和可视化工具。图1是一个典型的商业智能系统。
图1 商业智能系统构图
二、商业智能的技术构成
商业智能所要解决的问题不同,其应用到的技术也不尽相同一般地讲包括以下的部分(不同的体系,划分的方法可能有些差别,但本质相同)。
1.ETL:即数据的抽取/转换/加载。也就是将原来不同形式.分布在不同地方的数据,转换到一个整理好,统一的存放数据的地方数据仓库)。ETL可以通过专门的工具来实现,也可以通过任何编程或类似的技术来实现。
2.数据仓库:一个标准的定义是:数据仓库是一个面向主题,集成、时变、非易失的数据集合,是支持管理部门的决策过程。简单地说.数据仓库就是储存数据的地方。它既可能是原始的业务数据库,也可能是另外生成的。既可能是标准的关系型数据库,也可能是包括了一些特定面向分析特性的专门产品。
3.查询:找出所需要的数据。由于需求的多样性和复杂程度的差异,查询可能是最简单的从一张表中找出”所有姓张的人“到基于非常复杂的条件、对关系非常复杂的数据进行查找和生成复杂的结果。
4.报表分析:以预先定义好的或随时定义的形式查看结果和分析数据。将人工或自动查询出来的数据,以所需要的形式(包括进行各种计算、比较、生成各种展现格式、生成各种图表等)展现给用户,甚至让用户可以进一步逐层深入钻取这些数据,乃至灵活地按照各种需求进行新的分析并查看其结果。在这个领域,报表已经由原来狭义的做好固定报表发展为灵活地按业务要求随时制作各种报表、进行各种分析和数据研究处理。
5 OLAP分析:多维数据分析,从多个不同的角度立体地同时对数据进行分析。理解OLAP分析,最简单的例子是Excel中的数据透视表。需要指出的是OLAP有广义与狭义之分,广义的OLAP是相对OLTP而言,可以说包括了查询、报表分析。OLAP分析和数据挖掘,但真正大家所讲的实际是狭义的OLAP,即多维数据分析。OLAP分析一般讲应该是通过建模和建立立方体(CUBE)来实现.但现在也有一些简单的OLAP工具可以不建模即进行小数据量,低复杂度的分析(EXCEL的数据透视表即是一例)。
6,数据挖掘:一种在大型数据库中寻找你感兴趣或是有值信息的过程。相比于上面几个部分,数据挖掘是最不确定的。如果理解它与查询的区别,似乎是数据如果容易查出来,就是查询。如果费很大劲才能找出来,就是挖掘。上面这若干部分,并不是每一部分都必不可少,而是要根据应用的实际情况.具体问题具体分析。一般地讲,数据仓库(这里是广义的,其中相当一部分情况就是指标准的关系型数据库)和查询,报表分析是必不可少的,而其他一些功能则视应用的需要可能有不同程度的应用。
除了上面所讲的这些实质性、技术性的组成部分外,与商业智能相关的还有很多应用层面的概念,如EPM(企业绩效管理),DashBoard(仪表盘),预警、决策支持等等。这些概念在应用上有很大意义,也有一些相关的辅助技术,但本质上还是基于上述的几个组成部分。
三、实施商业智能的步骤
实施商业智能系统是一项复杂的系统工程,整个项目涉及企业管理、运作管理、信息系统、数据仓库、数据挖掘、统计分析等众多门类的知识。因此用户除了要选择合适的商业智能软件工具外还必须按照正确的实施方法才能保证项目得以成功。商业智能项目的实施步骤可分为:
1.商业需求分析/整理一商业需求确认/修正: 需求分析是商业智能实施的第一步,在其他活动开展之前必须明确的定义企业对商业智能的期望和需求,包括需要分析的主题。各主题可能查看的角度《维度),需要发现企业那些方面的规律,用户的需求、必须明确。对比规划的商业需求满足现有业务需求的程度,通过对比,修正并确认用户对BI的需求。包括报表的需求、分析模式的需求。
2 数据仓库建模:通过对企业需求的分析, 建立企业数据仓库的逻辑模型和物理模型,并规划好系统的应用架构,将企业各类数据按照分析主题进行组织和归类。1)制定数据ETL(抽取.转换、上载)的规则;2)制定有利于布置、分析效率的Dw存储模式;3)物理实现。
3 数据抽取:数据仓库建立后必矮将数据从业务系统中抽取到数据仓库中,在抽取的过程中还必须将数据进行转换。清洗,以适应分析的需要。
4.建立商业智能分析报表:商业智能分析报表需要专业人员按照用户制订的格式进行开发,用户也可自行开发(开发方式简单,快捷)。
5.用户培训和数据模拟测试:对于开发一使用分离型的商业智能系统,最终用户的使用是相当简单的,只需要点击操作就可针对特定的商业问题进行分析。
6系统改进和完善:任何系统的实施都必须是不断完善的,商业智能系统更是如此,在用户使用一段时间后可能会提出更多的,更具体的要求,这时需要再按照上述步骤对系统进行重构或完善。
四、商业智能的发展趋势
商业职能与DSS、ElS系统相比,具有更美好的发展前景。近些年来.商业智能市场持续增长。IDC预测,到2005年,BI市场将达到118亿美元.平均年增长率为27%(Information Access Tools Market Forecast and Analysis:2001-2005.IDC#24779.June 2001)。随着企业CRM,ERP,SCM等应用系统的引入。企业不停留在事务处理过程而注重有效利用企业的数据为准确和更快的决策提供支持的需求越来越强烈,由此带动的对商业智能的需求将是巨大的。商业智能的发展趋势可以归纳为以下几点:
1 功能上具有可配置性、灵活性、可变化性。BI系统的范围从为部门的特定用户服务扩展到为整个企业所有用户服务。同时,由于企业用户在职权、需求上的差异。BI系统提供广泛的,具有针对性的功能。从简单的数据获取,刘利用WEB和局域网,广域网进行丰富的交互、决策信息和知识的分析和使用。解决方案更开放、可扩展、可按用户定制。在保证核心技术的同时.提供客户化的界面针对不同企业的独特的需求。BI系统在提供核心技术的同时使系统又具个性化,即在原有方案基础上加入自己的代码和解决方案,增强客户化的接13和扩展特性;可为企业提供基于商业智能平台的定制的工具,使系统具有更大的灵活性和使用范围。
2.从单独的商业智能向嵌入式商业智能发展。这是目前商业智能应用的一大趋势,即在企业现有的应用系统中,如财务、人力、销售等系统中嵌入商业智能组件,使普遍意义上的事务处理系统具有商业智能的特性。考虑Bl系统的某个组件而不是整个BI系统并非一件简单的事.比如将OL AP技术应用到某一个应用系统,一个相对完整的商业智能开发过程,如企业问题分析、方案设计、原型系统开发,系统应用等过程是不可缺少的。
3.从传统功能向增强型功能转变。增强型的商业智能功能是相对于早期的用SQL工具实现查询的商业智能功能。目前应用中的BI系统除实现传统的BI系统功能之外,大多数已实现了数据分析层的功能。而数据挖掘.企业建模是Bl系统应该加强的应用.以更好地提高系统性能。
4 应用领域更加宽广。2006年,商业智能在中国的应用主要集中在金融、电信、保险、能源、制造、零售,政府等行业.应用比例见下图2
图2 2006年中国BI市场各行业所占比例
随着商业智能在13个行业成功的应用案例,商业智能的应用领域越来越广阔。这13个行业是:卫生行业(广州药业)、空调行业(上海双菱)、电子行业(西门子A&D集团),钢铁行业(宝钢),制药行业(广药)、保险行业(泰康人寿)、电信行业(天津联通).啤酒行业(珠江啤酒),证券行业(上海证交所)、金融行业(光大银行)、烟草行业(重庆烟草)、政府部门(固税总局)、汽车行业(上海汽车销售总公司)。
(本文不涉密)
责任编辑: