2003-02-14
摘要:本文的目的是对独立数据集市进行讨论,并探讨将其移植到结构式解决方案的流程。 独立数据集市:搁浅在数据荒岛上:独立数据集市的特征 独立数据集市有几个共同特征,首先,每个数据集市都是直接来源于运作系统,没有相应的数据仓库结构为其提供必要的体系结构以支持和发展数据集市;其次,这些数据集市,通常是由各个群体独自建立的,相互独立。常见情况是,这些群体所采用的工具、软件、硬件及流程通常是各不相同的。 对于构建了独立集市的公司来说,最直观的表现就是,当为决策支持系统(DSS)描绘出一个模式之后,这个模式的画面会跟意大利式细面条差不多(见图一)。然而,有不少公司都表示,这种图跟他们当前的DSS体系结构很像。 图 一独立数据集市的体系结构 这样的体系结构根本就不能称为体系结构,而是一系列的“炉管式”DSS,这种体系结构与结构式的数据仓库有着天壤之别(见图二)。
本文的目的是对独立数据集市进行讨论,并探讨将其移植到结构式解决方案的流程。在此,我们对DSS的结构体系将仅作简单介绍,而对于DSS的构建方法,到底应采用“自顶向下”还是“自底向上”,我们不作详细讨论,不过,经典的“自顶向下”方法更为灵活、逻辑性更强,在DSS的构建中,这种方法已被普遍采用,并且,当采用这种方式时,构建一个配有数据集市的数据仓库的成本,与构建独立数据集市的成本相比,实际上已相差无几。 独立数据集市:搁浅在数据荒岛上:独立数据集市存在的问题 独立数据集市:搁浅在数据荒岛上:冗余数据 随着独立数据集市数量的增长,数据冗余量也不断增长,这种冗余是由于每个独立数据集市都有一个整体数据的备份而引起的,但这些数据中有不少通常并不是必需的。如果对财富1000中的公司调查它们的冗余数据维护成本的话,这个数字毫无疑问将达到数据十亿美元。 独立数据集市:搁浅在数据荒岛上:冗余流程 数据仓库的体系结构可以对所有数据集市的共同活动进行集中化,没有数据仓库,这些流程就必须为每个数据集市进行复制,这将大大增加维护DSS所需的员工数量,对大多数公司来说,这都是一个沉重的负担。 通常,建立各个数据集市的团队是互相隔离的,其结果是,这些团队互相之间不能就标准、流程、知识及经验教训进行沟通,这将导致大量的重复劳动及重复分析。 这些自成体系的团队一般会选择不同的工具、软件及硬件,使企业不得不为支持各种技术而维持一定数量的技术人员。另外,在软硬件及工具合同方面,通常可以为企业的使用许可提供一定的折扣,如果统一采购的话,其带来的规模效应将可为企业节省大量成本。 独立数据集市:搁浅在数据荒岛上:可伸缩性 独立数据集市直接读取运作系统的文件或表,这极大限制了DSS的伸缩能力。例如,假设公司有五个独立数据集市,每个集市都可能会需要客户信息,这将造成对运作系统的客户表的五次分别抽取,大多数运作系统都限制了批处理窗口数,从而不能支持这么多的抽取数,而数据仓库则只需要一次抽取即可。 独立数据集市:搁浅在数据荒岛上:非集成 如上所述,独立数据集市是由自成体系的团队建立的,而且一般是为不同的部门建立的,导致这些数据集市没有进行集成,而且没有一个会包含了整个企业的视图。因此,如果CEO让IT部门提供一个获利能力最强的客户列表,那么每个数据集市提供的答案都将不同。 当今的企业正面临着合并及购并的狂潮,而这种行动的一个主要驱动因素就是为了减少IT开支,随着公司不断致力于控制渐增的IT成本,与独立集市相关的成本将显得更为突出。 许多已建立了独立集市的公司如今正在设法将其转变为依赖性数据集市,在此过程中所发生的成本,从时间和金钱上综合来看,并非是微不足道的。 独立数据集市:搁浅在数据荒岛上:独立数据集市为什么会存在? 有这么多的缺陷,为什么如此多的公司仍然建立了这种体系结构的DSS?这主要有下述几个原因: 独立数据集市:搁浅在数据荒岛上:DSS的复杂性 当决策支持系统疯狂蔓延时,多数公司都试图建立数据仓库,而建立一个结构优良且可伸缩的商务智能系统是相当复杂的,需要有成熟的软件、昂贵的硬件以及一支高水平的、有经验的队伍,另外,不管是企业还是咨询业,要找到真正理解数据仓库体系结构的工程师和项目领导都是相当困难的。 为了构建数据仓库,公司必须能真正理解数据及其代表的业务流程,这个任务的难度极大,但这是一个必须的步骤,同时也是DSS流程价值的真正来源。 独立数据集市:搁浅在数据荒岛上:独立数据集市的便捷性 建立独立数据集市比建立一个结构式决策支持系统的开支要少,另外,独立数据集市的构建比较快,并且不要求像数据仓库那样去理解数据,这些特点导致了构建独立数据集市思想的泛滥,而正是这种缺乏彻底分析和长期规划的思想,最终限制了独立数据集市用作商务智能系统时的有效性。 独立数据集市:搁浅在数据荒岛上:不适当的商家讯息 许多商家都已开发了用于建立部门级独立数据集市的工具,这些公司争先恐后地涌到市场上,并拼命兜销独立数据集市的概念,其中原因不言而喻。这些公司可以显著缩短它们的销售周期,因为只有一个部门会牵涉到软件采购决定中来,另外,它们的软件不需很复杂,因为它们仅需建立一个单独的数据存储而已。 在如今的市场上,商家的时髦用语就是“承包”,似乎每一家都能提供一个DSS解决方案,然而,仅靠购买一个“承包”方案并不能省去学习和理解公司数据及业务流程的任务,整合来自不同系统数据,要求进行仔细的分析,以及对业务流程和代表这些流程的数据进行深刻的理解。
|
信息化软件应用目录 OA 办公自动化系统
CRM 客户关系管理系统
PM 项目管理系统
SCM 供应链管理系统
CC 协同商务系统
BPM 业务流程管理
BI 商务智能
CMS 内容管理系统
KM/KBS 知识管理系统
电子商务系统
HRM 人力资源管理系统
ERP 企业资源计划
EAM 企业资产管理系统
|