2004-03-04
摘要:硬盘驱动系统所占空间和成本都下降鼓励了许多公司在大型存储方案中的信心提升。公司能够建立一个越来越大的交易系统和数据仓库,但是对这些积聚的数据使用的频率又如何呢?
作为一个新专栏:“知识整合”的作者,笔者认为介绍其在这个题目下的动机和所希望就相关概念予以探讨是适当的。就在不久之前,对管理十亿字节(或者更大,是令人恐怖的千兆字节)数据收集的想法仅是那些愿意花成千上百万资金在昂贵的大型超级计算机上的高端计算机用户考虑的范围。然而,今天,笔者写这篇文章是在重仅三磅的超薄计算机,它有20G储存能力,整台电脑花费不超过3000美金,今天已经司空见惯的事实在10年前是难以想象的!
硬盘驱动系统所占空间和成本都下降鼓励了许多公司在大型存储方案中的信心提升。公司能够建立一个越来越大的交易系统和数据仓库,但是对这些积聚的数据使用的频率又如何呢?更重要的是,这些数据如何被使用?甚至更尖锐的讲,在日益增多的数据管理问题中如何以最低的成本大规模存储数据来创造一个可以排除额外耗费资源(资本和智能)的环境?
我们可以看到这一点:当数据创新、生产、储备和存储量有了显著的增长时,但任意挑选一个人,你会发现其对数据的理解能力却有明显下降。以数据仓库(DW)、商务智能(BI)、和客户关系管理(CRM)以及其他知识密集型为代表的市场试图不断地抓住你的注意力,强调他们的产品是你的计划得以成功的关键。但是尽管我们似乎步入了这类技术的成熟阶段,BI和CRM的承诺仍然大大超过了现有工业实现承诺的能力。我认为不能实现这种承诺的大部分是由于信息处理产业中对数据的使用和价值的理解上的传统观点所致。
这也正是产生知识整合之所在。一间公司可能有最好的数据库或CRM软件,但是这些应用程序只有当信息注入的时候才能发挥效用。我们逐渐从以命令语言为方式的系统体系和基本架构的领域转到那些成功的与内容、方式和价值直接联系的相关程序的领域:
理解信息的内在价值。
明确信息如何被使用,以何种方式使用。
正式定义收集一个或多个数据集的期望值,并能对相应的期望值予以测量。
寻找提升信息价值的方法。
确定信息价值的标准,并以此标准来度量价值的增加。
对复杂的数据所有权概念做一探索。
在我们的数据中发现内在的知识。
使用已发现的知识。
我们处在一个信息的时代,但是对信息处理和管理的方式让我们想起了工业时代,那个以装备线顺序处理过程的时代。尽管在分布计算和相应的处理程序领域已取得了令人瞩目的成绩,多数信息应用程序仍然以线性方式运行,在各个独立的阶段进行“信息处理”,这种方式与汽车生产的方式是一样的。这种工厂式的处理方法人为设置了有效使用信息的障碍,会导致丧失机会,降低产品的竞争力。
以后,我们将探讨公司如何能够转向以知识为中心的观点,该观点认为信息是用来提高竞争力和战略优势的重要资产。当许多数据被验证、聚集、融合、加强、共享和广为传播成为整个企业知识的基础时,那就意味着你从工业时代对数据的看法转变到了知识经济时代对数据的看法。从更高的层次讲,我希望对相关信息处理程序的创建、使用和管理的传统观念予以挑战,也许还能激发一些对数据思考和操作的异于常规的方法。我们将看到:
改变了对数据的传统观点。
公司内部信息的政治角度。
数据所有权的范例、角色和责任。
数据评估和建立信息ROI。
管理信息质量的正效应。
业务规定。
在数据中发现知识。
在多变的环境中转变模型。
结合代表性的模型对数据模型予以统计。
信息控制。
知识的发现和保密能相互共存。
在数据环境中利用高技术。
抽象实体描述。
行为模式成为记录活动的副产品。
我深信只要这种“试验”能激发读者的反应,不论是正向的还是反向的反应,那么它就算成功了。我希望与大家共勉之。
|