2008-04-15
中国离”啤酒与尿布”还有多远?:作者: richardzzh 20071022 自从”啤酒和尿布”的故事在中国广泛流传之后,数据仓库在中国也热闹了一阵子,我们曾对它抱以极大的希望,但时隔不久数据仓库应用就进入了”冬眠期”?数据仓库技术在中国的应用受到了哪些因素的制约? 数据仓库是在数据库基础上发展而来的,它通常有三个部分:数据仓库(Data Warehous-ing)、联机分析处理(OLAP)及数据挖掘(Datamining),它们之间具有极强的互补关系。 1、市场环境压力大小决定数据战略时间迫切程度 数据仓库是为了满足人们在高度数据积累基础上进行数据分析的需要而产生的,但由于目前中国在基础数据的积累方面存在不足,导致数据仓库技术的应用没能推广开来。这种技术如何被多数人所接受呢?而不至于被认为是”只为报表而存在”。我认为要使数据仓库被多数人接受,首先需要解决的问题就是数据挖掘技术如何与现有商业技术的结合。 目前市场上已有多种适用解决所有商业模式的通用数据挖掘系统,但实际上这些系统极其不好用,只有那些非常熟悉数据挖掘技术的人才能够理解和使用它们,而普通用户是很难应用这些技术来解决自己的商业问题。 但数据战略最大的屏障则是企业中竞争意识、服务意识不强,对于决策分析的需求不迫切,或只是挂在嘴上,没有实际的实施可能。其深层的现象是,目前企业没有建立起一个管理机制来推动数据的共享,不论是对人的能力、企业的组织制度还是数据质量都没有一个连续的管理机制,要在这样的基础之上建立好用的数据分析是非常困难的。 实际上,在国外市场竞争非常激烈,每个企业为了自身的生存,已经想尽了办法,很多能够被人工发现的规律早就发现了,在这种情况下,使用数据挖掘技术来解决问题是一个很正常的想法。而国内企业,正处于传统经济转向到市场经济的浪潮中,从管理者、到实施者均尚没有认识到”生存”的真正压力,小小的”聪明”就能”博出位”。 2、数据挖掘远非听起来这么简单 数据挖掘工具并不能直接告诉决策者应该把啤酒和尿布摆在一起卖。实际上,数据仓库之上的数据挖掘更像一个过程,一个用户逐步认识自己、提高自己的过程,数据仓库与业务系统并不是平行的关系,它应该是基于所有业务系统之上的,对业务信息进行采集、分析、整理和发布等,应该是一个稳定的、带有时间参数的数据集合。 数据仓库是企业进行数据分析的基础,它的主要工作是将数据库中的原始数据进行归纳整理,聚集成一个可供高层次使用的数据集合。在数据仓库的基础上有两类分析工具,一类是做分析型工作的OLAP,另一类是做预测型工作的数据挖掘。所以,数据仓库最大的客户应该是企业的商业智能部门,或以商业智能为中心的数据营运分析中心。 我们总是希望自己能在企业数据中,发现像”啤酒和尿布”这样具有关联性的规律,并为企业创造价值,但目前这套技术体系,无论在中国还是在世界其他国家,应用都受到一定制约,最主要的原因是,你不是一个数据库专家、统计学专家以及人工智能专家,你将很难用好这样的分析工具。 3、数据仓库与数据挖掘商用价值趋向 从先进国家的经验中我们发现,联机交易处理系统(OLTP)和企业数据信息网两项信息化基础设施是必备的信息技术条件,竞争环境越激烈就越需要数据系统,企业需要了解客户的需求、需要发现经营风险同时还需要进行经营分析和管理,所有这些分析都属于大数据量的分析,采用传统的信息技术将会产生很多局限性,必须依靠一个TB级的数据仓库系统才能解决以上问题。 我个人一直找思考,数据仓库之上的BI应用,思考数据仓库与数据挖掘的商业应用方向,数据仓库并不能直接告诉决策者应该把啤酒和尿布摆在一起,所以企业不能将所有的”宝”都压在数据仓库上。如果说数据仓库是一支好”枪”,那么决策者就应该是”玩枪的人”。 数据仓库中有两大类的应用,分别是在线分析和数据挖掘,在线分析侧重于对所有事务进行多角度的展现,而数据挖掘则侧重于对事务中蕴涵的未知规律进行发现。从业务上看,两者都可以用来发现和总结规律,一种是通过验证某些猜想来发现规律,另一种则是通过数据来找寻隐含的未知规律。 文章引用自: http://blog.sina.com.cn/tbbi 中国离”啤酒与尿布”还有多远?:作者: Qing 20071022 对于BI的这些技术为什么难以应用,我认为还是在于缺乏简洁而满足需求的应用模式,这是无法造成BI应用井喷的关键所在。 一直以来,BI似乎没什么突破性,在技术上,数据仓库可以算是在传统关系数据库上考虑多维建模,以及专门用于海量数据存储、访问的硬件。OLAP,历史也已经很悠久,也有几十年,多位数据库看起来到是一种突破。数据挖掘,大部分是将别的学科,诸如统计、人工智能的技术堆起来,套上方法论。历史上,革命大多是由应用的突破引起的。 比如电的这个东西很早有人发现,富兰克林、伏特、法拉第都有贡献。其中最晚的法拉第已经是19世纪中期,那时候已经有电池的雏形,已经有物理电力线的概念,不过还是等到爱迪生把电灯发明以后,大概也是比法拉第的发现晚几十年以后吧。大家看这东西实在是好,才有需求井喷,然后再广泛布线,普及了。 在看看计算机的发展,也是如此。早先的大型机,都是高端应用,也只有那些学院里面的教授们才能忍受从纸带上读取信息。还是等待PC的出现,才让计算机需求井喷,从而让计算机技术飞速发展。 数据仓库是应用吗?OLAP是应用吗?数据挖掘是应用吗?都不是,都是技术。恐怕最贴近应用的还算是OLAP了,不过他还是太复杂,谁愿意在决策的时候钻来钻去,想到一个新的分析角度它又无能为力了。那个啤酒加尿布的故事,忽悠了不少人,可是它算什么应用,只是一个可以说事儿的点。它是数据挖掘吗?不是,它是可能是挖掘的结论,而且恐怕还不是直接结论,是从业务上进一步解读的结果,这个解读是人的大脑作出的判断。沃尔马和teradata忽悠了这个案例,无非还是说,我们有比较牛比的工具,我们是成功的。这是从利益出发的,大家可以将他看作是广告。 BI,就像现在要死不活的样子,还是生存和死亡的问题,to be or not to be。如果这些技术不能产生简洁而满足需求的应用,那么BI就得歇菜,这些技术打包到其他领域生存。要不就诞生一种牛比应用,BI继续活下去,滋润地很。 可谁知道这牛比应用是什么呢?这就是得突破了,天天构思如何建数据仓库,如何挖掘恐怕是难以突破的,还是得盯住需求,盯住决策者的行为。对此,我想对于BI界同仁来说,确实是BI兴亡,匹夫有责。对于这个问题的思索和不断尝试,也将是ttnn努力去追寻的。 中国离”啤酒与尿布”还有多远?:作者: Jcat 20071023 >因为缺乏简洁的应用,无法带动需求。 >可谁知道这牛比应用是什么呢?这就是得突破了 就像软件界曾经一直期盼的”银弹”一样,BI界何时能等到”重大的突破”呢? 中国离”啤酒与尿布”还有多远?:作者: Qing 20071023 不用去期盼,这个”重大的突破”是每位BI人都可以尝试。文中也提到,当出现了简洁而满足决策需求的分析应用,就是突破。 我想这里面有两个主要问题: 中国离”啤酒与尿布”还有多远?:作者: 玩石20071023 所以说,数据挖掘要剥离出来,并成为一个专业学科和价值应用,必定源于商业应用的决策支持。这中间起很大作用的不单只是技术,只有深入到一定程度,还谈得上技术创新那么,我们能做的更多的是开动脑筯找寻最直接和有效的商业解决方案。 中国离”啤酒与尿布”还有多远?:作者: XL 20071029 啤酒和尿布怎么不是数据挖掘了? 这个数据挖掘里最简单的关联分析,也是商业应用里最直观的数据挖掘,相对容易理解,而且超市里的那种self-check和会员积分,就是要保留客户买卖行为,挖掘客户信息,显然在零售业是成功应用的。 欧盟就有做数据挖掘和BI的项目来确定如何优化欧洲的啤酒市场~这种应用还是不少的。 中国离”啤酒与尿布”还有多远?:作者: hunter 20071031 觉得突破还是在概率/可视化上,自适应/人工智能可能也有点作用。 其实BI这么说起来已经是还没红的红海了,好比internet商业化之后再来琢磨能干个啥?谁能创造一个像电子商务,或者交友网站,或者垃圾邮件这样的模式,就有机会。
|
信息化软件应用目录 OA 办公自动化系统
CRM 客户关系管理系统
PM 项目管理系统
SCM 供应链管理系统
CC 协同商务系统
BPM 业务流程管理
BI 商务智能
CMS 内容管理系统
KM/KBS 知识管理系统
电子商务系统
HRM 人力资源管理系统
ERP 企业资源计划
EAM 企业资产管理系统
|