2004-05-20
摘要:文章从个性化服务系统和数据挖掘技术的特点出发,提出了一种基于数据挖掘的个性化服务系统的设计模型,并提出了个性化服务系统的简单评价方法。 关键词:个性化服务 数据挖掘 系统评价 基于数据挖掘的个性化服务系统设计与评价:一、个性化服务系统及其特点: 个性化服务系统是以用户为中心的服务系统,其核心是服务内容和服务方式的个性化,即想用户所想,最大限度满足用户的需求,一个好的个性化服务系统应该可以预见用户的潜在需求,从而更好地为用户服务。现代市场竞争的不断加剧、信息时代信息过载与无序、用户需求的不断变化,直接导致了个性化服务系统的产生。而个性化服务系统本身则充分体现了服务接受者和服务提供者的双赢。要实现一个好的个性化服务系统,需要对用户的行为与心理进行分析,准确的把握用户需求,从而提供有针对性的服务。数据挖掘技术为个性化服务系统的构件提供了强大的技术支持。 基于数据挖掘的个性化服务系统设计与评价:二、据挖掘技术 数据挖掘(Data mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又潜在有用的信息和知识的过程。随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多,而这些激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。数据挖掘可以理解为一类深层次的数据分析方法,由数据挖掘所得到的信息具有先未知性、有效性和可实用性。 从不同角度看,对于数据挖掘有不同的分类方法。例如,按照发现知识的种类可以分为总结规则挖掘、特征规则挖掘、关联规则挖掘、分类规则挖掘、聚类规则挖掘、趋势分析等,按照挖掘的数据库可以分为关系型、变量型、面向对象型、主动、异质数据库等;按照采用的技术分有人工神经网络、决策树、遗传算法、可视化法等。 数据挖掘技术从一开始就是面向应用的,目前,在很多领域,如银行、电信、保险、交通、零售(如超级市场)等商业领域,数据挖掘技术都得到了较好的应用。例如通过数据挖掘进行客户群体划分、背景分析、交叉销售等市场分析行为,以及客户流失性分析、客户信用记分、欺诈发现等商业智能分析。 基于数据挖掘的个性化服务系统设计与评价:三、构建基于数据挖掘的个性化服务系统 构建基于数据挖掘的个性化服务系统。主要是通过对相关知识库、企业历史数据、业务数据和用户日志的挖掘,并在用户的反馈信息挖掘中不断修正来实现的,一个基于数据挖掘的个性化服务系统可以简要描述为如下模式: 1.个性化服务方案: 2.企业门户: 3.用户资料库 4.用户日志: 5.已有的知识库: 6.业务数据中心: 7.用户反馈: 8.数据挖掘: 9.用户规则生成: 10.临界规则: 11.定期评价: 在个性化服务系统中,数据挖掘技术应用于挖掘基于时间序列的数据、基于关联规则的数据等,数据挖掘方法有自动聚集、决策树、神经网络等。挖掘基于时间序列的数据是从时间角度来分析数据的变化发展规律,发现数据之间潜在的规则和联系。挖掘基于关联规则的数据是通过相关数据的分析来得到新的知识规则。自动聚集是对大量数据按照一定的属性或方法归纳,发现相关性。决策树通过树的方式分类数据,为决策提供所需的支持。 例如,对于一个滑雪场的个性化服务系统,可以通过决策树的方式来分类客户,从而针对不同的用户定制或调整不同的个性化服务。假设滑雪场用户资料的数据如表1所示: 对于表1中数据可以通过ID3算法生成一棵判定树,具体过程为:按照用户接受不同的服务方案A和B对客户进行分类,用户的属性为年龄、性别和学历,计算信息量最大的属性,依次来划分,如果每个叶子节点包含的用户都属于同一个方案的接受者,则停止划分,否则继续寻找信息量最大的属性进行划分。直到所有的叶子节点包含的用户都是同一个方案的接受者停止。对于滑雪场的用户按照性别属性来说: 因为有4个女客户接受了方案A,2个女客户接受了方案B,所以利用基于熵(平均信息量)的函数计算可得: E是基于熵的函数,所以E值最小的属性年龄是信息量最大的属性。年龄作为被划分的属性,得到判定树如下: 进一步计算性别和学历属性的信息量可得E(性别)=4,E(学历)=6.490,选择性别作进一步划分,重复以上步骤,最终可以得到一棵最优判定树。 通过以上方法进行客户的划分之后,个性化方案的设计者可以考虑利用这一分类和其它信息相结合,从而制定有针对性的个性化服务方案,例如当系统提供一项新方案,该方案是A方案的扩展服务,在其他因素变化不是很大的情况下,可以首先将该方案提供给年龄在20-30岁的人进行选择。 ID3算法在一般情况下都能找出最优判定树。但不具备增量学习能力,ID5R算法是ID3算法的一个增量式变体。关于ID5R算法的详细介绍可以参阅参考文献3。数据挖掘集成了很多经典的技术方法,作为个性化服务系统,应该根据各种技术方法的优势和特点为个性化服务提供不同的有针对的支持。 个性化服务系统的另一个突出特点是交互性,即客户反馈和评价对于个性化方案的制定尤为重要,在这里只介绍通过用户反馈方式对个性化服务系统的评价方法。 1.个性化服务方案的认同评价 其中,
表示对于方案A用户实际接受的服务参数个数,n表示方案A提供服务的所有 2.整体个性化服务系统的满意度评价 其中,Sti表示第i个用户对第t次服务的评分,n表示参加系统评价的用户数量,t表示提供的服务次数,Emax表示系统给定的最大评分值。利用此方法既可以对某一类或几类服务方案进行评价,也可以对整体个性化服务系统进行评价。 基于数据挖掘的个性化服务系统设计与评价:五.优缺点分析 建立在数据挖掘基础之上的个性化服务系统充分利用了强大的数据挖掘技术优势,集成了用户的整体信息分析,并且通过设立临界点和临界规则检测可以及时的根据用户反馈调整个性化服务,例如,存储用户信息为向量表示,根据用户反馈调整向量,当某一个值或者某几个值达到临界点则改变个性化方案。临界点和临界规则检测可以为单个用户设立,也可以为某一类用户设立。对于用户反馈的数据挖掘还可以实现临界点和临界规则的自动调整,充分显示了智能个性化的特征。 个性化服务系统在利用数据挖掘技术上的实现仍然存在许多需要加以改善的地方,例如数据挖掘方法的选择和实用性问题,挖掘方法所受影响因素的分析问题,如何更好的考虑客户的心理与客户的行为差,用户兴趣变化的动态跟踪、以及知识库的质量和适用程度,都将影响到个性化服务方案制定得最终效果。同时个性化服务系统存在用户信息的保护问题,尤其是网络服务对用户日志挖掘的信息保护,是个性化服务系统设计、开发与评价需要注意的问题。
|
信息化软件应用目录 OA 办公自动化系统
CRM 客户关系管理系统
PM 项目管理系统
SCM 供应链管理系统
CC 协同商务系统
BPM 业务流程管理
BI 商务智能
CMS 内容管理系统
KM/KBS 知识管理系统
电子商务系统
HRM 人力资源管理系统
ERP 企业资源计划
EAM 企业资产管理系统
|