升蓝数据挖掘技术简介
- 数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
- 数据挖掘的功能:
- 数据挖掘通过预测未来趋势及行为,做出基于知识的决策,数据挖掘也用于具备相关度功能的全文检索引擎。
- 数据挖掘的目标:
- 是从数据库中发现隐含的、有意义的知识。
- 信息摘要和全文检索:
- 通过数据向量化分析,可对文本信息进行度量,度量的结果通常用于搜索引擎,在信息度量基础上建立的搜索引擎,不是简单文字的搜索,而是经过优化的与主题相关度的搜索引擎。
- 数据采集:建立在数据挖掘技术上的数据采集,可根据“预计主题”在互联网上有目的地采集信息,如可采集相关行业的各种数据资料、创建潜在客户资料库等。
- 自动预测趋势和行为:
- 数据挖掘自动在大型数据库中寻找预测性信息,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。一个典型的例子是市场预测问题,数据挖掘使用过去有关促销的数据来寻找未来投资中回报最大的用户,其它可预测的问题包括预报破产以及认定对指定事件最可能作出反应的群体。
- 关联分析:
- 数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。
- 聚类:
- 数据库中的记录可被化分为一系列有意义的子集,即聚类。聚类增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。聚类技术主要包括传统的模式识别方法和数学分类学。在划分对象时不仅考虑对象之间的距离,还要求划分出的类具有某种内涵描述,从而避免了传统技术的某些片面性。
- 概念描述:
- 概念描述就是对某类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述不同类对象之间的区别。生成一个类的特征性描述只涉及该类对象中所有对象的共性。生成区别性描述的方法很多,如决策树方法、遗传算法等。
- 偏差检测:
- 数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。偏差包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。偏差检测的基本方法是,寻找观测结果与参照值之间有意义的差别。
深圳升蓝软件公司
|
Customization Software Development
升蓝数据挖掘技术简介搜索引擎 数据挖掘 数据库 数据 挖掘
定制软件工程项目介绍
按需求定制软件产品
升蓝标准产品的二次开发
其他软件产品的定制开发
升蓝E-Solution信息中心
公文管理(公文流程)系统
升蓝知识管理系统简介
订单计划管理系统简介
企业培训管理系统简介
电子商务网页设计网站开发
升蓝会员管理系统简介
升蓝企业内部网站系统
升蓝全文检索技术简介
升蓝工作流程技术简介
升蓝数据挖掘技术简介
升蓝电子政务系统简介
搜索引擎优化技术简介
升蓝商业智能系统简介
ERP业务流程图简介
RTX 实时通信系统简介
RTX 系统的功能特点
RTX 系统的应用价值
定制软件工程相关下载
关于升蓝软件公司概况
升蓝软件的软件产品目录
客户服务及技术支持
产品资料文档免费下载
升蓝的成功案例分析
升蓝的解决方案系列文件
在线试用版本登录帐号
与升蓝软件公司联系
升蓝软件的知识库文档
网站导航和网站地图
网站标签和文档索引
网站内容搜索引擎
English Version
Traditional Chinese
|
Copyright © 1999-2011 Shenzhen Hiblue Software Co., Ltd. 深圳市升蓝软件开发有限公司
Url:
www.hi-blue.com
Email: