升蓝全文检索技术简介
信息时代的知识管理
- 计算机非常容易获得大量的文档和资料,在信息时代,我们可以非常容易从企业文档、产品资料、光盘书库、百科全书、专业书籍、下载文件获得大量的电子图书和文本资料。
- 因此,获取少量有用的信息远比获取大量无序的信息更为重要。
数据挖掘技术才是知识管理、文档管理的真正核心: 深圳升蓝 0755-88290361
- 上面已经提到,在信息时代,取得大量知识文献是一件容易的事(例如,通过下载,可以在很短时间内建立起百万数量级的知识库)。
- 但是仅有大量的知识库/文献库实际上是很难产生效益或用途的:
- 由于计算机文件可复制的特点,使得信息的冗余度和噪音非常高;
- 文件有大量相同主题或副本、文件的质量参差不齐,用户不得不花费大量的时候在筛选上,效率低下,而且得不到理想的结果;
- 文件数量巨大,版本众多,用户信息查询上使用的成本非常高;
- 如果没有进行有效的数据挖掘,实际上大量的知识/文档是没有用的。
- 例如,当我们遇到问题需要从知识库中查询知识的时候,如果知识库给出的结果是随机无序的10000个答案,那么,我们可以说这个结果显然是没有使用价值的,如果系统给出10个有序的答案才是有价值的。
- 如何筛选、索引、判断质量,使有用的文档能够被用户使用,才是知识管理的最重要核心。
升蓝的数据挖掘的技术
- 升蓝的数据挖掘技术是一种自然语言信息测量的技术,主要应用于搜索引擎。简单地理解,就是为企业内部网、知识管理系统、文档管理系统等提供一个类似Google的搜索引擎。
- 信息测量技术是非常复杂的计算过程,通过升蓝的数据挖掘的技术的计算,可以得到每篇文档的信息位置,并编录为索引。
- 用户进行搜索时,系统是从关键字所预测的主题,从索引的相应的位置的最近空间范围内取得相应的文档。具有以下几项(不仅仅)明显特点:
- 搜索结果按关键字相关度进行排序,能保证最符合用户请求的搜索结果排列上方的,使用户可以轻松得到相应的知识。
(排序还会考虑文档的质量和时间效应等因素)
- 可感知关键字的相关关键字,即使用户没有输入相关关键字,也能得到相应的结果。
(如:“学校”和“教育”是两个不同的词,但有一定的相关性)
- 可测量文章的关系,并标识相同或相似的文章。
(例如,有一个重要新闻,主要报纸都会报道,每个记者所写的内容、语文风格都不会相同,但我们没有必要把所有报纸的报道都读一遍,使用信息测试技术,可以测试出不同记者编写同一件事的报道是相同的。)
数据挖掘技术的其他必须功能:
- 可以对Word、Pdf、Excel、Rtf等常见的文件建立索引和预览页面。
- 支持中文的分词技术。
- 实现多条件搜索,如布尔操作,即“和、或、且”等搜索方式。
系统的其他常规搜索功能:
- 快速搜索:在所有界面的表头有一个快速搜索按钮,输入文字,点击搜索即可。
- 过滤:界面的在表头有选择日期、人员、单位等选择项,指定条件后即可立即显示搜索结果。
- 精确搜索:可指定一个记录的全部属性的任意一个或多个条件搜索。
升蓝软件www.hi-blue.com
|
Customization Software Development
升蓝全文检索技术简介全文检索 简介 搜索 全文检索技术 技术
定制软件工程项目介绍
按需求定制软件产品
升蓝标准产品的二次开发
其他软件产品的定制开发
升蓝E-Solution信息中心
公文管理(公文流程)系统
升蓝知识管理系统简介
订单计划管理系统简介
企业培训管理系统简介
电子商务网页设计网站开发
升蓝会员管理系统简介
升蓝企业内部网站系统
升蓝全文检索技术简介
升蓝工作流程技术简介
升蓝数据挖掘技术简介
升蓝电子政务系统简介
搜索引擎优化技术简介
升蓝商业智能系统简介
ERP业务流程图简介
RTX 实时通信系统简介
RTX 系统的功能特点
RTX 系统的应用价值
定制软件工程相关下载
关于升蓝软件公司概况
升蓝软件的软件产品目录
客户服务及技术支持
产品资料文档免费下载
升蓝的成功案例分析
升蓝的解决方案系列文件
在线试用版本登录帐号
与升蓝软件公司联系
升蓝软件的知识库文档
网站导航和网站地图
网站标签和文档索引
网站内容搜索引擎
English Version
Traditional Chinese
|
Copyright © 1999-2011 Shenzhen Hiblue Software Co., Ltd. 深圳市升蓝软件开发有限公司
Url:
www.hi-blue.com
Email: