升藍全文檢索技術簡介
信息時代的知識管理
- 計算機非常容易獲得大量的文檔和資料,在信息時代,我們可以非常容易從企業文檔、產品資料、光盤書庫、百科全書、專業書籍、下載文件獲得大量的電子圖書和文本資料。
- 因此,獲取少量有用的信息遠比獲取大量無序的信息更為重要。
數據挖掘技術才是知識管理、文檔管理的真正核心: 深圳升藍 0755-88290361
- 上面已經提到,在信息時代,取得大量知識文獻是一件容易的事(例如,通過下載,可以在很短時間內建立起百萬數量級的知識庫)。
- 但是僅有大量的知識庫/文獻庫實際上是很難產生效益或用途的:
- 由於計算機文件可複製的特點,使得信息的冗余度和噪音非常高;
- 文件有大量相同主題或副本、文件的質量參差不齊,用戶不得不花費大量的時候在篩選上,效率低下,而且得不到理想的結果;
- 文件數量巨大,版本眾多,用戶信息查詢上使用的成本非常高;
- 如果沒有進行有效的數據挖掘,實際上大量的知識/文檔是沒有用的。
- 例如,當我們遇到問題需要從知識庫中查詢知識的時候,如果知識庫給出的結果是隨機無序的10000個答案,那麼,我們可以說這個結果顯然是沒有使用價值的,如果系統給出10個有序的答案才是有價值的。
- 如何篩選、索引、判斷質量,使有用的文檔能夠被用戶使用,才是知識管理的最重要核心。
升藍的數據挖掘的技術
- 升藍的數據挖掘技術是一種自然語言信息測量的技術,主要應用於搜索引擎。簡單地理解,就是為企業內部網、知識管理系統、文檔管理系統等提供一個類似Google的搜索引擎。
- 信息測量技術是非常複雜的計算過程,通過升藍的數據挖掘的技術的計算,可以得到每篇文檔的信息位置,並編錄為索引。
- 用戶進行搜索時,系統是從關鍵字所預測的主題,從索引的相應的位置的最近空間範圍內取得相應的文檔。具有以下幾項(不僅僅)明顯特點:
- 搜索結果按關鍵字相關度進行排序,能保證最符合用戶請求的搜索結果排列上方的,使用戶可以輕鬆得到相應的知識。
(排序還會考慮文檔的質量和時間效應等因素)
- 可感知關鍵字的相關關鍵字,即使用戶沒有輸入相關關鍵字,也能得到相應的結果。
(如:「學校」和「教育」是兩個不同的詞,但有一定的相關性)
- 可測量文章的關係,並標識相同或相似的文章。
(例如,有一個重要新聞,主要報紙都會報道,每個記者所寫的內容、語文風格都不會相同,但我們沒有必要把所有報紙的報道都讀一遍,使用信息測試技術,可以測試出不同記者編寫同一件事的報道是相同的。)
數據挖掘技術的其他必須功能:
- 可以對Word、Pdf、Excel、Rtf等常見的文件建立索引和預覽頁面。
- 支持中文的分詞技術。
- 實現多條件搜索,如布爾操作,即「和、或、且」等搜索方式。
系統的其他常規搜索功能:
- 快速搜索:在所有界面的表頭有一個快速搜索按鈕,輸入文字,點擊搜索即可。
- 過濾:界面的在表頭有選擇日期、人員、單位等選擇項,指定條件後即可立即顯示搜索結果。
- 精確搜索:可指定一個記錄的全部屬性的任意一個或多個條件搜索。
升藍軟件www.hi-blue.com
|
Customization Software Development
升藍全文檢索技術簡介全文檢索 簡介 搜索 全文檢索技術 技術
定制軟件工程項目介紹
按需求定制軟件產品
升藍標準產品的二次開發
其他軟件產品的定制開發
升藍E-Solution信息中心
公文管理(公文流程)系統
升藍知識管理系統簡介
訂單計劃管理系統簡介
企業培訓管理系統簡介
電子商務網頁設計網站開發
升藍會員管理系統簡介
升藍企業內部網站系統
升藍全文檢索技術簡介
升藍工作流程技術簡介
升藍數據挖掘技術簡介
升藍電子政務系統簡介
搜索引擎優化技術簡介
升藍商業智能系統簡介
ERP業務流程圖簡介
RTX 實時通信系統簡介
RTX 系統的功能特點
RTX 系統的應用價值
定制軟件工程相關下載
關於升藍軟件公司概況
升藍軟件的軟件產品目錄
客戶服務及技術支持
產品資料文檔免費下載
升藍的成功案例分析
升藍的解決方案系列文件
在線試用版本登錄帳號
與升藍軟件公司聯繫
升藍軟件的知識庫文檔
網站導航和網站地圖
網站標籤和文檔索引
網站內容搜索引擎
English Version
Traditional Chinese
|
Copyright © 1999-2011 Shenzhen Hiblue Software Co., Ltd. 深圳市升藍軟件開發有限公司
Url:
www.hi-blue.com
Email: