正文 知識組織視野下檔案知識庫的構建思路探析(2 / 3)

2關聯檔案知識點,聚類檔案知識資源

檔案知識點的關聯組織“是將檔案知識及其相互聯係等關係信息也有效地存儲於數據庫中。這就使得原本無序的檔案知識變得易於控製且有序,讓原本孤立的數據呈現出有機的聯係”。[4]例如用戶在查閱數字檔案信息資源時,遇到不了解的人物、事件等時就會產生直接查閱相關文件的需要,通過檔案知識關聯,就可以將數據庫中的相應人物與事件等知識點與之關聯,為用戶提供更高效的服務。而檔案知識資源的聚類組織則“是根據一定的規則將信息或知識按類聚集起來,分別給予相同的類別標記,並將類號賦予相關信息,存儲於數據庫中的過程、技術和方法”。[5]這就將原本分散的檔案知識點按照一定的主題特征聚合在一起,使聚合在一起的檔案知識點具備相同的關聯或特征。經過檔案知識點的分類與標引,檔案知識點已經具備一定的主題與屬性特征,這一層次的檔案知識分別涵蓋各種事件、基本概念、情景、方法、用戶知識需求等知識點,可以滿足用戶低知識層麵的需求,解決用戶的一些較單一問題,可將其直接歸入檔案知識庫中,用以解決用戶單一、低知識密度的問題。而通過檔案知識點的關聯組織和聚類組織,形成知識密度較高且橫向關聯的檔案知識單元,如檔案文摘、索引、題錄等形式的檔案知識產品,實現檔案知識點的優化組合,檔案知識密度大為提升,可以解決用戶較複雜的問題,滿足用戶較高層次的檔案知識需求。

3挖掘推理檔案知識單元,組織關聯檔案知識語義

通過對檔案知識單元進行挖掘、推理、語意關聯等形式的知識組織,可以進一步增強檔案知識單元的知識密度,滿足用戶更高層次的檔案知識服務需求。檔案知識單元的語意組織“是將信息及信息間的語義關係存儲起來,構成具有語義關係的數據庫。在檢索和分析時,通過建立的語義關係,進行語義推理實現知識服務”。[6]檔案知識單元的語義組織與關聯將數據庫中檔案知識的原有記錄、字段的關係上升到知識間的語義關係,保證了檔案知識間的關聯與再生及隱性知識的呈現。這種語義關係非常豐富,例如檔案中事件與事件間語義關係、人與人之間的親屬關係及隸屬關係、不同主題間的語義關係等。通過檔案知識單元的挖掘、推理、語意關聯等知識組織,改變了原有檔案知識單元間的顯性聯係,產生了新的關聯與知識,形成檔案綜述、檔案百科全書、檔案年鑒、檔案主題庫等更高知識密度的檔案知識資源,即檔案知識簇,真正實現檔案資源有序化,有序檔案資源知識化,最終實現檔案知識資源服務化。

4再分析各層檔案知識,再生並利用檔案新知識

經過檔案知識點的關聯與聚類、檔案知識單元的挖掘推理與語意關聯而形成的檔案知識簇已經具備很高的知識密度,可以存入檔案知識庫中,服務於用戶高層次的檔案知識需求。然而檔案知識簇層麵的檔案知識仍不是最高層次的知識實現,還可以通過知識挖掘與推理等實現檔案知識的進一步升華,即檔案知識的再生,這也是借助檔案知識單元、知識關聯、檔案信息資源等,通過挖掘、推理、演繹、歸納等方法形成新的檔案知識的過程。這一過程需要融合用戶的需求及知識組織的背景,對用戶需求及檔案知識資源進行不同層次的細分、關聯、挖掘與推理,運用統計分析、機器學習、神經網絡等方法,分析出新穎、有效、潛在有用的規律等新知識。比如對用戶查檔新規律的歸納進而為用戶提供智能化推薦服務,這裏歸納出的新規律就是再生的檔案知識。檔案知識的再生過程也可以是從檔案知識簇到檔案知識點的逆向細化的過程,而在這一逆化過程的推理中也可能產生檔案新知識。檔案“再生知識產生過程中遵循有效性、新穎性、潛在有用性以及最終可理解性原則”,[7]以保證新生的檔案知識、規律、模型等對於新的數據仍有一定的適用性,對於用戶問題的解決以及社會實踐的發展仍然具有實際效用。通過知識分析、推理、挖掘等再生的新知識在形式、內容等方麵可能存在一定的問題,需要對其進行檢查修正,結合檔案用戶實際使用狀況及反饋等情況適當調整新知識,按照標準的規則修正再生的檔案新知識,然後直接放入檔案知識庫中服務於用戶。