檔案信息計算機的檢索
信息工作
作者:王萍
一、檔案信息計算機檢索的特點
一是信息存儲量大、檢索速度快、檢索效果好。二是檢索途徑多元化。三是檔案信息的檢索對計算機係統的依賴性強。運用計算機檢索檔案信息的查全率、查準率與檔案工作者、利用者熟練掌握計算機檢索文檔的知識及檢索技能的掌握有著密切的關聯,特別是在檔案信息服務經濟建設和服務民生工作中,要求檔案工作者不僅要掌握計算機檔案檢索知識,而且要向廣大的利用者普及檔案檢索知識,才能有效地提高檔案信息的利用效益,極大地擴展檔案工作的社會影響力,提高檔案工作的社會地位。
二、檔案計算機檢索係統的建立
建立功能完善的檔案計算機檢索係統,應科學地進行檢索流程和檔案信息檢索級別設計。
(一)計算機檢索流程設計。檔案計算機檢索流程包括檔案文獻信息的輸入和檔案文獻信息的輸出兩部分。
1 檔案文獻信息的輸入。計算機文獻檢索係統的基礎是數據庫的建立,包括文獻的選擇、標引、加工和輸入等一係列的過程,數據庫的數據數量和質量對於計算機檢索係統的性能具有直接影響。為適應檔案現代化管理需要,建立統一的檔案檢索和管理體係,更好地開發檔案信息,實現檔案信息共享,目前,我國各省(市)國家檔案館均製定了《綜合檔案館電子目錄數據庫結構與交換格式》。該標準分別製定了適用於文書立卷改革前的檔案目錄的《案卷級目錄數據庫結構與著錄格式》和適用於按照DA/T22-2000《歸檔文件整理規則》整理的檔案目錄的《文件級目錄數據庫結構與著錄格式》。文檔管理係統機讀目錄輸入規範,采用1992月1日實施的《檔案著錄規則DA/T 18-1999》的著錄項,文檔管理軟件在案卷級著錄和文件級著錄選取的主要著錄項目字段有:題名、並列題名、文件編號、責任者、附件、稿本和文種、密級與保管期限項、文件形成時間項、載體類型、數量及單位、分類號、檔案館代號、檔號、電子文檔號、縮微號、主題詞或關鍵詞。
2 檔案文獻信息的輸出。利用者根據對檔案文獻的信息需求,編製恰當的檢索條件,形成檢索表達式,並將其輸入計算機,在數據庫查找後將結果輸出。
(二)檔案信息檢索級別設計。檢索級別是衡量檢索深度和檢索精度的重要標準。檔案信息計算機檢索,檢索級別越小、越低、內容越具體,說明檢索的精度越高、檢索的深度越深。
1 案卷級檢索。案卷級檢索是指檢索出的檔案隻能是案卷級目錄,而無法一次檢索出其卷內的具體文件,其檢索依據是用案卷目錄來建立的案卷級目錄數據庫。檔案工作者都知道擬寫案卷題名是一件比較困難的事情,規定字數不能超過五十個漢字,且題名要盡可能涵蓋卷內文件的內容,即案卷題名的內涵盡可能等於卷內文件的外延。由於檔案工作者水平不一,擬寫的案卷題名涵蓋不了該案卷所有的文件內容。檢索文書檔案內容方麵,檔案館(室)很少采用案卷級檢索功能,而在科技檔案和專門檔案檢索中經常使用。
2 文件級檢索。利用計算機檢索工具不僅可以按著錄項目進行單項檢索,還可以把若幹項目結合起來檢索,均可檢索出具體的文件(即文件級檢索),以滿足利用者獲取檔案信息的需求。作為文件級檢索,是檔案館(室)經常采用的檔案文獻檢索手段,其具有一次輸入、多次輸出、多樣化輸出的功能。文件級檔案文獻的查準率和查全率,取決於操作者對檔案著錄項目的組合而設置檢索條件,凡輸入計算機的每一個檢索著錄條目為一個檢索入口,如把文件的責任者、題名、時間3項目結合起來檢索,可以獲得滿足這3個檢索條件的檔案文獻。在檢索工具中還可通過主題標引和分類標引的手段揭示出文件內容所涉及到的概念性主題或所屬邏輯類別,這類檢索有時被稱為“內容級檢索”。但因文件內容不能脫離開文件而單獨存在,檢索成果依然是一份份的文件,所以“內容級”嚴格說起來無法成立,隻能歸入“文件級”。