四、檔案信息計算機檢索技巧
我國各地國家公共檔案館和機關、企事業單位檔案(館)室使用的文書檔案管理係統,都具有檔案信息計算機檢索功能。計算機檔案信息檢索模塊最常用的邏輯與關係(AND)、邏輯或關係(OR)和邏輯非關係(NOT)3個表達式,為計算機檔案檢索係統的編程規範。提供給檔案信息獲取者使用的檢索界麵,基本上按照《檔案著錄規則DA/T 18-1999》的著錄項設置檢索入口。
在檔案信息檢索中,掌握一些檢索技巧能夠極大地提高檔案利用者檔案信息檢索能力。
(一)題名表述準確。檔案信息計算機檢索最基本同時也是最有效的技巧,就是選擇合適的檢索詞。檔案檢索係統會嚴格按照檔案利用者提交的檢索詞去檢索檔案信息。為此,檢索詞表達準確是獲得良好檢索結果的必要前提。常見錯誤是對檔案信息的表達不準確。例如,要查找《國有企業資產與產權變動檔案處置暫行辦法》,檢索詞可以是“國有企業資產與產權變動檔案處置暫行辦法”,如果把“暫行辦法”檢索詞換成“管理規定”,檢索結果不能滿足需求。另一類典型的表達是不能掌握不同曆史時期檔案文件的題名用語。例如,
“知識青年上山下鄉”,在題名檢索入口輸入“知識青年農村勞動”,就沒有“知識青年上山下鄉”的文件出現。還有一種類型是檢索詞中包含錯別字。例如,要查找“檔案專業任職資格”,用“檔案專業任職資格”,就可以檢索出有關檔案專業任職資格的檔案,但如果寫錯了字,變成“檔案職業任職資格”,其檢索準確率就達不到檔案查詢的指標要求。
(二)正確選擇檔案信息檢索項目。檔案軟件檢索界麵,基本上包含了《檔案著錄規則DA/T 18-1999》的所有項目,但在檔案館(室)日常查詢檔案資料工作中,並不是所有的機讀著錄條目都要輸入檢索條件。我們把機讀著錄條目按照使用頻率分為三級:一級為使用頻率較多的著錄條目,包含:題名、文件編號、責任者、檔號、文件形成時間項。二級為使用頻率一般的著錄條目,包含:分類號、檔案館代號、電子文檔號、縮微號、主題詞或關鍵詞、密級與保管期限。三級為使用頻率較少的著錄條目,包含:並列題名、附件、稿本和文種、項載體類型、數量及單位。
(三)檢索詞的主題關聯與簡練。為提高檔案信息資料的查全率,在文件題名檢索入口把查詢檔案的主題提煉成簡單的,而且與希望找到的信息內容主題關聯的檢索詞,檔案利用者最好學會使用兩個關鍵詞檢索,兩個關鍵詞中間用“+”關聯,並且合理地與使用頻率較多的一級著錄條目進行檢索條件組合。例如,查詢《城市建設檔案歸屬與流向暫行辦法》檔發字(1997)20號,國家檔案局1997年7月28日印發。檢索條件組合如下:
題名:“城市+建設檔案+歸屬”
責任者:國家檔案局
時間-
或題名:“城市建設+檔案+流向”
文件編號:檔發字(1997)
時間-
輸入檢索主題的質量關係到文件的查準率。實踐中得出經驗,題名檢索入口每個關聯詞組不要超多5個漢字,因為大多數的檔案利用者輸入漢字越多與計算機文件級數據庫匹配運算吻合機率越低。在檔案檢索中,檔案信息利用者要養成使用多個關鍵詞檢索的習慣,在檔案信息檢索時大多數情況下使用兩個關鍵詞檢索已經足夠了,關鍵詞與關鍵詞之間以“+”隔開,關鍵詞以2至4個漢字為宜。
檔案信息檢索正向全文文本、多媒體、多載體、跨平台等新型信息檢索的方向發展,為提高檔案信息的利用效果,檔案信息利用者掌握檔案信息檢索知識與檢索技巧能極大地提高檔案信息的查全率和查準率,檔案工作服務能力得到顯著提高。