計算機檢索與國際聯機檢索(3 / 3)

2.輔助索引檢索途徑。這是指非主題檢索途徑,即以文獻資料的外部特征進行檢索。采用這種檢索方式應盡可能利用與數據庫配套的各種分類表、代碼表等。如WPI數據庫配有“國家專利分類表”,“德溫特分類表”等。輔助索引既可以作為檢索入口,進行單獨檢索,也可以作為主題途徑檢索的一種輔助手段,如在進行主題檢索時,加上年代限製、語種限製、作者限製等,提高查準率。

二、製定檢索策略的方法

為了確保檢索的準確、高效、迅速,檢索策略必須準確地表達讀者或用戶的意圖,必須正確體現對數據庫中儲存的文獻特征的充分了解。要製定出這樣一個正確的檢索策略,就必須編寫好檢索提問式。而編好檢索提問式,必須掌握好檢索詞、邏輯算符、位置算符、截詞符和係統規定的檢索指令。

(一)邏輯算符。邏輯算符是表示讀者或用戶不同邏輯思想的工具,其功能是把一些簡單概念的檢索單元組合成複雜概念的檢索提問表達式,貼切地反映讀者或用戶的思想。通過歸納,可以看到單元組合有三種邏輯關係:AND、OR和NOT。

1.AND(或者符號*)——邏輯“與”關係。這個關係也稱作是邏輯積,表示限定性關係的組合,其含義是檢索的內容是檢索詞A與檢索詞B相重合的那部分文獻資料,目的是縮小檢索的範圍,增強檢索結果的專指性。但應該認識到,AND算符不能不加限止地使用,否則會導致檢索出現零結果。例如檢索詞A是“COLOUR”,在數據庫中有文獻資料239篇;檢索詞B是“TELE-VISION”,在數據庫有文獻資料576篇;用了算符AND後,是取兩者的交合部份,共有文獻資料73篇。這個檢索的提問式是:AANDB或A*B

2.OR(或者符號+)——邏輯“或”關係。這個關係也稱作邏輯和,表示並列關係的組合,其含義是檢索的內容是檢索詞A與檢索詞B包括範圍內的那部分文獻資料,目的是擴大檢索的範圍,提高檢索結果的查全率,防止漏檢。例如檢索詞A:“SENSOR”,在數據庫中有文獻資料732篇;檢索詞B:“DETECTOR”,在數據庫中有文獻資料504篇;使用算符OR以後,是選取兩者的全部外延之和,共有文獻1126篇。這個檢索的提問式是:

AORB或A+B

3.NOT(或者符號-)——邏輯“非”關係。這個關係也稱作邏輯非,表示排斥性關係的組合,其含義是檢索的內容是從檢索詞A中取出檢索詞B的那部分文獻資料,目的是從原有的檢索範圍中去除影響檢索結果的內容,提高檢索的正確性。例如檢索詞A:“ENERGY”,在數據庫中有文獻資料79270篇;檢索詞B:“NU-CLEAR”,在數據庫中有文獻資料53220篇;用了算符NOT後,是取兩者中的部分外延。這個檢索的提問式是:

ANOTB或A—B

(二)位置算符。

位置算符也叫全文邏輯算符。它用於表示詞與詞之間的相互位置關係,其目的是增強選詞指令的靈活性,它比邏輯算符更能表達複雜的概念。通常應用的位置算符有W;nW;nN;F;S;L;C;X;nX。

W:這裏的W是With的縮寫,表示算符兩側的檢索詞之間隻能空格或者是標點符號,不得有其它字或詞,且順序不能顛倒。nW:這裏的W是Word的縮寫,表示兩個詞之間最多有n個詞,兩側位置不能顛倒。

nN:這裏的N是Near的縮寫,表示算符兩側允許插入n個詞,且原來兩側詞序可變,但彼此要鄰近。

F:這裏的F是Field的縮寫,表示兩個詞可在一篇文獻中查找,不分詞序先後。S:這裏的S是Sentence的縮寫,表示兩詞同時出現在一個句子或片語中即算命中,詞序可任意變動,且兩詞間可加任意個詞。L:這裏的L是Link的縮寫,表示兩種作用,可表示前後兩側的檢索詞是敘詞字段的規範詞,不須再加後綴“/de”,係統便會自動進入DE字段查找;也可表示兩側檢索詞是從屬關係,後者從屬於前者。

C:這裏的C是Citation的縮寫,其作用與邏輯與相似,即表示兩側詞可在一篇文獻中查找,不分詞序先後,也不分字段。X:表示兩個相鄰且又詞形相同的詞作為詞組進行檢索,其間隻能是“-”號而不得有其它的字母或詞。

nX:表示兩個詞形相同的詞,其間夾有“n—1”個其它的詞,作為詞組進行檢索。

(三)截詞符。截詞符就是在檢索詞的兩側或一側加上一個“?”或數個“?”,表示檢索詞在數據庫中搜查的範圍。這個符號的運用,出於西方語言的特點。在西方語言中,一個詞幹加上不同的前綴、後綴就可以派生出許多新詞,或者使詞性發生變化。為了做到一詞多用,防止漏檢,節省聯機時間,可用以下四種截詞符。

1.前方一致——後截斷。它的表達式是“詞幹+“?”(或詞幹+“??”或詞幹+“???”)

在詞幹後加上一個“?”,稱作無限截斷,表示在詞幹後可以加任意個字符或者不加字符。如:Computer?可表示檢索:Computer。Computerised

Compaterization

Computer……

在這裏Computer是詞幹,表示前方凡有Computer這個詞,皆屬檢索範圍。因此,前方一致使用“無限後截斷”時,詞幹的字母不能太少,否則會造成大量的誤檢,甚至溢出,使檢索失敗。

2.後方一致——前截斷。它的表達式是:“?”+詞幹(或“??”+詞幹或“???”+詞幹)。

在詞幹前隻加一個“?”,稱為無限前截斷,表示在詞幹前可以加上任意個字符。如?Computer,表示:Microcomputer

……computer

有限字符的用法與後截斷相對應。

這種方法可以把與主題意義相關的詞集中起來,加強詞族性的檢索功能。由於這種方式對檢索技術的要求較高,所以,一般的聯機係統不采用。

3.中間一致——前後截斷。它的表達式是:“?”+詞幹+“?”(或??+詞幹+??或???+詞幹+???)。表示在詞幹的兩側可以加上有限個或無限個字符,其用法與前截斷、後截斷相對應。4.中間不一致——中截斷。它的表達式是“字母+?+字母”(或“字母+??+字母”,或“字母+???+字母”)中間需要加幾個字母,使添上幾個“?”。例如:m?n,表示man,men。這種方法又叫做屏蔽法,主要用於不同拚法和單複數變化等問題,避免因拚法異常而多項選詞,以減少輸入步驟,提高檢索效率。

邏輯算符、位置算符和截斷算符都是限定檢索詞或檢索語、構成檢索提問式的重要組成部份,體現著檢索係統的功能。在製定檢索策略時,一般的方法是先分析課題中包含哪些概念,找出表達這些概念的各種關鍵詞。然後,運用邏輯算符、位置算符和截斷算符把它們連接起來。一般說來,同時出現的詞越多,詞與詞之間的相對位置限製得越嚴,查準率就越高,但漏檢的可能性也越大;同時出現的詞越少,詞與詞之間的位置關係越鬆散,查全率就越高,但誤檢的可能性越大。讀者或用戶應根據課題的內容、文獻資料量的多少以及檢索的目的,靈活運用上述方法,以便獲得最佳的檢索結果。