正文 第一節 信息檢索概念與類型(1 / 2)

一、信息檢索的概念

信息檢索(Information Retrieval,簡稱 IR)最早由美國信息科學先鋒莫爾斯(Calvin Northrup Mooers(1919—1994))於20世紀50年代最先提出,他認為信息檢索是一種“誕生性通信形式”,其本質就是一種通信。也有人把信息檢索看成是計算機科學的一個分支,認為信息檢索已經超出了文獻檢索的範圍。而目前絕大部分學者所說的信息檢索是僅從文獻信息查找的角度來定義的,他們認為信息檢索是指將信息按一定的方式組織和存儲起來,並根據用戶的需要找出有關信息的過程。所以,它的全稱是信息存儲與檢索(information storage and retrieval),此為廣義的信息檢索,包括“存”和“取”兩個部分,而狹義的信息檢索則僅指有序化信息的檢索查找,即“取”的部分,相當於信息查詢(Information Search)。在通常情況下,當人們講到“信息檢索”時,指的是狹義概念。

二、信息檢索的類型

根據不同的劃分方法,信息檢索可劃分為不同的種類,下麵介紹幾種常用的劃分方法。

(一) 按檢索手段劃分

1、手工信息檢索

手工信息檢索是指利用各種印刷型檢索工具,以手工操作的方式來查找文獻的一種方法。這是一種信息檢索的傳統方式,發展到現在已有一個多世紀的時間。其優點是檢索準確性高,缺點是檢索效率低、速度慢、工作量大。檢索方法有順查法、倒查法、抽查法、追溯法、循環法等。

2、計算機信息檢索

計算機信息檢索指人們在計算機或計算機檢索網絡的終端機上,使用特定的檢索指令、檢索詞和檢索策略,從計算機檢索係統的數據庫中檢索出需要的信息,繼而再由終端設備顯示或打印的過程。計算機信息檢索包括脫機信息檢索、聯機信息檢索、光盤信息檢索和網絡化信息檢索。

與手工檢索相比,計算機檢索效率高、速度快、範圍廣、查全率高,雖然也有高檢索費用和低查準率等缺點,但隨著計算機技術、通信網絡技術的發展,計算機檢索已逐漸取代手工檢索,成為主要檢索形式。

(二) 按檢索對象劃分

1、文獻檢索

文獻檢索是指以文獻為對象的檢索。查找某一主題、時代、地區、著者、文種的有關文獻,及其出處和收藏處所等。文獻檢索一般使用文摘、目錄、索引、全文等檢索工具及其對應的數據庫和網絡資源。

2、數據檢索

數據檢索是指以數值或數據為對象的檢索。數據檢索是檢索出包含在文獻中的具體信息,如數據、公式、圖表或化學分子式等。數據檢索一般使用各種數值數據庫和統計數據庫。

3、事實檢索

事實檢索是指以某一客觀事實為對象進行檢索或對已有的數據進行邏輯推理後得出新的事實的過程。事實檢索也是檢索包含在文獻中的具體信息,如某一事物發生的時間、地點、過程等。事實檢索一般使用各種指南數據庫和全文數據庫。

在以上三種檢索中,文獻檢索是最典型、最重要和最常用的檢索方法。因為,數據檢索和事實檢索都要以文獻為依托,用戶所需的數據或事實不能脫離文獻而單獨存在,這些數據或事實也是反映信息的一種形式,或者說是反應信息的一種特殊形式,因此,他們可以被視為文獻檢索的特例。文獻檢索與數據檢索和事實檢索二者的差異主要在於提供給用戶的信息不同:對於文獻檢索,檢索人員通常把檢索出來的相關文獻提供給用戶,由用戶自己來瀏覽、領會、吸收和利用文獻的信息內容,從而滿足其信息需求;而對於數據或事實檢索,檢索人員需要把文獻中相關的數據或事實提供給用戶,直接滿足用戶的信息需求。

關於按檢索對象對信息檢索進行的劃分,也有學者將信息檢索劃分為文本檢索、數值檢索和音頻與視頻檢索。新的三分法較全麵地反映了信息檢索的概念內涵和最新發展。