正文 第25章 計算機和互聯網的前沿技術在數字圖書館的應用(1)(2 / 3)

由此可見,Z39.50在自動化圖書館時期主要是為了檢索不同係統軟件間MARC格式的文獻書目數據,而到了數字化圖書館,是要通過Z39.50和萬維網瀏覽器遠程訪問書刊的全文數據庫,從過去的書目數據檢索到全文檢索。

二、多媒體信息存貯和檢索技術

在前一章提及數字圖書館文獻和信息的存貯檢索和閱讀,不僅僅局限於過去的用眼“視”,而且可用耳“聽”,將來甚至可以用鼻子“聞”。要實現這些,需要強大而前沿的技術支撐。

20世紀90年代,國外就有人開始了基於內容的多媒體信息檢索方麵的研究。過去,人們習慣用概念和詞句來查詢文獻信息,現在可以用視覺(如一幅山水圖,可代替一篇散文讓讀者去品味),聽覺(一首歌曲,一部交響樂讓人去感受氛圍)。所以,計算機通過掃描儀、攝像機、數碼像機、話筒在線輸入靜態或動態(影視)的圖像、音頻作為查詢的樣本和條件。

多媒體具有各種視覺和聽覺特征以及其他時間和空間關係的特征。對於同一種特征,有不同的表示方法。例如,同樣是顏色特征,可以有直方圖特征、顏色集、主顏色等多種特征表示法,它們從不同的角度表示媒體的特征,而如何有機地組織這些多種特征,使應用能夠調用合適的特征表示來支持查詢,並按照用戶的查詢要求合並各種特征的檢索結果,是一個值得研究的問題,綜合利用兩種和多種媒體的特征,容易達到較高的檢索率。典型的例子是檢索足球比賽中的進球鏡頭,如果僅僅利用視頻特征,則難度很大,但如果綜合考慮到音頻特征,檢測出觀眾的歡呼聲和解說員興奮的關鍵詞,就容易準確定位。因此,這裏的問題是,如何綜合利用多種異構特征支持用戶的查詢?各種單一特征的查詢結果如何融合?如何利用特征之間的互補能力提高檢索效率?如何既考慮一般性特征,又考慮特定領域的特征?

綜合還意味著采納其他學科領域的成果,如傳統的基於文本的信息檢索技術、知識發現、人工智能等領域中的方法,像布爾檢索模型、多個異構特征查詢表達和檢索執行、知識庫、分類和聚類算法、用戶交互行為的機器學習等。

在學校教育教學中,這種技術尤顯重要。課程教材改革後,教師備課授課方式發生了較大變化,用多媒體課件來授課,則是再好不過的現代化教具了。但在製作這些課件時,就需要在數字圖書館查詢本館及網上多媒體信息資源,組合編輯成自己的教學課件。這就要數字圖書館提供大型媒體庫和集成檢索中超常規數據庫的索引能力。這對計算機、網絡和交互檢索的軟件接口提出了極高的要求。由於這些新技術不斷地被提出,不斷地被攻克,才使得數字圖書館在人們的認識上和實踐中,不停地得到發展。我們學校圖書館的人更要學習和了解這些新知識,才能為學校圖書館現代化建設中提供科學的意見和方案。

三、聲頻、視頻傳輸中的流媒體技術

當圖書館計算機自動化發展到聲像資料的借閱播放階段時,傳統圖書館文獻收藏和讀者服務管理及技術也發生了重大的變化。然而,在傳統圖書館自動化管理中的聲像閱覽,是用磁帶和光盤進行自然播放,技術要求相對低,而到了數字圖書館,讀者搜索閱讀瀏覽和收聽的視頻動態圖像及聲頻音樂等,並不是用磁帶和光碟在播放器上播放,而是檢索和遠程訪問。從網站的多媒體資源庫通過網絡傳輸與適時收視電視台播放的節目不一樣,用戶不再是被動接收,而是個性化地發出檢索要求,到對方多媒體庫中邊“抓”,邊看和邊聽。視聽內容的請求方,隻要有所約定的權限或存貯方願意無償提供,那麼這兩端全都是無人管理的自動搜索和自動播放。因此就要用到先進的流媒體技術。

流媒體簡單來說就是應用流技術在網絡上傳輸的多媒體文件,使用它,我們可不再象以前那樣訪問存儲在服務器上的媒體文件時,要等到整個文件傳輸到用戶端才能開始播放。它總是將大的文件分成較小的部分,依次發送到客戶端。客戶端使用的流媒體播放器在接收到一定量的文件數據包後就會開始播放,而不用等接收完全部的數據才開始。這樣就能滿足媒體播放的實時性,並且流媒體采用了先進的數據緩衝技術,當數據到達媒體播放器後,它會自動在係統緩存中存儲一定量的信息數據,然後流媒體器才從緩存中索取數據進行播放。這樣一來,即使網絡傳輸偶爾出現問題,隻要緩存中還有數據,媒體就能平滑流暢地播放了。流媒體運用了先進的壓縮和解壓縮技術,數據壓縮方式和JPEG格式圖像的壓縮格式很相似,隻在播放時,才是由流媒體釋放器進行實時的解壓縮。這樣可以使聲音和視頻文件在保證質量的前提下,壓縮到很小。通常可以做到WAV和AVI文件的3%~5%,也隻有這樣才能適用用戶的收視和收聽甚至放大播放。在學校,數字圖書館的流媒體技術可以直接運用到教育教學中去。用了這項技術,教師在備課時可方便地搜索下載音頻畫麵,還可在進行多媒體教學時,實時地接收搜索到的畫麵並當場演示,還可以形成網絡教學中的師生互動。顯示出數字圖書館強大的生命力和活力。