正文 麵向物聯網的多媒體數據庫檢索技術應用研究(1 / 2)

麵向物聯網的多媒體數據庫檢索技術應用研究

智能處理與應用

作者:於秀麗 邢智毅

摘要:隨著物聯網技術的不斷發展,多媒體數據的存儲及管理問題日益突出,傳統的數據庫技術已無法對其進行有效的管理。在此背景下,為了對多媒體數據庫檢索技術進行深入的研究,文章簡要論述了什麼是多媒體數據庫,重點討論了麵向物聯網的多媒體數據的特征,介紹了基於內容的檢索技術,並分別對音頻、圖像和視頻的檢索技術做了詳細探討,最後探討了麵向物聯網多媒體數據檢索的策略問題,以期對現實麵向物聯網的多媒體數據檢索具有指導意義和實用價值。

關鍵詞:多媒體;數據庫;麵向物聯網;檢索

中圖分類號:TP391 文獻標識碼:A 文章編號:2095-1302(2013)02-0065-02

0 引 言

伴隨著信息高速公路的興起,多媒體正在深入我們的生活,物聯網時代也離我們越來越近。在對文字、圖形、圖像、視頻及聲音等多種媒體信息進行綜合處理時,傳統的信息檢索已經不能滿足人們的需求,信息的查找和檢索要求也越來越高。

1 麵向物聯網的多媒體數據庫特點

多媒體數據庫是多媒體技術與數據庫技術相結合而產生的一種新型數據庫[1],是指數據庫中的信息不僅涉及各種數字、字符等格式化的表達形式,而且還包括多媒體的非格式化的表達形媒體數據的存儲、讀取、檢索等功能的數據庫係統[2]。多媒體數據庫繼承了傳統數據庫的一些優點,但數據管理要涉及到更複雜的處理。與此同時,繼計算機、互聯網之後,物聯網帶來了信息技術的第三次革命,經過綜合分析,物聯網環境下的多媒體數據與傳統的數據相比,往往具有一些獨立的特性。

1.1 數據的非結構化

聲音、圖像、影視等數據基本上都是二進製串。這些數據從其本身看不出任何結構,因此稱為非結構化數據。各種媒體的數字化存儲形式稱為多媒體數據。因為這些數據往往通過傳感器輸入計算機,又稱傳感器數據。媒體數據如果不另加一些描述和解釋,一般很難利用對數據的描述和解釋。這些特征使得傳統的關係型DBMS難以有效地管理這些類型的數據,從而促使我們去研究、引入新型的DBMS係統。

1.2 實時性和快速更新

物聯網技術是基於各種感知技術的應用。其上部署了多種類型傳感器,不同類型的傳感器捕獲的數據內容和數據格式各不相同。由於每個傳感器都是一個信息源,采集信息在一定頻率的周期性環境下,傳感器獲得的多媒體數據也不斷更新,具有實時性。

1.3 數據量大且維度高

物聯網是一種建立在互聯網上的泛在網絡。物聯網技術的重要核心仍在互聯網,通過各種有線和無線網絡與互聯網融合,將物體的信息實時準確地傳遞出去[4]。多媒體數據量一般都很龐大。雖然采取了數據壓縮技術,但壓縮後的數據量還是很大。在物聯網上的傳感器定時采集的信息需要通過網絡傳輸,所以,這樣的海量數據對多媒體數據庫的存儲及檢索提出了更高的要求,同時還要考慮海量數據傳輸標準的統一。

2 麵向物聯網的多媒體數據庫檢索

多媒體數據包括文字、圖像、視頻、音頻等不同格式的信息內容。隨著互聯網的發展,傳統的基於結構化的關係數據庫檢索方式並不適合非結構化的多媒體數據的檢索,人們對多媒體數據的檢索提出了新的要求。基於內容的檢索就是從媒體數據中提取出特定的信息線索,然後根據這些線索從大量存儲在數據庫中的媒體中進行查找,檢索出具有相似特征的媒體數據來。它可以在更深層次更有效地利用存儲的多媒體信息。

基於內容的檢索是一個逐步求精的過程[3]:第一是從媒體內容中提取信息線索。基於內容的檢索直接對圖像、視頻、音頻內容進行分析,抽取特征和語義,利用這些內容特征進行索引,並進行檢索。第二是相似性匹配,就是將查詢特征與特征庫中的資料按照一定的匹配算法進行形似匹配,把滿足一定相似性的一組候選結果按相似度大小排列放回給用戶。第三是特征調整。對於係統返回的查詢結果,用戶可選擇滿意結果,或從中選擇一個示例,經特征調整形成新的查詢。第四,逐步縮小檢索範圍,直到用戶滿意。

2.1 基於內容的圖像檢索技術

基於內容的圖像檢索技術是指利用一定的算法提取圖庫中圖像的顏色、紋理、形狀等特征進行檢索。用戶提供一個樣例圖像,係統提取樣例圖像的特征,然後跟數據庫中的所有圖像的特征進行比較,並將與樣例特征相似的圖像返回給用戶。