模式識別(Pattern Recognition)是借助計算機,自動模擬人類對外部世界某一特定環境中的客體、過程和現象的識別功能(包括視覺、聽覺、觸覺、判斷等)的科學技術。
模式識別技術在社會生活和科學研究的許多方麵有著巨大的現實意義,已經在許多領域得到了廣泛應用。隨著計算機技術和人工智能、思維科學研究的迅速發展,模式識別技術正在向更高、更深的層次發展。
一個模式識別係統由數據獲取、預處理、特征選擇和提取以及識別四大部分組成。
特征選擇是指從一組特征中挑選出對分類最有利的特征,達到降低特征空間維數的目的。特征提取是指通過映射(變換)的方法獲取最有效的特征,實現特征空間維數從高維向低維的變換。從定義可以看出,實現特征選擇和提取的前提是確定特征是否有效的標準,在此標準下尋找最有效的特征子集。
從分類的角度看,模式識別是把具體事物歸到具體某一類別的過程。也就是先用一定數量的樣本,根據它們之間的相似性進行分類器設計,而後用所設計的分類器對待識別的樣本進行分類決策。識別過程既可以在原始數據空間(預處理之後的數據)中進行,也可以對原始數據進行變換,將數據映像到最能反映分類本質的特征空間中進行。很明顯,經過特征選擇與提取後分類器的設計會更為容易。因為通過更為穩定的特征表示,分類器的性能得到了提高,並且由於刪去多餘或不相關的信息,使得研究對象之間的本質聯係更容易被發現。可以說,特征選擇與提取是模式識別係統設計成敗的關鍵。但是,由於在很多實際問題當中,那些重要的特征常常掩蓋在紛繁蕪雜的表象之下,不能夠直接獲得,或者受條件限製不能對它們進行測量,使得特征選擇和提取的任務複雜化,成為構造模式識別係統、提高決策精度的最困難的任務之一。
目前特征選擇與提取廣泛應用在社會生活和科學研究的各個領域。
(1)農產品品質檢測
農產品在其生產過程中由於受到人為和自然等複雜因素的影響,產品品質差異很大,如形狀、大小、色澤變化等。使用特征選擇與提取技術對農產品的外部品質特征進行提取進而實現農產品的自動分級是目前許多科學工作者研究的重要課題。目前國內外利用特征選擇與提取技術進行農產品品質自動識別研究的對象極其廣泛,如穀粒的表麵裂紋檢測和農作物種子的分級、根據梅、黃瓜、玉米、竹筍、西紅柿、辣椒、蘋果等的大小、形狀、顏色和表麵特征等進行分級等。
(2)醫學圖像分析
自從發現倫琴射線以來,醫學成像技術的不斷進步,相繼出現了C、MRI成像技術,給醫生帶來越來越豐富的圖像信息,也加深了人類對自身的認識和理解。隨著數字圖像處理和分析在理論和技術上的逐漸完善,以及數字醫學影像技術的發展,對數字醫學圖像的處理和分析成為國內外研究的熱點。研究者使用特征選擇與提取技術降低數字醫學圖像特征維數,提取出感興趣區域特征,輔助醫生判讀醫學圖像,提高診斷的準確性和效率。研究的對象包括鉬靶X線圖像、C圖像、MRI造影等。
(3)工業探傷
金屬材料在鍛造、焊接過程中,會形成各種內部缺陷,它們的存在和擴大會導致設備使用壽命縮短、安全可靠性降低。使用超聲檢測探傷時,定性(分類)比較困難,判斷準確率受人為影響較大。目前一些研究者使用LabView建立能對缺陷進行識別的智能係統,利用特征選擇與提取技術對探傷缺陷進行分類識別。橋梁裂紋損傷識別是及時發現橋梁裂紋保證橋梁安全作業的重要依據,應用特征選擇與提取技術識別橋梁裂紋是目前許多學者研究的重要課題。
(4)圖像數據庫檢索
近年來,隨著信息技術的發展,數字圖像的數量正在飛速增長。如何在海量的數字圖像中找到我們所需要的圖像數據越來越被人們所關注。基於內容的圖像檢索成為當前熱門的研究課題。它是一門有關圖像特征相似性匹配的新技術,需要深入研究圖像特征描述方法、特征提取與索引方法,以及相似性度量與快速檢索算法等問題,便於以圖像中包含的各類典型特征(即圖像內容本身)為客觀檢索對象,避免以文本為主觀標識所造成的圖像內容理解方麵的歧義。
(5)目標識別
目標識別技術一直是具有重要意義和實際價值的研究課題,它在監控係統和軍事目標跟蹤等領域得到了非常廣泛的應用。但是由於目標本身的多樣性和複雜性,以及實時成像環境因素(如天氣、光照、相機平移和噪聲幹擾)的影響,使得目標識別成為一項相當困難的工作。目標識別的基礎是圖像與內部模型的匹配和比較,在圖像數據中提取有效特征並通過匹配最終完成目標的識別。