通過分析可以得出一定區域裏出現的野生動物的種群、數量、性別等信息。事實上,一切野生動物的保護策略都必須基於它的種群數量和範圍來合理製定。“我們通過分析腳印來辨識動物的身份,可以辨識動物種群、數量、性別,甚至是年齡。根據腳印,我們能知道那是五歲的老虎還是十歲的老虎。這非常難,但是FIT作為基於JMP軟件開發的工具,已經能做到了,是非常了不起的突破。”Jewell自豪地說。
20個樣本建立精確模型
在用FIT做野生動物的監測追蹤過程中,有一點是非常關鍵的,那就是動物腳印兒的建模。“FIT生成新模型的方法是用已知的動物信息(如人工喂養的老虎、熊貓)數據進行模型訓練來得到正確的模型,然後再拿另外的數據進行校驗,來確保模型是正確無誤的,反複校驗成熟以後才用於預測功能。”Jewell介紹。
需要多少樣本數據才能建立精確的模型呢?“我們需要至少20隻東北虎個體的腳印數據才能保障模型的精確性。” Alibhai博士打開他們的模型訓練和測試數據結果分析圖,解釋道,“通過實驗研究我們發現,當實際用於模型訓練的數量低於12時,模型和實際就開始有偏離了。本來在理論上我們需要至少20隻老虎的腳印數據,但是JMP所提供的能力讓我們大大減少了所需要訓練模型的樣本數量。而且還讓整個過程用一張圖就可以很簡單地表達出來,哪怕不同領域的人,給你講一兩分鍾,你也可以了解得很清楚。”
Alibhai博士介紹,每個物種都有很獨特的腳印模式和特征,有些物種有高度的相似性,比如貓科動物裏麵的老虎、獅子、豹、山貓等,隻要軟件中調整一些關鍵參數即可。而對於像大熊貓、大象等截然不同的物種,他們就需要開發新的模型功能包。借助JMP突出的結構和算法設計,當數據量很大的時候,通過測試,JMP的處理速度與像R語言這樣的算法或者市場其他軟件相比,是後者的幾百甚至幾千倍。這也使得Alibhai博士用一台配置並不是很高的筆記本電腦就可以現場運行、展示比對分析。
“你不需要懂得太多的統計學原理和技術,隻要把一個圖片的信息拉到FIT菜單裏,它就能夠自動計算這些圖形的特征。我們可以對圖像進行旋轉等處理,以確保它和所設置的標準化樣本能夠保持一致,這樣就不用對野外取證的人員有太苛刻的要求。而我們也在開發三維等更多功能,讓FIT更自動化、更易用,甚至我們在研究能否結合虛擬和圖像分析技術,來通過腳印分析呈現反麵的腳掌信息。” Alibhai博士神采奕奕地說。
JMP數據分析軟件大中華區總經理嚴雪林介紹說,JMP免費為野生動物保護組織提供JMP軟件,而WildTrack的動物學家使用JMP的編程語言,自行開發了FIT工具供自己研究使用,甚至免費提供給其他的野生動物保護專家和機構。而JMP作為SAS旗下的統計應用分析的高端數據分析平台,不隻應用於公益組織,在金融、電信、保險、政府、製造業等幾乎所有需要數據分析的行業都被應用,蘋果、Intel、特斯拉、中國銀聯、招商銀行等都是JMP的客戶。