正文 華為“4V”金字塔打通大數據價值通道(2 / 2)

“4V”雖然準確地描述出了大數據的基本特點,但是“4V”隻是單擺浮擱,並沒有從邏輯的角度將大數據應用的遞進關係明確地展示出來。正是基於此,華為拋出了金字塔型“4V”理論,展現了從Volume到Velocity再到Variety,最終到Value的層次化的遞進式的創造大數據價值的方法論。

具體來說,第一步,企業需要建立一個能夠高效處理海量數據的存儲架構平台,它既能處理大量的小文件,也能處理單體較大的文件。第二步,這個存儲架構平台要具備極高的處理性能,因為大數據對實時處理的要求非常高。第三步,這個存儲架構平台要能處理多樣化的數據,包括結構化數據和非結構化數據。隻有通過前麵三步打下的基礎,企業用戶才能進入最後一步,在一個高效的專門為大數據構建和優化的平台上進行數據分析和挖掘,並最終獲得所需的價值。

大數據價值的實現過程是一個遞進的逐層深入的過程,但是建立高效的存儲架構平台是前提,它是大數據落地的基礎。

Hadoop不是全部

現在人們一談到大數據,首先會想到Hadoop。其實,Hadoop隻是大數據基礎架構與上層應用分析之間的一個橋梁,而不是大數據的全部。在廣電等很多領域,大數據處理並不一定要用到Hadoop。現在,使用Hadoop更多的是一些互聯網企業。然而除了互聯網大數據以外,行業大數據同樣重要,甚至價值密度更高。因此,將Hadoop與大數據劃等號,這是一個認識上的誤區。業內一位大數據專家指出,大數據不是一個分析工具,而是新的基礎架構。

華為認為,大數據分析的一個重要前提是,必須先建立一個高效的大數據存儲平台。那麼,所謂的高效又是如何來衡量的呢?

高效的第一個衡量指標是就是性能。性能是大數據存儲平台的基石之一,沒有性能的保證,大數據係統無異於空中樓閣。比如,中央電視台每晚7:30要準時播出天氣預報,如果氣象分析要經過24小時才能得到最後的結果,就會錯過天氣預報播出的時間,即使得到的預測結果再準確也是無用的結果。另外,在智能交通領域,交通部門需要掌握實時的路況信息,對交通違章或其他突發事件進行及時處理。如果後台的大數據采集、處理和分析平台不能在最短的時間內給出結果,那麼智能交通也隻能是一句空談。其實不僅是在大數據方麵,在整個IT領域,企業用戶對性能的追求都是無止境的,隻不過大數據對實時處理的要求非常高,所以高性能對於大數據來說顯得尤為重要。

其次,大數據強調的是簡化使用,提高效率。如果不具備專業技能和人員,Hadoop的實施將非常困難。簡化大數據的使用,其核心是在同一個平台之上針對數據的全生命周期進行管理,盡量避免異構環境下的數據遷移、數據丟失帶來的風險等。

最後,高效的大數據存儲平台應該采用多位一體的技術架構,即在同一個係統內,實現存儲、歸檔和分析的所有功能,完成對數據的管理,並提供開放的分析接口,與BI軟件和應用軟件更好地連接,進一步提高查詢效率。此外,在這樣一個一體化的結構之上,用戶還可以根據業務的情況靈活添加相關的功能模塊。華為的大數據存儲平台就具備了上述功能。

大數據帶來的改變從基礎架構層麵一直延伸至業務層麵。企業的管理者應該意識到,業務的創新需要底層創新的架構來支撐。從業務的角度看,企業的核心訴求是簡化應用,實現可持續發展,提高業務的效率,而這些業務目標的實現必須建立在一個合理的、高效的架構之上,隻有這樣才能更好地發揮IT的作用,獲得更大的數據價值。