正文 華為“4V”金字塔打通大數據價值通道(1 / 2)

華為“4V”金字塔打通大數據價值通道

大數據

作者:郭濤

IDC預測,全球的數據總量將在2020年達到40ZB。40ZB的數據量到底是多少呢?IDC給出了一個比喻:40ZB數據量相當於全球所有沙灘的沙粒總數的57倍。但在如此浩如煙海的數據中,隻有不到1%的數據得到了有效分析。數據就像是一座沉睡的寶藏,它需要我們利用大數據這一新架構、新工具,點石成金,變廢為寶。

大數據由業務驅動

為什麼在官方的健康組織還沒有發布健康趨勢之前,Google就能利用它的搜索引擎準確地預測流行病的爆發?大數據給我們所有人上了一課,也讓我們更加堅信,數據本身是有價值的,關鍵看你如何處理、分析和使用它。

雲計算不是一種新的技術,而是一種新的IT消費模式。同樣,大數據也不是簡單的技術組合,而是對企業商業模式的顛覆和再造,對業務創新和發展起到強大的推動作用,這樣的例子已經比比皆是。

比如,為了應對激烈的市場競爭,中信銀行信用卡中心迫切需要建立一個以數據倉庫為核心的分析平台,實現業務數據集中和整合,以支持多樣化和複雜化的數據分析。在部署了大數據應用係統之後,中信銀行信用卡中心實現了近似實時的商業智能(BI)和秒級營銷,運營效率得到全麵提升。

再比如,廣東地稅依托大數據平台推出的網絡發票能夠實時采集納稅人的開票數據,實時監控納稅人的開票情況,實時向社會公開開票查詢信息,實時為公眾查驗發票真偽,實現了對納稅人經營行為的全監控。同時,廣東地稅依托大數據平台還實現了對地稅幹部的稅收執法和行政管理進行全程分析監控,有效防控了各類執法和廉政風險。

在互聯網、金融、電信、能源、醫療、視頻監控、政府等眾多行業,大數據正在日益顯現出其獨特的價值。在企業內部,大數據可以為企業提供更科學的決策依據;在企業外部,大數據還是收集客戶信息,建立360°客戶視圖,讓企業實現精準化營銷的工具。從表麵看,大數據帶來的是一種技術上的變革,它有效地提高了企業和社會的生產力,而在這種技術變革的背後是業務需求使然,是人們對提高效率的不斷追求在推動這種變革的發生。

縱向打穿“4V”

經濟全球化的趨勢促進了大數據的應用需求。企業的管理者需要借助豐富的數據和實時分析工具,提高企業內部的工作效率,同時還要密切與客戶的關係,進一步提高客戶滿意度。商業模式的轉變、營銷手段的豐富,要求企業不能在舊有的基礎架構平台上縫縫補補,大數據需要一個全新的高效的基礎架構平台。

大數據這個概念出現前,“海量數據”這樣的稱呼人們已經使用了很多年。雖然大數據與海量數據之間還是有量上的差距,但是對於很多企業用戶來說,沒有適合的工具對海量數據進行挖掘是數據價值難以釋放的一個主要原因。在大數據分析工具出現前,商業智能、數據挖掘已經進行了多年,為什麼數據的價值沒有得到企業充分的重視呢?因為以前的數據挖掘是對抽樣數據進行分析,而且數據分析是離線的,數據的價值沒能得到全麵、實時的展現。

那麼構建一個可用的大數據係統,應該從何處入手呢?

現在,人們已經基本認同了大數據“4V”的特征:第一,Volume表明數據的體量巨大,企業處理的信息總量已經從TB級別躍升到PB級別;第二,Variety表明數據類型繁多,包括結構化、非結構化等類型的數據,尤其是非結構化數據的大幅增長對傳統的處理結構化數據為主的架構帶來了巨大衝擊;第三,Velocity表明實時處理是大數據的一個典型特征,而這也正是它區別於傳統數據挖掘技術的關鍵所在;第四,Value表明數據是有價值的,這也是大數據挖掘的最終目標。