大數據,變革思維
編者的話
人們不再認為數據是靜止和陳舊的。但在以前,一旦完成了收集數據的目的之後,數據就會被認為已經沒有用處了。比方說,在飛機降落之後,票價數據就沒有用了(對穀歌而言,則是一個險索命令完成之後)。
如今,數據已經成為了一種商業資本,一項重要的經濟投入,可以創造新的經濟利益。事實上,一旦思維轉變過來,數據就能被巧妙地用來激發新產品和新型服務。數據的奧妙隻為謙遜、願意聆聽且掌握了聆聽手段的人所知。
信息社會所帶來的好處是顯而易見的:每個人口袋裏都揣有一部手機,每台辦公桌上都放有一台電腦,每間辦公室內都擁有一個大型局域網。但是,信息本身的用處卻並沒有如此引人注目。半個世紀以來,隨著計算機技術全麵融入社會生活,信息爆炸已經積累到了一個開始引發變革的程度。它不僅使世界充斥著比以往更多的信息,而且其增長速度也在加快。信息總量的變化還導致了信息形態的變化——量變引發了質變。最先經曆信息爆炸的學科,如天文學和基因學,創造出了“大數據”這個概念。如今,這個概念幾乎應用到了所有人類致力於發展的領域中。
大數據並非一個確切的概念。最初,它是指需要處理的信息量過大,已經超出了一般電腦在處理數據時所能使用的內存量,因此工程師們必須改進處理數據的工具。這導致了新的處理技術的誕生,例如穀歌的MapReduce和開源Hadoop平台(最初源於雅虎),這些技術使得人們可以處理的數據量大大增加。更重要的是,這些數據不再需要用傳統的數據庫表格來整齊地排列——一些可以消除僵化的層次結構和一致性的技術也出現了。同時,因為互聯網公司可以收集大量有價值的數據,而且有利用這些數據的強烈的利益驅動力,所以互聯網公司順理成章地成為了最新處理技術的領頭實踐者,它們甚至超過了很多有幾十年經驗的線下公司,成為新技術的領銜使用者。
今天,一種可能的方式是,亦是本書采取的方式,認為大數據是人們在大規模數據的基礎上可以做到的事情,而這些事情在小規模數據的基礎上是無法完成的。大數據是人們獲得新的認知、創造新的價值的源泉;大數據還是改變市場、組織機構,以及政府與公民關係的方法。
(節選自《大數據時代》)