在麻瓜和魔法師之間作出選擇(1 / 2)

用數據說話,做最棒的魔法師

最棒的魔法師,是既深諳大數據的理念,又掌握著大數據的核心技術。但是,對於絕大部分人來說,後者是有困難的。我想特別強調的是,即便你不能掌握一項特定的數據技術,了解大數據的理念,培養大數據的思維模式,也是非常重要的——不管你從事什麼工作,這種大數據的思維模式都是有幫助的。事實上,我一直覺得類似於統計學(包括概率論、數理統計、統計物理等)和機器學習的理念,對於我們理解這個世界都是有幫助的,應該有一些生動的科普書,把這些重要的理念用通俗的語言告訴大家。

數據化思維的核心是什麼?就是定量化,或者說“用數據說話”。主觀能動性當然是我們人類的重要能力,特別是行業專家的思路和判斷往往非常重要,效果甚至好於機器學習的結果。但是,一切的評估都要定量化。舉個例子來說,要證明一個營銷行為B比營銷行為A更好,必須要無偏地把用戶劃分成兩個群,一個接受A一個接受B,然後通過對比來驗證兩者的效果。政府做決策的時候,例如改變醫保的規則,也需要充分的數據支撐,提前能夠量化這個改變帶來的效果,並且時時監督政策實施後的結果。學會用數據來說明“哪個更好哪個更壞”,是數據化思維的第一步。

作出讓世界尊重的原始創新

當魔法師的另一個好處,就是我們可以進入魔法世界——這是一個浪漫的戰爭世界,我們必須變得更強,才能打倒伏地魔!

在我讀大學的時候,我們的案頭枕邊,放著的是茨威格的《異端的權利》,是索爾仁尼琴的《古拉格群島》,我們追憶和供奉幾千年來為了人類進步付出甚至犧牲的科學家、哲學家、文學家、政治家,等等,我們能夠非常清楚地說出哪些人是世界的脊梁。我們在字裏行間追尋中國最苦難最黑暗的時代,羨慕在那個時代戰鬥的英雄,我們急切地希望這個時代能夠讓我們為民族的複興戰鬥——盡管可能不是用刀槍!

我不知道我們這一代,是不是中國流淌著戰鬥血液的最後一代大學生。我們現在麵對的是不一樣的戰場,不是刺刀機槍,而是要做讓世界尊重的原始創新。我在這本書裏麵描寫了很多在大數據領域努力拚搏希望有所創新的中國人,盡管他們中的絕大部分距離成功還非常遠,但我希望他們的故事以及這些故事背後的理念、技術和精神,能夠喚起更多的創新者。

有兩個問題,我希望每一個讀者都問問自己。第一,在你的一主中,有沒有可能作出類似於SpaceX和AlphaGo這樣讓世界尊重的原始創新。人生特別美好的一件事情,就是通過努力,把一件看起來不可能的事情做成!這個問題可以換一個問法,就是如果有10個最聰明厲害的人,願意3~5年竭盡全力為你工作,你會和他們一起做一件什麼事情?第二,你所做的事情,能夠為我們的國家乃至整個世界,產主什麼樣的重大貢獻。建一個色情網站、開發一款暴力遊戲,也能掙大錢,而且很快。致力於優化教育資源或醫療資源的配置,可能非常苦非常慢,掙錢也不如暴力遊戲,但是可能改變甚至拯救一大群人。如果讓我選擇,我會選擇後者。事實上,你所貢獻的要比你所得到的更能體現你的價值!

用數據說話,做最棒的魔法師

最棒的魔法師,是既深諳大數據的理念,又掌握著大數據的核心技術。但是,對於絕大部分人來說,後者是有困難的。我想特別強調的是,即便你不能掌握一項特定的數據技術,了解大數據的理念,培養大數據的思維模式,也是非常重要的——不管你從事什麼工作,這種大數據的思維模式都是有幫助的。事實上,我一直覺得類似於統計學(包括概率論、數理統計、統計物理等)和機器學習的理念,對於我們理解這個世界都是有幫助的,應該有一些生動的科普書,把這些重要的理念用通俗的語言告訴大家。

數據化思維的核心是什麼?就是定量化,或者說“用數據說話”。主觀能動性當然是我們人類的重要能力,特別是行業專家的思路和判斷往往非常重要,效果甚至好於機器學習的結果。但是,一切的評估都要定量化。舉個例子來說,要證明一個營銷行為B比營銷行為A更好,必須要無偏地把用戶劃分成兩個群,一個接受A一個接受B,然後通過對比來驗證兩者的效果。政府做決策的時候,例如改變醫保的規則,也需要充分的數據支撐,提前能夠量化這個改變帶來的效果,並且時時監督政策實施後的結果。學會用數據來說明“哪個更好哪個更壞”,是數據化思維的第一步。