內特·希爾沃與大數據
視野
作者:李曉鬆
2012年的美國總統大選讓誰聲名鵲起?從某種角度說,既不是獲選的奧巴馬,也不是落敗的羅姆尼,而是內特·希爾沃(Nate Silver)。
其原因是,在兩位候選人選情接近,誰也不敢妄下斷論時,他準確地預測出大選的結果——投票當天,希爾沃預測奧巴馬將有90.9%的機會獲得大多數選票,並非政治家們認為的所謂旗鼓相當。如果按州投票計算,希爾沃對美國50個州投票結果的預測全部正確。
“預言帝”的秘密,在於數據。他讓眾多企業看到了大數據應用的真實性和大數據行業化的希望。
大數據精彩無限?
如今,大批歐美企業對大數據應用趨之若鶩,穀歌、亞馬遜等利用收集到的大量客戶信息,為客戶量身定製各種個性化服務。不過,最典型的還是大數據招聘。即便因經濟衰退,美國的失業率高達兩位數,但還是有大量公司找不到既能勝任公司工作,又符合公司企業文化的員工。於是,大數據招聘應運而生。許多初創公司依靠強大的電腦技術以及互聯網上的數十億份簡曆信息來構建一種“獵頭算法”,它可以告訴用人單位,對於某一個特定的工作來說,什麼樣的求職者才是最適合的。他們相信,這種算法會使企業的人才招聘變得既有效率,又節省成本,同時實現求職者和招聘方的雙贏。
互聯網起初的確使找工作輕鬆了不少。隻需輕輕點擊幾次鼠標,求職者就可以同時申請十幾個職位,企業的招聘通知也能同時被很多人看到。有些大公司收到的簡曆數量甚至增長了五倍。同時它也會告訴求職者,這份工作是否適合自己。如果不適合的話,它還會告訴你為什麼。
不過,很多業內人士對這項新技術持懷疑態度。他們認為,技術本身不是問題,問題是有些公司自己都不知道自己想要的是什麼。有些東西就連招聘經理也不能用語言表達出來,要想量化這種無形的素質,幾乎是不可能的。即便真的可以做到這一點,用軟件來取代真人招聘,也是目光短淺的表現。經濟困難時期,向招聘者身上投入大量資金很難說得通,而且說到底,最適合招聘和評價頂級人才的,仍然是人,而不是電腦係統。
預測也能變災難
這時,我們需要希爾沃“及時”分享他的心得,他會談到總統大選時對手們的問題出在那裏:大多數預判選舉的評論員並不會像希爾沃那樣仔細地去分析數據。有些人的判斷建立在自己的偏見之上,比如共和黨的評論員們會盡力找出各種各樣的證據,證明羅姆尼將贏得選舉;有些人會人雲亦雲,如果大家都說選情很接近,那麼他們也會隨聲附和,選舉競爭一定很激烈;而有些人會刻意獨樹一幟,比如大家都認為奧巴馬會贏,那麼把寶押在羅姆尼身上的人會受到更多關注。另外,評論員本身的利益驅動也使他們更願意相信選票會很接近,因為隻有在選舉還存在懸念的情況下,大眾才會不斷關注政治新聞。