第一章你不知道的問題(二)(1 / 2)

此外,還有與星座相關的文章,比如十二星座中誰最小氣?十二星座中誰容易晚婚?十二星座女性誰最討人喜歡等。可謂五花八門,層出不窮。

麵對這些星座分析,有的人覺得它們很有道理,說得都對;但有的人覺得自己怎麼也無法對號入座。這是怎麼回事呢?星座分析裏的話是怎麼說出來的?這些話可信嗎?

要解開這個謎底,我們就刨根問底一次,看看網站上那些星座運程是怎麼來的。

揭秘事實

對於星座分析中那些似是而非的話,一個叫做information_is_beautiful的網站對它產生了懷疑,它對預測裏的高頻詞彙進行了搜索和分析,打算用數據證明星座預測這個“謊言”。

結果網站的研究者發現,每個星座預測裏麵的高頻詞有很多是互相重複的,而各個星座特有的高頻詞卻隻占了很小的比例。研究者得出的這個結果本身是否有說服力呢?

為了得到結果,網站研究者做了以下工作:

從屏幕上抓詞

在雅虎上抓取星座預測的詞條。複製粘貼肯定不行,於是研究者們找到Python編程高手Thomas,讓他寫了個屏幕抓取的腳本,這讓他們在Yahoo_Shine上獲得了22186個詞條,並將這些詞條導入一個巨大的電子表格中。當然,說起來容易做起來難,雅虎這樣的大網站,怎麼可能沒有自己的保護措施?當同一IP訪問服務器太頻繁的時候,就會被認作黑客,此IP在一段時間內就會被禁用。因為研究者們把握好了雅虎“限速”的尺度,所以才能用12小時左右獲得所需的原始數據,這些數據共有9.5MB。

過濾數據

前麵說過,星座預測一般分為很多方麵,比如事業、財運、每日運程、婚姻等等,研究員們考慮到特定方麵的運程分析會大量提到“career”“marriage”“work”等詞彙,所以他們決定過濾其他分類,隻分析關於每日運程的星座預測,這樣比較方便。結果共4380個單詞,每個星座平均365個單詞。

分析文本

研究者利用線上工具TagCrowd在文本庫裏尋找高頻單詞。第一步,分別找出十二個星座詞條裏出現頻率最高的50個單詞;第二步,從中挑選出每個星座獨有的詞彙。當然,研究者把一些無意義的常見單詞(如“and”、“for”、“is”)以及語義量詞(如“someone”、“really”、“quite”)去掉了。

結果如何呢?肯定會讓你吃驚的。因為在十二星座預測的詞彙裏,各自之間90%以上是相同的!

所謂的星座預測,根本就不可信!那為什麼還有人預測後覺得很準呢?我們把前麵關於獅子座的預測拿來分析:

獅子座是由太陽神阿波羅所管理(這句可能是獅子座特有的),所以在他身上處處顯露陽光、熱情、自信、大方的特質(誰不喜歡這樣的自己)..喜歡成為焦點人物的獅子座,都有脆弱之時(每個人都有脆弱的時候);因為他們太在乎別人對他的看法,往往因此而不快樂(如果有完全不在乎別人看法的人,那估計是機器人);不肯認輸的個性,也是令自己不愉快的泉源(不認輸並不能代表成功,因失敗產生不快樂很正常)。獅子座的女性更加可憐,她們是最怕老、怕寂寞、怕不被別人尊重(女性都怕老、怕寂寞、怕不被人尊重),為了要打擊這些心魔,她們會使用任何方法去改變它們(任何人對於上述心魔,都會采取辦法改變)。

從上麵的分析可以看出,除了第一句之外,其他都是“放之四海而皆準”的話,隻不過中間會夾雜“獅子座”這三個字,讓測試者更感覺是在說自己。

趣味推斷

如果不信,你可以假定自己不屬於任何星座,然後把十二個星座挨個測一遍,你最後可能會發現,你屬於哪個星座都可以,或者你不屬於任何星座。

怎樣烙餅最省時間

拋磚引玉

你一定還記得這樣一道題目吧,請用最短的時間完成下列事情:起床、洗漱、煮早餐、吃早餐、看報紙..這是一個統籌時間的問題,你可別小看了它,生活中到處都有這樣的題目考驗著我們的智慧,比如大學裏同是去圖書館占座,為什麼有人已經洗漱完畢奔向圖書館而有的人還沒刷完牙?再比如玩網絡遊戲的時候,為什麼有人能快速升級,而有人卻常常“裹足不前”?在工作中,為什麼有人的效率很高,能有條不紊地完成很多事情,而且每件事都做得很出色,而有的人卻手忙腳亂地加班到晚上**點..這類問題,歸結到一起,其實可以在下麵這個“烙餅”的案例中找到答案。