豆瓣:生活的發現者
無數據不互聯
作者:劉燕
八年前,豆瓣創始人楊勃開始為豆瓣寫第一行代碼時,就有了一個明確的方向——做一個關於生活發現的服務,也就是為人們推薦真實生活裏的好東西。
“世界上一直沒有一個偉大的‘生活發現’網站可以供我們參考,豆瓣一邊做一邊琢磨,希望可以成為一個這樣的網站。”楊勃說。
朝著這個目標,豆瓣有了自己的特點:工程師人數超過半數,他們不斷更新算法技術,解讀用戶每一次瀏覽痕跡背後的邏輯關係,最終高效地為用戶帶來最匹配的推薦結果。
這恰好是大數據時代最需要的質素,然而在當年,隻有豆瓣在琢磨一個讓人覺得奇怪的算法邏輯——“你先告訴我你喜歡什麼,然後我向你推薦你更喜歡、更需要什麼”。
讀懂你
“許多口味最類似的人卻往往是陌路,如果能不一一結交,卻知道成千上萬人的口味,能從中間迅速找到最臭味相投的,口口相傳的魔力一定能放大百倍,對其中每一個人都多少會有幫助。”伴隨這一願望,豆瓣誕生了。
而豆瓣的核心能力是從技術引擎開始的。當時,豆瓣對“發現”的理解是“個性化算法推薦”,也就是“豆瓣猜你會喜歡”,這形成了楊勃對豆瓣最初的設想:通過精準強大的算法為用戶進行產品推薦。
但在這之前,還需要建立全麵的興趣圖譜。
創辦豆瓣後的第三年,豆瓣開始加強“口口相傳的魔力”,推出了曾經叫做“友鄰廣播”的“豆瓣說”。接下來,豆瓣社區效應的表現越來越明顯,很多用戶開始在群組活動裏談論生活的方方麵麵,這讓楊勃意識到,是時候將豆瓣社區單列出來,並分化出線上活動、豆瓣小站。
其中,豆瓣小組從上線至今已經有超過30萬個興趣小組被用戶創建,每個月吸引5500多萬人訪問,而話題更是延伸到娛樂、旅行、美容、購物、二手交易、租房等生活的方方麵麵。這是興趣圖譜數據最大的來源所在,也讓豆瓣能從圖書、電影、音樂三大主題擴展到更多生活領域。
豆瓣也一直試著通過用戶行為分析,最終將產品延伸到多個簡單實用的生活服務組合中。不過,不是每一個產品都能存活下來。2006年,豆瓣推出“我去”——專注旅行分享的主題,很快因不受歡迎而停掉。相反,生活類小站、社區中二手交易、團購、手機應用等信息,受到好評。推出新產品、發起用戶意見反饋、最終由用戶決定產品去留,是豆瓣的慣性做法,但除了直接反饋之外,他們更信奉數據量化分析,采取主動的方式去獲得真實聲音而非被動等用戶的“抗議”。
“豆瓣有這麼一群用戶,他們更有特點,更願意展示多維的興趣圖譜,所以我們的數據會更加豐富。”豆瓣首席科學家王守崑說,基於算法技術進行個性化推薦,豆瓣成立時國內還沒有太多人研究,做得早也成為一種優勢。
通過算法自動推薦給你的個性化內容,背後是不斷改進的算法程序,每天從豆瓣頁麵的各個角落統計你的使用行為,比如點擊“收藏”、“感興趣”等內容,從而判斷並猜測你的喜好,然後把相匹配的內容推送在你進入豆瓣時的主頁麵。
當然,那些越是專注在某一個領域的用戶,得到的推薦越精準。這也使得豆瓣在推動有共同愛好、價值觀的用戶集中在一起,形成一個個圈子,由此可以解釋,為什麼不少連載故事會在這裏產生更直接的粉絲效應。
豆瓣猜
最早成為豆瓣算法實驗的領域就是圖書、電影和音樂,因為楊勃認為,它們更適合、更易於做個性化推薦。“在做算法這個領域,有個共識就是有什麼樣的數據就會產生什麼樣的結果,我們在這方麵的基礎會更好一些。”王守崑說。