……
當紫雲山莊的私人pary,隨著進行的節奏而越來越有感覺,遠在杭城的技術團隊剛開完自動抓取的腳本。
在計算機與互聯網的時代,一切講究的就是效率,但有些時候,單純的效率會催生出一種特殊的對抗。
任何網站的承載能力都是有上限的,如果一個網站的登6機製有訪問次數的上限,那麼隨便一個黑客、寫一個不斷登6的腳本,讓這個腳本一秒鍾送幾百幾千甚至幾萬次登6請求,很快就能夠摧垮整個網站的登錄機製,以至於讓所有用戶都無法正常登6。
為了應對這種“效率”,聰明的互聯網人明了一種人機鑒別的機製:驗證碼。
如果沒有驗證碼,一個腳本一秒鍾可以提交一萬次登6請求;可是一旦加了無法依靠腳本識別的驗證碼,純自動化的腳本就立刻被扼殺在了網站門外,想提交登6請求?可以,先填對驗證碼,識別有些難以辨認的驗證碼,至少需要幾秒鍾的時間,填寫也需要幾秒鍾時間,就算是一次就能成功,想提交一次登6請求,也至少需要十秒鍾。
一秒鍾一萬次,和一次十秒鍾,效率差了十萬倍。
馬老板的技術團隊開的就是一秒鍾一萬次的全自動化腳本,而淘寶網的服務器能夠承載千萬人同時瀏覽,這麼強大的帶寬與服務器支撐,馬老板的技術團隊可以在幾個時之間把淘寶網所有的頁麵全采集一遍。
可是一旦水印上線,馬老板這個如意算盤就要落空了。
到時候,擺在馬老板麵前的選擇隻有三個。
第一個選擇,為了保證效率,硬著頭皮也要用!那李牧求之不得,到時候整個樂淘全是打著淘寶水印1g的圖片,這廣告做的真是太合適了;
第二個選擇,為了不給李牧的淘寶打廣告以及同時打自己的臉,放棄效率,改為批量采集,但要人工遮擋之後再進行上傳,這樣一來,效率將大大拖慢。眼下,淘寶網商品介紹的平均圖片數差不多在5張左右,如果五張圖片隨即在不同的位置出現水印,五張圖片都要進行人工遮蓋的話,至少需要幾分鍾的時間……
第三種選擇,樂淘不再幫淘寶賣家采集並上架,讓淘寶賣家自己上傳商品,他們手裏的原始圖片是沒有淘寶網水印1g的,可這樣雖然減去了樂淘的麻煩,但是一下子把這麼大的工作量丟給淘寶賣家,他們能樂意嗎?
晚上九點,6照喜興奮的來到馬老板辦公室,激動地:“馬總,我們的采集腳本和上傳腳本都已經搞定了,比之前預計的時間提前了一個時!”
終於有了點好消息!馬老板立刻站起身來,高興的道:“很好很好!技術團隊的同事們這麼高的效率值得誇獎!”
罷,馬老板又道:“對了!為了避免夜長夢多,讓技術部門立刻把淘寶網所有的商品頁麵全部采集下來,記得用一個更換Ip的腳本,如果一個Ip產生極大量的訪問,李牧一定會有所察覺!我們要在他察覺之前,先把這些商品信息都采集過來,這樣就算他想辦法封堵也沒有意義了!”
6照喜立刻點了點頭:“我這就去吩咐!”
自動更換Ip的功能,網絡上有大量現成的軟件和腳本,各種網站刷獨立Ip、刷pV都用能夠不斷更換Ip的腳本實現,樂淘的技術人員自己就有現成的腳本,幾乎是拿過來就用了。
九點十分,樂淘正式啟動了對淘寶頁麵的采集,對百度這種搜索引擎來,采集一個淘寶的頁麵對它的整個采集工作來,簡直就是九牛一毛,但是對樂淘來,這還真是個浩大的工程。
今晚,雷教主在淘寶網加班坐鎮。
淘寶這次批量增加1g所采用的技術手段並不是給服務器上的每個圖片都加上1g,而是直接在網站程序中增加一個功能,一旦這個功能開啟,在開啟之後訪問網站的用戶,在訪問產品詳情頁的時候,服務器將自動把Lg疊加在圖片上進行展示,所以樂淘需要一點點采集頁麵,但淘寶卻掌握了一個瞬間給所有圖片加上水印1g的開關。
更重要的是,這個開關,早在一個時前,就已經悄悄打開。
當樂淘的采集腳本工作開始力起跑的時候,技術部門的負責人重點監督著采集的數量以及度,卻在不經意間現了異常:6續采集到的商品頁麵信息中,商品的每一張圖片介紹上,竟然都多了一個兩行的半透明白色1g!
1g的上一行是:“淘寶網”三個字;下一行是“;