最初的生成器,生成的段落bug還比較多,需要作者花功夫調整語句,進行修剪,到了後來,有了爬蟲軟件的助陣,簡直就進化到了近乎人工智能的階段。
爬蟲軟件是一種網頁內容抓取軟件。
通過一定的編程代碼,可以對抓取的網頁圖片或者文字,做出各種數據分析樣本。
這種軟件原本主要用途是做大數據收集,來進行商業分析,在電商這塊兒用得比較多。
在網文這塊的運用,早期也不過是用來做盜版網站。
但到了後期,由於樣本數量龐大,通過大量文本分析,很容易就能找出一些機製,通過軟件來實現文章自動生成。
起初比較容易開發的是詩詞、對聯自動生成軟件,到後來,隨著網絡小說的興起,網頁抓取樣本也大大豐富起來,於是也就進化到自動生成文章的地步了。
即使某些網站使用了圖片防盜技術,但沒多久,看圖識文的補丁程序就被編寫出來,絲毫不能阻止軟件抓取大量文本。
至於有些網站采取的加亂碼防盜措施——既從小說網站上複製下來的文本,粘貼後中間夾雜大量亂碼——更是非常容易破解,因為這些亂碼本來就是通過程序編寫進去,加密規則再複雜,也是可以通過程序再批量去除。
當然了,網文網站的加密規則,並不會太複雜。
總而言之,抓取樣本越多,網文生成器就能越智能,發展到極致,終於出現了一本,汲天地之靈氣取日月之精華彙古今之人文萃事實之新聞的奇書——《重生為惡》。
要說,如果這本書真是用人工智能編出來的,還真有一種人工智能下誕生了一個怪物的感覺。
另一方麵,對於這樣的推論,有不少人,尤其是魏碑的讀者,是不信的,也對這類說法嗤之以鼻,認為這簡直是天方夜譚。
其間,也有好事者去買了一個近五位數的網文生成器,似乎日更過萬不是夢,但能否達到魏碑這樣大火的效果,掐架群眾則各執一詞。
而發掘魏碑抄襲出處的工作一開始也不怎麼順利。
最初被指認抄襲的大概是六七本左右,隨著調色盤的比對,反抄襲聯盟發覺,所抄襲的書的量竟然直接多了個零還不止。
在查都查不完的情況下,反抄襲聯盟不得不為這本曠古奇書立了一個單獨的項目組,並建立誌願者群,在曆時兩年的情況的下,整理出500本書的名單和調色盤。
由於調色盤的篇幅巨大,不得不單獨出了七個主線支線劇情對比簡化版,來告訴吃瓜群眾到底是怎麼回事,並在共享空間裏分享了了所有調色盤。
在整理工作結束後,反抄襲聯盟最終得出了一個驚人的結論,這篇120萬字巨作,隻有最開始的八章,不到2萬字的篇幅是作者自己寫的,其餘的篇章全部是抄襲。
但在這兩年間,魏碑的小說早已賣出了版權,做了影視備案,並在此期間出版了全部書籍,電子版更是在全渠道大賣。
紅藍責編花七:“哎,當年為了這事,天寶的縹緲樓還走了一個主編,三個作者。”
“小哥哥!”冷不防劍無雙的聲音從背後冒了出來,把正在盯群看八卦的肥羊嚇了一跳。
他眼疾手快得關了群,才轉身,就看到劍無雙在狹窄的辦公區被電腦椅,下的轉盤椅腳絆倒,向他摔了過來。
肥羊不得已將她接住抱了個滿懷,然後就被她一身的鏈子弄得齜牙咧嘴。
臥槽,這妹子有毒吧!