第570章 打破夜色的電話(1 / 3)

隨著小組的組建,測試工作順利開展。

第一周的測試成果喜人,經過所有成員的努力,取得了不錯的結果,至少向關弘幾人證明了這個項目的可行性。

然而,英子卻不太滿意。

在池遠邀請她參與到模型中算法的修改完善後,她就一直不滿意。

雖然模型在第一周的測試中表現良好。

談不上來為什麼,她卻始終覺得有哪裏不對勁,尤其是她負責的部分。

池遠倒是覺得英子因為這段時間學習內容太多導致的不自信。

對於他而言,他向來更相信數據,特別是自己得到數據。

現在數據表現不錯,這是一種認可,隻是樣本不夠多,他不敢下肯定。

不過,有一點上他們達成了一致——還需要更多測試。

另一邊,隨著歸零的進行,更多的任務分配到了測試組上。

他們作為實習生,本來就不會把太重要的任務分給他們。

這樣,英子和池遠倒是能將更多精力投入到了自己的項目中。

然後……英子的‘感覺’這樣莫名其妙地應驗了。

隨著測試集的擴大,問題真的出現了——

模型出現了‘過擬合’。

這指模型在訓練數據上表現得很好,當脫離了測試數據,使用最新的、實際的數據作為測試集或驗證集,某些表現又表現得非常差。

模型訓練出來,就是用來對測試集給出判斷、甚至預測可能發生的更多錯誤。

所以,一旦出現了‘過擬合’,這模型就不能用了。

可靠性太差,誰敢用?

這無疑是一個巨大的打擊!

經過分析,他們懷疑‘過擬合’是因為以下原因:

1.模型過於複雜:沒錯,在想法期間就簡化過的模型還是太複雜了。這種複雜性使得模型不僅學會了數據中的有效模式,還學到了噪聲和異常,導致對未見過的數據泛化能力差。

2.訓練數據量不足:更準確地說,是數據類型不足。相似的數據有些多了,讓模型對某些特征或組合產生了過度依賴,而這些特征組合在新的數據上不一定成立。

工作量驟然翻了又翻。

池遠不得已把李浩源都拉了進來。

數據保密不給看,但能參與到優化模型啊!

幾乎每天,池遠都會坐在英子旁邊,跟網絡會議那頭的李浩源,奮戰到天明。

別說這是在拉壯丁!

李浩源一個大一學生,有什麼要緊事兒?

學習?對啊,實踐中學習,學習後實踐,來幫他們做項目,還能寫進簡曆。

社交?但是,李浩源一個社恐+深度恐女。

因此,池遠沒有一點負擔。

糾錯工作就這樣有條不紊地進行著。

池遠這邊跟關弘、李浩源還在不斷刪減試錯,硬是將計算機分數刷到了博士生的級別……

【計算機:327→498】(碩士:400)

另一邊‘特征依賴’,英子那奇怪的感覺就立大功……

雖然不能說一捏一個準,但大方向總是沒錯。

就好像回到了兩人高中為競賽互相競爭的時候。

池遠利用題目中的條件,通過嚴密的邏輯+繁瑣的計算,得到答案;

喬英子卻在讀完題隱隱約約知道答案長什麼樣一樣,直接兩點架橋,優雅地穿過去直達……

太不合理了。

要不是池遠靠著努力成功‘超越’(必須強調)她的物理,他都以為英子也有金手指了。

還是能一眼看到答案的金手指。

但即使是這樣……

“這也太玄幻了吧?”池遠忍不住吐槽。

“什麼?”

英子正專注於YF-77液氮液氧發動機的設計圖,聽到池遠的話,她抬頭。

又眨了眨眼睛,頓時感覺疲憊襲來,隻能抬手揉了揉眼睛。

對設計圖的專注,讓她很快就忘了池遠剛才的吐槽。