學神的傲嬌青梅，真的很可愛-第570章打破夜色的電話

隨著小組的組建，測試工作順利開展。

第一周的測試成果喜人，經過所有成員的努力，取得了不錯的結果，至少向關弘幾人證明了這個項目的可行性。

然而，英子卻不太滿意。

在池遠邀請她參與到模型中算法的修改完善後，她就一直不滿意。

雖然模型在第一周的測試中表現良好。

談不上來為什麼，她卻始終覺得有哪裏不對勁，尤其是她負責的部分。

池遠倒是覺得英子因為這段時間學習內容太多導致的不自信。

對於他而言，他向來更相信數據，特別是自己得到數據。

現在數據表現不錯，這是一種認可，隻是樣本不夠多，他不敢下肯定。

不過，有一點上他們達成了一致——還需要更多測試。

另一邊，隨著歸零的進行，更多的任務分配到了測試組上。

他們作為實習生，本來就不會把太重要的任務分給他們。

這樣，英子和池遠倒是能將更多精力投入到了自己的項目中。

然後……英子的‘感覺’這樣莫名其妙地應驗了。

隨著測試集的擴大，問題真的出現了——

模型出現了‘過擬合’。

這指模型在訓練數據上表現得很好，當脫離了測試數據，使用最新的、實際的數據作為測試集或驗證集，某些表現又表現得非常差。

模型訓練出來，就是用來對測試集給出判斷、甚至預測可能發生的更多錯誤。

所以，一旦出現了‘過擬合’，這模型就不能用了。

可靠性太差，誰敢用？

這無疑是一個巨大的打擊！

經過分析，他們懷疑‘過擬合’是因為以下原因：

1.模型過於複雜：沒錯，在想法期間就簡化過的模型還是太複雜了。這種複雜性使得模型不僅學會了數據中的有效模式，還學到了噪聲和異常，導致對未見過的數據泛化能力差。

2.訓練數據量不足：更準確地說，是數據類型不足。相似的數據有些多了，讓模型對某些特征或組合產生了過度依賴，而這些特征組合在新的數據上不一定成立。

工作量驟然翻了又翻。

池遠不得已把李浩源都拉了進來。

數據保密不給看，但能參與到優化模型啊！

幾乎每天，池遠都會坐在英子旁邊，跟網絡會議那頭的李浩源，奮戰到天明。

別說這是在拉壯丁！

李浩源一個大一學生，有什麼要緊事兒？

學習？對啊，實踐中學習，學習後實踐，來幫他們做項目，還能寫進簡曆。

社交？但是，李浩源一個社恐+深度恐女。

因此，池遠沒有一點負擔。

糾錯工作就這樣有條不紊地進行著。

池遠這邊跟關弘、李浩源還在不斷刪減試錯，硬是將計算機分數刷到了博士生的級別……

【計算機：327→498】（碩士：400）

另一邊‘特征依賴’，英子那奇怪的感覺就立大功……

雖然不能說一捏一個準，但大方向總是沒錯。

就好像回到了兩人高中為競賽互相競爭的時候。

池遠利用題目中的條件，通過嚴密的邏輯+繁瑣的計算，得到答案；

喬英子卻在讀完題隱隱約約知道答案長什麼樣一樣，直接兩點架橋，優雅地穿過去直達……

太不合理了。

要不是池遠靠著努力成功‘超越’（必須強調）她的物理，他都以為英子也有金手指了。

還是能一眼看到答案的金手指。

但即使是這樣……

“這也太玄幻了吧？”池遠忍不住吐槽。

“什麼？”

英子正專注於YF-77液氮液氧發動機的設計圖，聽到池遠的話，她抬頭。

又眨了眨眼睛，頓時感覺疲憊襲來，隻能抬手揉了揉眼睛。

對設計圖的專注，讓她很快就忘了池遠剛才的吐槽。