Re: [問卦] 為什麼現在新的深度學習模型都很少割
※ 引述《ruthertw (督人無數就是我)》之銘言:
: "為什麼現在新的深度學習模型都很少割出test dataset?"
: 在進行實驗的時候,
: 發現近三年來的研究工作,
: 很多都沒有切割test dataset,
: 論文裡也沒有列出test dataset的實驗結果.
: 反而都直接以validation dataset包含test dataset.
: 比例也從以往常用 train:val:test = 8:1:1 (7:2:1)
: 變成 train:val = 8:2
: 很多學校裡的指導教授還是要求要使用8:1:1這個鐵比例.
: 為什麼現在新的深度學習模型都很少割出test dataset?
: 這些新模型其實只是舉手之勞就可以做這到件事,
: 而且按照指導教授的要求,
: 論文裡要是沒有test dataset的實驗結果,
: 應該是不能被刊登.
: 不得其解...
: 大大們可以詳細說明解釋這個原因嗎?
: 還有,
: 想知道指導教授的堅持是對的嗎?
: 以及有沒有上述眾多問題的八卦?
: 先謝謝各位深度學習的高手~
看到我以為我跑錯版了,嚇死寶寶,
阿肥我來回答一下啦。
傳統訓練集就是拿來擬合模型參數的,驗證集是拿來做超參估計,然後鐵定要是無偏的樣本,跟訓練集彼此獨立的。
然後測試集就是最後評估整體模型的,也是要無偏獨立上面兩種。
還有一種方法是k-fold,就是把原始訓練集切成多個子集,再進一步把其中一個子集做驗證,其他子集就訓練,輪k次,很多文獻就乾脆把原本的測試集直接寫是驗證集,就變成80:20。
然後最後有一點就是其實現在很多模型尤其是OPEN AI那些超巨量模型你也很難做超參估計跟模型選擇,訓練一次就耗費幾億的,乾脆就一樣分80:20訓練跟驗證,反正只要確認20%是無偏獨立樣本就好了。
--
只有我看不懂嗎
就是 siae 夠大也夠不偏差,dataset一筆分
兩份,不另外生test set出來用
size
爆
[爆卦] 周思齊跟黃國昌合照慘遭出征爆
[問卦] 超級不爽我的親戚來拜託我,怎辦67
Re: [新聞] 林士傑對賴清德多重要?董智森揭超大咖地59
[問卦] 想要去三立上班,要什麼條件?爆
[問卦] 王菲只推一首歌的話,推哪首???爆
Re: [新聞] 鄭文燦涉貪獲交保檢抗告成功 高院撤銷發36
[問卦] 伊藤潤二跟三麗鷗的聯名,可愛嗎?52
Re: [爆卦] 周思齊跟黃國昌合照慘遭出征19
Re: [問卦] 台灣經明明很差 卻股市高漲 這啥回事?25
Re: [問卦] 樂觀低學歷女 vs 現實高學歷女 怎麼選?22
Re: [爆卦] 周思齊跟黃國昌合照慘遭出征16
[問卦] 沒人發現股價太高嗎?14
[問卦] 醫學期刊The Lancet說酒比毒危害大但沒43
[問卦] 老人:賺5萬3萬給父母都應該!怎反駁?20
[問卦] 小龍女跟尹志平打砲時484高潮了?19
[爆卦] TSM 一兆美金市值達成18
[問卦] 假如有一天中國徹底民主化對台是利還弊?18
[問卦] 中國為何沒英雄電影?〓〓19
[問卦] 繼光香香雞為何可以開那麼多分店啊?16
[問卦] 有沒有令人難忘的集體恐怖體驗的卦35
[問卦] 你們會看中國的動畫嗎22
[問卦] 你敢動我的馬,我就幹你的狗!有多經典?60
[問卦] 新加坡貧富差距創下24年來新低!15
[問卦] 法國為了擋極右派選個左派有比較好?16
[問卦] 邵雨薇以長相跟身材來講 大概PR?14
[問卦] 賈翔和苟或誰比較厲害的八卦?12
[問卦] 凌晨三點這邊怎麼還那麼多人13
[問卦] 最近很多事情都很怪 是不是有什麼事要發10
[問卦] 湖南洞庭湖潰堤 怎麼都沒人要捐錢了啊?9
[問卦] 台灣人ㄣㄥ不分?