Re: [問卦] 為什麼現在新的深度學習模型都很少割
※ 引述《ruthertw (督人無數就是我)》之銘言:
: "為什麼現在新的深度學習模型都很少割出test dataset?"
: 在進行實驗的時候,
: 發現近三年來的研究工作,
: 很多都沒有切割test dataset,
: 論文裡也沒有列出test dataset的實驗結果.
: 反而都直接以validation dataset包含test dataset.
: 比例也從以往常用 train:val:test = 8:1:1 (7:2:1)
: 變成 train:val = 8:2
: 很多學校裡的指導教授還是要求要使用8:1:1這個鐵比例.
: 為什麼現在新的深度學習模型都很少割出test dataset?
: 這些新模型其實只是舉手之勞就可以做這到件事,
: 而且按照指導教授的要求,
: 論文裡要是沒有test dataset的實驗結果,
: 應該是不能被刊登.
: 不得其解...
: 大大們可以詳細說明解釋這個原因嗎?
: 還有,
: 想知道指導教授的堅持是對的嗎?
: 以及有沒有上述眾多問題的八卦?
: 先謝謝各位深度學習的高手~
看到我以為我跑錯版了,嚇死寶寶,
阿肥我來回答一下啦。
傳統訓練集就是拿來擬合模型參數的,驗證集是拿來做超參估計,然後鐵定要是無偏的樣本,跟訓練集彼此獨立的。
然後測試集就是最後評估整體模型的,也是要無偏獨立上面兩種。
還有一種方法是k-fold,就是把原始訓練集切成多個子集,再進一步把其中一個子集做驗證,其他子集就訓練,輪k次,很多文獻就乾脆把原本的測試集直接寫是驗證集,就變成80:20。
然後最後有一點就是其實現在很多模型尤其是OPEN AI那些超巨量模型你也很難做超參估計跟模型選擇,訓練一次就耗費幾億的,乾脆就一樣分80:20訓練跟驗證,反正只要確認20%是無偏獨立樣本就好了。
--
只有我看不懂嗎
就是 siae 夠大也夠不偏差,dataset一筆分
兩份,不另外生test set出來用
size
爆
[問卦] 【Live】Mike Tyson VS Jake Paul爆
[問卦] 以前沒有智慧型手機大學生都在幹嘛??93
[問卦] 薄瓜瓜的小孩以後應該叫什麼名字?42
[問卦] 日本轉播一直講Chinese Taipei = =69
[問卦] 無蝦米和倉頡是怎麼沒落的爆
[問卦] 大榮貨運還不倒閉,我總覺得很不可思議60
[問卦] 認真問,20歲泰森打得贏保羅嗎56
[問卦] 大巨蛋當初是誰在黑?61
[問卦] 各位國小下課10分鐘最常玩遊戲?爆
[地震] 地震52
[問卦] 今年怎麼MLB營收爆增,NBA票房慘淡?99
[問卦] 為何父母那輩,都能有房有車= =...?73
[問卦] 你各位真的在日本看過賣比台灣貴的東西?41
Re: [新聞] 南市流浪犬又惹禍!馬術場遭入侵釀3死238
[問卦] 今天棒球大戰 該買日本還是買中華隊?38
[問卦] 在PTT推文@別人ID的在想什麼?28
[問卦] 為啥薄熙來給兒子取這種名字32
[問卦] 為什麼公務員不離職,反而選擇自殺?24
[問卦] 潮州副站長為什麼會那麼想紅啊??26
[問卦] 我All in日本了!發財致富全靠今天了各位!52
[問卦] 范琪斐的婚姻 是我少見多怪嗎?26
[問卦] 台日友好 然後日本派防禦率1.83的投手??17
[問卦] 5g是不是一個騙局啊23
[問卦] 高鐵北上有刀出沒?57
Re: [問卦] 大榮貨運還不倒閉,我總覺得很不可思議82
[爆卦] 世紀拳賽 泰森輸了…………21
[問卦] 買電視一定要買聲霸嗎19
[問卦] 大巨蛋有老鼠啦,救命喔18
[問卦] 馬斯克來台灣會砍什麼政府部門?13
Re: [新聞] 早預感黃珊珊鬧翻藍白合!蕭旭岑爆柯