Re: [討論] 2021 NBA歷史百大球員排行
首Po賺個P幣
個人對Learning to rank略有接觸,想說從一個不同的角度切入百大排名這件。
首先找到一組權重去對球員排名本身就是非常困難的問題。像前面版友講的,有人會說得分王重要乘以2,有人會說強分區要加權,還是不是要考慮DPOY/正負值/季後賽勝率/明星賽次數...要考慮的特徵排列組合非常非常多,還要幫每個特徵選出一個權重。
所以從資料科學的角度,常用的方式就是用監督式機器學習從現有的資料裡學出權重,這種方式必須要標記的資料。舉個例子:
大家都把自己的百大排名打在下方,這樣我們可能就得到了一些樣本可以去建立回歸模型。
然而以上也只是理想中的情況,實際上還有很多問題。首先是資料標記的問題 : 一般人大概排到第十幾個球員就懶得排下去了。這時候我們可以把排序問題變成比較問題 (MJ >> Curry 之類的),當我們有足夠的一組組的比較樣本之後,就也比較容易排出序列。
當然取得以上的資料後還會有很多問題,比方說以上的資料可能會有矛盾,又或者有反串,重複留言....之類的問題要處理。用哪些特徵也是需要鑽研的。而且最終學出來的權重也可能只是符合NBA版上對這篇文有留言的人的數據分佈而已,說不定相較於廣大群眾是反指標。
但至少我們可以透過分割資料的方式去評估這個模型的精確度,應該會比直接人為的定義權重略微符合風向。
-----
Sent from JPTT on my Google Pixel 4 XL.
--
我本來期待按下頁會看到你的算法....
同一樓..
同意 但就是要有資料庫
交給你了
不然拿近五年所有媒體做的來當資料
你用PTT推文去當回歸的data目的是?
回歸出在PTT推文最順風的排名
板上一堆反串,到時候真的生出來又要繼續吵架了XDD
要拿模型套在主觀評價真的很難,像Ewing生涯榮耀很
明顯比D. Howard少很多,可是所有媒體歷史排名Ewing
都是屌打DH
如果仔細分析 爭議文的推文應該有很高比率在反串
X
, : and one has done it 10 times. : The newest member of that group of certified bucket-getters is Steph Curry, : who on Sunday became just the 18th player in NBA history to win multiple : scoring titles.40
發表一下自己的想法,其實去年就有PO一篇,只針對某些項討論, 首先很多人認為,原PO的計算,低估了DPOY和防守隊,低估XX王,特別是得分王, 另外明星賽太高,這篇就討論這些範圍. 先說個人結論,之後再做分析, 1.DPOY和防守隊,就是不重要,這玩意就額外加分性質.10
噓 lavarslaker : 就是因為過往防守沒有被彰顯 年度球隊更偏重於進攻 07/24 03:07 → lavarslaker : 數據 才會設立防守球隊彰顯價值 07/24 03:07 這看起來是蠻值得講的一件事 之前也有一篇文56
想起去年ballacademy有列出各位置 歷史前十陣容的圖片 因為這個討論串 又忍不住找圖來複習一下 第五陣容22
原PO的計算公式實在是讓人很難不聯想到為LBJ量身訂做 第一: 年度隊伍一二三陣基本上跟明星賽的球員重疊性高,會有重複計分的問題 另外要衡量一個球員的偉大,怎麼會去計算到明星賽? 那是娛樂球迷的單一比賽,單純的比人氣93
同意原Po大部分觀點 這也是一直以來我覺得 累積數據不那麼重要 或者說不必單獨拿出來提的原因 常看到有人說某某某球員年度隊伍有多少次13
大家午安 想不到我昨天一個平凡的文章 #1W-fidf2 (NBA) 竟然能被大家推爆 然後原Po的文章 #1W-eVYI2 (NBA) 只剩下70推左右21
討論一下,但只是個人意見,不代表原PO, 本人意見就是XX王不重要,防守隊不重要. 首先從官方角度去看,NBA官方網站連結: 裡面根本沒有XX王,甚至最後一項還是普遍版友覺得不重要的生涯累積數據,爆
看了前面的想法 第一篇用自己的公式排了100個人 但是結果不被接受公式被抓出來嚴打 第二篇修正了一堆算了10個人很多人滿意 可是更後面的排名算不算得出來都有問題 那現在直接換個角度 不要管甚麼巔峰還累積數據 直接看很多人怎麼列前50
爆
[外絮] 用機器學習模型預測MVP得主今天早上在reddit看到的文章,覺得挺有趣,轉過來跟版友們分享。 小弟不是學資料科學的,如果內文有誤也請不吝指正 原文: 懶人包: 作者(u/robmoo_re)利用了過去38年的NBA的球員資料以及MVP票選結果(包含排名及票數)99
Re: [討論] 2022 NBA歷史百大球員排行原文排名偏重個人數據成就與過度凸顯FMVP的分數 但是身為歷史前幾,「當代統治力」是一個重要指標 要衡量球員的主宰力,就要納入「王朝權重」來彰顯巨星的偉大程度 王朝權重可以凸顯王朝核心在當年代的主宰程度(沒完成王朝不扣分) 才能更突顯數據累積跟「當代主宰」的差異。57
Re: [討論] 2022 NBA歷史百大球員排行說到底 今天如果討論的範圍只限定於前10大甚至前15大 最優先看的還是 冠軍 MVP 第一陣 這三個榮譽拿的不夠多, 你連進10大的資格都沒 這時什麼明星賽 得分王 FMVP 又或者是有人覺得很該值得驕傲的分區冠都沒啥意義.40
Re: [外絮] 用機器學習模型預測MVP得主大略看了一下原文 提供我的一點淺見 首先 使用機器學習處理問題 是假設實際存在一個真實的模型2X
Re: [討論] 2022 NBA歷史百大球員排行你做的這個表 其他指數我就不提 分區冠軍積分根本不合理 1.NBA東西區強弱不一樣 長期下來都是西強東弱 西區冠軍和東區冠軍的價值權重因此不能等同視之 2. 同樣強度的球員 弱區冠軍更有可能在過程中海虐對手 打出更高的PER24
Re: [討論] 2020 NBA歷史百大球員排行感謝原PO分享自己的想法, 有鑑於推文中有些人認為防守價值被評定太低,得分王應該多重要,明星賽權重的看法, 在這邊分享自己的想法. 可以先參考這篇文章: DVPE和DVPC的達成條件,6
Re: [討論] 2022 NBA歷史百大球員排行其實打這種文 你要先有"邏輯" 首先要先定義"強" 什麼是"強"? "強"有分兩種: 1. 個人強8
[討論] 球星程式化歷史定位排名先說好,我只是來騙p幣的,可能只會提出構想,然後由這裡的高手來完成,請不要噓我。 首先,是格式化的球星資料來源,用vba或是其它的程式來跑都好 球星姓名 大滿貫數 大滿貫盤子數 年終賽數 大師賽數 歷史積分 歷史排名 Nadal 22 X1 X2 X3 X4 X5 可以建議放大滿貫的權重是100;大滿貫盤子數是40;年終賽數是30; 大師賽20,其它都為12
Re: [閒聊] 繪師是怕畫不過AI還是怕AI會創作?怒刪,剛好碩班是研究AI領域,以我的角度來看 其實人工智慧這一塊的發展跟人類特徵學息息相關。人類從自我的習性套用到機器上,透 過流程特徵化後編制pipeline讓機器模仿人類的習性。 先說結論,Machine Learning(ML)不可能只靠「單一」一張畫師的畫就可以訓練成一個有 效的模型;相反地它需要透過大量的數據去臨摹某一種畫風。3X
[情報]K-近鄰演算法在圖型識別領域中,最近鄰居法(KNN演算法,又譯K-近鄰演算法)是一種用於分類和迴 歸的無母數統計方法[1]。在這兩種情況下,輸入包含特徵空間(Feature Space)中的k 個最接近的訓練樣本。 在k-NN分類中,輸出是一個分類族群。一個物件的分類是由其鄰居的「多數表決」確定的 ,k個最近鄰居(k為正整數,通常較小)中最常見的分類決定了賦予該物件的類別。若k
爆
[花邊] Allen空中膝蓋撞擊Yabusele的頭爆
[情報] Cunningham第三次大三元 隊史第四高90
[情報] 雷霆開季7-0的秘密:防守爆
[花邊] Ja Morant 空中360度上籃(單場2次)77
[情報] NBA Standings (Nov. 05, 2024)67
[花邊] Ty Lue:Kawhi這禮拜都不會上42
[花邊] Carrington與Green交談,Poole將其拉開32
[情報] 客場之旅1勝3敗 JJ:我們都很失望41
[花邊] Jimmy Butler作勢要打隊友52
[花邊] Curry命中三分後 嘴綠伸手指著Poole33
[花邊] JeffGreen成為NBA有過最多隊友的男人46
[情報] 活塞終止對戰湖人七連敗31
[情報] 騎士追平隊史最佳開季紀錄30
[花邊] 阿拓Banton第四節才上場,單節20分28
[花邊] Poole幫身穿Curry球衣的小勇士球迷簽名爆
[花邊] Cooper Flagg NCAA開幕戰表現70
[花邊] 今日Zach Edey 周志豪 生涯新高25分87
[情報] 活塞比去年快了55天拿到開季第三勝13
[情報] 上週東西區最佳球員: Mitchell, Booker77
[情報] Giannis Antetokounmpo將缺席今天面對騎士14
[情報] 尼克簽下Matt Ryan