PTT評價

Re: [討論] 2021 NBA歷史百大球員排行

看板NBA標題Re: [討論] 2021 NBA歷史百大球員排行作者
b29308188
(ben)
時間推噓10 推:10 噓:0 →:3

首Po賺個P幣

個人對Learning to rank略有接觸,想說從一個不同的角度切入百大排名這件。

首先找到一組權重去對球員排名本身就是非常困難的問題。像前面版友講的,有人會說得分王重要乘以2,有人會說強分區要加權,還是不是要考慮DPOY/正負值/季後賽勝率/明星賽次數...要考慮的特徵排列組合非常非常多,還要幫每個特徵選出一個權重。

所以從資料科學的角度,常用的方式就是用監督式機器學習從現有的資料裡學出權重,這種方式必須要標記的資料。舉個例子:
大家都把自己的百大排名打在下方,這樣我們可能就得到了一些樣本可以去建立回歸模型。

然而以上也只是理想中的情況,實際上還有很多問題。首先是資料標記的問題 : 一般人大概排到第十幾個球員就懶得排下去了。這時候我們可以把排序問題變成比較問題 (MJ >> Curry 之類的),當我們有足夠的一組組的比較樣本之後,就也比較容易排出序列。

當然取得以上的資料後還會有很多問題,比方說以上的資料可能會有矛盾,又或者有反串,重複留言....之類的問題要處理。用哪些特徵也是需要鑽研的。而且最終學出來的權重也可能只是符合NBA版上對這篇文有留言的人的數據分佈而已,說不定相較於廣大群眾是反指標。

但至少我們可以透過分割資料的方式去評估這個模型的精確度,應該會比直接人為的定義權重略微符合風向。

-----
Sent from JPTT on my Google Pixel 4 XL.

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 73.59.104.58 (美國)
PTT 網址

pneumo 07/24 10:47我本來期待按下頁會看到你的算法....

ljk476820 07/24 10:48同一樓..

youngluke 07/24 10:50同意 但就是要有資料庫

koga5566 07/24 10:52交給你了

koga5566 07/24 10:54不然拿近五年所有媒體做的來當資料

shifa 07/24 11:03你用PTT推文去當回歸的data目的是?

youngluke 07/24 11:05回歸出在PTT推文最順風的排名

ganhua 07/24 11:09板上一堆反串,到時候真的生出來又要繼續吵架了XDD

mightymouse 07/24 13:15要拿模型套在主觀評價真的很難,像Ewing生涯榮耀很

mightymouse 07/24 13:15明顯比D. Howard少很多,可是所有媒體歷史排名Ewing

mightymouse 07/24 13:15都是屌打DH

stja 07/24 13:18

mmk 07/24 14:42如果仔細分析 爭議文的推文應該有很高比率在反串