Re: [討論] 2023 NBA歷史百大球員排行
我不是統計專業,好奇發問
: 假設想要設計一個好的模型應該是:
: 找到你的Y,Y應該是「球員排名」
: 換言之沒有先透過一個大規模問卷
: 或是多個問卷進行meta analysis的話
做統計問卷會遇到一樣的問題,你抽樣的群眾數量中太多X因數
比方美國的州人數、年紀、種族、國籍……等等
感覺又繞回到一樣的困境
: 很難有一個有統計意義的公式
: 接下來要找到一堆x
: 這部分我覺得原PO的設計概念就會有很大幫助
: 不過要靠觀球的經驗法則做一個Empirical model太難了
: 我想用簡單的logit(實際分析可以order logit)
: 下面用原本的公式當作X假想實驗
所以我的想法是繞開這些問題
如果我做一個網頁,在數據庫裡面先存放200個可能的歷史百大球員的數據
(透過累計權威媒體的名單,或是類似原原Po之類的公式,
反正我只要大約的前200球員的名單,不必"正確")
每次點進去,就出現兩個人的比較數據
重點是不亮名,即參與投票的使用者不知道這兩球員是誰
(個別巨星球員可能容易被猜出來,但是大多數一般用戶應該不會去記)
--
下面舉個栗子(因BBS不好排版我只放常規賽)
A球員
首發 時間 投籃 命中 出手 三分 命中
350 25.4 44.70% 4.3 9.7 36.90% 1.4
命中 出手 籃板 前場 後場
3.2 3.9 3.5 0.6 2.8
搶斷 蓋帽 失誤 犯規 得分 勝 負
1.3 0.3 2 2.1 13.3 762 295
特殊榮譽
4次總冠軍、2次全明星替補、1次最佳第6人、
1次最佳新秀第二隊、2次最佳陣容第三隊
B球員
首發 時間 投籃 命中 出手 三分 命中
1150 35.6 45.20% 6.6 14.6 40.00% 2.3
罰球 命中 出手 籃板 前場 後場
89.40% 3.4 3.8 4.1 0.9 3.1
搶斷 蓋帽 失誤 犯規 得分 勝 負
1.1 0.2 2.1 2.2 18.9 755 545
特殊榮譽
2次總冠軍、10次全明星替補、
1次最佳新秀第二隊、1次最佳陣容第二隊、1次最佳陣容第三隊
--
使用者只要點選告訴我「你認為百大球星排名哪一位要更靠前」
點選之後就跳出下一題(另外兩個隨機球星)
這樣經過大量的捉對比較,我想應該會有一種統計學方式可以排出百大球星
(如開頭,我不是統計學專業,但是我想應該會有)
--
技術上來說一點都不難,寫個爬蟲就可以解決大部份問題
我上面只是臨時去阿陸仔網站複製一下而已
如果真的要做,列出來的數據只要不會嚴重暴露球員身份的都會顯示(如單場最高)
使用者愛看就看,挑自己覺得重要的看也可以。
而且排名也可以實時更動,只是版友們最關心的歷史前二可能還是沒辦法解決,
因為那兩人的數據太顯眼了,可能在過程中很容易被看出來。
不知道如果用這種方式做出來的排名,各位認為的可信度高不高。
P.S 栗子中,球員A是Manu Ginobili,球員B是Ray Allen
P.S 再次強調,我栗子只是為了說明概念,沒有季後賽以及各式進階數據,勿責怪
--
有很大的可能 會刻意被刷
然後會出現除了特定支持的對象 跟厭惡的對象以外
其他被亂按的情況
忘了說 我剛有想到防刷機制 首先,想為特定球員刷太難了,因為兩個是隨機出現的 你想為Z球員刷票,大概刷100道題才會遇見一次(2/200) 一般網路問卷都會有防護機制,簡單的看答題速度 那麼多數據,你一題花不到5秒,就不列入統計。 如果有人要用科技手段去刷,那就沒辦法了。
中間段還可以 前面的會被惡搞
是的,我猜尤其前二更是。其實這時候就會回歸到一般問卷的形式 對前二來說變成「誰是GOAT」的一對一問卷
但如果有放累積數據其實很容易知道是誰吧?
有些球星你一看數據就認得出來了
這個板都是資深球迷,我想加入很多一般球迷,可能這個因素會被稀釋吧 這個我也想過
除了特定好記的一些超級巨星以外其他能第一印象反
應出來的可能不會那麼多,但出現刷分現象就會失真
,還是必然出現刷分現象
吵排名都是吵前面的,數據其實很好比出來。
有些知名數據會被認出來 而獲得"這我認得"投票
我知道還是會有些問題 但是我認為會比一般的「誰是GOAT」、「誰是前十大」、「誰是百大」更客觀 那種問卷反而會有「我兩個都聽過,但是我不太清楚數據,選個我喜歡的吧」 然後對於全公式的統計方式,前兩篇也討論過了,不畫靶射箭根本微調不出公式。
搶斷蓋帽不能修一下嗎
懶,我有轉繁已經符合板規了
認真說,數據只能參考,仔細比賽才能看出真實實力
*仔細看
這個我接受,同樣的有很多人認為「場外影響力」也是一種因素。 比方Iverson的矮小身材、拼勁以及對籃球的推廣,也讓他抬高很多。
捉對比較的話要放多少數據?平均?累積?進階?
太難了 數據面向太多很難概括球員 不如給人名就好
不是,是我把兩球員的數據全部放出來 重點數據亮色,你全都能看,比較規則在使用者心中 我只要使用者點選哪一個是他認為「排名應該更靠前的球員」
沒有辦法放全部數據阿 數據百百種是要放哪些
我直接爬NBA官網阿... NBA官網有多少,我就可以顯示多少 NBA官網更新,我的網頁就跟著更新了
如果要避開記數據 還可以直接每個單項都只顯示兩個
球員的數據差 缺點是這樣資訊又更少一點
數據差好像不錯,可以思考一下 第一直覺是同位置的還好,不同位置的好像會更困惑
這種可以用機器學習的方式解決 先設定一個比較榮譽
的模型(簡單例:a*總冠軍+b*MVP+c*FMVP),然後讓
大家用這種方式去選,跑學習演算法去決定最切合大家
選擇的係數(上例的a,b,c),之後依照係數做排名
懂了,先用全虛構的球員數據+投票,然後跑公式是吧 好像可以
剛又想到一個避免記數據的方式:各項數據的對比不顯
示數字而是顯示兩者對比的長條圖(不給刻度)
這樣避免記數據的同時還讓比較更加直觀
我覺得你剛才說的那個好像很不錯 我先隨機生成200個虛構球員的虛構數據 (或者是真實數據加雜音) 然後用虛構數據去搞我原來那個投票方式 最後透過深度學習讓AI整理出一個公式剛好是符合投票結果 但是AI跑出來的公式如果不只一個能符合虛擬數據,但是套真實數據的時候又有差異呢? 擴大樣本再來一次嗎
這樣不同時代的資訊差怎麼辦? A球員6冠 B球員11冠
但是B球員的冠軍只要打兩輪
這無解,各種方式的排名這好像都是個大問題 前面也有人說了,上古時期球隊沒這麼多,含金量跟現在不同
然後就被機器人刷到爆開
這是我們技術人員的攻防
用虛構的球員數據跟榮譽去跑重要性好像不錯
我仔細想了十幾分鐘,好像會無法收斂,不能擬合 (哭)
※ 編輯: LearnLong (210.66.129.109 臺灣), 07/16/2023 20:32:56扣分有沒有考慮進去 比如說高排名被低排名的長年奪
冠
這樣龜龜會第幾名
但每個時代的數據不是等值的 2000年初球隊總分才90
爆
首Po請注意,本排名僅為實驗性質,嘗試以單一公式量化球員生涯成就,並不一定真實反應 球員歷史地位與排名。 本年度公式異動幅度較大,變更及說明部分以綠色標示。 主要變更: 1.雙MVP積分降回前年標準:MVP調整至40,FMVP調整至28,去年調升主要是為提高12
假設想要設計一個好的模型應該是: 找到你的Y,Y應該是「球員排名」 換言之沒有先透過一個大規模問卷 或是多個問卷進行meta analysis的話 很難有一個有統計意義的公式1X
不喜歡KI,但歷史排名,不至於要靠今年積分+7才有辦法擠進去TOP 100 : 98 ▲ Alonzo Mourning 1992 C 3.6 61.0 53.3 117.9 : 97 ▼ Jimmy Butler 2011 SF 16.5 36.0 65.6 118.1 +26.7 NEW : 96 ▲ Ed Macauley 1949 C 12.8 57.0 48.9 118.7 : 95 ▼ Damian Lillard 2012 PG 0 61.0 58.9 119.9 +10.5 NEW
76
[情報] PLG/T1 各項球員數據整理 (2022/12/12)╭──────────────────────────────────╮ │ 各項數據領先者....2 平均出賽時間.....11 │ │ │ │ 平均得分..........3 兩分命中率.......12 │ │ │64
[討論] 球員進攻選擇跟獲得罰球數的相關性→ ratzeial: 那你要不要順便看一下場均罰球高的球員出手距離跟罰球,跟你的公式有沒 有match? 問得好! 最喜歡這種想要進行學(筆)術(戰)交流的朋友了! 我們先不要把範圍限縮在場均高罰球次數的球員上,我首先比較好奇的是這個「出手距離跟41
[情報] PLG/T1 各項球員數據整理 (2023/04/20)╭──────────────────────────────────╮ │ 各項數據領先者....2 平均出賽時間.....11 │ │ │ │ 平均得分..........3 投籃命中率.......12 │ │ │32
Re: [情報] NBA75週年 76大球星 球員名單Part3&全名單把之前文章和推文有提到的球員數據整理成一篇 年代太久的球員不認識 所以沒有要列入討論 生涯累積數據只貼歷史排名前30名 先從有入選的球員開始 -------------------------------------------------31
[情報] PLG/T1 各項球員數據整理 (2023/03/29)╭──────────────────────────────────╮ │ 各項數據領先者....2 平均出賽時間.....11 │ │ │ │ 平均得分..........3 投籃命中率.......12 │ │ │25
[情報] PLG/T1 各項球員數據整理 (2023/05/14)END╭──────────────────────────────────╮ │ 各項數據領先者....2 平均出賽時間.....11 │ │ │ │ 平均得分..........3 投籃命中率.......12 │ │ │21
[情報] PLG/T1 各項球員數據整理 (2023/01/23)╭──────────────────────────────────╮ │ 各項數據領先者....2 平均出賽時間.....11 │ │ │ │ 平均得分..........3 投籃命中率.......12 │ │ │13
[討論] 兩球員比較這幾天查各聯盟球員數據的時候,發現有兩個身材相似的球員數據也很類似,就丟上來讓大家討論一下,看大家原本的印象是否會和實際的數據有落差。 時間 得分 籃板 助攻 抄截 失誤 兩分 兩分% 三分 三分% 罰球 罰球% 球員A 26:19 10.8 3.5 4.2 1.32 1.88 2.3/4.7 48.7% 1.6/4.7 34.8% 1.3/1.6 80.5% 球員B 32:43 10.8 3.6 3.7 1.1 2.2 1.7/3.9 43.6% 1.6/4.5 35.6% 2.8/3.2 87.5% 兩人數據差異最大的點就在於兩分的命中上,但球員B有著更多的罰球次數。7
Re: [討論] 當年NBA三分線改制我覺得以NBA目前的數據分析,特別是三分, 應該要多加一個比較細的選項。 也就是所謂的 第一(二、三、四、五)球 的平均命中率。 依照每個球員的投球次數去產生命中率。 例如三分,你如果沒看勇士比賽,最後只看BOX,