[閒聊] 進階數據RAPM簡介(二): PM and APM
前面已經說明PER不能確實反映球員對球隊獲勝機率的影響
因此一個直覺的方法就是直接看球員在場上球隊會領先還是落後
正負值(Plus Minus, PM)還蠻簡單明瞭的
就是特定球員在場上的時候,(球隊-對手得分)是變大還是縮小
數值越大代表對球隊幫助越多,負值就是傷害球隊
但是PM會有幾個大問題
1. 大部分球員無法單獨控制比賽走向。
Ex. 對面如果狂下三分雨,你的正負值就會崩盤
2. 沒有針對隊友和對手強度調整。
舉例來說,你跟LBJ同時上場正負值就會偏高
若在另一邊則可能會很難看
這樣正負值顯示的是LBJ的影響不是你的影響
3. 樣本數低之下雜訊偏高。
如果你這場正負值是+10,但湖人陷入苦戰LBJ正負值只有+5
這樣代表你打得比LBJ好嗎
恐怕不見然
為了解決前兩項問題,有人提出了Adjusted Plus Minus (APM)
APM的基本想法就是考量隊友以及對手的強度,把正負值分配到適合的球員身上
計算方法(*為了表達方便經過簡化)就是解不同陣容的多項式
舉例來說
X1= (A1+A2+A3+A4+A5)-(B1+B2+B3+B4+B5)
X2= (A1+A4+A5+A6+A8)-(B3+B4+B5+B7+B10)
X3= (A2+A3+A5+A7+A9)-(B1+B3+B4+B5+B8)
……
其中X為每百回合得分差
A為我方球員 B為敵對球員
透過套入矩陣解多項式
就能得到A1, A2, A3, B1, B2, B3等個別球員對球隊的貢獻
由於矩陣並非方陣
因此利用擬反矩陣(Pseudo Inverse Matrix)來近似反矩陣
並用最小平方法估計不同球員的貢獻值
APM聽起來好像很理想
能把球隊貢獻分配到個別球員
但是也有3個問題
1. 最小平方法是用估計的
會遇到變異數巨大的問題
2. 教練喜歡把特定幾位球員一起放上場
導致貢獻很難有效區分
3. 部分球員一起上場時間很少
導致樣本雜訊偏高
缺乏統計意義
第二和第三個問題比較難克服
總不能強迫教練不用固定陣容 讓大家隨機上場
但第一個問題就是Regularized Adjusted Plus-Minus (RAPM)想要解決的
下回待續
--
推
推
爆
Re: [外絮] LBJ與龜龜同時在場時的正負值為-87,於單純比正負值會有很多雜訊。以這個題目為例: 團隊NetRtg 上場時間min LBJ on & 龜 on: -1.55 1,225 LBJ on & 龜 off: -3.00 620 LBJ off & 龜 on: -5.15 1,075爆
[情報] Rajon Rondo今日正負值+22如題,而Rondo全場只上了26分鐘。 全隊第二的是Mann的+18。 有看比賽的就知道,快艇是Rajon Rondo一肩carry起來的。 PG和KL上半場準得跟鬼一樣,Rondo上場前,球隊落後17分,Rondo下場後也拉不開比分, 只能維持平盤。86
[討論] Danny Green是怎麼做到正負值那麼高啊?剛剛去看湖人數據的時候 看到季後賽正負值 DG到底是有什麼魔力+-值可以那麼高 +8.9,以我對正負值的認識,可能一場會不準,因 為可能剛好上場時間是有人在發力,或是剛好隊友很準,但是15場平均下來還可以第二,28
[專欄] 明星賽入選球員討論_以BPM進階數據切入Box Plus / Minus,(版本2.0(BPM))是基於籃球得分的度量標準,用於估計籃球運動員 在場上對球隊的貢獻。 該數據詳細解釋如下 BPM使用球員的得分資訊,位置和球隊的整體表現來估算球員的貢獻(以每100次回合的聯9
[閒聊] 進階數據RAPM簡介(末): RAPMRegularized Adjusted Plus-Minus (RAPM) 由於APM只用誤差最小平方法進行估算 若有球員表現呈高度相關性 則會出現多重共線性的問題 導致不同球員估算的正負值有劇烈的浮動8
[閒聊] 進階數據RAPM簡介(一): PER常常看到球迷引用進階數據分析球員 但往往都是直接拿數字來比大小 較少人會針對背後的數學公式/模型進行討論 因此想來介紹個在進階數據中鼎鼎大名的RAPM 要介紹進階數據之前要談一下進階數據老祖宗Player Efficiency Rating (PER)2
Re: [心得] 認識正負值(Plus/Minus)- RAPTOR官網的RTG系列是把球員在場上時,球隊的得失分做百回合量化,跟+/-值一樣屬於結果數據,因此我把他們放在同一個類型下。 : 關於ESPM RPM 以下是沒有放上來的原文內容 正負值的核心問題是樣本不足的情況下準確度很差。RAPM具效性的樣本通說是三年起跳;也因此半季不到就能產出內容的正負值數據中,公開資料都是以高比例的BPM為基底,否則無法有效反應球員的當季表現。RPM雖為黑盒子,但普遍認為ESPN也是以相同的方式產出數據。 RPM對於box score的使用相當吃重是公認的,當然不一定是像RAPTOR這樣直接BPM系跟RAPM系兩組數據調比重混合出結果,但我個人不覺得只靠RAPM基底調參數就能讓結果敏感反應,特別在你2.0 matchup又多了更多小樣本參數的框框下。