PTT評價

Re: [心得] 認識正負值(Plus/Minus)- RAPTOR

看板NBA標題Re: [心得] 認識正負值(Plus/Minus)- RAPTOR作者
IBIZA
(溫一壺月光作酒)
時間推噓15 推:16 噓:1 →:4

※ 引述《driftcreator (北美漂流中)》之銘言:

這篇的介紹大概有30%是錯的, 但錯的還蠻關鍵的

: 正負值(+/-)可說是籃球數據界的殿堂名駒,現今你能拿來直接做球員比對的all in one數據,多帶有正負值血統。其血統表如下:
: ・第一代「原始數據」:正負值(+/-)、官網RTG系列

RTG不是+/-系列數據, RTG是基於Points Produced的進階數據

: ・第二代「迴歸分析修正」:APM → RAPM
: ・第三代「混合傳統數據」:ESPN RPM(2013年版)
: ・第四代「混合動態追蹤數據」:ESPN RPM(2019年版)、RAPTOR
: 個人當前較推薦使用RAPTOR。邏輯透明且能追朔至2013賽季。
: 新版ESPN RPM因為是黑盒子的關係,所以無從介紹驗證。目前RPM的產出結果,與其他版本(RAPTOR、BPM2.0、PIPM)存在較大的差異性。

ESPN得到RAPM授權之後, 推出了RPM
就RPM的說明, RPM是以RAPM為基底, 加上數據做調整, 但一直沒說明調整的方式
所以上面關於ESPN RPM的說明沒問題

但就RAPTOR的說明, 他並不是和ESPN一樣, 以RAPM為基礎加上數據做調整
而是直接用傳統數據+動態追蹤數據, 透過回歸分析去追蹤RAPM
這一點和BPM的做法類似, RAPTOR在網頁上也直說是由BPM得到靈感

為什麼BPM跟RAPTOR會這樣做?
RAPM的模型自從推出後就廣被推崇
但RAPM最大的問題, 就是需要夠大的回合數才能得到有效的數字
這邊的回合數在一開始RAPM的網頁中被定義為20000回合
但其實一整季都打不到這個數字
最操勞的球員都要三季才能得到20000回合數, 遑論有很多球員一輩子可能都達不到

因為RAPM計算不便, 又有短期效度問題
所以就有人嘗試以傳統數據用迴歸分析, 去追蹤長期RAPM
這種做法的想法就是

以長期RAPM作為應變項, 為每個挑出來的數據跑回歸分析, 找出權重
這樣找出來的所有權重*數據之後加起來, 就會近似於長期RAPM
那麼之後我們就可以直接把權重*數據當作長期RAPM

最初是2011年的ASPM
ASPM用傳統數據透過回歸分析去追蹤八年(2003-2011)的RAPM數據
ASPM後來授權給BR網站, 因為他是用傳統數據, 也就是Box Stats去追蹤RAPM
所以被取名為BPM

RAPTOR則是BPM的新一代版本
RAPTOR在傳統數據之外, 加上了官網在近六年提供的動態追蹤數據


簡單講, ESPN RPM是RPM的混合版本, 他仍然是基於原本的RPM模型, 但加上數據做調整
但BPM跟RAPTOR則是RPM的追蹤版本, 用回歸分析去追蹤某段長時間的RAPM, 以此產生公式雖然都基於RAPM, 但他們是完全不同的東西
把他們列為不同代的數據是不適合的

要比喻的話
ESPN RPM是RAPM+其他數據生的小孩
而BPM跟RAPTOR則是透過整形把自己整得像某一段時間的RAPM

: ---
: 使用正負值數據前,你需要有以下基礎認知:
: 正負值數據僅呈現「該球員於當前環境的已產出表現」
: a.預設球員表現穩定,不存在定位調整或化學反應。因此季中轉隊球員數據容易失真。

這邊的說明是錯誤的
RAPM並沒有預設球員表現穩定,不存在定位或化學反應

相反的, RAPM利用大數據去分析lineup與lineup的對抗
這是RAPM被推崇的主要原因
但也是RAPM的問題, 因為很多lineup的回合數不足以消除偏差

RAPM知道定位跟化學反應的影響, 嘗試用大數據去分析lineup的影響
你可以說他受限於數據做的不夠好, 但不能說他沒這樣做

: b.這類數據對未來的預測性低。只要隔季所待球隊環境改變,數據就很容易大變。
: 新一代數據的準確度,與位在高樓大廈內的GPS定位差不多
: a.注意概略落點即可,不要太執著在排名與微小的數字差異上。
: b.原始+/-與官網RTG系列評估球員的精準度非常差,不要拿來用。
: ---
: FiveThirtyEight RAPTOR
: https://projects.fivethirtyeight.com/2020-nba-player-ratings/
: a.加入了Second Spectrum的動態追蹤數據;能向前追朔至2013賽季。
: b.由85% BPM與21% RAPM組成,且有公開細部的權重分配。

這邊錯了, 網頁上85%跟21%指的是Total RAPTOR=85% BOX RAPTOR+21% On/Off RAPTOR
跟BPM和RAPM無關

: c.邊緣輪替球員(replacement level)的基準值:-2.75。
: d.有「球員未來預期版」,並額外添加了一堆參數進去。
: ---
: 以上是基於ptt閱聽眾特性的精簡版本。以下是解析文字較多的太長不看版
: https://vocus.cc/basketball/5dc88173fd8978000153fb0e
: 關於數據,Playtype與USG%則是球迷間最容易濫用與錯誤解讀的。相關介紹如下
: 認識Playtype
: https://vocus.cc/basketball/5d967bc0fd89780001a485ed
: 認識USG%
: https://vocus.cc/basketball/5dc88151fd8978000153fb01

--
願歲月靜好,現世安穩

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.56.77 (臺灣)
PTT 網址

Vedan 05/08 12:24

Nogone 05/08 12:26

jonestem 05/08 12:28

lens82801 05/08 12:29

pneumo 05/08 12:33

※ 編輯: IBIZA (122.116.56.77 臺灣), 05/08/2020 12:53:34

FAYeeeeeeee 05/08 12:59我覺得搞懂這個比搞懂CBA還麻煩

jonathan890705/08 13:30

s891234 05/08 13:32

dda 05/08 13:37

Kenshin0707 05/08 13:58有資料有推

Altair 05/08 14:35推詳細說明與比較

Altair 05/08 14:35CBA有時候需要的是時空背景的理解

Altair 05/08 14:36而這種通常需要的是對分析假設及統計方法的理解

tanp23lj 05/08 14:44I大接受專業

Ten6666 05/08 15:39先推

KirkSynder 05/08 20:24專業文推,專業到沒幾個人看得懂

AmibaGelos 05/08 21:00推推 好奇如果拿短期球員的raptor去喂rapm會如何xd

AmibaGelos 05/08 21:00如果短期和長期沒有系統偏差的話應該會有幫助?

deanisme 05/08 22:52原來raptor也是box metrics的產物 一直覺得這種類

deanisme 05/08 22:52型的數據 其命名裡面根本不該有+/-

ckain 12/04 05:37