PTT評價

[討論] 球員進攻選擇跟獲得罰球數的相關性

看板NBA標題[討論] 球員進攻選擇跟獲得罰球數的相關性作者
henry87927
(科大港仔)
時間推噓64 推:71 噓:7 →:94

→ ratzeial: 那你要不要順便看一下場均罰球高的球員出手距離跟罰球,跟你的公式有沒有match?

問得好!

最喜歡這種想要進行學(筆)術(戰)交流的朋友了!

我們先不要把範圍限縮在場均高罰球次數的球員上,我首先比較好奇的是這個「出手距離跟獲得罰球」的相關性,如果再細分到一個一個球員上,會不會也成立呢?

首先,如果是用所有球員(我們算有出賽超過20場的)例行賽的數據去比較,那會長這樣:

https://i.imgur.com/21BoZjf.png


欸怎麼變正相關?因為會有一堆低出手數低罰球數的球員堆在左下角那邊,整個分析就沒意義了。

所以找出「場均出手多少次以上的球員才是有參考價值的樣本」就很重要了。

這邊歡迎各位版友提出更好的方法,我自己是用了帕雷托法則(就是鼎鼎大名的80/20法則)去做假設。

為了讓文理組都不得罪,這邊解釋一下80/20法則。大致上的意思是說80%的結果,都是源自 20% 的成因。

換句話說,小比例的原因就能帶來結果帶來巨大的影響。比如公司80%的營收大多來自前20%的客戶、國家80%的GDP來自前20%的企業等等。

上NBA版還能學統計學,想不到吧。


回到主題,NBA的出手次數雖然沒有集中到80/20,但70/30卻是有的。

本季例行賽,NBA官網登錄539名球員,全聯盟出手了217220次。

而出手次數前30%的球員(前162名)的加總出手數是142926次,佔了全NBA的出手數的66%。

所以拿出手次數前30%的球員作為樣本,來比較「球員出手距離跟獲得罰球數量」的相關性,應該很有代表意義了吧:
https://i.imgur.com/HeDrGir.png


嗯…還是正相關,我想了一下,發現我忽略了一個簡單的事實:

越常出手的球員,本來就越容易有罰球啊。

所以我再用這前30%的球員資料比較了場均出手數跟罰球數的關係:

https://i.imgur.com/peXXGwp.png

果然有夠相關。

但仔細觀察圖表之後,發現隨著出手次數的增加,資料點開始逐漸發散,尤其以出手數15次附近為分水嶺。

場均出手15次以上的「罰球數跟出手次數」相關性減弱了。代表有其他的變數在影響這個相關性。


那我們把場均出手15次以上的數據(其實是14.7次以上因為我想把Poole也擺進來XD)拿來比較,於是就得到了這張圖:

https://i.imgur.com/NiJvay2.png


能場均出手14.7次以上,應該可以說是各隊主力球員(共58位),大家應該都認得就加了名字上去。

順手標了幾個大家會感興趣的球員給大家當吵架素材,請珍惜帳號。


所以分析完數據之後下個結論:

1. 出手次數越多,就越有拿到罰球的機會(廢話

2. 球隊「主力球員」的攻擊選擇,則會受到出手距離的影響。出手距離越遠,得到的罰球數越少。

有不少推文有提到相關係數太低的問題,的確這篇拿來當論文應該會被教授洗臉洗到翻過去。
與罰球多寡有相關性的變數應該非常多,之後有空的話打算再抓多點數據做多變量分析。

這篇就當拋一個想法給大家討論,研究方式不嚴謹請見諒。
也附上這篇跟上一篇回歸線公式的比較:

上一篇回歸線:
https://i.imgur.com/IjizhdM.png


這一篇回歸線:
https://i.imgur.com/TIc7CZx.png


上一篇推文有人說要附上P value證明顯著性,好啦都來啦:
https://i.imgur.com/XD5l4jZ.png


最後應你要求,「順便看一下場均罰球高的球員出手距離跟罰球,跟你的公式有沒有match?」

我就抓場均最高的10位球員,自己看:
https://i.imgur.com/kLnrWhu.png


商科算文組的話我文理組都待過啦。大家聊球就好。不要亂開戰場:)

以上一點小分享,感謝大家。有看到推文說想看太陽46罰的分析,要是最後西決湖人打太陽我就做XD

數據都這裡抓的,有興趣歡迎各位多多利用[Teams Traditional | Stats | NBA.com](https://www.nba.com/stats/teams/traditional?SeasonType=Regular+Season)

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.239.48.62 (香港)

※ 文章網址:
https://www.ptt.cc/NBA/E.bBflWjAOFDxU

larry780109 05/05 01:51太神啦...

jay228 05/05 01:52有些球員是投很多中距離,有些是切入+外線

jay228 05/05 01:53單純用出手距離來看,似乎不太精確?

love1500274 05/05 01:57其實有太多因素影響罰球

love1500274 05/05 01:58球員會不會惡意萊犯規 和團隊是否為加分狀態

jay228 05/05 02:01或許該用三種出手距離各自取得的罰球數來判斷球商

kasugamaru 05/05 02:03怎麼不把罰球數/出手數

fish0414 05/05 02:06不用理那個人浪費自己時間其實

linchw 05/05 02:06他還能回你嗎 沒被水桶也太瞎

darren2586 05/05 02:12我大半夜看版不是為了看到統計課本的QAQ

star1234 05/05 02:15弱弱問,戰場是哪篇阿

rayisgreat 05/05 02:18未看先推 戰起來戰起來

allse1032 05/05 02:18太神啦看NBA版學統計

jgps61203 05/05 02:21勇湖G2快開打了 這裡還在打G1 OT5 777777

obeyxxxx 05/05 02:26以後一定要讓孩子好好讀書再去網路筆戰

abc32521 05/05 02:29推統計學

ccs100203 05/05 02:32推統計

willyhsuan 05/05 02:33Y軸放罰球數/出手數 X軸放出手距離加權

ymsc30102 05/05 02:33推 戰場在前面同一個作者 跳投大隊vs切入大隊那篇

DonDonFans 05/05 02:33

Liability 05/05 02:33推統計,比起只會留言跳針球商罰球好多了=_=

romeomonkey 05/05 02:45超屌欸 課文應該寫這個有趣多了

wpd 05/05 02:51他的前提是"場均罰球高的球員"

e8e88 05/05 02:51MVP的球商好高

wpd 05/05 02:51所以圖表裡不能列入場均低於大約3~4次的

wpd 05/05 02:54你做的應該叫"出手數高的球員 出手距離跟罰球關係"

wpd 05/05 02:55而不是"場均罰球高的球員 出手距離跟罰球關係"

canlest 05/05 02:57G1 OT打不完呀

wpd 05/05 02:57你好像有點刻意繞一圈用出手數高 罰球數高的"相關"

wpd 05/05 02:57去把這兩個前提直接替代掉

wpd 05/05 02:59你要有你自己的篩選標準可以 不過跟別人問的就有差

Aether13 05/05 02:59用腳想也知道有相關 重點是有沒有合理 公平吹判每個

Aether13 05/05 02:59play

wpd 05/05 02:59

wpd 05/05 03:01https://i.imgur.com/NiJvay2.png 就這張表

wpd 05/05 03:02場均罰球數低於3.5/4/4.5的拿掉 看看趨勢線如何

wpd 05/05 03:14後來看到你在結論完以後補充地方才做 後面那圖可以

wpd 05/05 03:17不過抓到TOP10 7.9罰 有點標準太高 多幾個篩選門檻

wpd 05/05 03:18不如抓個5 剛好有Curry Poole 比較多人想看

Delirious15 05/05 03:27幫結論:nba捧77買飯 鉛筆罰球賺分洗到MVP

hschian 05/05 03:37結論,普爾今年領多少?

hschian 05/05 03:38線上面那票領多少?

hschian 05/05 03:38最靠近普爾那個是不是欠噴?

w25707693 05/05 04:04不用浪費時間理某小丑欸

orthogonal 05/05 04:46推 其實我建議把 場均罰球次數/場均出手次數 當作

orthogonal 05/05 04:47罰球比例 去和出手平均距離算相關性

orthogonal 05/05 04:47精確地說是 (罰球+出手次數)/出手次數 因為會獲得

orthogonal 05/05 04:48罰球那幾乎都是有要出手被犯掉

orthogonal 05/05 04:48不過還有and 1跟三分罰球的問題...其實場均罰球次數

orthogonal 05/05 04:49還真不好精算

badangel000005/05 05:43簡單的事實 本來就不用理那個悲憤宅 超逗

Dino14124 05/05 06:03請問龜龜在哪QQ

ken720331 05/05 06:10推 比什麼感覺文好太多了....

ljk476820 05/05 06:10好猛…

NWAHSEF 05/05 06:16出手距離越近 防守球員越多 被犯規機會越高

azlbf 05/05 06:24不想做就直說 大腸已經555

xeriom22576 05/05 06:26結論就是勇士罰球少到靠北不是?

tim12345682 05/05 06:39太神啦 大數據分析

SagaLin 05/05 06:40自己也是統計背景推一下。我對紀錄的記錄方式不太

SagaLin 05/05 06:40熟,想問出手距離是不是只計算成功出手的球?如果

SagaLin 05/05 06:40獲得罰球的回合沒有算出手的話,這裡也許有一點樣

SagaLin 05/05 06:40本選擇的偏誤在(雖然影響可能不會太多)。如果有

SagaLin 05/05 06:40獲得罰球該次的出手距離,也許可以嘗試用距離解釋

SagaLin 05/05 06:40獲得罰球與否試試看。

killuaz 05/05 06:54Curry出手距離遠 防守球員有比較少嗎?XD

palapalanhu 05/05 06:54

ic09410 05/05 07:01所以結論是什麼?

ken720331 05/05 07:05掩護後三分出手 不就是抓瞬間空檔嘛 要什麼罰球

ken720331 05/05 07:05圓柱體?

baller0allen05/05 07:18結論就是沒有結論,數據太離散

baller0allen05/05 07:20我知道basketballstate 可以抓到 出手形態,可以以

baller0allen05/05 07:20出手形態為主做分析 可能比出手距離有用

baller0allen05/05 07:23還可以加入柴犬的影響(每個柴犬整場比賽吹罰的數

baller0allen05/05 07:23量與平均吹罰的偏離正負差)

kitoik5427 05/05 07:25不要不要 我現在就想看太陽46罰

ken720331 05/05 07:25阿銀是有可能把柴犬亂吹數據化嘛 他不是不想公開

Dickys20009205/05 07:25有解決內生問題給推

hschian 05/05 07:28聽君一席話,如同一席話~

ChrisPaul03 05/05 07:30相關係數0.1 就不要用統計學觀點了

ChrisPaul03 05/05 07:31很明顯不是這兩個變因在決定

edwinrw 05/05 07:33

tasimichael 05/05 07:50好了啦老哥

s8900117 05/05 08:05專業推

p890089 05/05 08:07推上面 R平方0.1這篇直接end

skywings198405/05 08:11認真!專業 !

BioJacob 05/05 08:11推大大分析,但怕有人看不懂只想吵XD

y800122155 05/05 08:12做出來結論跟想像不一樣就猛篩樣本數,那就不叫統計

y800122155 05/05 08:12

ScarYao 05/05 08:13不是 統計內容跟結論對不起來呀

ScarYao 05/05 08:14就是一路解釋到自己要的結果

rolandgjh 05/05 08:24相關係數只有0.1的統計結果可以說一點意義都沒有吧

rolandgjh 05/05 08:24…前面一堆推的可以說一下你們看懂了啥嗎

heartbeaz 05/05 08:26推 但一大早起來看這個應該沒人看的下去

Presentation05/05 08:29你的相關係數0.1太低,表示兩個變數是低度線性相關

Presentation05/05 08:29,另外xy的比例差異過大,導致你覺得線畫起來很有

Presentation05/05 08:29相關,實際上兩個軸的scale拉到一樣的話,回歸線應

Presentation05/05 08:29該幾乎是水平線了

受教了,沒有考慮到XY軸Scale的問題,所以圖誤導性太強了。我補個內文

ruokcnn 05/05 08:37R方0.1連社科院的論文都不會過啦XD

※ 編輯: henry87927 (14.0.157.122 香港), 05/05/2023 08:37:39

ruokcnn 05/05 08:39你商科484沒修過統計 補噓

hschian 05/05 08:41刪文算了~ 獻醜而已~

MK47 05/05 08:42BioJacob : 推大大分析,但怕有人看不懂只想吵XD

MK47 05/05 08:42這個就是看不懂相關係數0.1的人吧

wainkid 05/05 08:43有p先給推 但R沒有0.995的話...

※ 編輯: henry87927 (14.0.157.122 香港), 05/05/2023 08:47:54

JH4748 05/05 08:49這幾篇知識含量有點高餒

※ 編輯: henry87927 (14.0.157.122 香港), 05/05/2023 08:49:34

hschian 05/05 08:49出手距離/進攻方式 是兩馬子事 硬要綁在一起

hschian 05/05 08:49攻擊籃框 容易獲得罰球 這基本常識

hschian 05/05 08:50你要硬把出手距離拉近來講

hschian 05/05 08:50就莫名其妙而已

hschian 05/05 08:51最蠢就是那球星去套

hschian 05/05 08:51每個球星有不同的攻擊方式

hschian 05/05 08:52硬要抓球星來完美你的說法

Billbehappy 05/05 08:52給牡蠣

hschian 05/05 08:53你怎麼不去查,發生犯規的區域在那邊最多?

hschian 05/05 08:53硬要套欸~ 笑死~

chordate 05/05 08:57你可以參考一下那些做進階數據的怎麼做

chordate 05/05 08:57通常是分切入跳投去看,參考人家已經有的作法

chordate 05/05 08:58可以少很多冤枉路

chordate 05/05 08:59不是單純的用距離

Larry0806 05/05 09:15他這麼認真, 怎麼噓的這麼兇, 這要給鼓勵阿!!

Presentation05/05 09:18這種大學基礎統計學的回歸章節功課,圖跟數據解釋

Presentation05/05 09:18成這樣,要怎麼給推?

Larry0806 05/05 09:21有做功課就給推了~ 不滿意可以另闢新文推翻他阿

a12124477 05/05 09:22你要國中小看懂這個太強人所難了吧

MK47 05/05 09:29確實 國中小看圖多就推了 根本沒在管你推導過程、相

MK47 05/05 09:29關係數跟結論的關係

Presentation05/05 09:32推文不就說了,結論的正相關(出手距離、罰球數)

Presentation05/05 09:32數據的相關係數只有0.1,表示低度線性相關,至於圖

Presentation05/05 09:32為什麼看起來正相關是因為xy 軸的scale 差異過大,

Presentation05/05 09:33如果調整scale,圖看起來應該會接近水平線,就不會

Presentation05/05 09:33覺得很正相關了

Larry0806 05/05 09:33來來來 你各位專業的學碩博 生一篇讓我增長見聞

Presentation05/05 09:35我還正好真的是統計碩士呢,已經回覆的推文我想不

Presentation05/05 09:35必再爭論下去,原po 也已經知道自己的結論過於粗糙

Presentation05/05 09:35,等看看他修正後的文再說吧

jk10134 05/05 09:57看完就覺得難怪我薪水漲很慢QQ

DonDonFans 05/05 10:07結果兩天過去了 也只有原po在分析

DonDonFans 05/05 10:11老哥辛苦了==

eugene7983 05/05 10:29樣本數篩成這樣結果相關.1老實說啥都沒證明到……

e2167471 05/05 11:51因為認真的誤導沒什麼好推的 這麼愛看認真製圖

e2167471 05/05 11:51外面有很多地方都有在做這種製圖工程 專門把數據弄

a4326981 05/05 11:52好猛

e2167471 05/05 11:52得好像很顯著一樣 是哪些我就不說了

e2167471 05/05 11:53座標軸比例就一個最基本的玩法

e2167471 05/05 11:54或是改變座標軸起點 讓只差平移的看起來像倍數差的

e2167471 05/05 11:55如果是在這種地方認真 不值得給予掌聲吧(非指本文)

gamania1123405/05 12:31嗯,看不懂。有沒有大神認真解釋一下這篇的名詞跟

gamania1123405/05 12:31重點QQ

duck329 05/05 12:47反駁的要不要把你想要的條件直接用數據算出來

duck329 05/05 12:47起碼人家有算出東西給你看,別又在那憑感覺在討論

Presentation05/05 13:12統計數據圖表不是已經說明原po 解釋的問題點了,哪

Presentation05/05 13:12裡看不懂?

TheOneisNEO 05/05 13:29上面講的製圖工程哈哈哈

y800122155 05/05 19:18上面提scale的論述,我認為也是錯誤的,因為XY軸的

y800122155 05/05 19:19單位根本不一樣,就沒有所謂哪一種scale才是正確的

y800122155 05/05 19:19畫法,還是要回到回歸分析本身來評判解釋力夠不夠、

y800122155 05/05 19:19相關性高不高

TheOneisNEO 05/05 21:48上面講的應該是同樣的數據 分不同的球員群體(CFG)

TheOneisNEO 05/05 21:49圖的長寬就不一樣 顯得好像某球員特別離群

TheOneisNEO 05/05 21:49不是單純的xy長度比

Presentation05/06 09:24你都知道scale 單位不一樣,不就是我說的不能直接

Presentation05/06 09:25畫出來看起來是正的斜率就說正相關嗎?哪裡論述有

Presentation05/06 09:25問題

y800122155 05/06 10:56你用錯誤的論述去批評另一個錯誤的論述,就會變成一

y800122155 05/06 10:56個無毫意義的討論

Presentation05/06 13:05笑了,我說原po沒考慮到兩軸的scale不一樣,所以畫

Presentation05/06 13:05出來的圖才會像是很有正相關的回歸線,如果兩軸調

Presentation05/06 13:05整,可能就不會覺得很有正相關,這句話根本跟你說

Presentation05/06 13:05的單位毫無關係

Presentation05/06 13:17btw,通常這種scale 差異過大的狀況,會透過標準化

Presentation05/06 13:17等方式來讓不同單位的資料可以盡量的比較,所以也

Presentation05/06 13:17不是沒有方法可以來觀察

womanloveme 05/06 20:39邏輯、條件都合理~給推