顯示廣告
隱藏 ✕
※ 本文為 dinos 轉寄自 ptt.cc 更新時間: 2014-04-27 13:27:40
看板 MLB
作者 ken24griffey ()
標題 [閒聊] 要怎樣的團隊數據才進的了季後賽?
時間 Sun Apr 27 02:32:05 2014


把一支球隊送到季後賽去通常是各家GM們努力的目標
(需要觀念的球隊就另當別論了)

從2002到2013十一年間,總共有90隊次進到季後賽
(8*10+10*1,以往一年八支去年改成一年十支)
三十隊裡面有二十七隊有進過季後賽,最多的是NYY九次
http://ppt.cc/l3Qb
有三隊在這些年根本不知道季後賽是長什麼樣子
通通都是美聯的球隊(美東、美中、美西各一隊)

季後賽常客裡面也不乏payroll排行榜倒數的球隊
反過來說這三支球隊也都不是最最最沒錢的球隊
從這個角度來看

有不有錢跟進不得了季後賽好像關係並沒有太直接

所以我想要看看這幾年這些有進季後賽的球隊和沒進的球隊
在團隊數據上有哪些資料是有顯著的差異

或許可以提供一個補強時的考量
甚至是重新評估球員的價值

其實這個想法是在看完錢球之後想到的
電影裡面Billy Beane再挑新秀或是簽FA的時候很在意 OBP
不知道除了OBP外還有沒有其他的數據可以放進來一起評估


我把fangraphs上 投球、打擊、守備 的各項數值(大部分都不太知道哪是什麼XD)

扣除掉投手勝投勝率等勝負直接相關數據
總共51項數據
用non supervised的統計方法Principal Component Analysis主成分分析
來觀察兩組(post-season vs off-season)的趨勢
http://ppt.cc/fSOn
從2002-2013年間,有90支球隊(紅色)進到季後賽
有另外240支球隊直接放假(綠色)
從PCA圖上可以看出有分群的趨勢
代表兩組間應該有一些variable可以影響是否能進季後賽

接著再用supervised approach (PLS)試著找出最重要的variables
http://ppt.cc/rpjc

再分群效果不錯的情形下,找出Variable Importance in Projection (VIP)

前五名分別為
1. bat_wRC+:Weighted Runs Created Plus
2. pit_ERA-
3. bat_wRAA:Weighted Runs Above Average
4. pit_WHIP
5. pit_FIP-

好像都還是能夠理解

咦! 等等 那守備相關的數據不是也放了嗎??

總共18項與守備有關的數據有17項列在倒數20名VIP中
包含外野手助殺能力、內野手雙殺能力、捕手阻殺能力、UZR等等
都和能不能進季後賽關係不大

(防守野球、金守備計畫表示:________)

另外,再透過receiver operating characteristic curve (ROC)
來檢驗各項數據作為分群鑑別能力的靈敏度和選擇性
ROC 曲線下面積 (Area under curve, AUC)
若是等於1代表該進季後賽的都能被該模型正確預測出來且無偽陽性的結果產生
不過正常來說是不太可能發生的
AUC等於0.5左右大概相當於用擲杯來決定能不能進季後賽 (丟銅板好像比較合理XD)

我們可以看一下這幾項ROC的表現

wRC+ : http://ppt.cc/kru5
ERA- : http://ppt.cc/fdhU
AUC算出來最高的前兩名跟PLS中VIP最高的兩名都是同樣的
AUC=0.8 在臨床文章上已經是很不錯了
樓上討論的FIP http://ppt.cc/ypQb
表現也是相當不錯
豆爺念茲在茲的 OBP呢?
http://ppt.cc/Thux
雖然沒有wRC+ 那麼搶眼,但是比起看傳統AVG來說還是好了一些
http://ppt.cc/DECs


常常打很多安打卻得不了多少分的球隊,是不是就是少了製造得分能力的因素呢?
這要透過補強能適時擊出打點能力的選手?
或是換成調度能力和解讀球員特質能力強大的教練團?
才能提升所謂的wRC,好像也很難去驗證



至於防守端的數據我貼幾項出來
rARM, 外野手助殺能力 : http://ppt.cc/M1jP
rSB, stolen base saved, 阻殺能力 : http://ppt.cc/pvi3
UZR/150: http://ppt.cc/nEPd (好像有一點點關係了)
綜合來說,防守數值似乎和能否進入季後賽沒有太大的關聯性
也有可能是,大家都已經不錯了,
80和85分的差異不會像中職可能57跟62分那五分決定勝負
(防守野球、金守備計畫再表示:________)


因此,補一些防守專家在大聯盟中真的對球隊有幫助嗎??
我這邊指得是那些進不了季後賽還再補強的球隊



有趣的是
打者被K% 其實AUC也只有0.56,
忘記誰曾經說過三振也只不過是一種出局的方式
然而,對投手來說 投手K%的AUC 卻提升到 0.65
似乎有考量投手自己解決問題的能力




最後再把投打兩項最高分的(wRC+,ERA-)放在一起評估ROC
可以得到驚人超過0.9的AUC
http://ppt.cc/OQeO

總結來說,這些data告訴我們,
打者能創造越多得分,投手掉越少分,離季後賽就不遠了.....

怎麼突然覺得自己好像在說屁話XDDD




謝謝大家




--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.136.29.230
※ 文章網址: http://www.ptt.cc/bbs/MLB/M.1398537130.A.51A.html
cyscys:讚   XD1F 04/27 02:35
mess0706:這場比賽,得分較多的人將獲勝。2F 04/27 02:40
realestate:怎麼繞了一圈結果發現自己在說屁話XDDD3F 04/27 02:44
th11211:水手12年沒進季後賽 藍鳥20年 皇家28年了4F 04/27 02:49
th11211:但藍鳥/皇家最後一次進的剛好都是拿下冠軍...
away01231259:2002到2013應該是12年? 而且是2012開始十隊進季後6F 04/27 02:50

真的耶!!
應該是2003-2012 11年
然後漏了12年的兩隊
感謝


kenny781558:雖然個人的ERA會有很多誤差7F 04/27 02:54
kenny781558:但團隊的ERA還是很有參考價值XD
kenny781558:推原PO的用心!

※ 編輯: ken24griffey (220.136.29.230), 04/27/2014 03:01:02
MinChuan:雖然繞了圈再說屁話,但是很有科學精神XD10F 04/27 03:00
YHank:比賽得比較多分的會獲勝,賽季獲勝比較多場的隊伍會進季後賽11F 04/27 03:08
jimmily:依我看來,這場比賽得分多的隊伍會贏12F 04/27 03:18
ChrisDavis:英國研究指出:得分大於失分的隊伍會獲勝13F 04/27 03:21
arosshyi:為什麼只看的懂結論14F 04/27 03:36
lovebulls:失分=投手能力+團隊防守能力15F 04/27 04:46
lovebulls:ERA其實已經有把防守的好壞對勝負的影響包進去了
lovebulls:防守打底 搭配投手養成的建隊模式應該還是有用的
lovebulls:主打防守野球還是要有投手 投手能力究竟對失分影響還是
lovebulls:較大 XD
gghh:     建議drop掉那些大爛隊,只留差幾場進季後賽的隊伍當作20F 04/27 05:58
gghh:      counterfactual,說不定結果會有些不一樣。
gghh:       另外你的資料能跑些cov或correlation的東西嗎?
gghh:      這些應該可以延伸你結論中的分析
secpeda:這個遊戲,有必勝法24F 04/27 07:01
kaku216 
kaku216:PUSH25F 04/27 07:25
shinyfunny:雖然最後繞圈 但是很有趣XD26F 04/27 10:59
jeffchen106:認真文推27F 04/27 12:04
carrhung:推研究精神XD28F 04/27 12:09
kay16victor:絕密贏球方法:得越多分 掉越少分29F 04/27 12:23
asd831129:推 精彩30F 04/27 12:36
slugprince:推認真文31F 04/27 12:50
Asucks:就勝場數超過敗場數多愈多愈好啊!32F 04/27 13:07

--
※ 看板: dinos 文章推薦值: 0 目前人氣: 0 累積人氣: 146 
分享網址: 複製 已複製
guest
x)推文 r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇