※ 本文轉寄自 ptt.cc 更新時間: 2021-05-01 13:16:53
看板 NBA
作者 標題 [外絮] 用機器學習模型預估MVP得主
時間 Fri Apr 30 09:43:54 2021
今天早上在reddit看到的文章,覺得挺有趣,轉過來跟版友們分享。
小弟不是學資料科學的,如果內文有誤也請不吝指正
原文:https://perthirtysix.com/essay/2021-nba-mvp-race
懶人包:
作者(u/robmoo_re)利用了過去38年的NBA的球員資料以及MVP票選結果(包含排名及票數)
建造了一個預估球員得到MVP的機率以及MVP得主的模型,
利用這個模型,在過去38年中可以正確的計算出32年的得主。
在這個模型中,各項球員數據的權重(也就是這個模型認為影響MVP票選最重要的數據)
依序如下:
https://imgur.com/33ouqUG
球隊勝率%
每場上場時間
球隊種子序
WS/48
每場得分
出賽場次
VORP
2分命中率
罰球次數
助攻數
每場籃板
整體命中率
BPM
Usage%
每場失誤數
真實命中率
(以下不列,可以自己看圖)
模型利用以上數據算出每一個球員的candidacy score
這個分數越高者,即是模型認為越有可能得到MVP的人選
要特別說的是,某些數據本身是互相有關聯性的(譬如:兩分/三分命中率及整體命中率,
或是整體命中率跟一大堆進階數據),由於已經被重複計算過,因此單項的權重會降低,
不代表這項數據就不重要。
或是整體命中率跟一大堆進階數據),由於已經被重複計算過,因此單項的權重會降低,
不代表這項數據就不重要。
===
幾個有趣的結果
1. 誰是這38年來MVP分數最高的球員?
答案是08-09年的姆斯,分數高達4.49
2. 那最低分的MVP得主又是誰?
答案是04-05年的Nash,他當年的分數只有1.09
3. 誰的MVP被偷了?(誤)
剛剛提到38年中這個模型成功預測出32年的MVP得主,
這也代表其中有6年模型預測跟最終的結果是不一致的,
(1) 2016-2017年的MVP,模型預測得主是Harden(2.73),最終由當年拿下平均大三元
的Westbrook(2.44, 第二)拿走MVP
(2) 2010-2011年,當年分數最高的是LBJ(2.37),最終MVP被Rose(2.23)拿走。
(3) 2004-2005年,也就是上面提到,Nash以史上最低分(1.09)拿下MVP的那年。
(3) 2004-2005年,也就是上面提到,Nash以史上最低分(1.09)拿下MVP的那年。
當年屈居第二的是Shaq (1.12,其實沒差很多),也難怪他老人家到現在還在記仇
另外,隔年(05-06)Nash連莊時MVP分數也不是第一(1.8),
當年分數第一的是LBJ(2.25),只能說Nash真的是這個模型的outlier
4. Kobe到底有沒有偷了CP3一個MVP?
如果用這個模型看,答案是沒有,當年(07-08)Kobe以2.62分拿下MVP,
屈居第二的CP3分數是2.2分
5. 38年來最大的一二名差距發生在1999-2000年,當年大歐以3.71分拿下MVP,
分數第二的是Alonzo Mourning -- 0.7分 (票選第二的是KG,分數0.55)
另外,Curry全票MVP那年分數是3.47分,第二名的可愛1.89分,也是不小的差距
6. 那今年的MVP會是誰呢?
模型預測今年的MVP會是阿肥Jokic
https://imgur.com/KRIWmS9
本賽季截至目前為止,MVP分數最高的三人分別是
Jokic (2.02)
字母哥(0.26)
Embiid(0.04)
非常巨大的差距
====
有興趣的版友可以去看看這個模型是怎麼建出來的
裡面有個"Explore 1984 - 2020"可以拉出這38年間所有模型跑出來的結果
https://imgur.com/ZU04aVC
Reddit討論:
https://www.reddit.com/r/nba/comments/n150xj/
Creating a machine learning model to predict this years' MVP results : nba
2.9k votes, 223 comments. 3.9m members in the nba community. A subreddit dedicated to NBA news and discussion. ...
2.9k votes, 223 comments. 3.9m members in the nba community. A subreddit dedicated to NBA news and discussion. ...
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.248.194.238 (臺灣)
※ 文章代碼(AID): #1WYs3Uo8 (NBA)
※ 文章網址: https://www.ptt.cc/bbs/NBA/M.1619747038.A.C88.html
推 : 可以歐印阿肥了1F 04/30 09:45
推 : 阿肥加油2F 04/30 09:45
推 : 推數據量化3F 04/30 09:45
推 : 推數據化4F 04/30 09:47
推 : 這個讚5F 04/30 09:47
推 : 推一個6F 04/30 09:47
推 : 那就明顯阿肥了7F 04/30 09:48
推 : 38年來登登第二耶...8F 04/30 09:48
推 : 推9F 04/30 09:48
推 : 這個好像不錯10F 04/30 09:49
推 : 這不難就machine learning。python簡單寫11F 04/30 09:49
推 : 推量化 讚讚12F 04/30 09:49
推 : 這個好強13F 04/30 09:49
推 : 推14F 04/30 09:50
推 : COOL~15F 04/30 09:50
推 : 很有趣16F 04/30 09:51
推 : 有趣喔 這個17F 04/30 09:51
→ : 不過真的有看球的就知道CP3那年MVP沒被偷
→ : 不過真的有看球的就知道CP3那年MVP沒被偷
推 : 今年jokic是真的夠強,重點是幾乎沒缺陣19F 04/30 09:52
推 : 完了完了 這預測結果 幾個可戰的點都戰了(誤20F 04/30 09:53
→ : 現在MVP啊肥的國外賭盤是多少啊? 1.01?
→ : 現在MVP啊肥的國外賭盤是多少啊? 1.01?
推 : 濤哥的雞排我還沒領到有人知道他在那嗎?22F 04/30 09:55
推 : all in 阿肥了23F 04/30 09:55
推 : 2008 每周MVPRank 倒數二周CP3第1 最後一周Kobe超車24F 04/30 09:55
→ : 濤哥的宇宙艇論我猶言在耳25F 04/30 09:55
推 : 喔喔喔這modeling 屌喔26F 04/30 09:56
→ : 不過我還以為分數最高會是73的咖哩27F 04/30 09:56
推 : 酷28F 04/30 09:57
→ : (1)當年雷霆西區第六,龜拿真的是偷鬍子,不然就229F 04/30 09:58
→ : 連霸了
→ : (2)姆斯當年有拿下,是MVP五連霸...
→ : 連霸了
→ : (2)姆斯當年有拿下,是MVP五連霸...
推 : LBJ被偷兩次 好衰32F 04/30 09:58
推 : 剛好在吵Nash的兩屆MVP,結果都不是該年最高分33F 04/30 09:59
推 : LBJ被偷兩座...34F 04/30 09:59
推 : 我詹被偷2個MVP:(35F 04/30 09:59
→ : 詹皇悲情36F 04/30 10:00
推 : 推37F 04/30 10:01
推 : 分數測不準的那幾年幾乎都是因為所謂話題性頒獎的38F 04/30 10:01
推 : MVP小偷都現形了= =39F 04/30 10:02
推 : 不同年的得分之間是可以比較嗎?40F 04/30 10:02
推 : 引戰模型 我詹又要出來炒一波話題了41F 04/30 10:02
推 : 說好的美國選舉人團支持咖哩勒42F 04/30 10:02
推 : 歐印阿肥43F 04/30 10:03
推 : 人會審美疲勞機器不會,LBJ被偷也沒辦法44F 04/30 10:04
推 : 早就說過納什偷走一個MVP了XDDD45F 04/30 10:04
推 : 人看得出來組團抱腿 機器看不出來46F 04/30 10:04
推 : 所以這個model的結果,應該也間接可以選出年度隊伍47F 04/30 10:04
→ : 了
→ : 了
推 : LBJ真的被偷兩座,扣憐49F 04/30 10:05
推 : 不過光勝率和排名 這模型就不夠客觀 如果要加入不50F 04/30 10:05
→ : 客觀因子 那完成特殊成就也該列為一個
→ : 客觀因子 那完成特殊成就也該列為一個
推 : 這個好厲害哦52F 04/30 10:05
→ : 是不是可以增加參數 讓回測38次都符合最後結果53F 04/30 10:05
→ : 這樣用來預測之後才會更準確
→ : 這樣用來預測之後才會更準確
噓 : 金筆還有什麼話要說嗎 差這麼多還是好好打自己的東55F 04/30 10:06
→ : 部賽程吧 MVP沒你的事 別放話了
→ : 部賽程吧 MVP沒你的事 別放話了
→ : 有六次不符合 表示當年投票的人考慮其他因素57F 04/30 10:06
推 : 專業給推!好文可以M起來58F 04/30 10:07
推 : 證明姆斯MVP被Rose偷了59F 04/30 10:07
推 : 哈登其實被偷走兩座60F 04/30 10:07
推 : 勝率跟排名一直以來MVP投票都會考慮,也不能說不客61F 04/30 10:07
→ : 觀
→ : 觀
推 : 超有趣!63F 04/30 10:07
推 : 真的引戰機器模型 好好笑64F 04/30 10:08
推 : Nash抄截王65F 04/30 10:09
→ : 反而是破數十年紀錄,審美疲勞跟小人物出頭天這種很66F 04/30 10:09
→ : 難量化
→ : 難量化
推 : 誰是史上最弱mvp呢?68F 04/30 10:10
推 : 絕對是阿肥69F 04/30 10:10
推 : 以後都靠電腦算就不會有爭議惹70F 04/30 10:10
推 : Shaq那年也差距太大了吧71F 04/30 10:11
推 : 運彩是不是沒有開這種盤啊72F 04/30 10:11
→ : 已經明顯會那就影響結果了 那就更應該加進去73F 04/30 10:11
推 : 蠻有趣的74F 04/30 10:11
→ : 誰當年有特殊成就(場均大三元) 連莊多次沒特別突出75F 04/30 10:12
推 : 推 這個好強欸76F 04/30 10:13
推 : 好了 可以不用吵Kobe偷CP3 MVP了77F 04/30 10:14
→ : 提升勝場沒考慮進去阿78F 04/30 10:14
噓 : 下去79F 04/30 10:15
推 : 誰敢偷我肥的MVP !阿肥加油拿下它80F 04/30 10:15
推 : 數據視覺化 簡單明瞭 推推81F 04/30 10:15
推 : 年度大三元這個明顯是話題性考量,不然龜龜之後兩年82F 04/30 10:15
→ : 也有年度大三元,MVP票選卻都沒票了,就是沒話題性
→ : 了......
→ : 也有年度大三元,MVP票選卻都沒票了,就是沒話題性
→ : 了......
推 : LBJ每年都被偷吧85F 04/30 10:16
→ : 龜龜那年好歹模型算出來還是第二+大三元,拿沒很過86F 04/30 10:16
→ : 分吧
→ : 分吧
推 : 用被偷走的講法好奇怪 依據合理解釋應該是模型預測88F 04/30 10:16
→ : 失準 用被偷走感覺是肯定自己模型沒有錯
→ : 失準 用被偷走感覺是肯定自己模型沒有錯
→ : LBJ每年都被偷這種話也講出口喔90F 04/30 10:16
推 : 推回來91F 04/30 10:17
推 : LBJ 要六座MVP 還說沒偷92F 04/30 10:17
→ : 應該說姆斯偷了好幾年MVP吧 每年都抱團組三巨頭 最93F 04/30 10:18
→ : 好笑的是11年熱火戰績輸公牛
→ : 好笑的是11年熱火戰績輸公牛
→ : 所以就引戰模型阿 紛爭是不可能停止的95F 04/30 10:18
噓 : rose無腦粉:當年第二名不是lbj是dh96F 04/30 10:18
推 : Nash連偷兩座97F 04/30 10:19
→ : 戰力滿點98F 04/30 10:19
→ : 只是他形象不錯99F 04/30 10:19
→ : 如上面fj所說 應先以事實來建立模型100F 04/30 10:19
→ : 抱腿組巔峰三王 然後戰績輸單核的Rose 這樣叫偷101F 04/30 10:20
→ : 想不通為啥要捧老衲 膚色不正確102F 04/30 10:20
推 : 阿肥穩了103F 04/30 10:20
→ : 模型回測失準 就該修正104F 04/30 10:20
噓 : 是不是沒在看防守??105F 04/30 10:21
推 : 權重也是可以調整的 呵呵106F 04/30 10:21
推 : 阿肥早就穩了107F 04/30 10:22
推 : 用了38年的資料結果只中32年聽起來很怪108F 04/30 10:23
→ : Nash那兩年給他也沒懸念,在平均得分95的年代,太陽109F 04/30 10:23
推 : 史丹利學習110F 04/30 10:23
推 : 美國ptt好強111F 04/30 10:23
→ : 平均得分110,讓NBA在湖人王朝後不至於沒話題112F 04/30 10:24
→ : 同意fj的說法 用偷走是表示這模型是計算定律了?113F 04/30 10:24
→ : 0.04114F 04/30 10:25
推 : 機器沒辦法學習人類情感判斷?115F 04/30 10:27
推 : 所以NASH最低要說模型嚴重失準嗎116F 04/30 10:27
推 : 投票帶有非理性因素,機器人需要學習感情117F 04/30 10:28
推 : 如果要以事實去設計model,那很多感官或是特殊紀錄118F 04/30 10:29
推 : 推數據跟分享!119F 04/30 10:29
→ : 像是龜的得分王場均大三元,要怎麼設定就是問題120F 04/30 10:29
推 : 準確度超低吧...121F 04/30 10:29
推 : 算出來結果其實都滿合理122F 04/30 10:30
→ : ?? 38年正確跑出和事實相同的32年 不算低了耶123F 04/30 10:30
→ : 以前都說要看戰績(最大受益人Nash,Rose)然後西河124F 04/30 10:31
→ : 打出場均大三元又是另一回事了....
→ : 打出場均大三元又是另一回事了....
推 : 不愧是姆斯126F 04/30 10:32
→ : 當年龜那平均大三元 板上也都覺得MVP機會很高 所以127F 04/30 10:32
→ : 這種因為特殊條件的加分要怎麼設也是問題
→ : 這種因為特殊條件的加分要怎麼設也是問題
推 : Harden那年數據也很扯跟戰績更是狂勝129F 04/30 10:33
推 : 這個模型感覺對控球後衛不太有利130F 04/30 10:33
推 : Nash傳統數據不出色阿 姆斯是審美疲勞+抱團太難看才131F 04/30 10:33
→ : 輸Rose 龜則是第一次場均大三元
→ : 輸Rose 龜則是第一次場均大三元
→ : 控球後衛有很多層面是數據無法顯現的133F 04/30 10:33
→ : 對pg沒不利吧 咖哩兩屆都是符合阿??134F 04/30 10:34
→ : 會輸就是輸給機器無法判斷的東西了135F 04/30 10:34
推 : 會有結果不合 代表不夠精準 再想一下136F 04/30 10:34
推 : 有無法量化的因素 就無法做到100%準確啊137F 04/30 10:35
推 : 您的模型是不是對控衛不太友善啊138F 04/30 10:36
推 : 推139F 04/30 10:37
推 : 被Rose偷?你說CP3就算了起碼他當年第二名,姆斯當140F 04/30 10:37
→ : 年是第三名然後抱怨第一名在偷?
→ : 那第二名的魔獸是什麼,隱形人嗎
→ : 年是第三名然後抱怨第一名在偷?
→ : 那第二名的魔獸是什麼,隱形人嗎
推 : 每年風向又不一樣,不可能都合啦143F 04/30 10:38
推 : kobe cp3那年最後兩隊對決,賽前就有不少風向是說144F 04/30 10:38
→ : 哪隊西一,mvp機會就大增,最後湖人贏了就這樣
說一下我自己的感覺:→ : 哪隊西一,mvp機會就大增,最後湖人贏了就這樣
1. 原文有說,他們考量的結果並不只是得獎/沒得獎,而是把MVP票數、名次都有考量進去
因此就算是"失準"那幾年,可以發現其實一二名結果差距也不大
2. 預測投票不是預測氣象,太多人的主觀情感在裡面,我覺得能有這樣的準確度應該是
可以參考了
3. 當然這個東西只是模型,不是定理,100個人會做出100個不一樣的模型,就跟BBRef
上面一堆的XX probilities一樣,參考一下就好
寫個"被偷"只是想增加娛樂效果,若有冒犯敬請見諒
推 : 用過去38年資料訓練的模型,預測過去38年的資料,146F 04/30 10:40
→ : 準度會高也是正常...
→ : 準度會高也是正常...
推 : 我也想起濤哥148F 04/30 10:40
→ : LBJ被偷不是公認的嗎149F 04/30 10:40
推 : 38中32很不錯了,硬要都中會有overfit風險150F 04/30 10:41
推 : 更好笑的是11公牛季後賽被碾過去151F 04/30 10:41
推 : 結果很有趣 但想糾正一個語病 這個不叫回測 你只能152F 04/30 10:41
推 : 姆迷公認XDD153F 04/30 10:41
→ : 說是模型預測的結果和現實符不符合154F 04/30 10:42
→ : 回測必須要有明確的in-sample out-of-sample
那如果用"驗證"可以嗎?→ : 回測必須要有明確的in-sample out-of-sample
推 : Rose那不算偷吧 組三巨頭戰績反而輸公牛才是關鍵156F 04/30 10:44
推 : 姆斯都被控衛偷157F 04/30 10:44
→ : 公牛+21勝 聯盟戰績第一 熱火+11勝 聯盟第三158F 04/30 10:44
噓 : 照某些人的這講法加今年龜龜應該有四座Mvp了159F 04/30 10:45
→ : 因為得獎的是Rose才說偷啊,如果當初是DH拿也會被160F 04/30 10:46
→ : 說偷
→ : 說偷
噓 : 龜龜連續三年場均大三元怎麼沒給他三座再加上今年162F 04/30 10:49
→ : 應該要四座MVP了 把龜龜的給我還來
→ : 應該要四座MVP了 把龜龜的給我還來
推 : 鄉民不是很愛說老大偷MVP?164F 04/30 10:49
推 : 靠 原來LBJ被偷不是叫假的 還被偷兩座165F 04/30 10:50
推 : 就說"預測"就好啦 別說"回測"166F 04/30 10:50
推 : 數據量有點小167F 04/30 10:50
推 : 居然有學店GPA 1.9的說模型簡單168F 04/30 10:52
推 : 推模型,還我老大一個清白(誤169F 04/30 10:52
推 : 我原本要做這件事的 之後自己也來試試看170F 04/30 10:52
推 : 沒問題 我家肥宅已經確定 只希望不要受傷171F 04/30 10:55
推 : 覺得蠻準的172F 04/30 10:56
推 : 結果今年mvp是nash(?!)173F 04/30 10:57
推 : 阿肥拿得當之無愧174F 04/30 11:00
推 : 超屌175F 04/30 11:02
推 : 笑死一堆人捧金筆結果跟阿肥差距超大 哈哈176F 04/30 11:03
推 : 好強177F 04/30 11:08
推 : 今年阿肥穩了178F 04/30 11:09
推 : Nash就白人加權保障名額 季後賽就穿幫了179F 04/30 11:10
另外補充幾點在討論中看到的:
1. 跟PTT鄉民一樣,Reddit鄉民普遍認為narratives(風向)是一個重要但是難以量化
計算的參數
2. 由於NBA的球風不斷地在改變,投票者的口味也可能跟30年前大不同,有人建議應該給
予較近期的投票結果比較高的權重。也有鄉民建議可以分析並考量30年前跟現在投票
者看重的數據的差異(例如:會不會30年前的投票者比較看重籃板,而現在的投票者
比較看重三分命中率?)
原作者有說會把這些東西放入to-do list,就看看之後會不會有更好的模型出來囉
推 : 哈登那年真的被偷180F 04/30 11:13
推 : 推 有趣的模型181F 04/30 11:13
推 : 這很酷歐182F 04/30 11:13
推 : 姆斯就是猛183F 04/30 11:15
推 : 如果模型用過去38年的資料訓練模型,然後又拿同樣的184F 04/30 11:16
→ : 資料驗證模型表現,那為何準確率不是100%啊?有資料
→ : 科學大師願意解惑嗎
→ : 資料驗證模型表現,那為何準確率不是100%啊?有資料
→ : 科學大師願意解惑嗎
推 : nash好爛187F 04/30 11:17
推 : 推喔,感謝分享以及建模的天才188F 04/30 11:17
推 : 上面因為實際上選MVP是「人選」不是跑數字出來決定189F 04/30 11:19
→ : 用人選自然不會是100%統一的標準
→ : 用人選自然不會是100%統一的標準
推 : 太猛啦~191F 04/30 11:20
→ : 但這模型算是非常好預估未來人選的方式192F 04/30 11:20
推 : 金筆這麼低喔? PER數據很好欸193F 04/30 11:20
推 : 肥宅之光 衝啊194F 04/30 11:21
推 : 叫濤哥來看看,這才是真的大數據195F 04/30 11:21
推 : 我要來all in了196F 04/30 11:21
推 : 推197F 04/30 11:22
→ : 如果老漢受傷 他沒受傷的話8成是他 結果跑個模型那198F 04/30 11:22
→ : 麼低
→ : 麼低
推 : 這頂多能說用來解釋過去怎麼評斷的 但是過去不代表200F 04/30 11:22
→ : 未來
→ : 未來
推 : Nash真是白人膚色加持,總教練202F 04/30 11:22
→ : 也是空降,mvp也是空降
→ : 也是空降,mvp也是空降
推 : 岳父神偷204F 04/30 11:23
推 : 11年這模型算出來也超接近啊 姆斯2.37 Rose2.23 把205F 04/30 11:24
→ : 勝率加權多一點不就是Rose贏了XD 組三巨頭勝率輸公
→ : 牛還能說被偷喔?
※ 編輯: timmyen (111.248.194.238 臺灣), 04/30/2021 11:26:13→ : 勝率加權多一點不就是Rose贏了XD 組三巨頭勝率輸公
→ : 牛還能說被偷喔?
推 : 身家歐印阿肥208F 04/30 11:25
噓 : Nash不意外209F 04/30 11:26
推 : 這很讚啊 ^^210F 04/30 11:31
→ : 小新211F 04/30 11:32
推 : 有趣212F 04/30 11:33
推 : 好猛的模型213F 04/30 11:35
推 : 這學期做project 也用了簡單的ML預測UFC對戰214F 04/30 11:35
推 : Nash是以退役、且得超過一個MVP,但唯一沒打過總冠215F 04/30 11:36
→ : 軍賽的球員,這程式的準確度,我覺得還是有的
→ : 軍賽的球員,這程式的準確度,我覺得還是有的
推 : 阿肥海放...217F 04/30 11:36
→ : 丹東尼小球最大化了Nash,但也就只有摸到西冠而已218F 04/30 11:38
推 : joker不是說他今年得分、籃板、助攻都排在前五,抄219F 04/30 11:38
→ : 截也在前十,沒給他說不過去吧
→ : 截也在前十,沒給他說不過去吧
推 : nash史上第一控,年度mvp兩顆221F 04/30 11:39
推 : 為我柯平反,推推!222F 04/30 11:39
推 : 準確率不是100%是在overfitting與underfitting之間223F 04/30 11:39
→ : 的trade-off 當然你可以訓練模型讓它在“既有的”
→ : 資料準確率100% 但這可能會讓你的模型過度擬合訓
→ : 練資料 反而在面對我們真正感興趣的預測未知資料
→ : 時失去準確度
→ : 的trade-off 當然你可以訓練模型讓它在“既有的”
→ : 資料準確率100% 但這可能會讓你的模型過度擬合訓
→ : 練資料 反而在面對我們真正感興趣的預測未知資料
→ : 時失去準確度
推 : 但數據量有點小228F 04/30 11:42
推 : 冷笑話這麼厲害,怎麼在尼克湖人都玩不起來還要等229F 04/30 11:43
→ : 到有幫主,反而Nash還是能進西決,誰罩誰還不好說
→ : 到有幫主,反而Nash還是能進西決,誰罩誰還不好說
推 : 推nash這輩子沒打過冠軍戰,年度mvp兩顆231F 04/30 11:43
→ : 金筆:我才該得MVP232F 04/30 11:44
推 : 推一個233F 04/30 11:45
→ : 今年金筆應該還是出不了東部,MVP就別肖想了234F 04/30 11:46
→ : 1984前的不去算嗎235F 04/30 11:49
推 : 這個換個模型結果就完全不一樣了236F 04/30 11:50
→ : 肥VP237F 04/30 11:52
推 : 這是把38年票選結果和可量化數據丟進去train出一個238F 04/30 11:55
→ : 最符合票選結果的各項數據權重 無法考量人為主觀因
→ : 素 結果有些誤差是正常的
→ : 最符合票選結果的各項數據權重 無法考量人為主觀因
→ : 素 結果有些誤差是正常的
噓 : 結果沒看Nash打球的Nash粉跟你說就是這兩座MVP>Kidd241F 04/30 11:55
→ : &CP3
→ : &CP3
推 : 怎麼能把training data和testing data混在一起阿,243F 04/30 11:56
→ : 這樣就跟球員兼裁判一樣
→ : 這樣就跟球員兼裁判一樣
推 : 少了一個 媒體愛/新聞版面245F 04/30 11:57
→ : Nash那兩座也吃不少香妹、阿罵的buff246F 04/30 11:57
→ : 當時太陽各項最大貢獻指標 Nash也沒第一 防守又是洞
→ : 當時太陽各項最大貢獻指標 Nash也沒第一 防守又是洞
推 : Nash當年是真的有偷了大歐MVP的感覺248F 04/30 12:02
推 : 有點猛 推一個249F 04/30 12:04
推 : 差距巨大250F 04/30 12:05
推 : 這才是有價值的文章!立馬all in251F 04/30 12:06
推 : 這種資料量這麼少的可能是用LOOCV吧 不太可能直接252F 04/30 12:09
→ : 切training testing data
→ : 切training testing data
→ : MDA把能力夠強的持球者極大化對於這種競爭真有效益254F 04/30 12:09
推 : 阿肥是真的猛255F 04/30 12:10
推 : 拿training data verify 還只有32/38,這model感覺不256F 04/30 12:11
→ : 太行欸
→ : 太行欸
推 : 推258F 04/30 12:13
噓 : 一堆人根本沒點進去看演算法ㄏㄏ259F 04/30 12:17
推 : 去賭博網站all in 阿肥了!!!! 翻身就靠這一發260F 04/30 12:19
→ : !
→ : !
推 : 我看得懂262F 04/30 12:19
推 : 之前不是一票喊Kobe偷CP3的MVP263F 04/30 12:20
推 : 阿肥阿肥得第一!264F 04/30 12:23
推 : 這個數據超棒耶265F 04/30 12:26
推 : 歐印阿肥266F 04/30 12:27
推 : 感覺這套數據對前場有利一點點267F 04/30 12:28
推 : 哇,這戰點好足,偷mvp的原來是268F 04/30 12:33
推 : 我先 狗鼻偷MVP269F 04/30 12:34
推 : 板上一堆機器學習大師,看來要看李宏毅學學了270F 04/30 12:38
噓 : 為什麼才38年就建得出6年不符合的模型啊@@271F 04/30 12:38
→ : 內文是說用decision tree?272F 04/30 12:40
→ : 該修林軒田機器學習了QQ273F 04/30 12:42
推 : 早說螺絲偷我詹五連mvp274F 04/30 12:45
推 : 推275F 04/30 12:49
推 : 推量化!老詹原來有兩座寄放在別人那276F 04/30 12:57
推 : 推277F 04/30 12:57
推 : 36個點就可以做機器學習,南無厲害278F 04/30 12:58
噓 : 聯盟不還老詹MVP就是怕喬丹被比下去279F 04/30 13:00
推 : 這樣樣本不會太少嗎?280F 04/30 13:02
→ : 38年樣本算少嗎?..就幾乎所有的記者投票都算進來了281F 04/30 13:12
推 : 是只有算有得票的嗎?282F 04/30 13:16
→ : 詳細欸283F 04/30 13:29
推 : 罰球次數也算?難怪一堆碰瓷mvp284F 04/30 13:29
我覺得罰球這數據蠻有趣的,我猜測是聯盟捧的球星通常罰球多,通常也同時是MVP熱門罰球多是果不是因
推 : 優文給推 開放某黑崩潰285F 04/30 13:35
推 : 看來這模型挺客觀的286F 04/30 13:37
噓 : 那幹嘛還票選,跑數據就知道MVP了,整天偷不偷一點287F 04/30 13:37
→ : 意義都沒有,難不成還要打星號
→ : 意義都沒有,難不成還要打星號
推 : 這數據少了 聲量 跟 連莊遞減效應289F 04/30 13:41
推 : 有趣290F 04/30 13:41
推 : 38年就出錯6年 還不用修正嗎291F 04/30 13:42
→ : MVP很重話題的印象分啊,不然也不會雷霆全隊配合龜292F 04/30 13:43
→ : 龜刷場均大三元了
※ 編輯: timmyen (111.248.194.238 臺灣), 04/30/2021 13:45:01→ : 龜刷場均大三元了
→ : 話題熱度延續到季末 MVP就get了294F 04/30 13:44
噓 : 西河年年拿MVP295F 04/30 13:44
推 : 這模型湖人利多哈哈296F 04/30 13:46
噓 : 明明就有答案了 就不準確啊 明顯少了一些無法量化的297F 04/30 13:53
→ : 數值(外部因素 如 審美疲勞)
→ : 數值(外部因素 如 審美疲勞)
推 : 兩個姆斯都被偷兩座mvp 摳憐299F 04/30 13:56
推 : 可以算一下今年冠軍嗎300F 04/30 14:00
推 : 他的“預測”是指預測訓練集裡面的數據?301F 04/30 14:09
噓 : 準備寫論文囉!302F 04/30 14:13
→ : AI是需要資料去學習,數據量越多會越準確,mvp才幾個303F 04/30 14:16
→ : 還有需要考慮投票者突然腦袋斷線因素
→ : 還有需要考慮投票者突然腦袋斷線因素
推 : 又要來一個歐洲MVP了,期待305F 04/30 14:19
→ : 首先要思考的是基本上不存在數據不夠漂亮結果拿MVP306F 04/30 14:32
→ : 的狀況。所以這一篇夯不啷噹列了25個指標,也就是
→ : 更加強「堆數據=MVP」的推論。所以可以玩味的是這
→ : 模型的6個例外是不是有什麼重要資訊是沒有涵蓋在在
→ : 25項指標內。
→ : 的狀況。所以這一篇夯不啷噹列了25個指標,也就是
→ : 更加強「堆數據=MVP」的推論。所以可以玩味的是這
→ : 模型的6個例外是不是有什麼重要資訊是沒有涵蓋在在
→ : 25項指標內。
推 : 酷 有空來看311F 04/30 14:33
推 : 原PO在心得&回覆上的見解與氣度令人欽佩312F 04/30 14:44
→ : 對模型的批評又不是針對原po313F 04/30 14:49
推 : 這個不會過度耦合嗎?如果用訓練資料的模型再去跑測314F 04/30 14:49
→ : 試資料?
→ : 試資料?
推 : 史上最__mvp316F 04/30 14:50
推 : 這模型蠻有意思的317F 04/30 14:52
推 : 詹被偷兩個...318F 04/30 14:54
推 : 還我姆斯2座MVP獎杯==319F 04/30 15:02
推 : 很有趣又有深度,謝謝原po分享。希望以後能多點這種320F 04/30 15:20
→ : 文章
→ : 文章
推 : 酷322F 04/30 15:38
推 : 推數據323F 04/30 15:39
推 : 羅斯那個就聯盟捧加姆斯那年是反派 不算偷吧324F 04/30 15:42
推 : 就說LBJ被Rose偷MVP325F 04/30 15:59
→ : 可以噢326F 04/30 16:00
推 : 猛327F 04/30 16:12
推 : 出席率影響太大了328F 04/30 16:44
推 : 有趣329F 04/30 16:48
推 : 終於還Kobe清白了330F 04/30 17:11
推 : 所以以數據化來看,cp3表現最好的那年其實不輸給Na331F 04/30 17:24
→ : sh
→ : sh
推 : 歐肥那年強到可怕 很多人氣到不想看比賽333F 04/30 17:47
推 : 完了 雖然喜歡咖喱 看來是阿肥了334F 04/30 18:36
推 : 全票MVP沒毛病,差距那麼大,我阿嬤都知道要給Curry335F 04/30 18:47
→ : ~
→ : ~
推 : 38個資料點 恐怕很難做什麼有意義的學習337F 04/30 18:52
推 : 那些說詹沒被偷的詹酸勒338F 04/30 18:52
噓 : 數據都出來了 老詹就真的數據疲勞被偷至少兩座mvp339F 04/30 19:29
→ : 幸好真的夠猛 現在成就還是聯盟第一
→ : 幸好真的夠猛 現在成就還是聯盟第一
推 : 組三巨頭戰績還輸公牛 這樣也敢說偷?341F 04/30 19:36
推 : 西強東弱的因素也沒有放進模組342F 04/30 20:26
推 : 去年才有人模擬快艇會奪冠XD343F 04/30 22:04
推 : 這個好344F 04/30 22:17
推 : 水唷345F 05/01 00:12
推 : 該戰的全戰了,機器學習真的好棒棒346F 05/01 00:35
推 : 看到這個以為又是濤哥347F 05/01 00:47
推 : 推348F 05/01 01:37
推 : 阿肥,阿肥,叭叭叭~~349F 05/01 07:02
推 : nash拿是因為太陽戰績好 外加帶起小球球風 有時mvp350F 05/01 08:48
→ : 真的蠻印象派
→ : 真的蠻印象派
--
※ 看板: NBA 文章推薦值: 0 目前人氣: 0 累積人氣: 276
回列表(←)
分享