顯示廣告
隱藏 ✕
※ 本文轉寄自 ptt.cc 更新時間: 2021-05-01 13:16:53
看板 NBA
作者 timmyen (Ako)
標題 [外絮] 用機器學習模型預估MVP得主
時間 Fri Apr 30 09:43:54 2021



今天早上在reddit看到的文章,覺得挺有趣,轉過來跟版友們分享。
小弟不是學資料科學的,如果內文有誤也請不吝指正

原文:https://perthirtysix.com/essay/2021-nba-mvp-race

懶人包:
作者(u/robmoo_re)利用了過去38年的NBA的球員資料以及MVP票選結果(包含排名及票數)
建造了一個預估球員得到MVP的機率以及MVP得主的模型,
利用這個模型,在過去38年中可以正確的計算出32年的得主。

在這個模型中,各項球員數據的權重(也就是這個模型認為影響MVP票選最重要的數據)
依序如下:

https://imgur.com/33ouqUG
[圖]

球隊勝率%
每場上場時間
球隊種子序
WS/48
每場得分
出賽場次
VORP
2分命中率
罰球次數
助攻數
每場籃板
整體命中率
BPM
Usage%
每場失誤數
真實命中率
(以下不列,可以自己看圖)

模型利用以上數據算出每一個球員的candidacy score
這個分數越高者,即是模型認為越有可能得到MVP的人選

要特別說的是,某些數據本身是互相有關聯性的(譬如:兩分/三分命中率及整體命中率,
或是整體命中率跟一大堆進階數據),由於已經被重複計算過,因此單項的權重會降低,
不代表這項數據就不重要。


===

幾個有趣的結果

1. 誰是這38年來MVP分數最高的球員?

   答案是08-09年的姆斯,分數高達4.49

2. 那最低分的MVP得主又是誰?

   答案是04-05年的Nash,他當年的分數只有1.09

3. 誰的MVP被偷了?(誤)

   剛剛提到38年中這個模型成功預測出32年的MVP得主,
   這也代表其中有6年模型預測跟最終的結果是不一致的,

   (1) 2016-2017年的MVP,模型預測得主是Harden(2.73),最終由當年拿下平均大三元
       的Westbrook(2.44, 第二)拿走MVP

   (2) 2010-2011年,當年分數最高的是LBJ(2.37),最終MVP被Rose(2.23)拿走。

   (3) 2004-2005年,也就是上面提到,Nash以史上最低分(1.09)拿下MVP的那年。

       當年屈居第二的是Shaq (1.12,其實沒差很多),也難怪他老人家到現在還在記仇


       另外,隔年(05-06)Nash連莊時MVP分數也不是第一(1.8),
       當年分數第一的是LBJ(2.25),只能說Nash真的是這個模型的outlier

4. Kobe到底有沒有偷了CP3一個MVP?

   如果用這個模型看,答案是沒有,當年(07-08)Kobe以2.62分拿下MVP,
   屈居第二的CP3分數是2.2分

5. 38年來最大的一二名差距發生在1999-2000年,當年大歐以3.71分拿下MVP,
   分數第二的是Alonzo Mourning -- 0.7分 (票選第二的是KG,分數0.55)

   另外,Curry全票MVP那年分數是3.47分,第二名的可愛1.89分,也是不小的差距

6. 那今年的MVP會是誰呢?

   模型預測今年的MVP會是阿肥Jokic
   https://imgur.com/KRIWmS9
[圖]

   本賽季截至目前為止,MVP分數最高的三人分別是
   Jokic (2.02)
   字母哥(0.26)
   Embiid(0.04)

   非常巨大的差距

====

有興趣的版友可以去看看這個模型是怎麼建出來的
裡面有個"Explore 1984 - 2020"可以拉出這38年間所有模型跑出來的結果
https://imgur.com/ZU04aVC
[圖]

Reddit討論:
https://www.reddit.com/r/nba/comments/n150xj/
Creating a machine learning model to predict this years' MVP results : nba
[圖]
2.9k votes, 223 comments. 3.9m members in the nba community. A subreddit dedicated to NBA news and discussion. ...

 


--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.248.194.238 (臺灣)
※ 文章代碼(AID): #1WYs3Uo8 (NBA)
※ 文章網址: https://www.ptt.cc/bbs/NBA/M.1619747038.A.C88.html
GhostFather : 可以歐印阿肥了1F 04/30 09:45
karmel      : 阿肥加油2F 04/30 09:45
y28822885   : 推數據量化3F 04/30 09:45
depo        : 推數據化4F 04/30 09:47
MaxwellDSA  : 這個讚5F 04/30 09:47
JoeChang5566: 推一個6F 04/30 09:47
mirror0103  : 那就明顯阿肥了7F 04/30 09:48
vinsanity25 : 38年來登登第二耶...8F 04/30 09:48
asia2505    : 推9F 04/30 09:48
Wb2029T     : 這個好像不錯10F 04/30 09:49
lienray     : 這不難就machine learning。python簡單寫11F 04/30 09:49
RadioMan    : 推量化 讚讚12F 04/30 09:49
PrimeChaoz  : 這個好強13F 04/30 09:49
hiyuhfeng   : 推14F 04/30 09:50
tingx2      : COOL~15F 04/30 09:50
tony1768ya  : 很有趣16F 04/30 09:51
TWN56ers    : 有趣喔 這個17F 04/30 09:51
TWN56ers    : 不過真的有看球的就知道CP3那年MVP沒被偷
AtDe        : 今年jokic是真的夠強,重點是幾乎沒缺陣19F 04/30 09:52
icou        : 完了完了 這預測結果 幾個可戰的點都戰了(誤20F 04/30 09:53
icou        : 現在MVP啊肥的國外賭盤是多少啊? 1.01?
kkb512sk    : 濤哥的雞排我還沒領到有人知道他在那嗎?22F 04/30 09:55
zephry      : all in 阿肥了23F 04/30 09:55
MrSatan     : 2008 每周MVPRank 倒數二周CP3第1 最後一周Kobe超車24F 04/30 09:55
icou        : 濤哥的宇宙艇論我猶言在耳25F 04/30 09:55
IAMGRICE    : 喔喔喔這modeling 屌喔26F 04/30 09:56
icou        : 不過我還以為分數最高會是73的咖哩27F 04/30 09:56
chh1470     : 酷28F 04/30 09:57
IAMGRICE    : (1)當年雷霆西區第六,龜拿真的是偷鬍子,不然就229F 04/30 09:58
IAMGRICE    : 連霸了
IAMGRICE    : (2)姆斯當年有拿下,是MVP五連霸...
ke1210      : LBJ被偷兩次 好衰32F 04/30 09:58
william7497 : 剛好在吵Nash的兩屆MVP,結果都不是該年最高分33F 04/30 09:59
wurjicnip   :  LBJ被偷兩座...34F 04/30 09:59
leonho40412 : 我詹被偷2個MVP:(35F 04/30 09:59
karmel      : 詹皇悲情36F 04/30 10:00
henry910119 : 推37F 04/30 10:01
turnpoint   : 分數測不準的那幾年幾乎都是因為所謂話題性頒獎的38F 04/30 10:01
OGCOGCOGCOGC: MVP小偷都現形了= =39F 04/30 10:02
sunnyyoung  : 不同年的得分之間是可以比較嗎?40F 04/30 10:02
Kappa       : 引戰模型 我詹又要出來炒一波話題了41F 04/30 10:02
jardon      : 說好的美國選舉人團支持咖哩勒42F 04/30 10:02
kingianlin  : 歐印阿肥43F 04/30 10:03
ptychodera  : 人會審美疲勞機器不會,LBJ被偷也沒辦法44F 04/30 10:04
MarcusWright: 早就說過納什偷走一個MVP了XDDD45F 04/30 10:04
cp3bg32     : 人看得出來組團抱腿 機器看不出來46F 04/30 10:04
IAMGRICE    : 所以這個model的結果,應該也間接可以選出年度隊伍47F 04/30 10:04
IAMGRICE    : 了
sola16084   : LBJ真的被偷兩座,扣憐49F 04/30 10:05
sunnyyoung  : 不過光勝率和排名 這模型就不夠客觀 如果要加入不50F 04/30 10:05
sunnyyoung  : 客觀因子 那完成特殊成就也該列為一個
thom0923    : 這個好厲害哦52F 04/30 10:05
kevin0733   : 是不是可以增加參數 讓回測38次都符合最後結果53F 04/30 10:05
kevin0733   : 這樣用來預測之後才會更準確
sxzc        : 金筆還有什麼話要說嗎 差這麼多還是好好打自己的東55F 04/30 10:06
sxzc        : 部賽程吧 MVP沒你的事 別放話了
kevin0733   : 有六次不符合 表示當年投票的人考慮其他因素57F 04/30 10:06
artistno1231: 專業給推!好文可以M起來58F 04/30 10:07
peanut910013: 證明姆斯MVP被Rose偷了59F 04/30 10:07
tim900127   : 哈登其實被偷走兩座60F 04/30 10:07
society     : 勝率跟排名一直以來MVP投票都會考慮,也不能說不客61F 04/30 10:07
society     : 觀
william07392: 超有趣!63F 04/30 10:07
s07190719   : 真的引戰機器模型 好好笑64F 04/30 10:08
frank47147  : Nash抄截王65F 04/30 10:09
society     : 反而是破數十年紀錄,審美疲勞跟小人物出頭天這種很66F 04/30 10:09
society     : 難量化
samzi       : 誰是史上最弱mvp呢?68F 04/30 10:10
coox        : 絕對是阿肥69F 04/30 10:10
Blazeleo819 : 以後都靠電腦算就不會有爭議惹70F 04/30 10:10
RBC54321    : Shaq那年也差距太大了吧71F 04/30 10:11
tigerlolz   : 運彩是不是沒有開這種盤啊72F 04/30 10:11
kevin0733   : 已經明顯會那就影響結果了 那就更應該加進去73F 04/30 10:11
kyoko3678906: 蠻有趣的74F 04/30 10:11
kevin0733   : 誰當年有特殊成就(場均大三元) 連莊多次沒特別突出75F 04/30 10:12
redbean3781 : 推 這個好強欸76F 04/30 10:13
chinhan1216 : 好了 可以不用吵Kobe偷CP3 MVP了77F 04/30 10:14
sasewill    : 提升勝場沒考慮進去阿78F 04/30 10:14
tasimichael : 下去79F 04/30 10:15
kiralin     : 誰敢偷我肥的MVP !阿肥加油拿下它80F 04/30 10:15
elvis047    : 數據視覺化 簡單明瞭 推推81F 04/30 10:15
turnpoint   : 年度大三元這個明顯是話題性考量,不然龜龜之後兩年82F 04/30 10:15
turnpoint   : 也有年度大三元,MVP票選卻都沒票了,就是沒話題性
turnpoint   : 了......
mirac1e     : LBJ每年都被偷吧85F 04/30 10:16
jardon      : 龜龜那年好歹模型算出來還是第二+大三元,拿沒很過86F 04/30 10:16
jardon      : 分吧
fjuheadache : 用被偷走的講法好奇怪 依據合理解釋應該是模型預測88F 04/30 10:16
fjuheadache : 失準 用被偷走感覺是肯定自己模型沒有錯
Pinka5566   : LBJ每年都被偷這種話也講出口喔90F 04/30 10:16
sxzc        : 推回來91F 04/30 10:17
KevinJohnson: LBJ 要六座MVP 還說沒偷92F 04/30 10:17
Pinka5566   : 應該說姆斯偷了好幾年MVP吧 每年都抱團組三巨頭 最93F 04/30 10:18
Pinka5566   : 好笑的是11年熱火戰績輸公牛
jardon      : 所以就引戰模型阿 紛爭是不可能停止的95F 04/30 10:18
a180310444a : rose無腦粉:當年第二名不是lbj是dh96F 04/30 10:18
Kazmier     : Nash連偷兩座97F 04/30 10:19
EEzionT     : 戰力滿點98F 04/30 10:19
Kazmier     : 只是他形象不錯99F 04/30 10:19
kevin0733   : 如上面fj所說 應先以事實來建立模型100F 04/30 10:19
Pinka5566   : 抱腿組巔峰三王 然後戰績輸單核的Rose 這樣叫偷101F 04/30 10:20
EEzionT     : 想不通為啥要捧老衲  膚色不正確102F 04/30 10:20
z45678915   : 阿肥穩了103F 04/30 10:20
kevin0733   : 模型回測失準 就該修正104F 04/30 10:20
WO0820      : 是不是沒在看防守??105F 04/30 10:21
jardon      : 權重也是可以調整的 呵呵106F 04/30 10:21
CMPunk      : 阿肥早就穩了107F 04/30 10:22
lylu        : 用了38年的資料結果只中32年聽起來很怪108F 04/30 10:23
tyrone0923  : Nash那兩年給他也沒懸念,在平均得分95的年代,太陽109F 04/30 10:23
c22501656   : 史丹利學習110F 04/30 10:23
mc2834      : 美國ptt好強111F 04/30 10:23
tyrone0923  : 平均得分110,讓NBA在湖人王朝後不至於沒話題112F 04/30 10:24
Aggro       : 同意fj的說法 用偷走是表示這模型是計算定律了?113F 04/30 10:24
proter      : 0.04114F 04/30 10:25
chinhan1216 : 機器沒辦法學習人類情感判斷?115F 04/30 10:27
KevinJohnson: 所以NASH最低要說模型嚴重失準嗎116F 04/30 10:27
Coffeewater : 投票帶有非理性因素,機器人需要學習感情117F 04/30 10:28
icou        : 如果要以事實去設計model,那很多感官或是特殊紀錄118F 04/30 10:29
jackeighteen: 推數據跟分享!119F 04/30 10:29
icou        : 像是龜的得分王場均大三元,要怎麼設定就是問題120F 04/30 10:29
noway729    : 準確度超低吧...121F 04/30 10:29
nastycurry  : 算出來結果其實都滿合理122F 04/30 10:30
icou        : ?? 38年正確跑出和事實相同的32年 不算低了耶123F 04/30 10:30
nastycurry  : 以前都說要看戰績(最大受益人Nash,Rose)然後西河124F 04/30 10:31
nastycurry  : 打出場均大三元又是另一回事了....
Playonenight: 不愧是姆斯126F 04/30 10:32
icou        : 當年龜那平均大三元 板上也都覺得MVP機會很高 所以127F 04/30 10:32
icou        : 這種因為特殊條件的加分要怎麼設也是問題
chinhan1216 : Harden那年數據也很扯跟戰績更是狂勝129F 04/30 10:33
Justice5566 : 這個模型感覺對控球後衛不太有利130F 04/30 10:33
k7202001    : Nash傳統數據不出色阿 姆斯是審美疲勞+抱團太難看才131F 04/30 10:33
k7202001    : 輸Rose 龜則是第一次場均大三元
Justice5566 : 控球後衛有很多層面是數據無法顯現的133F 04/30 10:33
k7202001    : 對pg沒不利吧 咖哩兩屆都是符合阿??134F 04/30 10:34
chinhan1216 : 會輸就是輸給機器無法判斷的東西了135F 04/30 10:34
arbee       : 會有結果不合 代表不夠精準 再想一下136F 04/30 10:34
AHEAD099    : 有無法量化的因素 就無法做到100%準確啊137F 04/30 10:35
GOOGOOfish  : 您的模型是不是對控衛不太友善啊138F 04/30 10:36
ee397856    : 推139F 04/30 10:37
TimmyJiang  : 被Rose偷?你說CP3就算了起碼他當年第二名,姆斯當140F 04/30 10:37
TimmyJiang  : 年是第三名然後抱怨第一名在偷?
TimmyJiang  : 那第二名的魔獸是什麼,隱形人嗎
nastycurry  : 每年風向又不一樣,不可能都合啦143F 04/30 10:38
purification: kobe cp3那年最後兩隊對決,賽前就有不少風向是說144F 04/30 10:38
purification: 哪隊西一,mvp機會就大增,最後湖人贏了就這樣
說一下我自己的感覺:
1. 原文有說,他們考量的結果並不只是得獎/沒得獎,而是把MVP票數、名次都有考量進去
因此就算是"失準"那幾年,可以發現其實一二名結果差距也不大
2. 預測投票不是預測氣象,太多人的主觀情感在裡面,我覺得能有這樣的準確度應該是
可以參考了
3. 當然這個東西只是模型,不是定理,100個人會做出100個不一樣的模型,就跟BBRef
上面一堆的XX probilities一樣,參考一下就好
寫個"被偷"只是想增加娛樂效果,若有冒犯敬請見諒
reihane     : 用過去38年資料訓練的模型,預測過去38年的資料,146F 04/30 10:40
reihane     : 準度會高也是正常...
cbj1992a    : 我也想起濤哥148F 04/30 10:40
benny1990615: LBJ被偷不是公認的嗎149F 04/30 10:40
MaxwellsEQ  : 38中32很不錯了,硬要都中會有overfit風險150F 04/30 10:41
jsliao9786  : 更好笑的是11公牛季後賽被碾過去151F 04/30 10:41
redsa12     : 結果很有趣 但想糾正一個語病 這個不叫回測 你只能152F 04/30 10:41
sasewill    : 姆迷公認XDD153F 04/30 10:41
redsa12     : 說是模型預測的結果和現實符不符合154F 04/30 10:42
redsa12     : 回測必須要有明確的in-sample out-of-sample
那如果用"驗證"可以嗎?
SwissMiniGun: Rose那不算偷吧 組三巨頭戰績反而輸公牛才是關鍵156F 04/30 10:44
COTOYO      : 姆斯都被控衛偷157F 04/30 10:44
SwissMiniGun: 公牛+21勝 聯盟戰績第一 熱火+11勝 聯盟第三158F 04/30 10:44
tim900127   : 照某些人的這講法加今年龜龜應該有四座Mvp了159F 04/30 10:45
kai08130623 : 因為得獎的是Rose才說偷啊,如果當初是DH拿也會被160F 04/30 10:46
kai08130623 : 說偷
tim900127   : 龜龜連續三年場均大三元怎麼沒給他三座再加上今年162F 04/30 10:49
tim900127   : 應該要四座MVP了 把龜龜的給我還來
lanchenchen : 鄉民不是很愛說老大偷MVP?164F 04/30 10:49
cross980115 : 靠 原來LBJ被偷不是叫假的 還被偷兩座165F 04/30 10:50
redsa12     : 就說"預測"就好啦 別說"回測"166F 04/30 10:50
sdriver     : 數據量有點小167F 04/30 10:50
GaryOp      : 居然有學店GPA 1.9的說模型簡單168F 04/30 10:52
tomoti      : 推模型,還我老大一個清白(誤169F 04/30 10:52
guagua1101  : 我原本要做這件事的 之後自己也來試試看170F 04/30 10:52
jackjoke2007: 沒問題 我家肥宅已經確定 只希望不要受傷171F 04/30 10:55
FiveSix911  : 覺得蠻準的172F 04/30 10:56
kevinlai29  : 結果今年mvp是nash(?!)173F 04/30 10:57
JayceYen    : 阿肥拿得當之無愧174F 04/30 11:00
ken6136     : 超屌175F 04/30 11:02
kevinlook   : 笑死一堆人捧金筆結果跟阿肥差距超大 哈哈176F 04/30 11:03
Gary21      : 好強177F 04/30 11:08
dada86429   : 今年阿肥穩了178F 04/30 11:09
cama        : Nash就白人加權保障名額  季後賽就穿幫了179F 04/30 11:10

另外補充幾點在討論中看到的:

1. 跟PTT鄉民一樣,Reddit鄉民普遍認為narratives(風向)是一個重要但是難以量化
   計算的參數

2. 由於NBA的球風不斷地在改變,投票者的口味也可能跟30年前大不同,有人建議應該給
   予較近期的投票結果比較高的權重。也有鄉民建議可以分析並考量30年前跟現在投票
   者看重的數據的差異(例如:會不會30年前的投票者比較看重籃板,而現在的投票者
   比較看重三分命中率?)
   原作者有說會把這些東西放入to-do list,就看看之後會不會有更好的模型出來囉
yj80039     : 哈登那年真的被偷180F 04/30 11:13
HotDogCC    : 推 有趣的模型181F 04/30 11:13
blazers08   : 這很酷歐182F 04/30 11:13
a3221715    : 姆斯就是猛183F 04/30 11:15
fsttt       : 如果模型用過去38年的資料訓練模型,然後又拿同樣的184F 04/30 11:16
fsttt       : 資料驗證模型表現,那為何準確率不是100%啊?有資料
fsttt       : 科學大師願意解惑嗎
yuting020312: nash好爛187F 04/30 11:17
cktony      : 推喔,感謝分享以及建模的天才188F 04/30 11:17
matsuwu     : 上面因為實際上選MVP是「人選」不是跑數字出來決定189F 04/30 11:19
matsuwu     : 用人選自然不會是100%統一的標準
sexycute    : 太猛啦~191F 04/30 11:20
matsuwu     : 但這模型算是非常好預估未來人選的方式192F 04/30 11:20
a3221715    : 金筆這麼低喔? PER數據很好欸193F 04/30 11:20
cathyznzn   : 肥宅之光 衝啊194F 04/30 11:21
edq02yc     : 叫濤哥來看看,這才是真的大數據195F 04/30 11:21
protoss666  : 我要來all in了196F 04/30 11:21
darkreborn  : 推197F 04/30 11:22
a3221715    : 如果老漢受傷 他沒受傷的話8成是他 結果跑個模型那198F 04/30 11:22
a3221715    : 麼低
wind1193    : 這頂多能說用來解釋過去怎麼評斷的 但是過去不代表200F 04/30 11:22
wind1193    : 未來
iamgoodboy  : Nash真是白人膚色加持,總教練202F 04/30 11:22
iamgoodboy  : 也是空降,mvp也是空降
iWatch2     : 岳父神偷204F 04/30 11:23
roger2623900: 11年這模型算出來也超接近啊 姆斯2.37 Rose2.23 把205F 04/30 11:24
roger2623900: 勝率加權多一點不就是Rose贏了XD 組三巨頭勝率輸公
roger2623900: 牛還能說被偷喔?
※ 編輯: timmyen (111.248.194.238 臺灣), 04/30/2021 11:26:13
TVXFQ       : 身家歐印阿肥208F 04/30 11:25
goodawp1    : Nash不意外209F 04/30 11:26
swwf        : 這很讚啊 ^^210F 04/30 11:31
maxliao     : 小新211F 04/30 11:32
radiant     : 有趣212F 04/30 11:33
seeking     : 好猛的模型213F 04/30 11:35
job3904     : 這學期做project 也用了簡單的ML預測UFC對戰214F 04/30 11:35
sk050607    : Nash是以退役、且得超過一個MVP,但唯一沒打過總冠215F 04/30 11:36
sk050607    : 軍賽的球員,這程式的準確度,我覺得還是有的
s891050     : 阿肥海放...217F 04/30 11:36
sk050607    : 丹東尼小球最大化了Nash,但也就只有摸到西冠而已218F 04/30 11:38
zakijudelo  : joker不是說他今年得分、籃板、助攻都排在前五,抄219F 04/30 11:38
zakijudelo  : 截也在前十,沒給他說不過去吧
dynamis     : nash史上第一控,年度mvp兩顆221F 04/30 11:39
protest999  : 為我柯平反,推推!222F 04/30 11:39
gunies1111  : 準確率不是100%是在overfitting與underfitting之間223F 04/30 11:39
gunies1111  : 的trade-off  當然你可以訓練模型讓它在“既有的”
gunies1111  : 資料準確率100%  但這可能會讓你的模型過度擬合訓
gunies1111  : 練資料  反而在面對我們真正感興趣的預測未知資料
gunies1111  : 時失去準確度
sanadayasu  : 但數據量有點小228F 04/30 11:42
sasewill    : 冷笑話這麼厲害,怎麼在尼克湖人都玩不起來還要等229F 04/30 11:43
sasewill    : 到有幫主,反而Nash還是能進西決,誰罩誰還不好說
dynamis     : 推nash這輩子沒打過冠軍戰,年度mvp兩顆231F 04/30 11:43
scratch01   : 金筆:我才該得MVP232F 04/30 11:44
ph90119     : 推一個233F 04/30 11:45
scratch01   : 今年金筆應該還是出不了東部,MVP就別肖想了234F 04/30 11:46
gowaa       : 1984前的不去算嗎235F 04/30 11:49
thenick     : 這個換個模型結果就完全不一樣了236F 04/30 11:50
GABA        : 肥VP237F 04/30 11:52
AHEAD099    : 這是把38年票選結果和可量化數據丟進去train出一個238F 04/30 11:55
AHEAD099    : 最符合票選結果的各項數據權重 無法考量人為主觀因
AHEAD099    : 素 結果有些誤差是正常的
njunju      : 結果沒看Nash打球的Nash粉跟你說就是這兩座MVP>Kidd241F 04/30 11:55
njunju      : &CP3
smith2012   : 怎麼能把training data和testing data混在一起阿,243F 04/30 11:56
smith2012   : 這樣就跟球員兼裁判一樣
poweroo2001 : 少了一個 媒體愛/新聞版面245F 04/30 11:57
njunju      : Nash那兩座也吃不少香妹、阿罵的buff246F 04/30 11:57
njunju      : 當時太陽各項最大貢獻指標 Nash也沒第一 防守又是洞
b2209187    : Nash當年是真的有偷了大歐MVP的感覺248F 04/30 12:02
icespring   : 有點猛 推一個249F 04/30 12:04
AngelMAyCry : 差距巨大250F 04/30 12:05
somanyee    : 這才是有價值的文章!立馬all in251F 04/30 12:06
gunies1111  : 這種資料量這麼少的可能是用LOOCV吧  不太可能直接252F 04/30 12:09
gunies1111  : 切training  testing data
ghostxx     : MDA把能力夠強的持球者極大化對於這種競爭真有效益254F 04/30 12:09
jajepound   : 阿肥是真的猛255F 04/30 12:10
lulululula  : 拿training data verify 還只有32/38,這model感覺不256F 04/30 12:11
lulululula  : 太行欸
shawncarter : 推258F 04/30 12:13
ziggyzzz    : 一堆人根本沒點進去看演算法ㄏㄏ259F 04/30 12:17
jason770301 : 去賭博網站all in 阿肥了!!!! 翻身就靠這一發260F 04/30 12:19
jason770301 : !
dragon21503 : 我看得懂262F 04/30 12:19
a92005712d  : 之前不是一票喊Kobe偷CP3的MVP263F 04/30 12:20
jaworuji    : 阿肥阿肥得第一!264F 04/30 12:23
LaserLi     : 這個數據超棒耶265F 04/30 12:26
HardDDDD    : 歐印阿肥266F 04/30 12:27
chriscko    : 感覺這套數據對前場有利一點點267F 04/30 12:28
OyAlbert    : 哇,這戰點好足,偷mvp的原來是268F 04/30 12:33
PizzaKK     : 我先 狗鼻偷MVP269F 04/30 12:34
ksuenjjr    : 板上一堆機器學習大師,看來要看李宏毅學學了270F 04/30 12:38
daniel50506 : 為什麼才38年就建得出6年不符合的模型啊@@271F 04/30 12:38
efoxx1155   : 內文是說用decision tree?272F 04/30 12:40
karmel      : 該修林軒田機器學習了QQ273F 04/30 12:42
gfriend1127 : 早說螺絲偷我詹五連mvp274F 04/30 12:45
bubblefree  : 推275F 04/30 12:49
hyc0725zz   : 推量化!老詹原來有兩座寄放在別人那276F 04/30 12:57
boy88115    : 推277F 04/30 12:57
Supasizeit  : 36個點就可以做機器學習,南無厲害278F 04/30 12:58
WARgame723  : 聯盟不還老詹MVP就是怕喬丹被比下去279F 04/30 13:00
start928    : 這樣樣本不會太少嗎?280F 04/30 13:02
wseb        : 38年樣本算少嗎?..就幾乎所有的記者投票都算進來了281F 04/30 13:12
kei1823     : 是只有算有得票的嗎?282F 04/30 13:16
Noxus       : 詳細欸283F 04/30 13:29
xman262     : 罰球次數也算?難怪一堆碰瓷mvp284F 04/30 13:29
我覺得罰球這數據蠻有趣的,我猜測是聯盟捧的球星通常罰球多,通常也同時是MVP熱門
罰球多是果不是因
jamescle23  : 優文給推 開放某黑崩潰285F 04/30 13:35
pp3435      : 看來這模型挺客觀的286F 04/30 13:37
leo19841010 : 那幹嘛還票選,跑數據就知道MVP了,整天偷不偷一點287F 04/30 13:37
leo19841010 : 意義都沒有,難不成還要打星號
HsiangFly   : 這數據少了 聲量 跟 連莊遞減效應289F 04/30 13:41
kuiyy       : 有趣290F 04/30 13:41
ivo88114    : 38年就出錯6年 還不用修正嗎291F 04/30 13:42
mbmh        : MVP很重話題的印象分啊,不然也不會雷霆全隊配合龜292F 04/30 13:43
mbmh        : 龜刷場均大三元了
※ 編輯: timmyen (111.248.194.238 臺灣), 04/30/2021 13:45:01
mbmh        : 話題熱度延續到季末 MVP就get了294F 04/30 13:44
taro0116lo  : 西河年年拿MVP295F 04/30 13:44
Hsuannn000  : 這模型湖人利多哈哈296F 04/30 13:46
justice0926 : 明明就有答案了 就不準確啊 明顯少了一些無法量化的297F 04/30 13:53
justice0926 : 數值(外部因素 如 審美疲勞)
eric6616    : 兩個姆斯都被偷兩座mvp 摳憐299F 04/30 13:56
YouGot5566  : 可以算一下今年冠軍嗎300F 04/30 14:00
Tawara      : 他的“預測”是指預測訓練集裡面的數據?301F 04/30 14:09
hannah5269  : 準備寫論文囉!302F 04/30 14:13
banker5566  : AI是需要資料去學習,數據量越多會越準確,mvp才幾個303F 04/30 14:16
banker5566  : 還有需要考慮投票者突然腦袋斷線因素
leo255112   : 又要來一個歐洲MVP了,期待305F 04/30 14:19
shifa       : 首先要思考的是基本上不存在數據不夠漂亮結果拿MVP306F 04/30 14:32
shifa       : 的狀況。所以這一篇夯不啷噹列了25個指標,也就是
shifa       : 更加強「堆數據=MVP」的推論。所以可以玩味的是這
shifa       : 模型的6個例外是不是有什麼重要資訊是沒有涵蓋在在
shifa       : 25項指標內。
cliff2102   : 酷 有空來看311F 04/30 14:33
peadon      : 原PO在心得&回覆上的見解與氣度令人欽佩312F 04/30 14:44
kevin0733   : 對模型的批評又不是針對原po313F 04/30 14:49
a123456cg   : 這個不會過度耦合嗎?如果用訓練資料的模型再去跑測314F 04/30 14:49
a123456cg   : 試資料?
IRPT001     : 史上最__mvp316F 04/30 14:50
marginal5566: 這模型蠻有意思的317F 04/30 14:52
risingsuns  : 詹被偷兩個...318F 04/30 14:54
AnnaOuO     : 還我姆斯2座MVP獎杯==319F 04/30 15:02
sakura8     : 很有趣又有深度,謝謝原po分享。希望以後能多點這種320F 04/30 15:20
sakura8     : 文章
BardxBaymax : 酷322F 04/30 15:38
s8900117    : 推數據323F 04/30 15:39
VVinSaber   : 羅斯那個就聯盟捧加姆斯那年是反派 不算偷吧324F 04/30 15:42
sck921      : 就說LBJ被Rose偷MVP325F 04/30 15:59
WASIJLA     : 可以噢326F 04/30 16:00
ganhua      : 猛327F 04/30 16:12
s8800892000 : 出席率影響太大了328F 04/30 16:44
kenslc199   : 有趣329F 04/30 16:48
hjt11201213 : 終於還Kobe清白了330F 04/30 17:11
gcar        : 所以以數據化來看,cp3表現最好的那年其實不輸給Na331F 04/30 17:24
gcar        : sh
balabala56  : 歐肥那年強到可怕 很多人氣到不想看比賽333F 04/30 17:47
a62103101gun: 完了  雖然喜歡咖喱  看來是阿肥了334F 04/30 18:36
bighead7987 : 全票MVP沒毛病,差距那麼大,我阿嬤都知道要給Curry335F 04/30 18:47
bighead7987 : ~
drajan      : 38個資料點 恐怕很難做什麼有意義的學習337F 04/30 18:52
xgMd1trtw   : 那些說詹沒被偷的詹酸勒338F 04/30 18:52
trayman     : 數據都出來了 老詹就真的數據疲勞被偷至少兩座mvp339F 04/30 19:29
trayman     :  幸好真的夠猛 現在成就還是聯盟第一
KobeGeorge  : 組三巨頭戰績還輸公牛 這樣也敢說偷?341F 04/30 19:36
lunkk       : 西強東弱的因素也沒有放進模組342F 04/30 20:26
yesido330   : 去年才有人模擬快艇會奪冠XD343F 04/30 22:04
EricByrnes  : 這個好344F 04/30 22:17
jellyno1    : 水唷345F 05/01 00:12
homenet9    : 該戰的全戰了,機器學習真的好棒棒346F 05/01 00:35
zqAI3yGOAT  : 看到這個以為又是濤哥347F 05/01 00:47
qwe7893831  : 推348F 05/01 01:37
vking223    : 阿肥,阿肥,叭叭叭~~349F 05/01 07:02
kobe7785075 : nash拿是因為太陽戰績好 外加帶起小球球風 有時mvp350F 05/01 08:48
kobe7785075 : 真的蠻印象派

--
※ 看板: NBA 文章推薦值: 0 目前人氣: 0 累積人氣: 276 
分享網址: 複製 已複製
r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇