顯示廣告
隱藏 ✕
※ 本文為 TLdark 轉寄自 ptt.cc 更新時間: 2016-10-25 23:51:00
看板 C_Chat
作者 papple23g (逆道者)
標題 Re: [討論] 如何看出一個動漫腳色或作品,過氣與否?
時間 Mon Oct 24 01:25:41 2016


※ 引述《Emerson158 (紅豆 X 八嘎 X 烏魯賽)》之銘言:
: 那一般被創造出來的動漫腳色,甚至動漫作品,
: 如何判別或者感覺她已經過氣了呢?
: 討論程度是一個指標,
: 周邊商品的數量也是一個指標
: 還有其他指標嗎?


其實有一個方法可以快速辨別熱門程度的指標

就是把它輸入到Google搜尋趨勢(Google Trends)

https://www.google.com/trends

例如輸入 進擊的巨人 後

它會呈現近年的搜尋熱門趨勢(最高數值會被設為100)

http://i.imgur.com/JVbuzmA.png
[圖]
 

可以看到它剛開始有一個急遽竄紅的時期,過了高峰後就會開始衰減

於是現在我們可以問:

能不能透過搜尋趨勢的曲線,來認定它是不是過氣的作品?

以及,我們要怎麼量化一個作品的過氣程度呢?



一般我們對過氣的定義是,當初全盛期的熱潮,現今已不復存在

所以最「理想」的過氣情況,就是當初急遽竄紅,然後人氣又快速衰減

最好到最後大家都如同失憶一般,紛紛吐出「OO…是誰?」這樣的情況

好,那有甚麼適合的曲線方程式可以描述這樣的趨勢呢?




有的,我們有 馬克士威-波茲曼分布(Maxwell–Boltzmann distribution)
http://i.imgur.com/CFAN5Km.gif
[圖]
 
它的方程式寫為
http://i.imgur.com/PrDpCbE.png
[圖]
 



波茲曼分布是用來描述理想氣體的速率分佈的曲線

它描述某個溫度下,一個盒子內的氣體在各種速度下所佔有的粒子數量

它成功地解釋了許多基本的氣體性質

撇去推導過程不說,這邊先只對它的公式做一些定性上的說明

大家可以看到,每條曲線從原點開始,粒子數目會隨著速率增加

這表示當你速率越大,你可以做出的動作越多(有更多方向的選擇)

所以橫軸上的速率越高,這個速率所"提到"的粒子數也就越多

但接著,後面是個快速衰減的曲線

原因是在統計學上,粒子被分配到高能量的機率很低

據分析,它是一個指數衰減─沒有人能抵得過指數衰減的壓制

因此圖形畫起來就像是偏向左邊集中的鐘形曲線了



值得一提的是,根據方程式的結果

當溫度提高時,整體分佈會向右平移而壓扁(紅曲線)

溫度變低時,分佈會向左集中而變得尖銳(青曲線)

看起來有點像熱門程度變化的趨勢曲線



作為比較,如果把橫軸換成時間軸,縱軸換成熱門指數

那麼氣體分子因速度增加而提升了運動的可能性

就類比於作品熱度經一段時間散播名氣而竄紅

而氣體分子因能量分佈而造成高能量粒子數有明顯的指數衰減現象

類比於長時間下,作品熱潮的退去,考驗著一個作品能不能夠久存於人心的實力

這樣看來,波茲曼分布的確是個非常適合描述熱門趨勢的曲線模型


(需要特別注意的是,Google Trends顯示的是關鍵字搜尋熱度,並非直接顯示粉絲的比例
,或到達多"鐵粉"的程度。但紛絲在一定程度上都有推廣的作用,間接引發搜尋熱度,這
同時也和”有沒有常常提到或聽到這個作品”的「過氣程度」有意義上的直接關係)




根據這樣的啟發,我們可以設計一個方程式來做data fitting

也就是模仿波茲曼分布的公式:
http://i.imgur.com/PkU4q2R.png
[圖]
 

其中a是竄紅指數,b就是過氣指數,A僅是作為幅度的調整

(※時間統一以月為單位)

而關於調整offset的c值,可以取未竄紅前的關鍵字平均熱門程度

或者是參考作品發售的時間點取值,也可以取最靠近高峰值的前一個極值

三種取法的c值通常都會很接近,但也有例外

例如動畫化後才大紅的作品,就不適合拿輕小說的發售時間作為參考點(data fitting也
容易出現錯誤)



事不宜遲,我們先拿《神魔之塔》作為關鍵字來試水溫
http://i.imgur.com/VUThHma.png
[圖]
 
http://i.imgur.com/MF7XVEm.png
[圖]
 

(藍線為原始資料,綠線為fitting曲線)

經data fitting後

得到《神魔之塔》竄紅指數為0.95853676

過氣指數為0.00411

以其他同類型的資料來說,算是比較不過氣的遊戲



第二個實驗品是《開心農場》
http://i.imgur.com/rxcGIpj.png
[圖]
 
http://i.imgur.com/WXW9cvk.png
[圖]
 

竄紅指數2.25962323

過氣指數0.0333251

幾乎是《神魔》過氣指數10倍

其實想想也蠻正常的

我還記得開心農場上的植物由於多年沒有照料

在很久以前早就過了生氣,繁榮不在了



確認模型可使用後,當然就是開始大量的找關鍵字了

搜尋了一下版上曾經被質疑是否過氣的角色和作品
http://i.imgur.com/tU7Nzun.png
[圖]
 



瀏覽了一些文章,找了約十幾個作品和角色的關鍵字

也參雜一些可能不過氣的角色或遊戲來做比較

下面是fitting圖,得到的數值結果將會於稍後發表
http://i.imgur.com/Z7ER81A.png
[圖]
 
http://i.imgur.com/xvMSMeS.png
[圖]
 





有一點必須提到的是

我在搜尋「poi」的搜尋趨勢時,結果和預期的完全不同

http://i.imgur.com/WyuUcOW.png
[圖]
 



估狗了一下,原來poi可以是指Apache POI,一種開放源碼函式庫

為了避免用詞的混淆,將地區縮限為台灣:
http://i.imgur.com/LBoVnHR.png
[圖]
 



可以看到peak已經很明顯被過濾出來了

雖然整體仍然提高了一個平台,但是這可以透過調整offset去除掉

其他碰到類似情況的關鍵字也可以能透過縮限地區、增加輔助關鍵字或者是指定搜尋類別
來解決



(p.s.過濾姆咪這個詞我已經放棄了XD)



另外也想嘗試在過程中盡可能找出大起大落的關鍵字(非角色或作品)

想到當時很紅的「淡定紅茶」(2012年5月)
http://i.imgur.com/3mxP9Hc.png
[圖]
 



以及跨年活動(2015)
http://i.imgur.com/U7uyqGT.png
[圖]
 

「跨年」的熱門程度甚至連長尾效應都非常小…

說得也是,如果到現在10月了你還說你要跨年到2016

不僅過氣,別人還會以為你腦袋的運作上有困難



「淡定紅茶」和「跨年」的計算也會於併入發表結果









於是,終於來到了結果發表時間!(登登~







==================================================

[對象]        [使用關鍵字]     [地區]    [過氣指數]
夏娜          夏娜              台灣      0.000216
minecraft     minecraft         全球      0.000232
K-ON          K-ON              台灣      0.000241
LoveLive      LoveLive          台灣      0.000986
神魔之塔      神魔之塔          台灣      0.00411
pokemon       pokemon           全球      0.0296
開心農場      開心農場          台灣      0.0333
海老名        海老名 菜々       全球      0.061
雷姆(re0)     雷姆              台灣      0.067
乳繩          乳繩              台灣      0.0771
鬥陣特攻      Overwatch         全球      0.0932
小埋          小埋+土間埋       台灣      0.107
鬥陣特攻      鬥陣特攻          台灣      0.162
pokemon       pokemon+寶可夢    台灣      0.193
無名(甲鐵城)  無名 甲鐵城       台灣      0.203
淡定紅茶      淡定紅茶          台灣      0.211
poi           poi               台灣      0.5
跨年(2015)    跨年              台灣      1.452

==================================================

搜尋地區多以台灣的為準

目的是為了讓結果更貼近洽眾的感受

以ACG的角度來看,目前過氣指數最高的角色是甲鐵城的無名

最過氣的用詞是poi (不視為角色是因為口頭禪的用法比指夕立本身的情況還要多)

這個結果倒蠻驚訝的

搞不好是因為poi的語意不定,所以更適合只在動畫上映期間跟風使用吧?

大量poi的留言也會讓不懂的人去搜尋這個鬼玩意XD



而跨年的過氣指數已經高到跨越世界線了

不過離下次的跨年也不遠了,大家用愉快的心情迎接吧



※附記:

藝人或者偶像等似乎不適合套用在這個模型

藝人的熱門趨勢通常是後面一連好幾個peak,增減不一

不過同時也產生了一個新的疑問:

當一個疑似過氣的藝人因後來某些事件而增加搜尋量時

他還算是過氣嗎? 這個就很難說清了

而同樣生為偶像且常被質疑是否過氣的初音未來

其趨勢圖如下
http://i.imgur.com/RwLia8u.png
[圖]
 

由於V家可以延伸的領域範圍很廣

所以沒有明顯衰減的曲線也不適合套入該模型使用

至少可以確定還沒到達過氣的程度


其他無法套用公式的例子:

◎Elsa (階段式的走紅)
結論:不過氣
http://i.imgur.com/k5mo15C.png
[圖]
 

◎PPAP (現正當紅)
結論:待觀察
http://i.imgur.com/elVbNvs.png
[圖]
 




以上就是我的分析結果

謝謝大家的觀賞~~






--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.8.34.100
※ 文章代碼(AID): #1O3FAO3f (C_Chat)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1477243544.A.0E9.html
weichipedia: 這篇太專業 推1F 10/24 01:28
Israfil: 優....優文......2F 10/24 01:29
weichipedia: 不過我要再強調一點 小埋沒有過氣3F 10/24 01:29
weichipedia: 小埋是全希洽人的妹妹 在下的老婆
QBian: 姆咪QQ5F 10/24 01:30
QBian: 蜜蜜才是大家的妹妹
pups914702: 專業文poi7F 10/24 01:31
[圖]
 
ntupeter: 推推9F 10/24 01:31
allanbrook: 斬子小姐:QQ10F 10/24 01:32
[圖]
 
twosheep0603: 拿波茲曼分布去filtering趨勢真的是挺天才的12F 10/24 01:33
twosheep0603: 你有沒有興趣投稿巴哈姆特論文獎?
weichipedia: 用波茲曼去做真的很猛 怎麼想到的14F 10/24 01:35
wuwuandy: 這只能推了15F 10/24 01:36
litcurler: 做傅立葉轉換呢?16F 10/24 01:38
[圖]
 
hachiman: 成天廢問唯一的貢獻就是看能不能像這樣釣出優文了18F 10/24 01:41
hollande: http://i.imgur.com/Md4N3dz.png 看來一色派真的是主流19F 10/24 01:41
[圖]
 
twosheep0603: 傅立葉轉換是拿來看頻域的 要先找到對應的物理意義20F 10/24 01:46
achero: 姆咪21F 10/24 01:48
LinTom: 這個厲害XDDD22F 10/24 01:54
wlsh5701: 跨年年年都過氣XD23F 10/24 01:54
Lupin97: 優文給推24F 10/24 01:56
buke: 推 專業25F 10/24 01:59
dsersr: 你要不要投稿搞笑諾貝爾獎26F 10/24 01:59
king786945: 真好奇你的offect是怎麼才設定的 這其實很模糊27F 10/24 02:02
sixpoint: http://i.imgur.com/kqDCwRy.png 求解籤28F 10/24 02:07
[圖]
 
rchih: 您過氣系?29F 10/24 02:12
yiefaung: 乾脆去做machine learning算了XD30F 10/24 02:13
Centauro: 太神啦31F 10/24 02:15
orze04: 基本上有多個波峰的都不能用波茲曼分布32F 10/24 02:15
orze04: [因為和基礎假設就為違背了
better83214: 推推34F 10/24 02:23
flysonics: XDDD 這篇超專業的 版主快M他!!!35F 10/24 02:31
foxsound: 專業推36F 10/24 03:26
wesleyrobbie: 太神啦37F 10/24 03:26
jacktang3200: 你過氣系?38F 10/24 03:34
Doracacazin: 嗯嗯原來如此 跟我想的一樣39F 10/24 03:38
sam39192: 猛40F 10/24 04:20
tweence: 不明覺厲41F 10/24 05:24
tomuy: 強42F 10/24 06:35
BalaBalaDaBa: 覺得複雜但還真的很屌43F 10/24 07:34
syllien: POI還可以是影集person of interest…!?xd44F 10/24 07:56
MayBeSoft: 你做一下偶像大師的看看45F 10/24 08:21
KHDSN: 這篇太優惹46F 10/24 08:55
drifthouse: 優文中的優文47F 10/24 09:15
ChuuBou: 不推不行。我家夏娜不過氣!!48F 10/24 09:16
narnia11105: 這是你畢業論文嗎XDDD49F 10/24 09:36
octopus4406: POi也可以是美國影集喔50F 10/24 09:36
octopus4406: 原po在寫論文嗎太屌啦
octopus4406: 是說都舉了巨人不分析一下嗎
shakai1010: 夏娜再戰10年53F 10/24 09:41
sioprr: 專業推54F 10/24 09:44
allenpong: 好像有點屌55F 10/24 09:46
longkiss0618: 太強了56F 10/24 09:47
HeterCompute: 推理論分析57F 10/24 10:52
Lulowfan: 只有猛58F 10/24 11:06
OalexO: poi我覺得會有很大一部分是指美劇59F 10/24 11:09
dolphinsun: U文幫推!60F 10/24 11:52
smics: 專業推~61F 10/24 11:53
MarXXXX: 推個62F 10/24 12:14
gary2011: 推63F 10/24 12:24
jasonpop: 你在寫論文膩64F 10/24 13:01
sakaya00: 太有才華了!65F 10/24 13:02
CalciumPlus: 推66F 10/24 13:38
oversky0: 請問為何不用 log-normal, Gamma, F-distribution 這幾67F 10/24 14:31
oversky0: 種也很相似的分佈函式?
dustlike: 快投論文啊XDD69F 10/24 14:37
DarkHolbach: 專業,推一個70F 10/24 14:52
romsqq: 原PO也太專業!!!71F 10/24 15:40
ap9xxx: 有數據推72F 10/24 15:58
P680: 居然是用波茲曼 太強啦73F 10/24 16:28
ShibaTatsuya: 不明覺厲74F 10/24 19:53
carrothead: 不明覺厲 有點強O.O75F 10/24 20:40
smallkaka: gj76F 10/24 20:53
AUGnebulaUGA: 推個77F 10/24 21:33
t128595: 感謝樓主的分析,夏娜再戰十年!78F 10/25 00:21
needshe520: 酷79F 10/25 06:52
t128595: 借轉夏娜版謝謝!80F 10/25 12:40
t128595:轉錄至看板 Shana                                        10/25 12:40
OTZisss: 太強啦! 只是感覺分開分析上升與下降的趨勢好像更直觀?81F 10/25 19:37

--
※ 看板: ACG 文章推薦值: 0 目前人氣: 0 累積人氣: 486 
作者 papple23g 的最新發文:
  • +7 [問卦] 模擬台灣十年內所有的停電事件會怎樣 - Gossiping 板
    作者: 111.240.157.21 (台灣) 2024-07-19 01:50:50
    15F 9推 2噓
  • +264 [問卦] 有沒有民調劉伯溫的八卦? - Gossiping 板
    作者: 111.240.107.235 (台灣) 2022-08-29 00:49:34
    大家好 最近我在逛板上的文章時,推文的一張圖引起了我的注意: 我就想到,通常選舉一結束,大家就鳥獸散,很少有人會回憶哪一家的民調做得比較準確 但是數據就公開在那裏,只要用對的方式進行分析,應該就能立馬 …
    298F 265推 1噓
  • +87 [XD] 賣金紙 - joke 板
    作者: 49.216.52.147 (台灣) 2020-08-18 23:39:51
    昨天看到老弟轉貼的 從 0:22 開始看 賣金紙的開始回答觀眾各式各樣的問題 但是問題一個比一個還鬧,看他越講越心累XD 個人喜歡的提問有 面積(唐突の數學題)、防火、冰箱 還有 現在買 凌晨走 X …
    101F 93推 6噓
  • +63 [問卦] Ptt推文曝光度分析的八卦? - Gossiping 板
    作者: 61.216.6.172 (台灣) 2020-04-14 16:34:31
    大家好 昨晚看到一篇「用JPTT的給我進來」的文 以及看到底下滿滿 imgur 的圖片 小弟的數據魂莫名燃燒了起來(? 大家知道 imgur 圖片網址把後面的點(.)和附檔名刪掉的話 就可以看到這張圖 …
    86F 64推 1噓
  • +171 [童年] 橡皮筋大戰 - StupidClown 板
    作者: 61.216.6.172 (台灣) 2019-12-17 16:07:19
    家裡是做鋁門窗的 從小就在鋁料堆和切割機的噪音中長大 有次我跟我弟一起玩橡皮筋大戰 那時地上散落著撿不完的「彈藥」,撿到就直接朝對方射去 就在戰況膠著時,我趁著空檔,蹲在地上收集橡皮筋 結果我的左耳突 …
    186F 173推 2噓
點此顯示更多發文記錄
分享網址: 複製 已複製
r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇