PTT評價

[乃木] 數據乃團 (一) - 資料說明 (長文)

看板SakaTalk標題[乃木] 數據乃團 (一) - 資料說明 (長文)作者
nekowang
(貓)
時間推噓11 推:11 噓:0 →:0

閒到蛋疼拿乃團來練習 Tableau…
https://public.tableau.com/app/profile/yi.pin.wang/viz/Nogizaka46Analysis/Main

請使用 FHD 螢幕觀看以免跑版或閱讀困難;排版不佳請擔待,以後再改進。預設進入在英文頁面,請自行切換到中文頁面。

共四個頁面,包含內容如下:
「出演資料」:各曲的隊型與站位,以及各成員的出演紀錄。
「基本數據」:各成員的出演累計與佔比數據,如出演曲數、 C 位曲數、出演率、點將率、聚光率等。
「進階數據」:各成員的愛將指數、愛將指數+、工作馬指數
「相關圖表」:白石軍團 vs. 西野軍團、生田軍團 vs. 齋藤軍團、各表題期別組成人數推移圖

本篇主要是說明各種名詞定義與計算公式,數據的探討會另開篇章說明。

文長,可以先看其他數據探討的文,有需要再回頭來參照。

簡單地說就是參考棒球數據的計算來量化了成員的單曲專輯出演紀錄,以便需要研 (ㄅㄧˇ) 究 (ㄓㄢˋ) 營運對誰比較有愛時,有一個可以共同參照的基準。

那怎樣算是營運對該成員有愛呢? 通常大家都圍繞在選拔與 C 位在討論,不過一張單曲有7 首歌,若只看表題 1 首而當其他 6 首為無物,似乎也有偏頗。所以基於「選拔」的精神是「點將」,以及「表題 C」的精神是「聚光」,來一併衡量表題曲以外的歌曲可以如何代表營運對成員的偏愛程度。

從「點將」的本義來說,就是營運明確指明一成員來出演某首歌,而非用「期別」或「同選拔」這樣大範圍框列方式指派。另外,一首歌如果點了太多人出演,也會喪失特別點人的意義。所以暫定 10 人為上限,將非表題非 Under 非框列且人數在 10 人以內的歌曲稱為「特選小組」歌曲。有被選入表題曲或特選小組歌曲才會認定是被營運「點將」。

而「聚光」則是以 C 位為判定基準。不過除了表題 C 是官方公告外,其他曲的 C 目前暫時只能參考日文維基資訊認定。另外獨唱曲與二重唱曲雖然沒有 C 位認定,但因為實質效果跟 C 位一樣,所以也被納入計算;又因為表題 C 最多 2 人,所以也只算到二重唱。最後,為了尊重表題 C 的地位,表題 C 的權重會是其他曲 C 位的 2 倍。

基於以上設定,來計算以下幾項數據,做為營運對成員偏愛的評量依據:

1. 點將率 (Promotion%, PP) = 期間內的 (表題 + 特選小組) / 成員對應的新發行曲數;概念上同打擊率,不過是營運 (打者) 對該成員 (投手) 的打擊率。

2. 聚光率 (Spotlight%, SP) = 期間內的 (表題 C + 任何 C + 獨唱/二重唱) / 成員對應的新發行曲數;概念上同長打率。

3. 愛將指數 (Preference Index, PI) = (點將率 + 聚光率) x 1,000;概念上同 OPS 。

4. 愛將指數+ (PI+) = 當期愛將指數 / 當期平均愛將指數 x 100;概念上同 OPS+ 。另外成員的生涯 PI+ 是依所經歷時期的對應新發行曲數做加權平均而得。

5. 工作馬指數 (Workhorse Index, WI) = (點將率 - 聚光率) x 1,000;沒有對應的棒球數據項目,含義上是判斷營運對常點將成員的定位。若某成員常常被點將但都輪不到站 C,那就是被營運當成好用又沒想力推的工作馬。

在愛將指數中,各種歌曲產生的推力權重範例如下:
表題 Actually… 的中西 => 3 (表題 + 表題 C + C)
Unit ざぶんざざぶん 的筒井 => 2 (特選小組 + 二重唱)
Unit 価値あるもの 的久保 => 2 (特選小組 + C)
表題 Actually… 的山下 => 1 (表題)
Unit 価値あるもの 的金川 => 1 (特選小組)
Under 届かなくたって… 的佐藤楓 => 1 (C)
Unit 絶望の一秒前 的井上和 => 1 (C)
Unit 他人のそら似 的任一人 => 0

在上面的計算公式中,所謂「成員對應的新發行曲數」,指的是在某一時期內,成員有參加的專輯/單曲中有多少新發行的歌曲。單曲內基本上都是新發行的歌曲,但專輯內就含有舊歌,這些舊歌必須排除在計算外。

至於何謂「參加」,定義是:只要營運在錄音時可以選擇該在團成員,就算是有參加。所以:
1. 北野 20 單病休,營運想點將都沒法點,所以在計算北野的數據時, 20 單的 7 首曲要從分母扣除。
2. 宣告畢業而不參加接下來要發行的某單或某專,若全不參加,則該單的內含曲數要扣除;若參加其中任何一首,則該單的內含曲數仍要計算。所以北野的 29 單與衛藤的 4 專都要計算對應的曲數。
3. Under 專輯「僕だけの君」雖然選拔成員因“資格不符”而未出演裡面任何一首新發行歌曲,但因為這是營運的選擇,所以選拔成員會被視為「參加」。
4. 「世界中の隣人よ」有畢業生參與,對這些畢業生而言,專輯「Time Flies」的所有內含曲數都不列入計算。
5. 若成員畢業後隔一單/專的專輯納入該成員先前錄製的曲子,則該專輯僅計算該成員畢業前錄製的歌曲。例如白石在專輯「Time Flies」中,只計算有出演的「世界中の隣人よ」和沒出演的「ゆっくりと咲く花」,其他 5 曲則不列入計算。 (Route 246 是特例,原則上白石宣告的畢業日期是早於 Route 246,但因疫情延後畢業而導致 Route 246 線上發行時看起來還在團)

前面公式中還提到「時期」的設定,除了避免計算上以單曲/專輯為單位會樣本太小而失真,還有考量整體環境變化的影響。像是前 13 單都是內含 6 曲,是 14 單後才變為內含 7曲,或是因人員變動而導致營運變更受推人選及單曲/專輯內的歌曲類別等設定。因此基本上分成 1 – 8 單、9 – 16 單、17 – 22 單、4 專 – Time Flies、29 單 – 目前 這
5 個時期。前面二個時期因為二期成員是陸陸續續上台,所以直接將 前 16 單對半切,後面的時期都是以三期生後各期別的第一首歌曲為切分點。

若依營運在各時期所給出的機會,計算出各時期的平均愛將指數分別為:
165.2, 147.3, 100.2, 99.0, 113.5
由此可知理論上經校正後的愛將指數+能適切評估營運在一時期中對成員的偏愛程度。

用第一時期 1 – 8 單的白石為例:
參加曲數 P = 49
表題曲數 T = 8
特選小組曲數 SU = 7
表題 C 曲數 TC = 1
C 位曲數 C = 3
獨唱/二重唱曲數 SD = 2

所以白石的相關數據為:
點將率 PP = (8 + 7) / 49 = 30.61%
聚光率 SP = (1 + 3 + 2) / 49 = 12.24%
愛將指數 PI = (30.61% + 12.24%) x 1,000 = 428.6
愛將指數+ PI+ = 428.6/165.2 x 100 = 259.4
工作馬指數 WI = (30.61% - 12.24%) x 1,000 = 183.7

最後補充一些細節:
1. 4 單因為「指望遠鏡」還多了個出演成員不同的「指望遠鏡~アニメ版~」,所以 4 單的內含曲數算 7 首。
2. 12 單多了 7-11 盤,因此內含曲數也是 7 首。
3. 一些只以影片形式存在但沒出現在單曲/專輯的 CD 內的歌曲例如伊藤万理華的「はじまりか」不列入計算。
4. 有成員影像但沒唱的歌曲亦不視為該成員出演該曲,如池田與川﨑不算出演「絶望の一秒前」,也因此沒參加 29 單。
5.「ボーダー」雖然只有身為研究生的 6 人,不過因為名義上是框列二期成員,所以列為期別曲而非特選小組。

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.79.164.222 (臺灣)
PTT 網址

nofriendsqq08/03 05:40先推

kl60604508/03 08:24好文推

linchen112108/03 09:48

AsukaMiku08/03 09:51推 感謝整理

limi12378908/03 10:19

ssaume08/03 14:05資料庫整理辛苦了ww 好文推一個

m38124908/03 14:21大大是在寫論文吧 好強

singzion33308/03 15:51推!!!

TLinHe08/03 16:26優質推

Akikiri08/03 18:43優質推

anthonylee08/03 23:28認真推