Kelloggで受けた最初の授業、"Leadership and Organization"の中で、教授が人間が持つバイアスについて説明する回がありました。個人的に特に印象的だったのは、Eurovisionという毎年欧州各国が代表して歌唱パフォーマンスを披露する番組(欧州版紅白の様な番組?)にて、出演順が後になるほど勝率が高い傾向があるという話でした。Eurovisionを例に、「人は直前に見たパフォーマンスを高く評価する傾向がある」として、複数名が比較されるプレゼン/コンペの類は、なるべく後の順序を取りに行くべき、というのが教授からのメッセージでした。
後になるほど有利、というこの上なくシンプルな話に興味を惹かれ、日本でも同じ傾向が見られるのか調べたいと思い、パフォーマンス→投票で結果が決まる番組としてM1グランプリに思い当たりました。WikipediaからデータをExcelに落とし、平均順位を見てみたところ、やはり、出演順が後ろのほうが平均順位が高い傾向があることが判明しました。
Leadershipの授業の中でコンペの類は出番が後になる程勝率が高いとの研究を見たので、M-1グランプリのデータを分析してみた。
— 小市民 (@Shoshiminkun) 2020年9月4日
①1stの出番が後になる程平均順位が上
②1st、2ndとも同様の傾向
③トップバッターと最後で、3位程度順位に違いが出る
思った以上に結果が綺麗に出て驚きました。 pic.twitter.com/DCujM5PWsD
さて、前置きが長くなりましたが、今回はPythonを使って、得点/順位への出番順の影響や、出番順を調整した時に結果はどうなるか、という点を分析していきたいと思います。分析データは前回同様Wikipediaより拝借しました。
コンビ名/所属事務所がセットになっていたり、出番順/得点が1st、2ndで分かれていなかったりとデータが汚かったので、綺麗にするのに多少手間取りました。年によって審査員数が異なり1st roundの最高点が500点~1,000点までバラつきがあった為、全て700点満点に換算した上で分析を行いました。
3番手までは不利
1stの出番毎の得点(700点換算)を見ていくと、やはり後半になるほど有利な傾向がある様です。一番平均が低い3番手と一番高い10番手では、28点もの差がありました(9人で開催している年がある為10番手はデータセットが同一ではない点には注意。2番手に高く9番手との比較でも22点の差があります)。興味深いのは、トップバッター不利説が指摘される一方、トップバッターだけではなく2番手、3番手も不利になっているところです。順序が番組側によって恣意的に決められているとは思いませんが、「4,5番の中盤でひと盛り上がりした後、9、10番手で最大の盛り上がりを見せる」というのは、所謂ドラマチックな展開の典型例といったところで、出来すぎな印象さえ受けます。
吉本有利説は本当か?
分析の前に巷で囁かれる噂を探していたところ、トップバッター不利説の他に吉本芸人の方が有利という説も見つかりました。
所属事務所毎に平均順位を見てみると、確かに一定数出場がある大手事務所(吉本の他、ワタナベ、松竹、人力舎)で比較すると、吉本芸人のほうが平均的に得点がとれていると言えるかもしれません。とはいえ、出場者の111÷149 = 74%程度が吉本出身の大会なので、吉本有利を論じても仕方ない気がします。歴代優勝者を見ると、サンドウィッチマン(フラットファイヴ)、ますだおかだ(松竹芸能)、アンタッチャブル(人力舎)と、他事務所からも3組優勝者が出ていました(近年は吉本ばかりなのは気になりますが)。
マヂカルラブリーは1st落ち?
さて、ここからが本当にやりたかったことですが、1stの出番順を調整した上でランキングを出すと、順位はどの程度変動するのか見ていきたいと思います。そのために、「出番順を調整した予想点数」を計算した上、「(実際の点数)- (予想点数)=(超過点数 )」と定義、超過点数で順位をつけるということをしていきます。予想点数の計算方法はごく単純な重回帰分析で、1st得点(700点換算)を目的変数、参加大会(1-16回)と出番順を説明変数として実行しました。実行結果を各大会優勝者に絞って出力したのがこちら。
1st得点順位=最終順位ではないので、1st得点順位と超過得点順位を比較していきます。番組のシステム上特に意味が大きいのは2020年のマヂカルラブリー、2015年のトレンディ・エンジェルの2組で、どちらも1st roundの得点では2番となっていますが、出演順を調整した超過得点の順位では4位となっています。2nd roundに進めるのは1st上位3組のみの為、出番順次第で2ndにいけない可能性があったことが示唆されています。その他、1st round1位からぶっちぎって優勝したサンドウィッチマンも調整後だと3位になっており、9番手という出番順の恩恵を大きく受けていた可能性があります。
大接戦と言われた2020年の順位を超過得点ベースの順位で見ていくと、1位:おいでやすこが、2位:見取り図、3位:ニューヨークとなっています。ニューヨークは2019年大会でトップバッターだったこともあり、出番順で不運を被っている代表例と言えるかもしれません。
ここまでの分析で、全ての若手芸人にチャンスが与えられ、「面白いかどうか」という実力勝負で決まるM1に於いても、どうやら出番順という運に結果が影響されそうだ、ということが分かってきました。M1の外で仕事が取れるかという点はより一層実力より運が大きな影響を持つ様に想像されますし、改めて、不確実な世界でリスクをとって仕事をしている、芸人の皆様には畏敬の念を覚えました。
最後になりますが、こちらの記事で初めてPythonで重回帰分析を回してるので、ロジックやデータの使い方等、改善すべき点等ありましたら何でもコメント/Twitter等でご指摘頂けると嬉しいです。
Appendix:出番順、芸歴の影響は統計的に有意か
重回帰分析の結果もAppendixとして載せておきます。1stの出番、開催年のダミーデータの他、芸歴の年数も含めた上で実行しています(出番順と違って芸歴は芸人の力量の差を反映している可能性もあると思い、本文上の超過得点の分析では説明変数から外しています)。結果、出番順は2.3点程度、芸歴も2.1点程度の上乗せがあり、いずれも統計的に有意(P-valueが0.05以下)となっていました。ラストイヤーは有利なのか、敗者復活はどうか、等今後の分析可能性が浮かびますね。