小市民ブログ

KelloggってMBAを出てアメリカで移民サバイバル生活をしています。サウナが好きです

MBA受験とバックグラウンド

スポンサー有無は(恐らく)結果に影響している

まず、こちらのグラフを見て下さい。

f:id:shoshimin:20210305134044p:plain

こちらのグラフは、AGOS社のHPより2014年以降の米国トップ7校(通称*M7)のMBA受験の結果を取得し、GMAT/TOEFLスコアを社費・私費に色分けしてプロットしたものです。社費・私費共に幅広く分布しているものの、平均的にはGMAT、TOEFL共に大きな差が無い様に見えます。こちらを見て、社費・私費で受験結果に大きな差が有るようには思われないと昨日ツイートをしました。

*M7は、HBS、Stanford、Wharton、MIT、Columbia、Booth、Kelloggの7校

(元データはこちらから取得。AGOS様、有難う御座います。)

www.agos.co.jp

これで自分の中では結論が出ていたのですが、とある方より不合格者も含めて分析しないと妥当ではないとのご指摘を頂き、今日再びデータとにらめっこをしておりました。先ず、先程の散布図の中に不合格者を追加し、更に細かく分布を比較するために箱ひげ図を作成しました(箱の中が四分位点、横棒が下限/上限です)。

f:id:shoshimin:20210305225539p:plain

f:id:shoshimin:20210305124557p:plainf:id:shoshimin:20210305124612p:plain

こちらから私が読み取ったのは以下です。

  • GMAT・TOEFL共に不合格者の多くは合格者のレンジにすっぽり収まっており、スコア面で合格者と並ぶレベルの不合格者が相当数存在
  • GMATは社費合格者平均で10点弱、TOEFLは私費合格者が2点程度上回っているが、いずれも合格者の中でばらつきがあり、社費/私費合格者間で決定的な差は無い

即ち、散布図、箱ひげ図からは合格圏内の中で社費・私費共に多くの受験生がひしめき合っている状態で選考が行われ、結果として合格者・不合格者共にGMAT/TOEFL共に差がついていない状況であることが示唆されています。そんな状況を頭に入れた上で社費/私費合格者の具体的な数値を見ていくと、(今更ながら)社費/私費で合格/不合格の割合が大きく異なることに気が付きます。社費は107÷258 = 41.4%、私費は34÷119 = 28.6%と社費は私費の1.5倍近くの確率で合格を勝ち取っていることが分かります。とすると、実際のところは「合格者間で社費・私費でスコアに差がないから社費/私費は関係ない」ではなく、「スコア面で同レベルのCandidateが沢山いる中で、社費からより多くの割合で合格者が出ている」というのが正しい状況認識と思われます。

【社費合格者】      【私費合格者】

f:id:shoshimin:20210305124903p:plainf:id:shoshimin:20210305124938p:plain

【社費不合格者】      【私費不合格者】

f:id:shoshimin:20210305125018p:plainf:id:shoshimin:20210305125052p:plain

性別も(恐らく)結果に影響している

性別についてもスポンサー同様、合格者のスコアの分布を見る限りは男女で顕著な差があるようには見受けられません。

f:id:shoshimin:20210305141452p:plain

f:id:shoshimin:20210305230016p:plain

f:id:shoshimin:20210305141832p:plainf:id:shoshimin:20210305141917p:plain

しかしながら、全体の合格率で見てみると男性・女性で大きな差が見られます。男性が124 ÷ 354 = 34.8%の合格率となるのに対し、女性は31÷52 = 59.6%と、1.7倍程度の合格率となっています。こちらも状況はスポンサー有無と恐らく同じで、Candidacyが同程度の受験生がひしめく中で、女性の方が学校側から選好される傾向があるものと思われます。

【男性合格者】      【女性合格者】

f:id:shoshimin:20210305142104p:plainf:id:shoshimin:20210305142127p:plain

【男性不合格者】      【女性不合格者】

f:id:shoshimin:20210305142523p:plainf:id:shoshimin:20210305142544p:plain

分析の限界について

今回の分析にはデータの都合上、以下の様な限界があります。

  • 回答者はAGOS利用者に限られるため、網羅的なデータではない。かつ、個々の受験生が未回答としている項目も見られた(未回答の場合はデータセットから削除)
  • データは自己申告の為誤りの可能性が否定できない
  • 合格者・不合格者で回答率が異なる可能性が高い。仮に全て不合格となった場合にAGOSの合格者アンケートに協力する可能性は低く、一定程度生存者バイアスがかかっている可能性が高い
  • 社費生は社費制度がある会社に限定され、かつ恐らく私費生より年齢層が高いため、社費/私費で合格者のバックグラウンドが均質とは言えない

本来的には不合格者含めてより網羅的なデータが有ると望ましいのですが、MBA各校が全ての受験生データを公開でもしない限り入手は不可能なため、現実的に完全なデータを使って分析する日が来ることは無さそうです。尚、「スポンサーや性別、スコア以上にエッセイやインタビューの出来の方が大事だ」というご指摘も受けそうですが、エッセイ/インタビューについては社費・私費共に同条件の分析になっているため、特定のバックグラウンドが有利という結論には影響しないと考えました。

最後に

今回の分析で特定のバックグラウンドの方を貶める意図は全くなく、見てきた通り合格されている方の殆どはスコア面でも素晴らしいパフォーマンスを挙げた方ばかりだと思います。一方、同じレベルのCandidateのプールがある中で、特定のバックグラウンドの方が学校側から好まれやすいとは言えるのではないかと思います。

また、私費・男性の合格者や社費や女性でも不合格の方もいる為、バックグラウンドだけで決まるものでも無く、エッセイやインタビューで挽回できる可能性も存在すると考えて良いでしょう。GMATやTOEFL足切りとして機能した後でも合格圏にいる受験生が多数存在し、その上でバックグラウンド/インタビュー/エッセイで勝負が決まる、というよく言われる話を裏付ける分析結果だったと思います。

受験生の方々におかれては、変えられない自分の状況を嘆くというよりは、自分の持っているカードを踏まえた戦略を立てて、合格を掴み取って頂くことを祈っております。

最後に、分析についての反省としては、成功/失敗両面の事象がある場合、成功側だけの分析では不完全な可能性があるという気付きがありました。また、Excelと違ってPythonの場合特定のデータセットの大きさに意識が向かなくなりがち(確率を忘れがち)なので、分析時に必ず確認する癖を付けたいと思います。あとは、合格/不合格みたいな1 or 0の事象について、個別要因の寄与度を推定するモデルが作れると良いなと思ったので、時間が出来たら勉強したいと感じました。

本日は以上です。