2022年コロンビア選挙、統計によると誰が勝つのか?
もう1週間ほどで、コロンビア共和国の新しい大統領が選ばれます。メディアでは人気の話題になっていて、多くのニュースサイトが大統領候補に関する世論調査を行っています。このデータからはどんな勝者が出る可能性があるのでしょうか。
世論調査のデータは役立つのか?
答えは「はい」です。公開された世論調査のデータをもとに、候補者が選挙の第2ラウンドで勝利する確率を出す統計モデルを作ることができます。しかし、いくつかの注意点があります。
世論調査のばらつき
予測モデルを作るとき、収集したデータのばらつきを考慮する必要があります。これはいくつかの理由で起きる可能性があります:
- 人々が世論調査で嘘をつく。
- 人々の意見は時間と共に変わる。
- 投票する人口と世論調査を行った人口が異なる。
- 調査機関のバイアス。
これらの問題があるにもかかわらず、勝者を予測する効果的なモデルを構築することは可能です。
世論調査の問題があるにもかかわらず、このモデルはどのように作られたのか?
世論調査のデータに見られるこれらの欠点は、私たちのモデルでは「ばらつき」として解釈され、これがちょうどいいのです。私たちは得票数や得票率を正確に予測するのではなく、誰が勝つかを予測したいわけですから。過去の選挙データも参考にして使えて、世論調査のデータと選挙結果の予想される行動、及び選挙で勝者が得た得票率の差を教えてくれます。
こちらで現在の予測を見られます: https://artofcode.tech/2022-colombian-election-forecast/
このモデルをどう解釈すればいいの?
現時点では、結果は五分五分です。一人の候補者が勝つ確率が高いですが、勝利は確実ではありません。統計学では、ある出来事が95%の確率で起こると見られる場合に、よく確信が持てるとされますが、ここではそうではありません。このような状況は、2016年のアメリカ選挙など他の選挙でも見られました。このモデルに似ているものが、ヒラリー・クリントンが71%の確率で勝つと予測しましたが、彼女は選挙に落ちました。高い勝利確率を持ってはいましたが、90%以上の勝利確率を見ない限り、明確な勝利を確信するのは難しいです。
結論
統計学とデータサイエンスは世論調査のデータをもとに結果を予測するのに非常に役立ちますが、多くのポピュラーなニュースサイトがこれらの数字の解釈に問題を持つようで、世論調査が役に立たない情報を提供するか、操作されていると一般の人々の間でよくある感情になっているようです。ここでは、より現実的な世論調査結果の意味を評価することを希望し、当サイトの現在の予測を確認していただき、可能な限り頻繁に更新します。
参照:
予測: https://artofcode.tech/2022-colombian-election-forecast/
Github: https://github.com/christianpaez/colombian-election-analysis-2022
こちらの記事はdev.toの良い記事を日本人向けに翻訳しています。
https://dev.to/christianpaez/who-will-win-the-2022-colombian-election-according-to-statistics-470d