PAGE TOP

世論調査はサンプル集団が歪みすぎてて真実を反映できない


世論調査なんてアテにならない!という声を最近ネットでよく聞くようになりました。ネットは政権支持者が多いので支持率が高いときは特にそういうこと言わないのに、低くなるとこういうこと言い出すのは何とも…って感じですが。世論調査はアテにならないは結構前から思ってたことなので考察したいと思います。

2018年4月のNNN世論調査で以下数字が出たようです。
対象者数:有権者1952人
回答数:772人(非回答:1180人)
内閣を支持しない:53.4%
内閣を支持する:26.7%
わからない:20.0%

まず、よく聞かれる国民の総意を表すのに1000人に満たないサンプルでは少なすぎる、という論点。この例ですと772人ですが、うーんこれは少なすぎないと思います。是非検定してそれが正しい確率を確かめてくださいってことで。僕が今回指摘したいのは、サンプル集団の歪み、です。

結論を言うと、上の調査では1180人が回答しない、と回答したわけですから、僕はこう表現すべきだと思います。

こっちのグラフのほうがまだマシだ、と思えるように「歪み」の事例からご紹介。

大手リサーチ会社、楽天リサーチのサンプル集団が持つ歪み

さてネット広告会社勤めの僕は、結構アンケート集計をすることが多いのです。そこでよく利用されるのが安くて母数も大きい楽天リサーチという会社。公式サイト発表によると230万人がリサーチに登録していて、その会員にメールを送り回答フォームに入力してもらってアンケートを取る、アンケート回答者は楽天ポイントがもらえるみたいな仕組みです。

ある時、日本でインターネットを使っている人はどれくらいか、というアンケートを取ろうとする会社がありました。そこで楽天リサーチを使用したのですが、なんと!ネット利用すると答えた割合は100%だったのです。日本は国民総ネット社会を達成していました。

???なんかおかしいですよね。そう楽天リサーチ自体がネットで答えるものなので回答者はネットを使っていて当たり前、というかネット使えない人は答えられない、だから100%に絶対なるんです。(ってことに気づくんで実際調査はしてません。)

230万人という巨大な母数を持っていても、 それが全員 「ネットユーザー」であり、もっというと「チマチマアンケート答えて楽天ポイントを稼ぎたい人」なんです。これがサンプルの歪みです。ポイントサイト利用率とか、楽天カード利用率とか、ガツンと跳ね上がりそうな歪みですよね。

世論調査のサンプルは歪みまくっている

話を世論調査に戻しましょう。世論調査はランダムの電話番号に発信するので、電話を契約できないような貧困層は絶対に調査対象になりません。また、知らない番号からかかってくる電話を取らない人、日中は常にアクティブで電話に出られない人、なんかも調査対象になりえないんですね。

これだけでそこそこの歪みです。ただコレくらいなら仕方ない歪みだと思います。ここまでの歪みで作成したのが最初に僕が提示した、回答なしが圧倒的比率を占めるグラフです。

ガチで問題なのが、1952人に繋がったのに回答しなかった1180人は切り捨てたということ。

つまり「えー忙しいしやめときます」とか「めんどくさ…」って断る人をサンプルから切り捨ててるわけです。つまりサンプルの母集団は「何?世論調査?よーし答えてやろう、まずは何だ?早く質問しなさい」みたいな人だけなんです。

いよいよヤバくなってきました。年老いて暇を持て余し、今の政権はけしからん!と息巻いているおじいさんしか回答者の人物像が浮かばなくなってきました。

いやそんなはずは…ね、年齢比率を見れば…こ、公開されていない!年齢比率が…まじで、おじさんとおじいさんしか回答してないんじゃないか説が濃厚となりました。

朝日新聞の調査で政権支持率が低いのも「え、朝日新聞…時間使いたくねえ」って人を切り捨てて「おうおう、朝日か、ワシは毎朝読んどるよ、どれ、質問してみなさい」みたいな人ばかりだからでは…

世論調査のように匿名でわざわざ報酬もないのに時間をかけて答える、ということはわざわざ答えたい理由があると考えるのが普通です。その理由としては批判したいからでしょう。わざわざカスタマーセンターにこの商品が良かった!と電話する人はいないですけどクレームを入れる人はいっぱいいます。

良いと思ってる人はアクションを起こさず、悪いと思ってる人がアクションを起こしがちなのは想像に難くないかと思います。そして世論調査の集計システムはアクションを起こしがちな人だけがサンプル対象となっているのです。

ブログ一覧へ