デマや似非科学に騙されない、統計学の話【その2】
こんにちは
それでは前回に引き続いて、デマや似非科学に騙されないための話をしていきたいと思います
前回は、「統計学や科学的根拠とは何か」「科学的根拠のない話の間違ってる可能性」
について話したと思います
今回は
間違ってる可能性の高い情報とは何か
について話して行きたいなと思っています
• サンプル数が少ない
これは知ってる人も多いのではないかなと思います
例えば、サイコロを3回転がして、6、2、6という順で、目が出たとします
ここでみなさんは、このサイコロが6や2が出やすいサイコロだと思いますか?
ほとんどの人は、まだ3回しか転がしてないから、たまたまだろうと考えると思います
しかし、300回サイコロを転がして200回6が出たとしたら?
これはどう考えてもこのサイコロはおかしい、6が出すぎる
と思いますよね
変わったのはサイコロを振った回数だけで、2/3で6が出てるというのは変わらないのですよね
それでも回数が多いほど「たまたま」ではないだろうと、私たちは感覚で思うわけですし、実際その通りなんです
サンプル数が少ないと、「たまたま」なんらかの偏りが出てしまう場合が多いんですね
サンプル数が少ない情報を信じて、偏った情報が広まってしまうということがよくあります
さっきみたいに、文章で数値として書かれると、サンプル数が少ないと「たまたま」と思う人が多いのに、
実例ではサンプル数が少ない話を鵜呑みにしてしまう人も多いんです
よく、
「こんな人はこういう性格に違いない!」
と言う人がいて、それを本当だと信じたり、同調する人がいるんですね
でもそれ、サンプル数が少ないんですよね
この場合、その人が会ってきた人たちの中で、「こんな人」と思い、かつ記憶に残った人がサンプルです
人生で会った人、すれ違った人はたくさんいるかもしれないですが、記憶に残ってる範囲っていうとかなり少なくなるはずですよね
ほとんどの人は性格まで知ってて覚えてる人なんてそう多くはないでしょう
その上、「こんな人」に当てはまる人は限られますから、印象に強く残ってる十人もいかないくらいの人数を思い浮かべながら言ってる場合が多いんじゃないかって思います
つまり、そんな数十人くらいのサンプル数で、「全人類みんなこう!」みたいに全体を予想しても、それは全く信頼性がないんです
間違ってる可能性が高いということです
だからみなさん、個人の経験で考えましたみたいな話は鵜呑みにしないようにしましょう
たった1人の経験なんて、見える範囲、できる範囲はたかが知れてますからね
・ 生存バイアス
つぎは生存バイアスです
これもある意味サンプル数が少ないということにもなるのですが
生存バイアスとは
「生存した物のみを基準とすることで誤った判断を行ってしまうこと」
らしいです
簡単に言うと、
「成功した人だけの話で判断したら、間違ってることもあるよ」
ということです
なんで?と思う人もいるかも知れません
自己啓発とか、投資本とか、受験必勝法とか、そういうのって全部成功した人の話ばっかり載ってるのがほとんどだと思います
しかし、
成功した方法の中には、ものすごい数の失敗者や脱落者がいるなんて、ザラにあります
例えば体罰です
体罰をする理由は、「強くするため」という人が多いと思います
それはある意味本当に効果があって、体罰でストレスに強くなる人っていうのは本当にいます
でもそれはその人のストレス耐性が強いからなんです
その人にとって適度なストレスは人を成長させるというのは実際証明されています
体罰を良しとする人は、「体罰に生き残った人」の情報だけしか見てないんですね
そうしたら当然「体罰は人を強くする」という結論になってしまうわけです
しかし、みんながそうじゃないわけですね
体罰が大きいストレスとなる人は、もうそれだけで心身を壊す元になったり、またその前に逃げたりしてるのです
ほとんどの人が体調を崩したり辞めてしまったりしてる、という中でストレス耐性の高い数人だけ残ってるという状況だとします
体罰を受けた人全員の成長量を考えてみましょう
わずかな生き残った人は成長量はプラスになるでしょうが、
多くの脱落した人は、むしろマイナスにもなると言えるでしょう
そこで全員の成長量の平均を計算してみますと、大してプラスの数字にはならないのだろうということはわかりますよね
そんな方法よりも、
脱落者が少なくて、全員が少しずつ成長できる
つまり全員がプラスの数字である方法の方が平均が高くなるだろうことは予想できますし、効率がいいということです
ここで話を振り返ってみると、
体罰を良しとする人は、「生き残った人だけ」見て、「体罰は人を強くする」と考えているわけですが、
実際に脱落者も含めて全体で考えてみると、大して強くなってないんですね
つまり「体罰は人を強くする」というのは誤った判断であり、これぞ
「生存した物のみを基準とすることで誤った判断を行ってしまうこと」
ということで、明らかな生存バイアスです
自己啓発などの本も、成功者の話ばかり載せて、失敗者や脱落者には触れられないものがほとんどだと思います
もしそういっは本を読むときや、話を聞くときは、「その方法の中でどれだけの脱落者がいたのか」
に想いを馳せてください
そして、「成功できた人は何割なのか、全体のメリットの平均はいくつだろうか」
といったことも考えてみてください
間違っても生き残った人の話だけで判断しないようにしましょう
余談ですが、「全体のメリットの平均」は「期待値」という言い方もするので、気になる人は調べてみてください
・擬似相関
続いて擬似相関です
これもかなりありふれてる話ですが、研究職に就いてる人でも判断が難しいこともあります
ただ、擬似相関といったものがあると知っているだけでも、「もしかしたらこれは擬似相関かも」と疑うことができるので、結構役に立つと思います
ではその擬似相関とは何なのか
「2つの事象に因果関係がないのに、見えない要因によって因果関係があるかのように推測されること」
だそうです
簡単に言うと
「直接関係ないのに、関係があるように見えること」
といった感じです
とは言ってもピンとこない方もいるかもしれません
ここで具体例を見ていきましょう
前によく「東大生にはピアノを習ってた人が多いから、ピアノを習うと頭が良くなる!」
と言った説が流行ったことがありました
しかしこれは擬似相関なんです
どういうことかというと、学力とピアノに直接関係はないんですね
実は東大生というのは、かなり金持ちな集団なんです
なんと、親の世代年収が950万円以上の人が約5割もいるんです
日本全体で世帯年収1000万円以上の人は約1割なので、金額が若干違うとはいえ、東大生に金持ちが多いのは明白でしょう
そして、金持ちだと何をするかというと、子どもにお金をかけるんですね
その結果、ピアノを習ってる人が多いというだけの話なのです
これはピアノだけでなく水泳なども言われることもありますが、2つとも東大生関係なく、習い事ランキング上位にランクインしてるほどの人気のよくある習い事というだけの話なんですね
つまり、ピアノの習ってたことと学力には何の相関もなく、
東大生→金持ち→お金があるから習い事をする
ただこれだけの関係だったわけです
ここでは見えない要因は「世帯年収」で、実際は
東大生と世帯年収
世帯年収と習い事
にそれぞれ相関があったということですね
このように
「直接関係ないことが関係あるように見える」ものを
擬似相関と言うわけです
そして、東大生というのはかなりのことのダシとして使われます
「東大生には○○が多い!」みたいな話は今回の例に関わらず巷に溢れています
しかし擬似相関なことも多いです
「東大生には金持ちが多い」という知識を持ってよく考えてみてください
金持ち以外にも地域差だとか色んな見えない要因があります
「高年収者は○○が多い!」みたいな話も擬似相関が多いです
この場合は「高年収者はお年寄りが多い」という知識があると便利です
この場合に関わらず、相関がありそうだと思ってしまう話には「見えない要因はないか」ということを考えてみてください
擬似相関に気づいて、情報に踊らされることを避けられるかもしれません
今回は思ったほか長くなってしまいましたが、一旦ここで終わりにしたいと思います!
「サンプル数が少ない話」
「生存バイアス」
「擬似相関」
を話していきました!
これらをまとめると、
「サンプルの数や偏りを考える」
「脱落者にも想いを馳せて、平均を計算してみる」
「見えない要因を疑ってみる」
ということを実行していくと、情報を見極める力がグンと上がっていくと思います
ここまで読んでくださってありがとうございました!
こんなのわかってたよという方は改善点などあればコメントお待ちしております!
もちろん感想も待ってます!