平均値なんて信用出来ない
統計学を勉強しようだなんて全くこれっぽっちすら思ってもいないのですが、どうにも「平均値」の出し方、そして結果に納得出来ない節がこれまでに度々あったので、それを思い出して調べてみました。
「中央値」と呼ばれる、昇順に並べたデータの中央に位置する値を指すものと、「モード」と呼ばれる、最頻値を指すもの。この2種類は知っておいたら間違いなく得するものだと思いました。上記サイト様をご覧になれば瞬時にご理解頂けると思いますが、かいつまんで、ここで非常に極端な例を提示してみます。
例)100人中99人が100円、1人が10,000円、お金を所持しています。
平均値:(100円×99人+10,000円×1人)÷100人=199円
中央値:100,100,100,100...,10,000 →100円(50番及び51番目に低い値)
モード:100円が99人、10,000円が1人 →100円(最も人数が多い値)
99%の人が100円しか持っていないにも関わらず、1%の人によって平均値が飛躍します。一方、中央値とモードに至っては、その10,000円所持者をガン無視して100円という値を弾き出します。
…極端な例だったので、色々おかしな点もありますが、まぁこの様に平均値では見られない値も弾き出せる。そういった点では「平均値なんて信用出来ない」場合もある、ということが勉強になりました。