slowly life 〜読書、美術館巡り、ワイン、コーヒー〜

気ままに日頃考えていることを文章にまとめるブログ。

認知バイアス事典 統計学  平均による誤謬 アンスコムの数値例 棒グラフの誤用 折れ線グラフの誤用 3Dグラフの誤用 絵グラフの誤用 標本の偏り 自己選択のバイアス 健康労働者効果 バークソン・バイアス 集団比較の誤謬 シンプソン・パラドックス 時系列比較の誤謬 回帰の誤謬 少数の法則 有意差の誤謬 検定の多重性 モンティ・ホール問題 基準率の無視 検察官の誤謬



統計学のバイアス

前半はグラフによる説明が多いけど、スクショを載せるのも良くないので、用語と説明のみになっている。

より専門的で、普段の生活の中で表などを見たりすることがない人にとっては馴染みにくい内容だと思った。

最後の方のものは、あまり理解できない。。。


平均による誤謬

実際の分布は無視して、常に平均値の周辺にデータが多く分布していると思い込んでしまうこと。


給与所得の平均値が際たる例。

平均値550万だとしても、中央値は450万、全体の数として多いのは300-400万の人だったりするグラフがある。



アンスコムの数値例

分布が異なっている複数のデータにおいて平均などの統計量が一致する現象を紹介した例。


数字だけでは読み取れないのでグラフ化して可視化することで見える。

ただ、第三者によって歪められたグラフもあるので注意が必要。



棒グラフの誤用

誤った棒グラフを作成することで、グラフを見たものの判断に影響を与えること。


目盛りの省略などで簡単に誤解を与えられる。


折れ線グラフの誤用

他者に誤解を与える様な折れ線グラフを作成してしまうこと。


3Dグラフの誤用

必要性のない立体的に見せるデザインを加えてグラフを描くこと。


3Dには手前にあるグラフが大きく、奥に位置するほど小さく見える様な視覚的効果がある。

3Dグラフに出会ったときはより注意深くなろう。



絵グラフの誤用

絵グラフを作成するとき、数値とイラストの大きさが対応しないグラフを作成すること。



標本の偏り

調査の対象となる集団から無作為に対象者を選ばないことで調査結果に偏りが生じること。


SNSの回答は偏りがあるのであまり信頼できない。



自己選択バイアス

調査の対象者に協力するか否かの判断を任せた際に生じるバイアス。


世論調査の回答者は、政治に関して興味を持つ人が多い。

興味のない人はそもそも電話に出ない。



健康労働者効果

特定の職種に関連する疾病のリスクを調査するとき、勤務する労働者が一般人よりもリスクが低くなる現象。


その会社に所属しているという時点で(採用の段階で)他の人よりも精神も身体も健康な人が集まっている可能性がある。



バークソン・バイアス

ある2つの変量間の関係を調べる時、実際とは異なる傾向が出てしまう現象。


疫学調査で生じやすいバイアス

喫煙とコロナ感染についても

感染しやすい者が医療従事者だったり、入院している患者だったりして、そもそも喫煙している人が少ない母数で関係を調べることになる。



11 集団間比較の誤謬

性質の異なる集団を、調整することなく同じ基準で比較してしまうこと。


政党A1000万票から1100万票に増えた(10%増加)

政党B100万票から200万票に増えた(2倍増加)

どちらも同じ100万票の増加だが、増加率で見たら政党Bが多くかんじる。

政党Bが大躍進したかの様に見える。



12 シンプソン・パラドックス

ある集団全体の傾向と、その集団をいくつかのグループに分割した時の傾向が異なる現象。


カリフォルニアバークレー校の例

比較的合格率の高い学科Aと学科Bは男性が多く受験しており、合格率の低い学科は女性が多く受験している。


全体と個別の両方を比較することが重要



13 時系列比較の誤謬

異なる時点での比較において、計測されなかった数の存在や調査対象の変化によって正しく比較ができなくなること。


いじめが毎年増えているという統計

いじめの定義が毎年変わること

メディアの注目度

スマホやSNSの普及

などの要因も関わっている。



14 回帰の誤謬

平均への回帰による自然な変動に対して、何らかの要因を結びつけてしまうこと。


平均への回帰 

ある試行において偶然に極端な結果が得られたとき、それ以降の結果では偶然が起こらず平均的な結果が多く得られるようになる現象。


結果に対して直感的に何らかの要因を関連づけようとすると、誤った考えが正しいものだと感じてしまう。


ビギナーズラックは信用しない!!



15 少数の法則

少ないサンプルや試行回数から得られた結果を正しい結果であると考えてしまうこと。


1人の意見やり方を聞いてこれだ!って思って真似することの危険性…



16 有意差の誤謬

統計的仮説検定における有意差について誤った解釈をしてしまうこと。


有意差がないからと言って効果がないのではなく、

効果があるとは言えないという。

効果がないと断定はできない。



17 検定の多重性

複数回の検定を繰り返し行うことで、誤って有意差があると判断する確率が高まってしまうこと。


例を読んでも実感が湧かなかった💦



18 モンティ・ホール問題

確率論における有名な問題の一つ。

直感的に正しいと思う解答が誤った解答になってしまう代表的な例。


モンティ・ホール問題とは、「当てずっぽうで選んだドアが当たりである確率」と「当てずっぽうで選んだ扉が外れである確率」を比べよ、という問題なのである。


これは考えるほどよくわからなくなる問題だけど

自分の直感をあまり信じすぎないようにしようと思う。



19 基準率の無視

前提となる確率的な情報を無視して、わかりやすい情報などに基づいて直感的に判断すること。



20 検察官の誤謬

統計的な推測によって法的な証拠能力を示すとき、誤った確率的な解釈をすること。


過去のDNAの精度の甘さのせいで冤罪となることもあった。(1990年の足利市の事件が例として挙げられている)