データに騙されないために

コンピュータサイエンス誌 bit, Vol.31, No.2, p.1 (1999) に掲載


最近の表計算ソフトの機能は目を見張るものがある.データさえ打ち込んでおけば,折れ線グラフ,棒グラフ,円グラフ,さらにそれらの立体効果まで,おてのものである.また,ちょっとした統計計算までついていて,回帰分析や統計検定も気軽に試すことができる.私が大学生の頃は,関数電卓(当時は5万円くらいだった)を片手にグラフ用紙と格闘したものであるが,それでも,若い頃は計算尺を使っていたという先生からは,結構うらやましがられたのを記憶している.まさに隔世の感がある.

今では,手近なパソコンでデータの集計やグラフ化が可能なためか,テレビや新聞で,データを示しながらの解説が増えているように思う.それは一面,事実にもとづく報道として歓迎すべきことではあるのだが,多くは基本的なところで,誤りを犯している.そうした解説をむやみに信じ込まないよう,注意が必要なのだ.いくつか例をあげてみよう.

「長寿の食卓調べ」というのがあって,90歳以上の長生きの方々の食事は,食物繊維や乳製品を多く摂取しているというデータが報告された.そして,そのデータをもとに,食物繊維や乳製品が長寿の秘訣だと解説された.しかし,本当にそう結論していいのだろうか.単に,大正生まれの人々の世代としての好みではないのか.あるいは,年をとるとそうした食物が好きになるに過ぎないのではないか.正しく調べるには,長生きしていない人々の食事と比較しなければならない.ところが,そうした人々はすでに亡くなられているので,現在の食事は比較が不可能である.ならばどうするか.長生きの方々の昔の食事と,生きていれば同年齢であるが,亡くなられた人々の同じ頃の食事とを比較するのだ.

一般に,あるグループのメンバーについて統計的データが得られたならば,それを,そのグループに属さないメンバーの統計的データと比較して,データの特徴を議論すべきなのである.

さらに,もうひとつ注意すべき点がある.あるデータについて何らかの特徴がみられたとしても,そこからすぐに,原因・結果の関係を想定してはならない.

以前,テレビ番組で「熱帯魚の効果」というのがあった.家に熱帯魚を飼っている若者と,飼っていない若者とを比べて,心理テストを行い,熱帯魚を飼っている若者のほうが心理的に安定しているという特徴を得ていた.ここまではいいのだが,その番組では,「だから,心の安定のために,皆さん熱帯魚を飼いましょう」といった解説であった.これは必ずしも正しくない.熱帯魚が心の安定の原因になっているとは限らないのだ.心理的に安定傾向にある若者が,好んで熱帯魚を飼っている可能性も有力なのである.原因・結果の関係をつきとめるには,あらかじめ心理テストを行った多くの若者に対し,それぞれ熱帯魚を飼わせ,十分な期間が経過したのち,再テストを行う必要がある.

最後に,練習問題をあげておこう.ある食品の新聞広告である.「キシリトールはフィンランドで生まれました.5歳児でむし歯になったことのない子供はフィンランドでは70%もいます.日本では23%です...むし歯の原因にならないキシリトール」(問題点に気づかれただろうか.解答は最後のページ).


解答:フィンランドはむし歯予防に積極的な国であろうと推測でき,キシリトールの使用以外にもさまざまな対策を行っていると考えられる.それらすべての結果がむし歯の少なさに現れているのであり,キシリトールの使用だけを取り上げて,むし歯の少なさとの原因・結果の関係を主張するのは問題である.


ホームへ戻る
明治大学文学部 石川幹人