統計学の胡散臭さについて

統計学(確率を含む)を相対化できる人たち

私は、統計学について全てを網羅しているわけではないので、「統計学は胡散臭い!」と自信をもって断言することはできない。

しかし、私の周囲には、「統計学は胡散臭い!」と断言して憚らない統計の専門家がいるので、私もその胡散臭さを感じ取れるぐらいに、統計学に早く習熟したいと考えている。

京極堂による確率批判

先日、京極夏彦の『魍魎の匣』を読み返していて、気になる箇所を見つけた。

「確率と云うのはね、要するに詭弁だ。中たらない未来予知を如何にも中たっているように見せかける数字の仕掛け(トリック)だよ。例えば明日雨が降る確率が五割だとしよう。こりゃあ、降っても、晴れても適中していることになるじゃないか」

 京極堂に突き放すように云われて、私ははっとした。今まで考えてみたこともなかったのだが、全くその通りである。気象台が雨が降る確率を七割と発表したとして、若し晴れたとしても三割は中たっている。その代わり本当に降っても三割は外れている訳だ。どんな場合も、十割でない限り、それは精精目安にしかならないのだ。

from 『魍魎の匣』 p-343

確かに、京極堂が言うように、確率的な表現は、詭弁のようにも思える。「中たらない未来予知を如何にも中たっているように見せかける数字の仕掛け(=トリック)」にも思える。

しかし私は、京極堂による上記のような意見に、次のように反論したいと思う。

京極堂に対する反論

京極堂は、確率を、いつでも、どんなときでも、未来予知を正しく行える「胡散臭いもの」、つまり、決して予測をはずすことのないトリックめいたものとして捉え、このことを問題にしている。確かに、明日晴れる確率が五割という場合、降っても晴れても、未来は正しく予知されたことになりそうである。このことをもって、確率はトリックだと述べることは、理に適った行為であるように思える。

しかし京極堂は、確率の考え方を誤解している。

そもそも確率は、未来に起きる出来事をズバリと言い当てるものではない。確率は、何らかの出来事の起こりやすさを、数値で表現するだけである。従って、「いつでも適中する」というような胡散臭い宣伝文句は、最も似合わない。もちろん、晴れか雨かが、10割の確率で、デジタルに判断されることもある。しかし、このように、未来に何が起きるかどうかについて、デジタルに、白か黒かが明確に決定されることは稀である。このようなケースもありうるが、これだけが確率の醍醐味ではない。

人間に予測できるほど、自然は単純ではない。複雑な自然現象の有様を、どうにかして予測したいが、白か黒かをデジタルに判断するのは難しい。このようなときに、確率の考え方は役に立つ。 

確率の醍醐味は、白か黒かをデジタルに完璧に判断することにあるのではなく、白と黒の間のグレーの領域を設定したうえで、白の度合い、あるいは、黒の度合いをなんとかして数値で表現しようとするところにあると私は考えている。その意味では本来、確率は、未来予知をする際の「精精目安にしかならない」ものである。

しかし京極堂は、「決して予測を外すことのない、絶対的な正しさを提供するもの」として、確率を理解しているようである。繰り返すが、もともと確率は、絶対的な正しさを提供するものではない。確率は目安にしかならない。にもかかわらず、京極堂は、確率を「決して外れないもの」「絶対的な正しさを提供するもの」と自ら仮定し、そしてそのうえで、確率が絶対的な正しさを提供するものではないことを、後から指摘しているように思える*1

統計学(確率を含む)を妄信することへの危惧

以上、確率をトリックとみなす京極堂に反論を行ってきた。

しかし、上記のような私の批判は、的はずれである可能性が高い。頭の良い京極堂のことだから、確率が未来に何が起きるのかについて、絶対的に正しい予測を提供するなどとは、最初から考えていないのではないだろうか。

絶対的な正しさを提供するわけではない確率が、一般市民にとっては、絶対的な正しさを提供するもの、目安以上のものとして、盲信・誤解されていることを憂いているからこそ、わざわざあえて京極堂は、確率を批判してみせているような気がしてならない。

疑問

「雨が降る確率が5割」という言い方と、「未来予知が適中する」という言い方と、「未来予知が5割はあたる」という言い方の違いが、よく分からなくなってきた。これらは、それぞれ、別の出来事を指し示しているのだろうか。それとも全て同じ意味なのだろうか。只今混乱中。

参考資料

コスト/ロス モデル

降水確率が発表されるようになった背景には、コスト/ロス モデルの考え方がある。これは、予報が完全に的中しない場合に、確率の予報を出すことによって、長い目で見れば損失を最小限にできるというモデルである。

例えば、傘を持っていく労力を300円、傘を持たずに濡れることによる損失を1000円とする。(この労力や損失は人によって変わる。損失は、例えば背広のクリーニング代だったりする。)

この例では、降水確率が30%以上の場合、傘を持っていった方が良いことになる。降水確率40%の場合を考えよう。10回のうち4回は雨が降ると考えられるから、

傘を持っていくと、労力は300円×10=3000円。損失は0円。 合計は3000円。
傘を持っていかないと、労力は0円。損失は1000円×4=4000円。合計は4000円。
従って、傘を持っていけば、持っていかない場合に比べて1000円得である。

一方、確率予報を行わない場合、すべて晴れまたは曇りと予報され、傘は持っていかないとすれば、

労力は0円。損失は1000円×4=4000円。合計は4000円。
という選択肢しかなくなる。

ごく単純な例を挙げたが、実際には0%から100%までの降水確率について上記のような考え方を適用することにより、労力と損失の合計を最小限にすることができる。
from wikipedia 降水確率を重森が若干修正

「A地方の明日の降水確率は80%(=0.8)」という言い回しについて、これが意味するところ

 予報官は、"気圧の分布や雨雲の配置、さらに今日の天気といった気象的な条件が、現在と一致するような状況が100回起これば、そのうち80回は、翌日に雨が降る"と判断している。

from 『理解しやすい数学Ⅰ』 p-143

*1:京極堂は、「予測が適中する/予測が外れる」の二項対立に基づいて思考し、「確率が常に予測を的中させるものであること」を問題にしている。そしてこのような確率の性質を、「いつでも未来を正しく予測できたことになる」という意味で「トリックだ」と述べる。一方、私の理解では、確率はそもそも、「予測が適中する/予測が外れる」の二項対立には馴染まないものである。天気予報を例にするならば、確率の考え方は、「晴れる」という現象と「雨が降る」という現象が両端にあるような直線を想定し、この直線上に点を打つことによって、明日の天気を予測する。「晴れる」という現象が起きる確率が5割ならば、点は、直線のちょうど真ん中に打たれることになる。これは「いつでも予測が外れない」ということを意味しない。ただただ「晴れる」という出来事の起こりやすさを、5割という表現で示しているだけである。逆に言うならば、「雨が降る」という出来事の起こりやすさを、5割という表現で示しているだけである。確率は、「中たらない未来予知を如何にも中たっているように見せかけ」てなどいない。確率が、「中たらない未来予知を如何にも中たっているように見せかけ」ているのではなく、京極堂や関口が、「中たらない未来予知を如何にも中たっているように」見てしまっているのである。「予測が適中する/予測が外れる」という、デジタルに白黒付けたがるような枠組みのもとで、確率は理解されるべきではない。確率は、「晴れる」度合い、「晴れる」可能性、「晴れる」傾向を、数字で示しているだけである。確率は、明日の天気について目安しか提供しない。なんらかの出来事が生起する可能性の程度を、数値で表現しているだけである。したがって、当然のように、たとえ「晴れる」確率が5割だとしても、あるいは9割だとしても、「雨が降る」こともありうる。