ちょっと呟いてみる

日々の戯言、写真、旅行記、好きな音楽、格言、Minecraftプレイ記録

味噌汁バイアス

タグに「医療」を付けたが、医療の話はほぼ出てきません。それでも、今の生業の一つが一応"医療統計"なんでね。

まず志の輔さんの落語を聞けぇ!


www.youtube.com
まず聞け。全部聞け。面白いから。
で、だ。本題も面白いが、まぁ、それはそれとして。枕の話である。
志の輔さんが言う。「選挙でねぇ、開票率5%で当選確実って、おかしいでしょう!?」
数学者の秋山仁先生が言う。「あんたねぇ、鍋一杯に味噌汁作って、味見する時、どんぶり一杯飲みますか?」
「小皿に少しですね」
「それが5%ですよ」
…ガキの頃、小学館の「学研」読んでたんでね、この先生のコラムがあって「なんだこの変人」とか思ってたんですがね、正直。いっぱしの大人になって、この話を聞いた時、「ああ、やっぱり数学者ってすげえな」と思ったんですよ。

小皿に少し

えー、このエントリに飽き足らない方は、Newtonライト『統計のきほん』を読みましょう。

それはともかくとして、味噌汁の話である。
味噌汁を作る時、味噌の量がちょうどいいかどうか、一番確実に判断する方法は、全部飲み干してしまえばいいのである。「あ、ちょっと味噌の量が足りなかったかな」「あ、味噌を入れすぎたかな」…おいちょっと待て。夕飯に味噌汁は無いのか。お前全部飲んだのか。
全部飲む、というのは、例えば丁度均等に味噌が行き渡って、「飲み口から全部飲み終えるまで、ちょうどいい量だった」というだけでなく、入れた味噌が鍋のヘリに固まってた時に、「あー、ちょっと薄いかな…あれ? ここに来たら濃くなった? ダマになってたんだ。でも全体的にはちょうどいいよね」ということが分かる、という利点がある。しかし夕飯に味噌汁は出ないのである! なぜなら貴方が全部飲んだから!!
この味噌汁全飲みを全数検査という。文字通り全てを片っ端から調べる手法である。東北の農産物で放射線測定を行っているのがこれである。幸い、放射線量を測定するのに誰かがそれを食べる必要が無いので(笑)可能なことであるが、それにしても"全部調べる"というのが、どれだけの労力とリソースを要するのか、それを承知で、消費者の安心のために"片っ端から検査"を続けていることに、クソデマ屋がどれだけクソなことをしていることか!
…まぁ、それは別件である。味噌汁の話に戻す。
という訳で、まさか味噌がダマになっているかどうか調べるために、鍋一杯の味噌汁を全部飲み干していたのでは、飲んだ主は高血圧になるし、夕餉に味噌汁が出て来ないのである。なので、"ダマにならないように味噌を入れた後、しっかり混ぜる必要がある"。

鍋全部と小皿の1杯

鍋の味噌汁全部飲むわけにはいかないから、"鍋の汁全体に均等に味噌が行き渡っている"と"仮定"して、その少し、鍋一杯の全量の、小皿少しだけとって味見して、鍋の味噌汁の味噌の濃度を考える。そうはうまくいかず、子供が駄々捏ねてかまってたからあんまり混ざってないかもしれないけど、小皿一杯どころかスプーン一杯しか飲めないときも有るけど、ちょうどいい塩梅の味噌汁作りたいんだけど、どう? っていうのを科学的に煮詰めるのを"統計学"という。
逆に言えばだ。赤ちゃんが泣いてあやしているうちに、作ってた味噌汁が湯だってしまった。火を切って味見するとちょうど良い感じ。これ幸いにそのまま夕飯に出したら「薄くない?」。見てみると鍋の底に味噌のダマが。慌てて味見したんで、ちゃんと混ざってなかったようだ。ダマに近いところを掬って味見したんで、ちょうどいいと思ってしまったらしい。
統計学では、鍋全体の味噌汁が"母集団"、鍋全体の全体的な味噌汁の濃度を"母平均"という。実際にはどんなに混ぜったってどこかは少し濃くて、どこかは少し薄い。その薄い、濃いのバラつき具合を"母分散"と呼ぶ。正確を期すならここから先に標準偏差とかいう概念が入ってくるが、それはおいておいて。
"母平均"や"母分散"を正確に調べる方法は"味噌汁全飲み"なのだが、そんなことやったら夕餉に味噌汁は出ないのである。それじゃ困るので、鍋一杯の味噌汁が"大体均等だろう"という仮定で、その鍋一杯の味噌汁の"小皿一杯"(母集団の中の一部を採取したので"標本")をとって味見して("標本"の味噌汁の大体の濃さを"標本平均"、味見の飲み口から飲み終わりの味のバラつき具合が"標本偏差")、今の味見から鍋の味噌の具合を推し量る(標本から母集団を推定する)のが、"統計"という所業なのである。

お前の味見は俺の味噌汁と同じ味か?

ぶっちゃけこういうことである。ちゃんと混ざってないで味見して「これでちょうどいい」と思って出した食卓は阿鼻叫喚となるのである。味噌が鍋のそこでダマってますよ! しかし、だ。もう大きな味噌の塊が鍋の底に引っ付いているのと、具の白菜の際にちょっと引っ付いているのでは、味にかなり違いがあるのである。
鍋全体のうち、味噌がどれだけダマになっているかの指標を"バイアス"と呼ぶ。日本語では「偏り」ともいう。アレだ、ある一軒の「○○うどん」の入口に立って「あなたはどのうどんが好きですか?」インタビュー→「今の若者の○割は××うどんが好きだということです!」…んなわけあるかい。ある一軒のうどん屋の街頭アンケートで"今の若者"を代表されてたまるか。母集団と標本が一致していない典型例である。
…が、今のマスゴミはこんなのばっかり。だから"ゴミ"なんだ。
"ちゃんと混ぜてない"。これがバイアスである。メシマズ嫁をお持ちの方は、よーくわかるだろう。ちゃんと混ぜてないことが、どれほど恐ろしいことか! それが"バイアス"である。

p値の呪い

秋山仁さんの話は、反例なのである。ちゃんと混ざってる、という前提において*1全体の5%でも、味噌汁の皿1杯の如く、予測できるである。では、"ちゃんと混ざってなかったら?"世の中にはそういうことがあるもので、「偶々最初の何百票か開けたらA氏投票で、それが続いたのでA氏当然確実、といっていたのが、その後B氏の投票が多くなって最終的にB氏当選」はありえるのである。予想したことが偶々そうなったという確率を叩き出したのが、いわゆるp値で、あれは"偶々そうなっただけ"というのがどのくらいか、という値なのである。よくマスゴミが「99.9%以上の確率で…」とかいうが、実際は逆で、「こういう結果になったが、それが偶然なのがpぐらいだろう」という話である。100-p%で正しい、ではないのである。あれだ。「10年間一緒に過ごしてきたが、嫁の味噌汁を飲んで翌日腹を壊さなかった日は無かった。しかし昨日の味噌汁は奇跡的に美味かった。今日は下痢していない。今日の夕餉で腹を壊さない確率は10(年)×30*2/365だ」…2chにスレが立つレベルである。

ありえないことはありえないのはどのくらいありえないのか

統計屋というのは、そういうことを生業ににしている。あんたの飲んだ味噌汁の味は、どうかね?

*1:ムサシがー、という人がいるが、あれただの票計測器ですから。疑うんなら票の運搬者を追跡しなさい

*2:1ヶ月の日数. 2月や31日の月は無視

当blogの記事全文の転載は固くお断り致します。原著作者(Terra Khan)の氏名を表示した引用、トラックバックは構いません。
「Terra Khan's Photo Gallery」の写真はクリエイティブ・コモンズ・ライセンスの指定に準じ、原著作者(Terra Khan)の氏名を表示し、非営利の場合に限り自由に使用できます。ただし、改変したもの(二次著作物)を公開する時、同じライセンスにする必要があります。各写真の署名の記載の通りです。