最近思うこと<タイトル。
クリスマスを祝う事には、少なくとも宗教的には意味あるけど、
新年って、たまたま暦のループが1周しただけの日じゃん。
それに加えて、さらに最近思うこと。
まず、「遠くの身内より近くの他人」ってのは理屈として正しいだろう。
では、「遠くの身内より近くの身内」ってのも理屈として正しいだろうか。
そもそも「易きに流れる」のもどうなんだろうなぁ、と。
遠くの身内を選んだ方が良い場合もあるかも知れん(まぁ状況によるが
でもやっぱ、人間って楽な方が本能的に好きだよね?
…
なんて意味のない事を色々考えてしまう程切羽詰った今日この頃。
平日に日記の更新なんかしてる(時間的?精神的?)暇ないよ、って感じで。
「ああ忙しい、忙しい」と自分で言ってるような、
「忙しい自分に惚れてる」系の人間&行為は嫌いだけど、
それでもあえて言ってしまう。「ああ忙しい、忙しい」。
(でもその忙しさは、今までのツケなんだけどなー)
…
今くらいのペースでずーっと研究続けてたら、それなりの論文が書けたかもしれん。
(後の祭り)
そんなわけで最近研究が「いっぱいいっぱい」な状況に来てる今日この頃、
統計に関する話題を良く見ます。
(ちょっと無理矢理な話の持っていき方だけどキニスルナ)
今日も助手の方に色々アドバイスをもらったんですが、そん時にも
「ダイス係数」やら「相互情報量」「χ(カイ)2乗検定」「Information gain」
やら、名前しか記憶に残ってないor聞いた事すらないような用語が出てきたり。
「統計は難しい&知らないなぁ」とか思ったり、
そういう情報がポンポン紹介できるその人も凄いなぁ、とか思ったり。
という話とは直接の関係はないんだけど、例えば
かかる確率が1%である病気があります。
また、この病気にかかっているかを判断する検査薬がありますが、
この薬の誤診率は5%です。
この薬で「陽性」と判断された人が、本当に病気である確率はいくら?
なお誤診率5%とは、病気にかかってない人でも、5%で陽性と判断
してしまったり、病気にかかってる人でも、5%で陰性と判断してしまう、
という意味です
これって単純に考えても、
病気にかかっていて、かつ陽性と判断される割合
⇒0.01 x 0.95 = 0.0095
病気にかかっていて、かつ陰性と判断される割合
⇒0.01 x 0.05 = 0.0005
病気にかかってなくて、かつ陽性と判断される割合
⇒0.99 x 0.05 = 0.0495
病気にかかってなくて、かつ陰性と判断される割合
⇒0.99 x 0.95 = 0.9405
だから、
陽性と判断される割合の和
⇒0.0095 + 0.0495 = 0.059
なので、陽性と判断された人が本当に病気である確率は
⇒0.0095 ÷ 0.059 = 0.161
となって、たかが16%ちょい、って話になってしまう。
人間の感覚と数学的な確率って、案外違うんすねぇ、という話。
数学らしく式を書くと。
病気にかかっている事象をx、陽性と判断されるのをyとすると、
今問われてるのは、yである時にxとなる条件付確率。
P(x|y)=P(x)*P(y|x)/P(y)
で、
P(x) = 0.01
P(y|x) = 0.95
P(y) = 0.059
だから、結局同じく16%ちょい。