Quantcast
Channel: 薬剤師のためのEBMお悩み相談所-基礎から実践まで
Viewing all articles
Browse latest Browse all 345

尤度とは何か?

$
0
0

こんにちは、黒田です。

 


ここしばらく続けているデータ欠損の補完方法に関して、まだ説明していない「完全情報最尤推定法」に触れていきたいと思います。

 


ですが、その前に「尤度」とはそもそも何かについて述べておきたいと思います。というのも、上記の「完全情報最尤推定法」とは、端的にいえば尤度を最大化する手法ということになるのですが、少なくとも私が学生だった頃、「尤度」についてきちんとした説明を受けた記憶は皆無だからです。

 


そのため、薬学関係者の中には尤度についてよくわかっていないという人も、結構多いのではないかと推測されます。これが正しいなら、尤度について初歩的な説明をここで述べることは有用でしょう。これが、この記事を作成した動機です。

 

 

 

 

 

尤度の定義

そもそも、「尤度」の読み方さえ分からない人もいるかもしれませんので、念のため確認しておくと、これは「ゆうど」と読みます。

 


尤度の「尤」は訓読みすると「もっとも」ですので、尤度とは「もっともらしさ」ということです。たいていの説明ではこのように述べられていると思います。

 


が、これは分かったような分からないような説明です。ですので、もう少し違った方面から定義について説明します。

 


数学的には、次のように尤度は定義づけられます。事象x1、x2、・・・、xiの生じる確率が、p(x1)、p(x2)、・・・、p(xi)であるとすると、尤度は次のように記述できます。

 

 

-------------
p(x1)p(x2)・・・p(xi)

-------------

 


例えば、コインを3回投げてすべて表が出た場合、尤度は1/2×1/2×1/2です。

 

 

 

 

 

 

確率と尤度はどう違うか?

こうした尤度の定義はずっと前に目にしていたのですが、これがイマイチ分からない状態がずっと続いていました。なぜなら、

 


「これって、確率と全く同じことじゃないのか?」

 


と感じていたからです。

 


実際、尤度と確率は式にすると同じ形になり、したがって具体的な数値を代入して計算した結果も同じになります。ということもあり、ずっと確率と尤度の違いが分かりませんでした。

 


しかし、後にいろいろな資料に目を通して、一応自分なりの言葉で説明できそうなところまで来たので、この記事を書いたわけです。

 


両者の違いは、簡単にいえば次の通りです。

 

 

  • 確率:これから行う施行の結果の確率
  • 尤度:すでに観測された現象に対する説明の「もっともらしさ」


もう少し説明します。上記でコイントスの例を挙げましたが、この場合に確率と尤度の違いが不明瞭になったのは、コインを投げるという施行を行う以前から、表と裏が出る確率がともに1/2であると分かっているからです。

 


これに対して、医学・薬学を含めた自然科学領域では、確率未知の事象を対象にすることがよくあります。例えば、新規開発された医薬品を服用した時の、ある時間における血中濃度などです。

 


「血中濃度は確率とは違うだろう」と思うかもしれませんが、自然界の現象は、何らかの分布形に従うものが多いです。薬物の血中濃度は一般に対数正規分布すると知られていますが、この意味するところは、複数の被験者で測定した特定の薬物血中濃度を対数変換すると、そのデータは正規分布するということです。

 


個々の血中濃度は単純な数値ですが、それらの分布は正規分布、すなわち平均値のところがもっとも大きい確率を示し、両側に行くにしたがって確率が低下する釣り鐘様の分布形となります。要するに、直接的に確率の形で記述できないデータでも、その分布は確率の形で論じることができるということです (だからこそ、確率密度という概念があるわけです)。この場合、平均値や標準偏差などが分かれば、確率密度が求められます。

 


少々話がそれました。上記の薬物血中濃度の例では、その平均値や標準偏差は分かりません、なにしろ新規の薬剤ですから。

 


ともあれ、実際に投与を行い、血液サンプルから測定を行えば血中濃度のデータは手に入ります。例えば、これを30名の被験者に対して行い、結果として30のデータが得られたとき。このときに、「こうしたデータを与える集団の平均値や標準偏差は、いくらであるのがもっともらしいか?」を考えるのが尤度という概念ということです。

 


表現として適切かどうか自信はありませんが、個人的には確率と尤度は同じ現象を「逆の方向から見ている」という風にイメージしています。つまり、これから起こる現象についてどういう結果を与えるか予想するのが確率、すでに起こった現象からもとになった分布を考えるのが尤度、というイメージです。

 


もう少し数学的にいえば、同じ式中の個々の測定値を未知数とみれば確率に、平均値や標準偏差を未知数とみなせば尤度になるといってよいと思います。

 

 

 

 

 

最尤法とは何か?

薬学領域では、尤度は「最尤法」という言葉で登場することが多いという印象を持っています。これについて触れておかないと、上記の説明もあまり意味がなくなってしまいますので、ここで補足しておきましょう。

 


最尤法とは、文字通りなのですが「尤度がもっとも大きくなるようにパラメータを決定する方法」を指します。もう少しいえば、尤度が最大になるときの値をパラメータとして採用することです。ちなみに、ここでいう「パラメータ」とはモデルのパラメータです。具体的には平均値などですね。

 


「尤度が最大になると、具体的に何がよいのか?」と思われるかもしれませんが、こういうことです。

 


尤度が低くなるようなパラメータとは、正規分布を例にしてみれば、明らかに観察されている頻度が低い値を平均値に設定している場合などです。より具体的にいえば、実測値として70や75や78などが多くみられるデータに対して、平均値=10などとした場合です。

 


これでは、設定したパラメータは実際に観察された現象を上手く説明できていないことは明らかですから、平均値=10とした見立ても信用できないことになります。

 


逆に、尤度を大きくするパラメータの場合は、設定したパラメータから導かれる確率密度が、実測データを上手く説明できるものになります。要するに、尤度が大きいときのパラメータは、信頼性が高いということです。

 


そこで、パラメータをいろいろと変化させたときの尤度を連続的に計算し、尤度が最大になるときのパラメータを採用しましょう、というのが最尤法の基本的な考え方です。

 


これで、欠損値の補完方法である「完全情報最尤推定法」を説明する準備が整いました。これについては次回述べます。

 

 

 

では、また次回に。

 

 


Reference

  • http://koumurayama.com/koujapanese/
  • http://myenigma.hatenablog.com/entry/20120624/1340538748
  • http://qiita.com/kenmatsu4/items/b28d1b3b3d291d0cc698

Viewing all articles
Browse latest Browse all 345

Trending Articles