ベイズ - 確率 の 謎 を 解明 し,意思決定 の 裏 に ある 数学 的 な 知恵 を 探求 する

作者: リン・ハーンリディア作成日:2023年11月27日 11:55:42 更新日:2024年01月01日 12時20分59秒

img

ベイジアン統計学は,数学分野における強力な学問であり,金融,医学研究,情報技術を含む多くの分野で幅広い応用があります.それは,新しい後期的な信念を導き出すために,以前の信念と証拠を組み合わせ,より賢明な意思決定を可能にします.

この記事では,この分野を設立した主要な数学者について簡単に紹介します.

ベイズ の 前 ベイジアン統計学をよりよく理解するには 18世紀に戻り 数学者デ・モイヴルと 彼の論文"確率論"を参照する必要があります

この論文では,デ・モイヴは,その時代の確率と賭博に関する多くの問題を解きました. ご存知のように,これらの問題の1つに対する彼の解は,正規分布の起源につながりましたが,それは別の話です.

論文の中で最も単純な質問の一つは

公平なコインを3回連続で投げると 3つの表が出る確率は?

The Doctrine of Chancesで説明されている問題を読んでみると,ほとんどの場合,与えられた出来事の確率を計算する仮定から始めていることに気付くかもしれません.例えば,上記の質問では,コインを公平とみなす仮定があります.したがって,投球中にヘッドを得る確率は0.5です.

これは今日 数学的に表すなら

公式

𝑃(𝑋|𝜃)

しかし,もしコインが公平かどうかわからない場合は?𝜃 ?

トーマス・ベイズ と リチャード・プライス

1763年,約50年後に,ロンドン王立協会の哲学取引に"チャンス論の問題の解決法"という論文が掲載されました.

この文書の最初の数ページには,数学者リチャード・プライスが彼の友人トーマス・ベイズが彼の死前数年前に書いた論文を要約した文章があります. プライスは彼の紹介で,デ・モイヴレの"確率論"に言及されていないトーマス・ベイズの重要な発見について説明しました.

実際,彼は1つの特定の問題について言及しました

未知の出来事の成功と失敗の数を考えると,任意の2つの等級の間にその確率を見つけます.

予測される確率です. 予測される確率は,θ逆確率という用語が生まれました 数学的に言えば

公式

𝑃( 𝜃 | 𝑋)

これは,今日のベイズ定理の 後部分布と呼ばれています.

原因 と 結果 が ない 理由 に つい て

この2人の長老の研究の動機を理解してトーマス・ベイズそしてリチャード・プライスしかし,これをするために,私たちは一時的に統計に関する知識を脇に置く必要があります.

18世紀には,確率論が数学者にとってますます興味深い分野になりつつある.デ・モイヴレやベルヌッリのような数学者たちは,ある種の出来事が一定の確率で起こるが,それでも固定されたルールによって支配されていることを既に示している.例えば,もしあなたがダスを複数回投げると,その6分の1が6に落ちる.それは運命の確率を決定する隠されたルールがあるかのように.

この時代を生きていた 数学者で敬虔な信徒だと 想像してみてください この隠れた法則と 神との関係を 理解したいと 思うかもしれません

これは実際にベイズとプライスが自問した問題でした.彼らは,彼らの解決策が,世界が知恵と知性の結果である必要があることを証明するために直接適用されることを望んでいました.したがって,究極の原因として神の存在を証明します.つまり,因果関係のない原因です.

ラプラース

驚くべきことに,約2年後1774年,トーマス・ベイエスの論文を読んだことなく,フランスの数学者ラプラスは,逆確率問題に関する論文"事件の確率による出来事の原因について"を執筆しました.最初のページでは,主な原理を読むことができます:

事件が n つの異なる理由によって引き起こされる場合,これらの原因の間の比率は,これらの原因の発生確率に等しく,それぞれの原因の発生確率は,これらの原因の発生確率に等しく,それぞれの原因の発生確率は,この事件の発生確率を,これらの原因の発生確率の合計で割った結果に等しい.

これは,今日,ベイズ定理として知られているものです.

img

どこにP(θ)均一な分布です

コイン実験

PythonとPyMCのライブラリを使って,簡単な実験をします.

友人がコインを渡して,それが公平だと思うか尋ねるとしましょう. 彼は急いでいて,コインを10回しか投げられないと答えます. ご覧のように,未知のパラメータがあります.pこの問題では,コインを投げるときに頭が出る確率です. そして,コインを投げるときに頭が出る確率です.p.

(注:このパラメータはpこのパラメータが固定されているので,その間で最も確率が高い場所を知りたいのです.)

この問題について異なる見解を持つために 2つの異なる先入観のもとで解決します

    1. 同じ確率を割り振ります. 確率を割り振るには,pこの場合,私たちは,あなたの信念に何の情報も追加していないため,非情報的な事前と呼ばれるものを使用します.
    1. 硬貨が不公平であるとしても,それを極めて不公平にするのは難しい.したがって,あなたはパラメータを信じます.p0.3未満または0.7以上になる可能性は低い.この場合は,情報先駆使を使用します.

この2つのシナリオでは,我々の以前の信念は次のとおりです.

img

この証拠で,パラメータをどこに見つかるでしょう?p?

img

パラメータの先行分布がp最大確率推定値 (MLE) に集中するp=0.2周波数学で用いられる方法に類似する方法である.真の未知のパラメータは95%信頼区間である0.04から0.48の間である.

高い信頼度がある場合,そのパラメータはp0.3 から 0.7 の間にある場合, 後部分布は 0.4 の近くにあることがわかります. MLE が示すよりもはるかに高いです. この場合,真の未知のパラメータは 0.23 から 0.57 の 95% の信頼区間内にあります.

だから,最初のシナリオでは,このコインが公平ではないと確信を持って友人に言うが,別のシナリオでは,それが公平かどうか不確実だと言うだろう.

異なる先行信念のもとでは結果は大きく異なることがあります. 伝統的な方法に対するベイジアン統計学の利点の1つは,科学方法論と同様に,新しい観察と証拠と組み合わせることで私たちの信念を更新することを可能にします.

エンド

本日の記事では,ベイジアン統計学の起源とその主要な貢献者について見ました.その後,この統計分野に多くの重要な貢献者 (ジェフリーズ,コックス,シャノンなど) が,quantdare.com.


もっと