電卓 確率分布の正規法則。 確率分布

確率分布の正規法則。 確率分布

確率的推論の背後にある考え方は何ですか?

確率的推論の最初の最も自然なステップは次のとおりです。ランダムに値を取る変数がある場合、その変数が特定の値を取る確率を知りたいと考えます。 これらの確率の合計が確率分布を指定します。 たとえば、サイコロが与えられた場合、次のことができます。 アプリオリに、1/6 の等しい確率で、いずれかのエッジに当たると仮定します。 そして、これは骨が対称である場合に起こります。 ダイが非対称の場合、実験データに基づいて、より頻繁に脱落する面についてはより高い確率を決定し、より頻繁に脱落しない面についてはより低い確率を決定することが可能です。 まったく出現しない面がある場合は、確率 0 を割り当てることができます。これは、サイコロを振った結果を説明するために使用できる最も単純な確率法則です。 もちろん、これは非常に単純な例ですが、例えば保険数理計算において、実際のデータに基づいて保険契約を発行する際の実質リスクを計算する場合にも、同様の問題が生じます。

この章では、実際に最も頻繁に生じる確率法則を見ていきます。

これらの分布のグラフは STATISTICA で簡単にプロットできます。

正規分布

正規確率分布は統計学で特によく使用されます。 正規分布により得られるのは、 良いモデル実際の現象の場合:

1) データが中心の周りに集中する傾向が強い。

2) 中心からの正の偏差と負の偏差は同じ確率で発生します。

3) 中心からの偏差が大きくなると、偏差の頻度は急速に低下します。

いわゆる中心極限定理を使用して説明される正規分布の基礎となるメカニズムは、次のように比喩的に説明できます。 コップ一杯の水の中にランダムに落とした花粉の粒子があると想像してください。 単一の粒子を顕微鏡で見ると、粒子が動いているという驚くべき現象が見られます。 もちろん、これは水分子が移動し、その動きが浮遊している花粉粒子に伝わるために起こります。

しかし、動きは正確にどのように起こるのでしょうか? さらに詳しくはこちら 興味がある 尋ねる。 そしてこの動きはとても奇妙です!

個々の花粉粒子には、水分子からの衝撃という形で無数の独立した影響があり、粒子は非常に奇妙な軌道に沿って移動します。 顕微鏡で見ると、この動きは繰り返し無秩序に破線になっているように見えます。 これらのねじれは予測できません。粒子に対する分子のカオス的な影響に正確に対応するパターンはありません。 浮遊粒子は、ランダムな瞬間に水分子の衝撃を受け、運動方向を変え、しばらく慣性で移動し、再び次の分子の衝撃を受けます。 コップ一杯の水の中にすごいビリヤードが出現!

分子の動きの方向と速度はランダムであるため、軌道内のねじれの大きさと方向も完全にランダムで予測できません。 19 世紀に発見されたブラウン運動と呼ばれるこの驚くべき現象は、私たちに多くのことを考えさせます。

入力すると 適切なシステムしばらくして粒子の座標をマークすると、通常の法則が得られます。 より正確には、分子衝突による花粉粒子の変位は正規法則に従います。

ブラウン運動と呼ばれるこのような粒子の運動法則は、A. アインシュタインによって初めて厳密な物理的レベルで記述されました。 その後、Lenzhevan は、よりシンプルで直感的なアプローチを開発しました。

20 世紀の数学者たちはこの理論に全力を尽くし、300 年前にこの理論が発見されたときに最初の一歩が踏み出されました。 最も単純なオプション中心極限定理。

確率論における中心極限定理。元々は 17 世紀にモブレとラプラスの定式化で有名な法則の発展形として知られていました。 多数 J. Bernoulli (1654-1705) (J. Bernoulli (1713), Ars Conjectandi を参照) は現在、極めて発展し、その高みに達しています。 V 現代原理不変性、その作成においてロシアの数学学校が重要な役割を果たしました。 ブラウン粒子の運動が厳密に数学的に説明されるのはこの原理にあります。

その考え方は、多数の独立した量 (花粉粒子上の分子の衝突) を合計すると、特定の合理的な条件下で正規分布した量が得られるというものです。 そして、これは、初期値の分布とは独立して、つまり不変に発生します。 言い換えれば、特定の変数が多くの要因の影響を受けており、これらの影響が独立していて比較的小さく、互いに加算される場合、結果の値は正規分布になります。

たとえば、人の体重はほぼ無限の数の要因 (数千の遺伝子、素質、病気など) によって決まります。 したがって、すべての個体の母集団における体重の正規分布が期待されます。

あなたが金融家で株式市場に携わっているのであれば、当然のことながら、株価がブラウン粒子のように動き、多くの要因による混沌とした影響を経験しているケースをご存知でしょう。

正式には、正規分布密度は次のように記述されます。

ここで、 a と õ 2 は法則のパラメーターであり、それぞれ与えられた確率変数の平均と分散として解釈されます (正規分布の特別な役割のため、その密度関数と分布関数を示すために特別な記号を使用します)。 視覚的には、標準密度グラフは有名な釣鐘型曲線です。

正規確率変数 (a,õ 2) の対応する分布関数は Ф(x; a,õ 2) で表され、次の関係で与えられます。


パラメーター a = 0 および õ 2 = 1 を持つ正規法則は標準と呼ばれます。

値 z, 0 に適用される標準正規分布の逆関数

STATISTICA の確率計算ツールを使用して、x から z を計算したり、その逆を計算したりできます。

通常法の主な特徴:

平均値、最頻値、中央値: E=x mod =x med =a;

分散: D=õ 2 ;

非対称:

過剰:

式から、正規分布が 2 つのパラメータで記述されることは明らかです。

a - 平均 - 平均。

õ - 標準偏差 - 標準偏差、「シグマ」と読みます。

時々一緒に 標準偏差を標準偏差といいます, しかし、これはすでに時代遅れの用語です。

正規分布に関する有益な事実をいくつか紹介します。

平均値によって密度位置の測定値が決まります。 正規分布の密度は平均に関して対称です。 正規分布の平均は中央値および最頻値と一致します (グラフを参照)。

分散 1、平均 1 の正規分布の密度

平均 0、分散 0.01 の正規分布密度

平均0、分散4の正規分布の密度

分散が増加すると、正規分布の密度は OX 軸に沿って広がります。分散が減少すると、逆に縮小し、平均値と一致する最大値の点の周囲に集中します。 。 分散がゼロという制限的なケースでは、確率変数は縮退し、平均に等しい単一の値をとります。

2 シグマと 3 シグマ、または 2 と 3 標準偏差のルールを知っておくと役に立ちます。これらは正規分布に関連しており、さまざまなアプリケーションで使用されます。 これらのルールの意味は非常に単純です。

平均点から、または正規分布の最大密度点から、それぞれ右と左に 2 つと 3 つの標準偏差 (2 シグマと 3 シグマ) を置くと、この間隔から計算された正規密度グラフの下の面積は、それぞれ、グラフの下の全面積の 95.45% と 99.73% に等しくなります (STATISTICA 確率計算ツールで確認してください!)。

言い換えれば、これは次のように表すことができます。部品サイズや株価など、正規母集団におけるすべての独立した観測値の 95.45% および 99.73% は、平均から 2 および 3 標準偏差以内にあります。

均一分布

一様分布は、各値の可能性が等しい変数、つまり変数の値が一定の領域に均等に分布している変数を記述する場合に役立ちます。

以下は、区間 [a, b] の値を取る一様確率変数の密度関数と分布関数の式です。

これらの式から、一様確率変数が集合から値を取得する確率が容易に理解できます。 [c, d] [a, b]、(d - c)/(b - a) に等しい。

入れましょう a=0、b=1。 以下は、セグメントを中心とした均一確率密度のグラフです。

統一法則の数値的特徴:

指数分布

日常の言葉では珍しいと言えるような出来事が起こります。 T が強度 X で平均して発生する稀なイベントの発生間隔である場合、値は
T はパラメータ (ラムダ) を持つ指数分布を持ちます。 指数分布は、人気のない Web サイトへの訪問はまれなイベントであるため、これらの訪問の間隔など、連続するランダム イベントの間隔を表すためによく使用されます。

この分布には、残効がないという非常に興味深い特性、またはロシアの有名な数学者 A. A. マルコフにちなんでマルコフ特性とも呼ばれる非常に興味深い特性があり、これは次のように説明できます。 特定のイベントの発生瞬間間の分布が指標である場合、分布は任意の時点からカウントされます。 次のイベントまでの時間も (同じパラメータを持つ) 指数分布になります。

言い換えれば、まれなイベントが連続する場合、次の訪問者を待っている時間に関係なく、次の訪問者の待ち時間は常に指数関数的に分散されます。

指数分布はポアソン分布に関連しています。単位時間間隔内で、間隔が独立しており指数関数的に分布しているイベントの数は、ポアソン分布を持ちます。 サイト訪問の間隔が指数関数的に分布している場合、たとえば 1 時間以内の訪問数はポアソンの法則に従って分布します。

指数分布はワイブル分布の特殊なケースです。

時間が連続的ではなく離散的である場合、指数分布の類似物は幾何分布になります。

指数分布密度は次の式で表されます。

この分布には、その特性を決定するパラメータが 1 つだけあります。

指数分布密度グラフは次のようになります。

基本 数値特性指数分布:

アーランのディストリビューション

この連続分布は (0,1) を中心とし、次の密度を持ちます。

期待と分散はそれぞれ等しい

Erlang ディストリビューションは、キューイングと電話の理論の問題で最初に Erlang を使用した A. Erlang にちなんで名付けられました。

パラメーター µ および n を持つアーラン分布は、n 個の独立した同一分布の確率変数の合計の分布であり、それぞれがパラメーター nµ を持つ指数分布を持ちます。

n = 1 のアーラン分布は、指数分布または指数分布と同じです。

ラプラス分布

ラプラス密度関数、または二重指数関数とも呼ばれる関数は、回帰モデルの誤差分布を記述するために使用されます。 この分布のグラフを見ると、OY 軸に関して対称な 2 つの指数分布で構成されていることがわかります。

位置パラメータが 0 の場合、ラプラス分布密度関数は次の形式になります。

位置パラメータがゼロであると仮定した場合、この分布則の主な数値特性は次のとおりです。

一般に、ラプラス分布密度は次の形式になります。

a は分布の平均です。 b - スケールパラメータ。 e - オイラー数 (2.71...)。

ガンマ分布

指数分布の密度には点 0 に最頻値があり、これは実際のアプリケーションには不都合な場合があります。 多くの例では、考慮中の確率変数の最頻値が 0 に等しくないことが事前にわかっています。たとえば、顧客が電子商取引ストアに到着する間隔や Web サイトへの訪問間隔には、顕著な最頻値があります。 このようなイベントをモデル化するには、ガンマ分布が使用されます。

ガンマ分布密度の形式は次のとおりです。

ここで、Г はオイラーの Г 関数、a > 0 は「形状」パラメータ、b > 0 はスケール パラメータです。

特殊なケースとして、アーラン分布と指数分布があります。

ガンマ分布の主な特徴:

以下は、スケール パラメーターが 1、形状パラメーターが 3 と 5 の 2 つのガンマ密度プロットです。

ガンマ分布の有用な特性: 任意の数の独立したガンマ分布確率変数 (同じスケール パラメーター b を持つ) の合計

(a l ,b) + (a 2 ,b) + --- +(a n ,b) もガンマ分布に従いますが、パラメーターは a 1 + a 2 + + a n および b です。

対数正規分布

確率変数 h は、その自然対数 (lnh) が正規分布則に従う場合、対数正規または対数正規と呼ばれます。

対数正規分布は、たとえば、収入、新婚夫婦の年齢、食品中の有害物質の基準からの許容偏差などの変数をモデル化するときに使用されます。

したがって、値が x には正規分布があり、その値は y = e x は対数正規分布になります。

指数のべき乗に正規値を代入すると、正規の確率変数が繰り返しの合計の結果であるのと同様に、対数正規値が独立変数の繰り返しの乗算の結果であることが簡単に理解できます。

対数正規分布密度の形式は次のとおりです。

対数正規分布の主な特徴:


カイ二乗分布

平均 0、分散 1 の m 個の独立正規変数の二乗和は、自由度 m のカイ二乗分布になります。 この分布はデータ分析で最もよく使用されます。

正式には、自由度 m の井戸二乗分布の密度は次の形式になります。

マイナスの場合 xの密度が0になります。

カイ二乗分布の基本的な数値特性:

密度グラフを次の図に示します。

二項分布

二項分布が最も重要です 離散分布、ほんの数点に集中しています。 これらの点 二項分布正の確率を割り当てます。 したがって、二項分布は、個別に選択された点にゼロ確率を割り当て、連続と呼ばれる連続分布 (正規分布、カイ二乗分布など) とは異なります。

次のゲームを考慮すると、二項分布をよりよく理解できます。

コインを投げていると想像してください。 紋章が抜ける可能性があるようにしましょう p、表が着地する確率は q = 1 - p (コインが非対称で、重心がずれている、つまりコインに穴があるなど、最も一般的なケースを考えています)。

紋章を着地させると成功とみなされますが、尾を着地させると失敗とみなされます。 この場合、描画された表 (または裏) の数は二項分布になります。

非対称のコインや不規則なサイコロの考慮は実際的に興味深いことに注意してください。 J. ニューマンが彼のエレガントな著書「確率論の入門コース」で述べているように、 数学的統計」という言葉から、人々は長い間、サイコロ上の点の頻度はサイコロ自体の特性に依存し、人為的に変更できると推測してきました。 考古学者らはファラオの墓から2組のサイコロを発見した。1つはすべての面が外れる確率が等しい「正直な」サイコロで、もう1つは意図的に重心をずらして6の目が外れる可能性を高めた偽のサイコロだ。

二項分布のパラメータは成功の確率です p (q = 1 - p) とテスト数 n。

二項分布は、ランダムに選択された企業の男性と女性の数などの二項イベントの分布を記述するのに役立ちます。 特に重要なのは、ゲームの問題における二項分布の使用です。

成功確率 m の正確な式は、 n 回の試行は次のように記述されます。

成功の p 確率

q は 1-p、q>=0、p+q==1 に等しい

n- テストの数、m =0.1...m

二項分布の主な特徴:

この分布のグラフは次のとおりです。 いろいろな数字テスト n と成功確率 p の形式は次のとおりです。

二項分布は正規分布とポアソン分布に関連しています (下記を参照)。 特定のパラメータ値で 多数これらのディストリビューションに変換することをテストします。 これは、STATISTICA を使用して簡単に実証できます。

たとえば、パラメータを含む二項分布のグラフを考えると、 p = 0.7、n = 100 (図を参照)、STATISTICA BASIC を使用しました。グラフが正規分布の密度に非常に似ていることがわかります (実際に正規分布です!)。

パラメーターを使用した二項分布プロット p=0.05、n=100 はポアソン分布に非常に似ています。

すでに述べたように、二項分布は原生動物の観察から生じました。 ギャンブル- 公正なコインを投げます。 多くの状況でこのモデルは役に立ちます まずいいよより複雑なゲームや証券取引所でプレイする際に発生するランダムなプロセスの近似。 多くの重要な機能が備わっていることは注目に値します。 複雑なプロセスは単純な二項モデルから理解できます。

たとえば、次の状況を考えてみましょう。

紋章の損失を 1、尾翼の損失をマイナス 1 としてマークし、連続する時点での勝ちと負けを合計します。 グラフは、1,000 回の投球、5,000 回の投球、および 10,000 回の投球におけるこのようなゲームの典型的な軌道を示しています。 軌道がゼロより上または下にどれだけ長いかに注目してください。つまり、完全に公平なゲームで 1 人のプレイヤーが勝つ時間が非常に長く、勝ちから負けへの移行は比較的まれであり、これを調和させるのは困難です。 「絶対に公平なゲーム」という表現が魔法の呪文のように聞こえる、準備ができていない心。 したがって、ゲームの条件に関しては公平ですが、典​​型的な軌道の動作はまったく公平ではなく、均衡を示しません。

もちろん、経験的にこの事実はすべてのプレーヤーに知られており、プレーヤーが賞金を持って離れることを許可されず、さらにプレイすることを強制される場合、戦略がそれに関連付けられます。


1 人のプレーヤーが勝ち (軌道が 0 を超える)、2 番目のプレーヤーが負ける (軌道が 0 を下回る) 間の投球数を考えてみましょう。 一見すると、その投球数はほぼ同じであるように見えます。 ただし、理想的なコインを 10,000 回投げた場合 (つまり、ベルヌーイ テストの場合、 p = q = 0.5、 n=10,000) 当事者の一方が 9,930 回を超える試行でリードし、もう一方が 70 回未満である確率は 0.1 を超えます。

驚くべきことに、公平なコイントスを 10,000 回行うゲームでは、リーダーが最大 8 回変わる確率は 0.14 よりも大きく、78 回を超えてリーダーが変わる確率は約 0.12 です。

したがって、逆説的な状況が発生します。対称ベルヌーイ ウォークでは、連続してゼロに戻る間のグラフ上の「波」 (グラフを参照) が驚くほど長くなる可能性があります。 これには別の状況が関係しています。 T n /n (グラフが x 軸の上にある時間の割合) が 1/2 に近い値である可能性が最も低くなります。

数学者は、いわゆる逆正弦の法則を発見しました。これによると、0 ごとに< а <1 вероятность неравенства , где Т n - число шагов, в течение которых первый игрок находится в выигрыше, стремится к

逆正弦分布

この連続分布は間隔 (0, 1) を中心とし、次の密度を持ちます。

逆正弦分布はランダム ウォークに関連付けられています。 これは、対称コイン、つまり等しい確率のコインを投げたときに、最初のプレーヤーが勝つ時間の割合の分布です。 S は紋章と尾に付いています。 別の言い方をすると、このようなゲームは粒子のランダム ウォークとして考えることができ、ゼロから開始して同じ確率で右または左に 1 回ジャンプします。 粒子のジャンプ (頭または尾の落下) は同じ確率で発生するため、このような歩行は対称と呼ばれることがよくあります。 確率が異なっていれば、非対称な歩行となるでしょう。

逆正弦分布密度グラフを次の図に示します。

最も興味深いのはグラフの定性的解釈であり、そこから公正なゲームにおける一連の勝敗について驚くべき結論を導き出すことができます。 グラフを見ると、最小密度は次の点にあることがわかります。 1/2。「だから何?」 - あなたが尋ねる。 しかし、この観察について考えてみると、その驚きは際限がないでしょう。 ゲームは公平であると定義されていますが、実際には一見したほど公平ではないことが判明しました。

粒子が正と負の両方の半軸、つまりゼロの右または左に同じ時間を費やす対称的なランダムな軌道は、まさに可能性が最も低いものです。 プレイヤーの言葉に目を移すと、対称的なコインを投げる場合、プレイヤーが勝ちと負けに同じ時間を費やすゲームが最も可能性が低いと言えます。

逆に、一方のプレイヤーが勝つ可能性が大幅に高く、もう一方のプレイヤーが負ける可能性が最も高いゲームです。 驚くべきパラドックス!

最初のプレイヤーが勝つ時間 t の割合が次の間にある確率を計算するには、 t1から t2、分布関数値から必要 F(t2) は分布関数 F(t1) の値を減算します。

正式には次のようになります。

P(t1

このことから、STATISTICA を用いて計算すると、10,000 ステップで 0.1 の確率で粒子がプラス側に留まる回数が 9930 回以上、つまり、大まかに言って少なくとも 1 回はそのような位置が観測されることになります。 10 点中 10 点中 (一見すると不合理に思えますが、百科事典『確率と数学的統計』、42 ~ 43 ページ、M.: Big Russian Encyclopedia、1999 年に収録されている Yu. V. Prokhorov の注目すべきメモ「ベルヌーイのランブラー」を参照してください) )。

負の二項分布

これは整数点に割り当てられる離散分布です k = 0,1,2,... 確率:

p k =P(X=k)=C k r+k-1 p r (l-p) k "、ここで 0<р<1,r>0.

負の二項分布は多くのアプリケーションで見られます。

全体 r > 0 の場合、負の二項分布は、「成功」の確率を伴うベルヌーイ テスト スキームにおける r 番目の「成功」までの待ち時間の分布として解釈されます。 p は、たとえば、2 番目のエンブレムが描画される前に行われなければならないロールの数です。この場合、パスカル分布と呼ばれることもあり、ガンマ分布の離散的な類似物です。

r = 1 の負の二項分布は幾何分布と一致します。

Y がランダム パラメーター を持つポアソン分布を持つ確率変数の場合、密度を持つガンマ分布を持つ

この場合、U はパラメーターを伴う負の二項分布になります。

ポアソン分布

ポアソン分布はレア イベント分布と呼ばれることもあります。 ポアソンの法則に従って分布する変数の例としては、事故の数、生産プロセスにおける欠陥の数などが挙げられます。ポアソン分布は次の式で定義されます。

ポアソン確率変数の主な特徴:

ポアソン分布は、指数分布およびベルヌーイ分布に関連しています。

イベントの数がポアソン分布を持つ場合、イベント間の間隔は指数分布または指数分布になります。

ポアソン分布プロット:

パラメーター 5 のポアソン分布のグラフと、p=q=0.5、n=100 のベルヌーイ分布のグラフを比較します。

グラフが非常に似ていることがわかります。 一般的なケースでは、次のパターンがあります (たとえば、優れた書籍 Shiryaev A.N.「確率」モスクワ: Nauka、p. 76 を参照): ベルヌーイ テストで n が大きな値を取る場合、成功の確率 / ? が比較的小さいため、成功の平均数 (積と nar) が小さくも大きくもない場合、パラメーター n、p を持つベルヌーイ分布は、パラメーター = np を持つポアソン分布で置き換えることができます。

ポアソン分布は、まれなイベントの分布として品質管理図などで実際に広く使用されています。

別の例として、電話回線に関連し、実践から得られた次の問題を考えてみましょう (参照: Feller V. Introduction to the Theory of確率とその応用。Moscow: Mir, 1984, p. 205、および Molina E. S. (1935)工学における確率、電気工学、54、423 ~ 427 頁、Bell Telephone System Technical Publications Monograph B-854)。 この作業は、現代の言語、たとえばモバイル通信の言語に簡単に翻訳できます。興味のある読者はぜひ翻訳してみてください。

問題は次のように定式化される。 2 つの電話交換機 A と B があるとします。

電話交換機 A は、2,000 人の加入者と交換機 B の間で通信を提供する必要があります。通信の品質は、回線が空くまで待機するコールが 100 件中 1 件だけである必要があります。

問題は、一定の通信品質を確保するには、電話回線を何本設置する必要があるかということです。 明らかに、その多くは長期間無料なので、2,000 行を作成するのは愚かです。 直観的な考察から、明らかに、最適な行数 N が存在することは明らかです。この数はどのように計算するのでしょうか?

加入者のネットワークへのアクセスの強度を表す現実的なモデルから始めましょう。モデルの精度は、もちろん標準の統計基準を使用して検証できることに注意してください。

したがって、各加入者が 1 時間あたり平均 2 分間回線を使用し、加入者の接続は独立していると仮定しましょう (ただし、フェラーが正しく指摘しているように、戦争や戦争など、すべての加入者に影響を与える何らかのイベントが発生しない限り、後者は発生します)ハリケーン)。

次に、成功確率 p=2/60=1/30 の 2000 回のベルヌーイ試行 (コイン投げ) またはネットワーク接続があります。

N 人を超えるユーザーが同時にネットワークに接続する確率が 0.01 を超えないような N を見つける必要があります。 これらの計算は STATISTICA システムで簡単に解決できます。

STATISTICA を使用して問題を解決します。

ステップ1。モジュールを開く 基本的な統計。 110 個の観測値を含む binoml.sta ファイルを作成します。 最初の変数に名前を付けます 二項式、2番目の変数 - ポワソン.

ステップ2。 二項式、 ウィンドウを開く 変数 1(写真を参照)。 図に示すように、ウィンドウに数式を入力します。 ボタンをクリックしてください わかりました.


ステップ3。タイトルをダブルクリックすると ポワソン、 ウィンドウを開く 変数 2(写真を参照)

図に示すように、ウィンドウに数式を入力します。 次の式を使用してポアソン分布パラメーターを計算することに注意してください。 =n×p。 したがって、 = 2000 × 1/30 となります。 ボタンをクリックしてください わかりました.


STATISTICA は確率を計算し、生成されたファイルに書き込みます。

ステップ4。観察番号 86 まで下にスクロールします。二項分布を使用した場合、1 時間に 2,000 人のネットワーク ユーザーのうち 86 人以上の同時ユーザーが存在する確率は 0.01347 であることがわかります。

二項分布のポアソン近似を使用すると、2,000 人のネットワーク ユーザーのうち 86 人以上が 1 時間に同時に作業する確率は 0.01293 になります。

必要な確率は 0.01 以下であるため、必要な通信品質を提供するには 87 回線で十分です。

二項分布に正規近似を使用すると、同様の結果が得られます (これを確認してください)。

V. フェラーは STATISTICA システムを自由に使用できず、二項分布と正規分布のテーブルを使用したことに注意してください。

同じ推論を使用して、W. フェラーによって議論された次の問題を解決できます。 ユーザーを 1,000 人ずつ 2 つのグループに分けるときに、ユーザーに確実にサービスを提供するために必要な回線が多いか少ないかを確認する必要があります。

ユーザーがグループに分かれている場合、同じレベルの品質を達成するにはさらに 10 回線が必要になることがわかりました。

1 日を通してのネットワーク接続強度の変化を考慮することもできます。

幾何学的分布

独立したベルヌーイ テストを実行し、次の「成功」までの試行回数をカウントすると、この回数は幾何学的分布になります。 したがって、コインを投げる場合、次の紋章が現れるまでに必要な投げの回数は幾何学的法則に従います。

幾何分布は次の式で求められます。

F(x) = p(1-p) x-1

p - 成功の確率、x = 1、2、3...

分布の名前は等比数列に関連しています。

したがって、幾何分布は、特定のステップで成功が発生する確率を指定します。

幾何分布は、指数分布の離散的な類似物です。 時間が量子によって変化する場合、各瞬間における成功の確率は幾何学的法則によって記述されます。 時間が連続的な場合、確率は指数関数または指数法則によって記述されます。

超幾何分布

これは、確率変数 X の離散確率分布であり、整数値 m = 0、1、2、...、n を次の確率でとります。

ここで、N、M、n は非負の整数であり、M< N, n < N.

超幾何分布は通常、非置換の選択に関連しており、たとえば、M 個の黒と N - M 個の白を含む N 個のボールを含む母集団から、サイズ n のランダムなサンプルから正確に m 個の黒ボールを見つける確率を決定します (次を参照)。たとえば、百科事典「確率と数学的統計」、M.: Great Russian Encyclopedia、p. 144)。

超幾何分布の数学的期待値は N に依存せず、対応する二項分布の数学的期待値 µ=np と一致します。

超幾何分布の分散 二項分布の分散を超えない npq。 超幾何分布の任意の次数の瞬間において、二項分布のモーメントの対応する値になる傾向があります。

この分布は品質管理アプリケーションで非常に頻繁に発生します。

多項式分布

多項式または多項式分布は、当然のことながら分布を一般化します。 二項分布はコインを投げて 2 つの結果 (表または山) が得られる場合に発生しますが、多項分布はサイコロを振って 3 つ以上の結果が考えられる場合に発生します。 正式には、これは確率変数 X 1,...,X k の同時確率分布であり、非負の整数値 n 1,...,n k をとり、条件 n 1 + ... + n k = を満たします。 n、確率:

「多項分布」という名前は、多項式 (p 1 + ... + p k) n を展開するときに多項確率が生じるという事実によって説明されています。

ベータ版の配布

ベータ分布の密度は次の形式になります。


標準のベータ分布は、0 から 1 までの区間を中心としています。線形変換を使用すると、任意の区間の値を取るようにベータ値を変換できます。

ベータ分布を持つ量の基本的な数値特性:


極値の分布

極値の分布 (タイプ I) の密度は次の形式になります。

この分布は極値分布とも呼ばれます。

極値の分布は、洪水レベル、渦速度、特定の年の株式市場指数の最大値など、極端なイベントをモデル化する際に使用されます。

この分布は、保険数理計算だけでなく、電気回路の故障時間を説明するためなどの信頼性理論でも使用されます。

レイリー分布

レイリー分布の密度は次の形式になります。

ここで、 b はスケールパラメータです。

レイリー分布は 0 から無限大までの範囲に集中しています。 STATISTICA では、値 0 の代わりに、しきい値パラメーターに別の値を入力できます。この値は、レイリー分布を近似する前に元のデータから減算されます。 したがって、しきい値パラメーターの値は、すべての観測値よりも小さくなければなりません。

2 つの変数 1 と 2 が互いに独立しており、同じ分散で正規分布する場合、変数 レイリー分布になります。

レイリー分布は射撃理論などで使用されます。


ワイブル分布

ワイブル分布は、信頼性理論におけるさまざまなタイプの故障時間を説明するためにこの分布を使用したスウェーデンの研究者ワロッディ ワイブルにちなんで名付けられました。

正式には、ワイブル分布密度は次のように書かれます。

ワイブル分布密度は次のように書かれることもあります。

B - スケールパラメータ。

C - 形状パラメータ。

E はオイラー定数 (2.718...) です。

位置パラメータ。 通常、ワイブル分布は 0 から無限大までの半軸を中心としています。 境界 0 の代わりにパラメータ a を導入すると、これは実際にはしばしば必要となり、いわゆる 3 パラメータのワイブル分布が生じます。

ワイブル分布は信頼性理論と保険で広く使用されています。

前述したように、指数分布は、物体の故障確率が一定であるという仮定の下で故障までの時間を見積もるためのモデルとしてよく使用されます。 故障の確率が時間の経過とともに変化する場合は、ワイブル分布が適用されます。

=1 の場合、または別のパラメーター化では、式から簡単にわかるように、ワイブル分布では指数分布になり、- の場合はレイリー分布になります。

ワイブル分布パラメータを推定するための特別な方法が開発されています (たとえば、推定方法と推定時に発生する問題について説明している書籍: Lawless (1982) Statistical models and Methods for lifetime data, Belmont, CA: Lifetime Learning を参照してください)。 3 パラメータ分布ワイブルの位置パラメータ)。

多くの場合、信頼性解析を行う場合、ある時点から短い時間間隔内に故障が発生する確率を考慮する必要があります。 現時点まではそうしなかったが 故障は発生しませんでした。

この関数はリスク関数または故障率関数と呼ばれ、正式には次のように定義されます。

H(t) - 時間 t における故障率関数またはリスク関数。

f(t) - 故障時間の分布密度。

F(t) - 故障時間の分布関数 (間隔にわたる密度の積分)。

一般に、故障率関数は次のように記述されます。

リスク関数が定数に等しい場合、これはデバイスの通常の動作に対応します (式を参照)。

リスク関数が低下するとき。これはデバイスの慣らし運転に相当します。

リスク関数が減少するとき。これはデバイスの老朽化に対応します。 典型的なリスク関数をグラフに示します。


以下は、さまざまなパラメーターを使用したワイブル密度プロットです。 パラメータ a の 3 つの値の範囲に注意する必要があります。

第 1 領域ではリスク関数が減少し (調整期間)、第 2 領域ではリスク関数が一定に等しく、第 3 領域ではリスク関数が増加します。

新車の購入を例にすると、ここで述べたことを簡単に理解できるでしょう。最初に車を適応させる期間があり、次に長期間の通常の運転があり、その後車の部品が磨耗して故障のリスクが生じます。急激に増加します。

すべての運用期間を同じディストリビューション ファミリで説明できることが重要です。 これがワイブル分布の背後にある考え方です。


ワイブル分布の主な数値的特徴を示しましょう。


パレート分布

応用統計のさまざまな問題では、いわゆる切り捨てられた分布がよく見られます。

たとえば、この分布は、利息が特定の値 c 0 を超える場合に、保険や税金で使用されます。

パレート分布の基本的な数値特性:


物流

ロジスティック分布には密度関数があります。

A - 位置パラメータ。

B - スケールパラメータ。

E - オイラー数 (2.71...)。


ホテリング T 2 分布

この連続分布は、区間 (0, Г) を中心として次の密度を持ちます。

パラメータはどこにありますか n と k (n >_k >_1) は自由度と呼ばれます。

k = 1 ホテルリング、P 分布は生徒の分布に減少し、 k >1 は、スチューデント分布を多変量の場合に一般化したものと考えることができます。

Hotelling 分布は正規分布に基づいています。

k 次元のランダム ベクトル Y が平均のゼロ ベクトルと共分散行列を持つ正規分布を持つとします。

量を考えてみましょう

ここで、ランダム ベクトル Z i は互いに独立しており、Y と同じ方法で分布します。

この場合、確率変数 T 2 =Y T S -1 Y は、n 自由度の T 2 -ホテリング分布を持ちます (Y は列ベクトル、T は転置演算子)。

確率変数はどこにありますか t n は、自由度 n のスチューデント分布を持ちます (『百科事典』の「確率と数学的統計」、792 ページを参照)。

Y にゼロ以外の平均を持つ正規分布がある場合、対応する分布は次のように呼ばれます。 非中心的 n 自由度および非心パラメータをもつホテルリング T 2 分布 v.

Hotelling T 2 分布は、Student の ^ 分布と同じ状況で数学統計で使用されますが、多変量の場合にのみ使用されます。 観測結果 X 1,..., X n が、平均値 µ のベクトルと非特異共分散行列を持つ独立した正規分布ランダム ベクトルである場合、統計


Hotelling T 2 分布があります。 n - 1 の自由度。 この事実は、ホテリング基準の基礎を形成します。

STATISTICA では、たとえば「基本統計とテーブル」モジュールでホテリング テストを利用できます (下のダイアログ ボックスを参照)。


マクスウェル分布

マクスウェル分布は、理想気体の分子の速度分布を記述する際に物理学で生まれました。

この連続分布は (0, ) を中心とし、次の密度を持ちます。

分布関数の形式は次のとおりです。

ここで、Ф(x) は標準正規分布関数です。 マクスウェル分布は正の歪度係数を持ち、点で単一モードを持ちます (つまり、分布は単峰性です)。

マクスウェル分布には、任意の次数の終了瞬間があります。 数学的な期待値と分散はそれぞれ等しい、そして

マクスウェル分布は当然ながら正規分布に関連しています。

X 1、X 2、X 3 がパラメータ 0 および õ 2 の正規分布を持つ独立した確率変数である場合、確率変数は マクスウェル分布があります。 したがって、マクスウェル分布は、3 次元空間のデカルト座標系の座標が独立しており、平均 0、分散 õ 2 で正規分布するランダム ベクトルの長さの分布と考えることができます。

コーシー分布

この驚くべき分布には、x の絶対値が増加するにつれて密度が非常にゆっくりとゼロになる傾向があるため、平均値が存在しない場合があります。 このような分布はヘビーテール分布と呼ばれます。 平均を持たない分布を考え出す必要がある場合は、すぐにそれをコーシー分布と呼びます。

コーシー分布は単峰性であり、モードに関して対称であり、モードは中央値であり、次の形式の密度関数を持ちます。

どこ c > 0 - スケールパラメータと aは中心パラメータであり、最頻値と中央値の値を同時に決定します。

密度の積分、つまり分布関数は次の関係で与えられます。

学生の分布

「学生」というペンネームで知られ、イギリスのビールの品質の統計的研究からキャリアを始めたイギリスの統計学者 W. ゴセットは、1908 年に次のような結果を得ました。 させて x 0 、 x 1 、..、x m - 独立、(0, s 2) - 正規分布確率変数:


この分布は現在 Student 分布 (と略されます) として知られています。 t(m) 分布 (m は自由度の数) は、2 つの母集団の平均を比較するように設計された有名な t 検定の基礎です。

密度関数 f t (x) は確率変数の分散 õ 2 に依存せず、さらに単峰性で点 x = 0 に関して対称です。

Student 分布の基本的な数値特性:

t 分布は、平均の推定値が考慮されており、標本分散が不明な場合に重要です。 この場合、標本分散と t 分布が使用されます。

自由度が大きい (30 を超える) 場合、t 分布は標準正規分布と実質的に一致します。

t 分布密度関数のグラフは、自由度が増加するにつれて次のように変形します。ピークが増加し、裾がより急峻に 0 に近づき、t 分布密度関数のグラフが横方向に圧縮されているように見えます。


F 分布

考えてみましょう m 1 + m 2 の独立した (0, s 2) 正規分布量

そして、置きます

明らかに、同じ確率変数は、2 つの独立した適切に正規化されたカイ 2 乗分布変数と の比として定義することもできます。

有名な英国の統計学者 R. フィッシャーは 1924 年に、確率変数 F(m 1, m 2) の確率密度が次の関数で与えられることを示しました。


ここで、Г(у) はオイラーのガンマ関数の値です。 ポイント y、法則自体は F 分布と呼ばれ、分子と分母の自由度はそれぞれ m,1l m7 に等しくなります。

F 分布の基本的な数値特性:


F 分布は、判別分析、回帰分析、分散分析、およびその他のタイプの多変量データ分析に現れます。

実際には、多数の確率因子の影響を受けるほとんどの確率変数は正規確率分布の法則に従います。 したがって、確率論のさまざまな応用において、この法則は特に重要です。

確率変数 $X$ は、その確率分布密度が次の形式である場合、正規確率分布則に従います。

$$f\left(x\right)=((1)\over (\sigma \sqrt(2\pi )))e^(-(((\left(x-a\right))^2)\over ( 2(\シグマ )^2)))$$

関数 $f\left(x\right)$ のグラフは図に模式的に示されており、「ガウス曲線」と呼ばれます。 このグラフの右側は、ユーロ導入前に使用されていたドイツの 10 マルク紙幣です。 よく見ると、この紙幣にはガウス曲線とその発見者である偉大な数学者カール・フリードリヒ・ガウスが描かれていることがわかります。

密度関数 $f\left(x\right)$ に戻って、分布パラメーター $a,\ (\sigma )^2$ について説明しましょう。 パラメーター $a$ は、確率変数の値の分散の中心を特徴付けます。つまり、数学的な期待値の意味を持ちます。 パラメータ $a$ が変化し、パラメータ $(\sigma )^2$ が変化しない場合、関数 $f\left(x\right)$ のグラフが横軸に沿ってシフトするのが観察できますが、密度グラフは横軸に沿って変化します。それ自体は形を変えません。

パラメーター $(\sigma )^2$ は分散であり、密度グラフ曲線 $f\left(x\right)$ の形状を特徴付けます。 パラメーター $a$ を変更せずにパラメーター $(\sigma )^2$ を変更すると、密度グラフが横軸に沿って移動することなく、圧縮または伸縮して形状がどのように変化するかを観察できます。

正規分布確率変数が指定された区間に該当する確率

知られているように、確率変数 $X$ が区間 $\left(\alpha ;\ \beta \right)$ に該当する確率は $P\left(\alpha ) で計算できます。< X < \beta \right)=\int^{\beta }_{\alpha }{f\left(x\right)dx}$. Для нормального распределения случайной величины $X$ с параметрами $a,\ \sigma $ справедлива следующая формула:

$$P\left(\アルファ< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right)$$

ここで、関数 $\Phi \left(x\right)=((1)\over (\sqrt(2\pi )))\int^x_0(e^(-t^2/2)dt)$ はラプラス関数 。 この関数の値は から取得されます。 関数 $\Phi \left(x\right)$ の次の特性に注目することができます。

1 。 $\Phi \left(-x\right)=-\Phi \left(x\right)$、つまり関数 $\Phi \left(x\right)$ は奇数です。

2 。 $\Phi \left(x\right)$ は単調増加関数です。

3 。 $(\mathop(lim)_(x\to +\infty ) \Phi \left(x\right)\ )=0.5$, $(\mathop(lim)_(x\to -\infty ) \ Phi \左(x\右)\ )=-0.5$。

関数 $\Phi \left(x\right)$ の値を計算するには、Excel の関数 $f_x$ ウィザードを使用することもできます: $\Phi \left(x\right)=NORMDIST\left(x ;0;1;1\right )-0.5$。 たとえば、$x=2$ の場合の関数 $\Phi \left(x\right)$ の値を計算してみましょう。

正規分布確率変数 $X\in N\left(a;\ (\sigma )^2\right)$ が数学的期待 $a$ に関して対称な区間に入る確率は、次の式を使用して計算できます。

$$P\left(\left|X-a\right|< \delta \right)=2\Phi \left({{\delta }\over {\sigma }}\right).$$

スリーシグマの法則。 正規分布確率変数 $X$ が区間 $\left(a-3\sigma ;a+3\sigma \right)$ に収まることはほぼ確実です。

例1 。 確率変数 $X$ は、パラメーター $a=2,\ \sigma =3$ を持つ正規確率分布則に従います。 $X$ が区間 $\left(0.5;1\right)$ に該当する確率と、不等式 $\left|X-a\right| の確率を求めます。< 0,2$.

数式を使用する

$$P\left(\アルファ< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right),$$

$P\left(0.5;1\right)=\Phi \left(((1-2)\over (3))\right)-\Phi \left(((0.5-2)\ over (3) が見つかります。 ))\right)=\ファイ \left(-0.33\right)-\ファイ \left(-0.5\right)=\ファイ \left(0.5\right)-\ファイ \left(0.33\right)=0.191- 0.129=0.062ドル。

$$P\left(\left|X-a\right|< 0,2\right)=2\Phi \left({{\delta }\over {\sigma }}\right)=2\Phi \left({{0,2}\over {3}}\right)=2\Phi \left(0,07\right)=2\cdot 0,028=0,056.$$

例 2 。 年間を通じて、特定の企業の株価が正規法則に従って分布する確率変数であり、数学的期待値が従来の通貨単位 50 に等しく、標準偏差が 10 に等しいと仮定します。議論中の期間の当日のプロモーション価格は次のようになります。

a) 従来の通貨単位が 70 を超えていますか?

b) 1 株あたり 50 未満ですか?

c) 1 株当たり従来の通貨単位は 45 から 58 の間ですか?

確率変数 $X$ をある企業の株の価格としましょう。 条件により、$X$ はパラメータ $a=50$ - 数学的期待値、$\sigma =10$ - 標準偏差を持つ正規分布に従います。 確率 $P\left(\alpha< X < \beta \right)$ попадания $X$ в интервал $\left(\alpha ,\ \beta \right)$ будем находить по формуле:

$$P\left(\アルファ< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right).$$

$$а)\ P\left(X>70\right)=\ファイ \left(((\infty -50)\over (10))\right)-\ファイ \left(((70-50)\ (10))\right)=0.5-\Phi \left(2\right)=0.5-0.4772=0.0228.$$

$$b)\P\left(X< 50\right)=\Phi \left({{50-50}\over {10}}\right)-\Phi \left({{-\infty -50}\over {10}}\right)=\Phi \left(0\right)+0,5=0+0,5=0,5.$$

$$in)\ P\left(45< X < 58\right)=\Phi \left({{58-50}\over {10}}\right)-\Phi \left({{45-50}\over {10}}\right)=\Phi \left(0,8\right)-\Phi \left(-0,5\right)=\Phi \left(0,8\right)+\Phi \left(0,5\right)=$$

確率分布は、測定可能な空間上の確率の尺度です。

W を任意の性質の空でない集合とし、 Ƒ -s- W 上の代数、つまり、W 自体、空集合 Æ を含む W の部分集合の集合であり、最大でも集合論的演算の可算集合で閉じられます (これは、 Î Ƒ セット = W\ 再び属します Ƒ で、もし 1 , 2、…О Ƒ 、 それ Ƒ そして Ƒ )。 ペア (W、 Ƒ )は可測空間と呼ばれます。 非負関数 P( )、全員に対して定義されています Î Ƒ 、P(W) = 1 で P が可算加法である場合、つまり任意のシーケンスの場合、確率尺度、確率、P. 確率、または単に P. と呼ばれます。 1 , 2、…О Ƒ そのような あい あ、j= すべての人にとっての Æ ¹ j、等式 P() = P( あい)。 3 (W、 Ƒ 、P) は確率空間と呼ばれます。 確率空間は、A.N. によって提案された公理的確率理論の元の概念です。 1930年代初頭のコルモゴロフ。

あらゆる確率空間上で、(実) 測定可能な関数を考えることができます。 バツ = バツ(w)、wÎW、つまり、次のように機能します (w: バツ(w)О B} Î Ƒ 任意の Borel サブセットに対して B実線 R。 関数の可測性 バツは (w: バツ(w)< バツ} Î Ƒ あらゆる本物の バツ。 測定可能な関数は確率変数と呼ばれます。 各確率変数 バツ、確率空間 (W, Ƒ 、P)、P の確率を生成します。

PX (B) = P( バツÎ B) = P((w: バツ(w)О B}), B Î Ɓ ,
測定可能な空間上 ( R, Ɓ )、 どこ Ɓ R、分布関数

FX(バツ) = P( バツ < バツ) = P((w: バツ(w)< バツ}), -¥ < バツ <¥,
これらは確率変数の確率と分布関数と呼ばれます バツ.

分布関数 Fどの確率変数にもプロパティがあります

1. F(バツ) 減少しない、

2. F(- ¥) = 0, F(円)=1、

3. F(バツ) はすべての点で連続したままになります バツ.

分布関数の定義では、不等式が使用されることがあります。< заменяется неравенством £; в этом случае функция распределения является непрерывной справа. В содержательных утверждениях теории вероятностей не важно, непрерывна функция распределения слева или справа, важны лишь положения ее точек разрыва バツ(存在する場合) および増分サイズ F(バツ+0) - F(バツ-0) これらの点では。 もし F バツの場合、この増分は P( バツ = バツ).

任意の機能 F 1. ~ 3. の性質を持つ を分布関数と呼びます。 () 上のディストリビューション間の対応 R, Ɓ ) と分布関数は 1 対 1 です。 任意の R に対して。 Pの上 ( R, Ɓ ) その分布関数は等式によって決定されます。 F(バツ) = P((-¥, バツ)), -¥ < バツ <¥, а для любой функции распределения Fそれに対応するのはRです。 Pは、有限数の互いに素な区間関数の和集合からなる集合の代数 £ で定義されます。 F 1 (バツ) は 0 から 1 まで直線的に増加します。関数を構築するには F 2 (バツ) セグメントは、セグメント 、インターバル (1/3、2/3) 、およびセグメント に分割されます。 関数 F 2 (バツ) 区間 (1/3, 2/3) 上の値は 1/2 に等しく、セグメント上では 0 から 1/2 まで、およびセグメント上では 1/2 から 1 まで直線的に増加します。 このプロセスは継続し、機能は ふん+1 は次の関数変換を使用して取得されます。 ふん, n³ 2. 関数が実行される間隔 ふん(バツ) は一定であり、 ふん +1 (バツ) と一致する ふん(バツ)。 機能が発揮される各セグメント ふん(バツ) から直線的に増加します ある前に b、セグメント 、区間 (a + (a - b)/3、a + 2(b - a)/3) 、セグメント に分割されます。 指定した間隔で ふん +1 (バツ) は ( ある + b)/2、および指定されたセグメント上 ふん +1 (バツ) から直線的に増加します ある前に ( ある + b)/2そして( ある + b)/2から bそれぞれ。 それぞれ0ポンド バツ£1 シーケンス ふん(バツ), n= 1、2、...、ある数値に収束します F(バツ)。 分布関数の数列 ふん, n= 1, 2,..., は等連続なので、極限分布関数 F(バツ)は連続です。 この関数は、成長点がなく、これらの区間の合計の長さは 1 である可算区間セット (区間ごとに関数の値が異なります) では定数です。 したがって、次のルベーグ測度は次のようになります。スープをセットする Fはゼロに等しい、つまり F特異な。

各分布関数は次のように表すことができます。

F(バツ) = p交流 F交流 ( バツ) + p d F d ( バツ) + p s F s ( バツ),
どこ F交流、 F dと F s は絶対連続、離散、特異分布関数であり、非負数の合計です。 p交流、 p d および ps は 1 に等しい。 この表現はルベーグ展開と呼ばれ、関数は F交流、 F dと F s - 分解コンポーネント。

次の場合、分布関数は対称と呼ばれます。 F(-バツ) = 1 - F(バツ+ 0) の場合
バツ> 0。対称分布関数が絶対連続である場合、その密度は偶関数です。 確率変数の場合 バツ対称分布がある場合、確率変数 バツそして - バツ均等に分配されます。 対称分布関数の場合 F(バツ) がゼロで連続である場合、 F(0) = 1/2.

確率論でよく使用される絶対連続規則には、一様規則、正規規則 (ガウス規則)、指数規則、コーシー規則などがあります。

R. は区間上で均一と呼ばれます ( ある, b) (またはセグメント [ ある, b]、または間隔をあけて[ ある, b) そして ( ある, b])、密度が一定 (かつ 1/( に等しい) の場合 b - ある)) の上 ( ある, b) であり、( の外側ではゼロに等しい) ある, b)。 ほとんどの場合、(0, 1) 上の一様分布が使用され、その分布関数は F(バツ) はゼロに等しい バツ£ 0、1 に等しい バツ>1 および F(バツ) = バツ 0時< バツ£ 1. (0, 1) の一様確率変数には確率変数があります バツ区間 (0, 1)、この区間のボレル部分集合のセット、およびルベーグ測度から構成される確率空間上の (w) = w。 この確率空間は、「点 w を区間 (0, 1) にランダムに投げる」実験に対応します。ここで、「ランダム」という言葉は、(0, 1) からのすべての点の平等 (「機会均等」) を意味します。 確率空間 (W, Ƒ 、P) 確率変数があります バツ(0, 1) 上で一様分布を使用し、その後任意の分布関数でそれを使用します F確率変数があります Y、分布関数 年度と一致する F。 たとえば、確率変数の分布関数 Y = F -1 (バツ) と一致する F。 ここ F -1 (y) = inf( バツ: F(バツ) > y}, 0 < y < 1; если функция F(バツ) は実数直線全体で連続的で厳密に単調である場合、 F-1 - 逆関数 F.

パラメータ付きの通常の R. ( ある、s 2)、-¥< ある < ¥, s 2 >0、密度のある R と呼ばれる、-¥< バツ < ¥. Чаще всего используется нормальное Р. с параметрами ある= 0 および s 2 = 1、これは標準正規 R と呼ばれます。その分布関数 F( バツ) は初等関数の重ね合わせでは表現されないため、その積分表現 F( バツ) =, -¥ < バツ < ¥. Для фунции распределения F(バツ) 現代のコンピューティング技術が登場する前に必要だった詳細なテーブルが編集されました (関数 F( バツ) は、特別なテーブルを使用して取得することもできます。 関数 erf( バツ))、値 F( バツ) のために バツ> 0 は級数の合計を使用して取得できます

,
そしてのために バツ < 0 можно воспользоваться симметричностью F(バツ)。 パラメータ付きの正規分布関数値 あるそして、s 2 は、F(( バツ - ある)/秒)。 もし バツ 1と バツ 2 パラメータ付きの独立正規分布 ある 1 、s 1 2 および ある 2 , s 2 2 つの確率変数、その合計の分布 バツ 1 + バツ 2 はパラメーターを指定しても問題ありません ある= ある 1 + ある 2 および s 2 = s 1 2 + s 2 2 です。 このステートメントは、ある意味では真逆でもあります。つまり、確率変数の場合 バツパラメータ付き正規分布 あるそしてs2と
バツ = バツ 1 + バツ 2 どこで バツ 1と バツ 2 は定数以外の独立した確率変数であるため、 バツ 1と バツ 2 は正規分布を持ちます (クラマーの定理)。 オプション ある 1 、s 1 2 および ある正規確率変数の 2 , s 2 2 分布 バツ 1と バツ 2に関連する あるおよび s 2 は、上で与えられた等式によって求められます。 標準正規分布は、中心極限定理の極限です。

指数分布は密度のある分布です p(バツ) = 0 バツ < 0 и p(バツ) = l e-l バツバツ³ 0 (l > 0 はパラメータ、その分布関数) F(バツ) = 0 バツ 0ポンドと F(バツ) = 1 - e-l バツバツ> 0 (場合によっては、実軸に沿ったシフトによって示されたプロットとは異なる指数プロットが使用される)。 この R. には、後遺症がないという特性があります。 バツは指数 R を持つ確率変数であり、任意の正の場合 バツそして t

P( バツ > バツ + t | バツ > バツ) = P( バツ > t).
もし バツが故障前のデバイスの動作時間である場合、後遺症がないということは、時刻 0 にオンになったデバイスが故障するまで故障しない確率を意味します。 バツ + t彼がその瞬間まで拒否しなかったことを条件に バツ、に依存しません バツ。 この特性は、「老化」が存在しないものとして解釈されます。 残効がないことは指数分布の特徴的な特性です。絶対連続分布のクラスでは、上記の等式は指数分布 (パラメータ l > 0 を伴う) に対してのみ有効です。 指数関数 R. は、最小スキームでは限界 R. として表示されます。 させて バツ 1 , バツ 2 ,… - 非負の独立同一分布確率変数とその共通分布関数 Fポイント 0 は成長点です。 その後、 n確率変数の®¥分布 Yn= 分( バツ 1 ,…, Xn) 単一の成長点 0 を持つ縮退分布に弱く収束します (これは大数の法則に似ています)。 さらに、ある e > 0 について分布関数が次のように仮定されると、 F(バツ) 区間 (0, e) 上の表現は認められ、 p(あなた)®lで あなた ̄ 0、確率変数 Z の分布関数 n = n 分( バツ 1 ,…, Xn) で n®¥を-¥に均等に< バツ < ¥ сходятся к экспоненциальной функции распределения с параметром l (это - аналог центральной предельной теоремы).

R. Cauchy は密度のある R. と呼ばれます p(バツ) = 1/(p(1 + バツ 2))、-¥< バツ < ¥, его функция рас-пределения F(バツ) = (arctg バツ+ p/2)/p. この R. は、次の問題の解決に関連して 1832 年の S. ポアソンの著作に登場しました: 独立した同一分布の確率変数は存在しますか? バツ 1 , バツ 2 ,... 算術演算の意味 ( バツ 1 + … + Xn)/n毎回 n各確率変数と同じ R を持ちます。 バツ 1 , バツ 2、…? S. ポアソンは、指定された密度の確率変数がこの性質を持つことを発見しました。 これらの確率変数については、大数の法則のステートメントは成り立ちません。つまり、算術演算は ( バツ 1 +…+ Xn)/n成長とともに n退化する。 ただし、これは、指定された分布を満たさない元の確率変数の分布に制限を課すため、大数の法則と矛盾しません (この分布では、1 未満のすべての正の次数の絶対モーメントが存在しますが、数学的な期待は存在しません)。 O. コーシーの作品では、彼の名前を冠した R. が 1853 年に登場しました。R. コーシーは親戚です。 バツ/Y標準正規 P を持つ独立確率変数。

確率論でよく使用される離散変数には、R. ベルヌーイ、二項 R.、および R. ポアソンがあります。

R. ベルヌーイは、2 つの成長点を持つ分​​布を「2 つの成長点を持つ分​​布」と呼びます。 最も一般的に使用される確率変数は R です。 バツ、確率で値0と1を取る
q = 1 - pそして pそれぞれ、0< p < 1 - параметр. Первые формы закона больших чисел и центральной предельной теоремы были получены для случайных величин, имею-щих Р. Бернулли. Если на вероятностном пространстве (W, Ƒ 、P) 順序があります バツ 1 , バツ 2,... それぞれ 1/2 の確率で値 0 と 1 を取る独立した確率変数がある場合、この確率空間上には (0, 1) 上で一様な R を持つ確率変数が存在します。 特に、確率変数は (0, 1) 上で一様分布を持ちます。

パラメータ付きの二項 R. nそして p, n- ナチュラル、0< p < 1, называется Р., с точками роста 0, 1,..., n、確率が集中している C n k p k q n-k, k = 0, 1,…, n,
q = 1 - p。 R金額です n成長点 0 および 1 を持つ R. ベルヌーイを持つ独立確率変数。確率が集中します。 qそして p。 この分布の研究は、J. ベルヌーイを大数の法則の発見に導き、A. モブレを中心極限定理の発見に導きました。

ポアソン公式は、確率 l が集中する一連の点 0、1、... をサポートとする公式と呼ばれます。 -l/ k!, k= 0、1、…、l > 0 はパラメータです。 パラメーター l および m を持つ R. ポアソンを持つ 2 つの独立した確率変数の合計も、パラメーター l + m を持つ R. ポアソンになります。 R. ポアソンはパラメーターを使用した R. ベルヌーイの極限です nそして p = p(n) で n®¥の場合 nそして p関係によって関連付けられている n.p.®lで n®¥ (ポアソンの定理)。 シーケンスが 0 の場合< T 1 < T 2 < T 3 <… есть последовательность моментов времени, в которые происходят некоторые события (так. наз поток событий) и величины T 1 , T 2 -T 1 , T 3 - T 2 ,... は独立した同一分布の確率変数であり、それらに共通する R はパラメータ l > 0 の指数関数であり、確率変数 Xt、間隔内に発生したイベントの数に等しい (0、 t)、parameter.l を持つ R. Poisson があります。 t(このような流れをポアソンと呼びます)。

R の概念には多くの一般化があり、特に多次元の場合と代数構造に拡張されます。

サービスの目的。 オンライン計算機は、確率変数 X の分布表 (実行された実験の数) を作成し、系列のすべての特性 (数学的期待値、分散、標準偏差) を計算するために使用されます。 決定報告書はWord形式で作成されます。
例1. 壺の中 白と 黒いボール。 ボールは白いボールが現れるまで戻らずに壺からランダムに引き出されます。 これが発生するとすぐにプロセスが停止します。
このタイプのタスクは、構築のタスクに関連しています。 幾何分布.

例2。 2 人のスリー シューターがそれぞれターゲットに向かって 1 発の射撃を行います。 最初の射手がそれに命中する確率は 、 2番 - 。 確率変数 X (ターゲットへのヒット数) の分布則を作成します。

例2a。 射手は 2 発、3 発、4 発を発射します。 対応するショットが当たる確率は次のとおりです。 , 。 最初のミスが発生した場合、射手はそれ以降の競技には参加しません。 確率変数 X (ターゲットへのヒット数) の分布則を作成します。

例 3. からのパーティーでは 詳細 標準品の不良品。 コントローラーがランダムに描画します 詳細。 確率変数 X (サンプル内の欠陥のある良品の数) の分布則を作成します。
同様のタスク: かごの中に赤のボールが m 個、青のボールが n 個あります。 K 個のボールがランダムに描画されます。 DSV X の分布の法則、つまり青いボールの出現を作成します。
他の人を見る 解決策の例.

例4. 1 回の試行でイベントが発生する確率は次のとおりです。 。 生産された テスト。 確率変数 X (イベントの発生数) の分布の法則を作成します。
このタイプのディストリビューションの同様のタスク:
1. 1 発で的中する確率が 0.8 の場合、確率変数 X 4 発の命中数の分布則を作成します。
2. コインを7回投げます。 紋章の出現数の数学的期待値と分散を求めます。 紋章の出現数Xの分布を表にしてみます。

例その1。 3枚のコインが投げられます。 1回の投げで紋章を獲得できる確率は0.5です。 確率変数 X (ドロップされたエンブレムの数) の分布則を作成します。
解決。
紋章が描かれない確率: P(0) = 0.5*0.5*0.5= 0.125
P(1) = 0,5 *0,5*0,5 + 0,5*0,5 *0,5 + 0,5*0,5*0,5 = 3*0,125=0,375
P(2) = 0,5 *0,5 *0,5 + 0,5 *0,5*0,5 + 0,5*0,5 *0,5 = 3*0,125=0,375
3 つの紋章を取得できる確率: P(3) = 0.5*0.5*0.5 = 0.125

確率変数 X の分布則:

バツ0 1 2 3
P0,125 0,375 0,375 0,125
チェック: P = P(0) + P(1) + P(2) + P(3) = 0.125 + 0.375 + 0.375 + 0.125 = 1

例その2。 1 人の射手が 1 発でターゲットに命中する確率は、最初の射手の場合は 0.8、2 番目の射手の場合は - 0.85 です。 射手たちは標的に向かって一発発砲した。 ターゲットに命中することを個々の射手にとって独立したイベントとして考慮し、イベント A (ターゲットに正確に 1 回命中する) の確率を求めます。
解決。
イベント A - ターゲットへの 1 回のヒットについて考えてみましょう。 このイベントが発生するために考えられるオプションは次のとおりです。

  1. 最初の射手は命中し、2 番目の射手は外しました: P(A/H1)=p 1 *(1-p 2)=0.8*(1-0.85)=0.12
  2. 最初の射手は外れ、2 番目の射手は標的に命中しました: P(A/H2)=(1-p 1)*p 2 =(1-0.8)*0.85=0.17
  3. 1 番目と 2 番目の矢は互いに独立して標的に当たります: P(A/H1H2)=p 1 *p 2 =0.8*0.85=0.68
この場合、イベント A (ターゲットに正確に 1 回命中する) の確率は次のようになります: P(A) = 0.12+0.17+0.68 = 0.97

サイトの新着情報

>

最も人気のある