アパートのインテリア 信頼区間。 サンプルと信頼区間

信頼区間。 サンプルと信頼区間

統計には、点推定値と区間推定値という 2 種類の推定値があります。 ポイント推定母集団パラメータを推定するために使用される単一の標本統計量です。 たとえば、サンプル平均は 点推定値です 数学的期待母集団と標本分散 S2- 母集団分散の点推定 σ 2。 標本平均値は母集団の数学的期待値の不偏推定値であることが示されています。 すべてのサンプル平均値(サンプルサイズが同じ)の平均であるため、サンプル平均値は不偏と呼ばれます。 n) は、一般集団の数学的期待に等しい。

標本分散を求めるには S2母集団分散の不偏推定値となった σ 2、標本分散の分母は次と等しく設定する必要があります。 n – 1 、 だがしかし n。 言い換えれば、母集団の分散は、考えられるすべての標本分散の平均です。

母集団パラメータを推定するときは,次のような標本統計量を考慮する必要があります。 、特定のサンプルによって異なります。 この事実を考慮に入れると、 間隔の推定一般母集団の数学的期待、サンプル平均の分布を分析します (詳細については、を参照してください)。 構築された区間は、真の母集団パラメーターが正しく推定される確率を表す特定の信頼水準によって特徴付けられます。 同様の信頼区間を使用して、特性の割合を推定できます。 Rそして人口の主な分布集団。

または形式でメモをダウンロード、形式で例をダウンロード

既知の標準偏差を使用して母集団の数学的期待の信頼区間を構築する

母集団における特性のシェアの信頼区間の構築

このセクションでは、信頼区間の概念をカテゴリ データに拡張します。 これにより、母集団における特徴の割合を推定することができます。 Rサンプルシェアを使用する RS= X/n。 示されているように、数量が nRそして n(1 – p)数値が 5 を超えると、二項分布は正規分布として近似できます。 したがって、母集団におけるある特性の割合を推定するには、 R信頼水準が以下に等しい区間を構築することが可能です。 (1 – α)х100%.


どこ pS- 特性のサンプル割合が等しい バツ/n、つまり 成功数をサンプルサイズで割ったもの、 R- 一般集団におけるその特性の割合、 Z- 標準化正規分布の臨界値、 n- サンプルサイズ。

例 3.からだと仮定しましょう 情報システム先月以内に完了した 100 件の請求書のサンプルが抽出されました。 これらの請求書のうち 10 件にエラーが発生したとします。 したがって、 R= 10/100 = 0.1。 95% の信頼水準は臨界値 Z = 1.96 に対応します。

したがって、請求書の 4.12% ~ 15.88% にエラーが含まれる確率は 95% です。

特定のサンプルサイズの場合、母集団内の特徴の割合を含む信頼区間は、連続的なサンプルサイズの場合よりも広く見えます。 確率変数。 これは、連続確率変数の測定値にはカテゴリデータの測定値よりも多くの情報が含まれるためです。 言い換えれば、2 つの値のみを取るカテゴリデータには、その分布のパラメーターを推定するには不十分な情報が含まれています。

有限の母集団から抽出された推定値を計算する

数学的期待値の推定。最終的な母集団の補正係数 ( fpc) を使用して、標準誤差を係数で減少させました。 母集団パラメータ推定値の信頼区間を計算するとき、サンプルが返されずに抽出される状況では補正係数が適用されます。 したがって、信頼水準が次のような数学的期待値の信頼区間になります。 (1 – α)х100%、次の式で計算されます。

例4.有限母集団に対する補正係数の使用を説明するために、例 3 で説明した請求書の平均金額の信頼区間を計算する問題に戻りましょう。会社が毎月 5,000 件の請求書を発行すると仮定します。 バツ=110.27ドル、 S= 28.95ドル N = 5000, n = 100, α = 0.05、t 99 = 1.9842。 式 (6) を使用すると、次のようになります。

機能のシェアの推定。リターンなしを選択する場合、信頼レベルが以下に等しい属性の割合の信頼区間は、 (1 – α)х100%、次の式で計算されます。

信頼区間と倫理的問題

母集団をサンプリングして統計的な結論を導き出す場合、倫理的な問題がしばしば発生します。 主なものは、標本統計量の信頼区間と点推定値がどのように一致するかです。 関連する信頼区間 (通常は 95% の信頼水準) とその導出元のサンプル サイズを指定せずに点推定値を公開すると、混乱が生じる可能性があります。 これにより、ユーザーは点推定値がまさに母集団全体の特性を予測するために必要なものであるという印象を与える可能性があります。 したがって、どのような研究においても、点推定ではなく区間推定に焦点を当てるべきであることを理解する必要があります。 その上、 特別な注意与えられるべきです 正しい選択サンプルサイズ。

ほとんどの場合、統計操作の対象となるのは、特定の政治問題に関する人口の社会学的調査の結果です。 同時に、調査結果は新聞の一面に掲載され、標本誤差や統計分析方法は中間のどこかに掲載されます。 得られた点推定値の妥当性を証明するには、それらの点推定値の取得に基づいたサンプル サイズ、信頼区間の境界、およびその有意性レベルを示す必要があります。

次のメモ

Levin et al. の書籍「Statistics for Managers」の資料が使用されます。 – M.: ウィリアムズ、2004年。 – p. 448–462

中心極限定理は、標本サイズが十分に大きい場合、平均値の標本分布は正規分布で近似できると述べています。 この特性は、母集団の分布の種類には依存しません。

周波数と分数の信頼区間

© 2008

国立公衆衛生研究所、オスロ、ノルウェー

この記事では、角度変換と Agresti - Coull 補正を備えた Wald 法を使用した Wald、Wilson、Clopper - Pearson 法を使用した、周波数と比率の信頼区間の計算について説明します。 提示された資料は、 一般情報頻度と割合の信頼区間を計算する方法について説明しており、ジャーナルの読者が自分の研究結果を発表するときに信頼区間を使用することだけでなく、将来の出版物に取り組む前に専門文献を読むことにも興味を持ってもらうことを目的としています。

キーワード : 信頼区間、頻度、割合

以前の出版物の 1 つでは、質的データの説明について簡単に言及し、母集団における研究対象の特性の発生頻度を説明するには、点推定よりも区間推定の方が好ましいと報告しました。 実際、調査はサンプルデータを使用して行われるため、結果の母集団への投影にはサンプリングの不正確さの要素が含まれているはずです。 信頼区間推定されたパラメータの精度の尺度を表します。 興味深いことに、医師向けの基本統計に関する書籍の中には、度数の信頼区間の話題を完全に無視しているものもあります。 この記事では、頻度の信頼区間を計算するいくつかの方法を見ていき、非反復性や代表性、観測値相互の独立性などのサンプル特性を暗示します。 この記事では、頻度は、特定の値が合計で何回発生するかを示す絶対数としてではなく、研究対象の特性が発生する研究参加者の割合を決定する相対値として理解されます。

生物医学研究では、95% 信頼区間が最も一般的に使用されます。 この信頼区間は、その範囲内の領域を表します。 本当の意味 95%のケースで共有されます。 言い換えれば、集団における形質の出現頻度の真の値は 95% の信頼区間内にあると 95% の信頼性で言えます。

医学研究者向けの統計マニュアルのほとんどは、周波数誤差が次の式を使用して計算されると報告しています。

ここで、p はサンプル内の特性の出現頻度 (0 から 1 までの値) です。 国内の科学論文のほとんどは、サンプル内の形質の出現頻度 (p) とその誤差 (s) を p ± s の形式で示します。 ただし、集団における形質の出現頻度について 95% 信頼区間を提示する方が適切です。これには、次の値が含まれます。

前に。

一部のマニュアルでは、サンプルが小さい場合、1.96 の値を N – 1 自由度の t の値に置き換えることを推奨しています。ここで、N はサンプル内の観測値の数です。 t 値は、ほぼすべての統計学の教科書に記載されている t 分布の表を使用して求められます。 Wald 法での t 分布の使用には、以下で説明する他の方法と比べて目に見える利点がないため、一部の著者は推奨していません。

度数または比率の信頼区間を計算するための上記の方法は、1939 年の Wald と Wolfowitz の出版後に広く使用され始めたため、Abraham Wald (1902 ~ 1950 年) にちなんで Wald と名付けられました。 ただし、この方法自体は 1812 年にピエール シモン ラプラス (1749 ~ 1827) によって提案されました。

Wald 法は非常に人気がありますが、その適用には重大な問題が伴います。 この方法は、サンプル サイズが小さい場合や、特性の発生頻度が 0 または 1 (0% または 100%) になる傾向があり、0 と 1 の頻度では単純に不可能な場合にはお勧めできません。誤差を計算するときに使用される正規分布の近似は、n · p の場合には「機能しません」。< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

新しい変数には 正規分布、変数 φ の 95% 信頼区間の下限と上限は、φ-1.96 および φ+1.96left に等しくなります。">

小さなサンプルの場合は 1.96 の代わりに、N – 1 自由度の t 値を代用することをお勧めします。 この方法負の値を生成せず、Wald 法よりも周波数の信頼区間をより正確に推定できます。 また、国内の多くの医療統計参考書にも記載されていますが、医学研究における普及には至っていません。 角度変換を使用した信頼区間の計算は、0 または 1 に近づく周波数には推奨されません。

医学研究者向けの統計の基礎に関するほとんどの書籍では、信頼区間の推定方法の説明は通常ここで終わりますが、この問題は国内だけでなく、医療研究者にとっても典型的な問題です。 外国文学。 どちらの方法も中心極限定理に基づいており、サンプルが大きいことを意味します。

上記の方法を使用した信頼区間の推定の欠点を考慮して、Clopper と Pearson は 1934 年に、いわゆる正確な信頼区間を計算する方法を提案しました。 二項分布研究中の特性。 この方法は多くのオンライン計算機で利用できますが、この方法で得られる信頼区間はほとんどの場合広すぎます。 同時に、この方法は保守的な評価が必要な場合の使用をお勧めします。 サンプルサイズが減少するにつれて、特に N の場合、方法の保守性の程度は増加します。< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

多くの統計学者によると、頻度の信頼区間の最適な評価は、1927 年に提案されたウィルソン法によって実行されますが、国内の生物医学研究では実際には使用されていません。 この方法では、非常に小さい周波数と非常に大きい周波数の両方の信頼区間を推定できるだけでなく、少数の観測値にも適用できます。 で 一般的な見解ウィルソンの公式による信頼区間は次の形式になります。



ここで、 は 95% 信頼区間を計算するときに値 1.96 をとり、N は観測値の数、p はサンプル内の特性の発生頻度です。 この方法はオンライン計算機で利用できるため、問題なく使用できます。 また、n p に対してこの方法を使用することはお勧めしません。< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Wilson 法に加えて、Agresti-Coll 補正を備えた Wald 法も、周波数の信頼区間の最適な推定値を提供すると考えられています。 Agresti-Coll 補正は、分子に 2 を加算し、分母に 4 を加算することを計算する際に、サンプル (p) における特性の発生頻度を Wald の式で p` に置き換えることです。 p` = (X + 2) / (N + 4)、ここで、X は研究対象の特性を持つ研究参加者の数、N はサンプルサイズです。 この変更により、イベント頻度が 0% または 100% に近づき、サンプルが小さい場合を除いて、ウィルソンの式と非常によく似た結果が得られます。 周波数の信頼区間を計算するための上記の方法に加えて、小さなサンプルに対する Wald 法と Wilson 法の両方に対して連続性補正が提案されていますが、研究ではその使用が不適切であることが示されています。

2 つの例を使用して、信頼区間を計算するための上記の方法の適用を考えてみましょう。 最初のケースでは、ランダムに選択された 1,000 人の研究参加者から成る大規模なサンプルを研究します。そのうち 450 人が研究対象の特性 (これは危険因子、結果、またはその他の特性である可能性があります) を持っており、頻度は 0.45、つまり 45 です。 %。 2 番目のケースでは、研究は少数のサンプル、たとえばわずか 20 人を使用して実行され、研究対象の特性を持つ研究参加者は 1 人 (5%) だけです。 Wald 法、Agresti-Coll 補正を使用した Wald 法、および Wilson 法を使用した信頼区間は、Jeff Sauro によって開発されたオンライン計算機 (http://www./wald.htm) を使用して計算されました。 ウィルソンの連続性補正信頼区間は、Wassar Stats: 統計計算の Web サイト (http://faculty.vassar.edu/lowry/prop1.html) によって提供される計算機を使用して計算されました。 角度フィッシャー変換計算は、それぞれ 19 および 999 自由度の臨界 t 値を使用して手動で実行されました。 両方の例の計算結果を表に示します。

6 つの方法で計算された信頼区間 違う方法本文で説明されている 2 つの例については、

信頼区間の計算方法

P=0.0500、または 5%

X=450、N=1000、P=0.4500、または 45% の 95% CI

–0,0455–0,2541

アグレスティ=コル補正を施したヴァルト

<,0001–0,2541

連続性補正付きウィルソン

クロッパー・ピアソンの「正確な方法」

角度変換

<0,0001–0,1967

表からわかるように、最初の例では、「一般的に受け入れられている」Wald 法を使用して計算された信頼区間は負の領域に入りますが、頻度の場合はこのようなことはあり得ません。 残念なことに、ロシア文学ではこのような事件は珍しいことではない。 頻度とその誤差に関してデータを表現する従来の方法では、この問題が部分的に隠蔽されます。 たとえば、ある形質の発生頻度(パーセンテージ)が 2.1 ± 1.4 と示されている場合、これは 2.1%(95% CI: -0.7; 4.9)ほど「目に不快」ではありませんが、同じこと。 Agresti-Coll 補正と角度変換を使用した計算を備えた Wald 法では、ゼロに近づく下限が得られます。 ウィルソンの連続性補正方法と「正確な方法」では、ウィルソンの方法よりも広い信頼区間が生成されます。 2 番目の例では、すべての方法でほぼ同じ信頼区間が得られます (違いは 1000 分の 1 でのみ表示されます)。この例のイベントの発生頻度は 50% とそれほど変わらず、サンプル サイズは次のとおりであるため、これは驚くべきことではありません。かなり大きい。

この問題に興味のある読者には、R. G. Newcombe と Brown、Cai と Dasgupta の著作をお勧めします。これらの著作では、信頼区間を計算するためにそれぞれ 7 種類と 10 種類の異なる方法を使用する場合の長所と短所が示されています。 国内のマニュアルの中では、理論の詳細な説明に加えて、Wald と Wilson の方法、二項頻度分布を考慮した信頼区間の計算方法が紹介されている、およびという本をお勧めします。 無料のオンライン計算ツール (http://www./wald.htm および http://faculty.vassar.edu/lowry/prop1.html) に加えて、度数の信頼区間 (それだけではありません!) は、 CIA プログラム (信頼区間分析)。http://www からダウンロードできます。 医大。 ソトン。 交流。 英国/シア/ 。

次の記事では、定性データを比較する単変量の方法について説明します。

参考文献

バネルジ A.明確な言語での医療統計: 入門コース / A. Banerjee。 – M.: 実践医学、2007. – 287 p. 医療統計 / 。 – M.: Medical Information Agency、2007. – 475 p. グランツ S.医学および生物学的統計 / S. Glanz。 – M.: プラクティカ、1998 年。 データの種類、分布テスト、記述統計 // 人間の生態学 – 2008. – No. 1. – P. 52–58. ジジン K.S.。 医療統計: 教科書 / 。 – ロストフ n/d: フェニックス、2007. – 160 p. 応用医療統計 / 、 。 - サンクトペテルブルク。 : Foliot、2003. – 428 p. レイキン G.F。 生体認証 / 。 – M.: 高校、1990年。 – 350 p. メディック V.A。 医学における数学的統計 / 、 。 – M.: 財務と統計、2007. – 798 p. 臨床研究における数学的統計 / 、 。 – M.: GEOTAR-MED、2001. – 256 p. ユンケロフ 5 世. そして。 医学研究データの医学的および統計的処理 / 、 。 - サンクトペテルブルク。 : VmedA、2002. – 266 p. アグレスティ A.二項比率の区間推定では、正確より近似の方が優れています / A. アグレスティ、B. クール // アメリカの統計学者。 – 1998. – N 52. – P. 119–126。 アルトマン D.信頼できる統計 // D. Altman、D. Machinen、T. Bryant、M. J. Gardner。 – ロンドン: BMJ Books、2000. – 240 p. ブラウン L.D.二項比率の区間推定 / L. D. Brown、T. T. Cai、A. Dasgupta // 統計科学。 – 2001. – N 2. – P. 101–133。 クロッパー C.J.二項分布の場合に示された信頼限界または基準限界の使用 / C. J. Clopper、E. S. Pearson // Biometrika. – 1934. – N 26. – P. 404–413。 ガルシア ペレス M.A。 二項パラメータの信頼区間について / M. A. Garcia-Perez // 質と量。 – 2005. – N 39. – P. 467–481。 モトゥルスキー H.直感的な生物統計 // H. モトゥルスキー。 – オックスフォード: オックスフォード大学出版局、1995。 – 386 p. ニューカム R.G.単一比率の両側信頼区間: 7 つの方法の比較 / R. G. Newcombe // Statistics in Medicine. – 1998. – N. 17. – P. 857–872。 サウロ J.二項信頼区間を使用した小さなサンプルからの完了率の推定: 比較と推奨事項 / J. Sauro、J. R. Lewis // ヒューマンファクターおよび人間工学学会年次総会の議事録。 – フロリダ州オーランド、2005 年。 ヴァルド A.連続分布関数の信頼限界 // A. Wald、J. Wolfovitz // 数学統計年報。 – 1939. – N 10. – P. 105–118。 ウィルソン E.B.。 確率的推論、継承の法則、および統計的推論 / E. B. ウィルソン // 米国統計協会ジャーナル。 – 1927. – N 22. – P. 209–212。

割合の信頼区間

A. M. グリボフスキー

国立公衆衛生研究所、オスロ、ノルウェー

この記事では、二項比例の信頼区間を計算するためのいくつかの方法、つまり、Wald 法、Wilson 法、arcsine 法、Agresti-Coull 法、および正確な Clopper-Pearson 法を紹介します。 この論文は、二項比率の信頼区間推定の問題について一般的な紹介をしているだけであり、その目的は、読者が自身の実証研究の結果を提示する際に信頼区間を使用するよう刺激するだけでなく、統計の本を参照することを奨励することです。自分のデータを分析して原稿を準備する前に。

キーワード: 信頼区間、割合

連絡先:

ノルウェー、オスロの国立公衆衛生研究所上級顧問

その他の値はすべて、理論上の類似値の推定値であり、サンプルではなく一般母集団が入手できた場合に得られるものです。 しかし、悲しいことに、一般の人は非常に高価で、アクセスできないことがよくあります。

間隔推定の概念

どのサンプル推定にもある程度のばらつきがあります。 は、特定のサンプルの値に応じた確率変数です。 したがって、より信頼性の高い統計的結論を得るには、点推定値だけでなく、確率の高い区間も知る必要があります。 γ (ガンマ) 評価されたインジケーターをカバーします θ (シータ)。

正式には、これらはそのような2つの値です(統計) T1(X)そして T2(X)、 何 T1< T 2 、与えられた確率レベルで γ 条件が満たされています:

要するに、その可能性が高い γ またはそれ以上、真のインジケーターはポイントの間にあります T1(X)そして T2(X)、下限と上限と呼ばれます 信頼区間.

信頼区間を構築するための条件の 1 つは、信頼区間の最大の狭さです。 できるだけ短くする必要があります。 その欲求はごく自然なものです、なぜなら... 研究者は、目的のパラメータの位置をより正確に特定しようとします。

したがって、信頼区間は分布の最大確率をカバーする必要があります。 そして評価自体が中心にあるべきです。

つまり、(推定からの真の指標が)上方に逸脱する確率は、下方に逸脱する確率に等しいということです。 非対称分布の場合、右側の間隔は左側の間隔と等しくないことにも注意してください。

上の図は、信頼確率が大きいほど間隔が広くなり、直接的な関係があることを明確に示しています。

これは、未知のパラメータの区間推定理論への短い紹介でした。 数学的期待値の信頼限界を見つけることに移りましょう。

数学的期待値の信頼区間

元のデータが に分散している場合、平均は正規値になります。 これは、正規値の線形結合にも正規分布があるという規則に従います。 したがって、確率を計算するには、正規分布則の数学的装置を使用できます。

ただし、これには、期待値と分散という 2 つのパラメータを知る必要がありますが、これらは通常は不明です。 もちろん、パラメーターの代わりに推定値 (算術平均と ) を使用することもできますが、その場合、平均の分布は完全に正規分布にはならず、下方にわずかに平坦になります。 この事実はアイルランドの市民ウィリアム・ゴセットによって巧みに指摘され、彼の発見をバイオメトリカ誌の 1908 年 3 月号に発表しました。 秘密保持の目的で、ゴセットは自分自身に「学生」と署名しました。 これが Student t 分布の様子です。

しかし、K. ガウスが天文観測の誤差を分析する際に使用したデータの正規分布は、地球上の生活では非常にまれであり、確立するのは非常に困難です(高精度を得るには約 2,000 回の観測が必要です)。 したがって、正規性の仮定を破棄し、元のデータの分布に依存しない方法を使用することが最善です。

未知の分布のデータから算術平均を計算した場合、その分布はどうなるのかという疑問が生じます。 答えはよく知られた確率論によって与えられます。 中心極限定理(CPT)。 数学では、これにはいくつかの変形がありますが (定式化は長年にわたって洗練されてきました)、それらはすべて、大まかに言えば、多数の独立した確率変数の合計は正規分布の法則に従うというステートメントに要約されます。

算術平均を計算するときは、確率変数の合計が使用されます。 ここから、算術平均には正規分布があり、期待値は元のデータの期待値、分散は であることがわかります。

賢い人は CLT を証明する方法を知っていますが、Excel で行われる実験を利用してこれを検証します。 50 個の均一に分布した確率変数のサンプルをシミュレートしてみましょう (Excel 関数 RANDBETWEEN を使用)。 次に、そのようなサンプルを 1000 個作成し、それぞれの算術平均を計算します。 それらの分布を見てみましょう。

平均値の分布が正規則に近いことがわかります。 サンプルのサイズと数をさらに大きくすると、類似性はさらに良くなります。

CLT の妥当性を自分の目で確認したので、 を使用して、与えられた確率で真の平均または数学的期待値をカバーする算術平均の信頼区間を計算できます。

上限と下限を設定するには、正規分布のパラメータを知る必要があります。 原則として、何もないため、推定値が使用されます。 算術平均そして 標本分散。 繰り返しますが、この方法ではサンプルが大きい場合にのみ良好な近似が得られます。 サンプルが小さい場合は、多くの場合、Student 分布を使用することをお勧めします。 信じないでください! 平均値のスチューデント分布は、元のデータが正規分布している場合にのみ発生します。つまり、ほとんど発生しません。 したがって、必要なデータ量の最低基準を直ちに設定し、漸近的に正しい方法を使用することをお勧めします。 彼らは 30 回の観察で十分だと言います。 50 を選択してください - 間違いはありません。

T1.2– 信頼区間の下限と上限

– サンプルの算術平均

s0– サンプルの標準偏差 (不偏)

n - サンプルサイズ

γ – 信頼確率 (通常は 0.9、0.95、または 0.99 に等しい)

c γ =Φ -1 ((1+γ)/2)– 標準正規分布関数の逆数値。 簡単に言えば、これは算術平均から下限または上限までの標準誤差の数です (これら 3 つの確率は 1.64、1.96、および 2.58 の値に対応します)。

この式の本質は、算術平均を取得し、それから一定の量を確保することです ( γ付き) 標準誤差 ( s0/√n)。 すべてはわかっているので、それを受け入れて検討してください。

パソコンが普及する前は、正規分布関数やその逆関数の値を求めていました。 これらは現在でも使用されていますが、既製の Excel 式を使用する方が効率的です。 上記の式のすべての要素 ( 、 、 ) は Excel で簡単に計算できます。 しかし、信頼区間を計算するための既製の公式があります - TRUST.NORM。 その構文は次のとおりです。

CONFIDENCE.NORM(アルファ;標準オフ;サイズ)

アルファ– 有意水準または信頼水準。上で採用した表記では 1-γ に等しくなります。つまり、 数学的確率期待値は信頼区間の外になります。 信頼水準が 0.95 の場合、アルファは 0.05 になります。

標準オフ– サンプルデータの標準偏差。 標準誤差を計算する必要はありません。Excel 自体が n の平方根で除算します。

サイズ– サンプルサイズ (n)。

CONFIDENCE NORM 関数の結果は、信頼区間を計算する式の 2 番目の項です。 半間隔 したがって、下限点と上限点は平均値±求められた値となります。

したがって、元のデータの分布に依存しない、算術平均の信頼区間を計算するための普遍的なアルゴリズムを構築することが可能です。 普遍性の代償は、その漸近的な性質です。 比較的大きなサンプルを使用する必要がある。 ただし、現代のテクノロジーの時代では、必要な量のデータを収集することは通常は難しくありません。

信頼区間を使用した統計的仮説のテスト

(モジュール111)

統計学で解決される主な問題の 1 つは次のとおりです。 その本質は簡単に次のとおりです。 たとえば、一般人口の期待がある値に等しいと仮定します。 次に、与えられた期待値に対して観察できる標本平均の分布が構築されます。 次に、この条件付き分布のどこに実際の平均が位置するかを調べます。 それが許容限界を超えた場合、そのような平均が現れる可能性は非常に低く、実験を一度繰り返したとしても、それはほとんど不可能であり、提案された仮説と矛盾しますが、この仮説は首尾よく棄却されました。 平均が臨界レベルを超えない場合、仮説は棄却されません (ただし証明もされません!)。

したがって、信頼区間の助けを借りて、今回の期待値の場合には、いくつかの仮説を検証することもできます。 やり方はとても簡単です。 特定のサンプルの算術平均が 100 であるとします。仮説は、期待値がたとえば 90 であるとテストされます。つまり、原始的に質問を投げかけると、次のように聞こえます。平均値が 90 に等しい場合、観察された平均値は 100 であることが判明しましたか?

この質問に答えるには、標準偏差とサンプル サイズに関する情報がさらに必要になります。 標準偏差が 30 で、観測値の数が 64 であると仮定します (根を簡単に抽出するため)。 この場合、平均の標準誤差は 30/8、つまり 3.75 になります。 95% 信頼区間を計算するには、平均値の両側に 2 つの標準誤差 (より正確には 1.96) を加算する必要があります。 信頼区間は約 100±7.5、つまり 92.5 ~ 107.5 になります。

さらなる推論は次のとおりです。 テストされる値が信頼区間内にある場合、仮説と矛盾しません。 ランダムな変動の範囲内に収まります (確率 95%)。 チェックされる点が信頼区間の外にある場合、そのようなイベントが発生する確率は非常に小さく、いずれの場合も許容レベルを下回ります。 これは、仮説が観察データと矛盾するとして拒否されることを意味します。 この場合、期待値に関する仮説は信頼区間の外にあるため (検定値 90 は区間 100±7.5 に含まれていません)、この仮説は棄却される必要があります。 上記の原始的な質問に答えると、「いいえ、そんなことはありません。いずれにせよ、このようなことは非常にまれに起こります」と言うべきです。 多くの場合、それらは、信頼区間が構築された指定されたレベルではなく、仮説を誤って棄却する特定の確率 (p レベル) を示しますが、これについてはまた別の機会に説明します。

ご覧のとおり、平均値 (または数学的期待値) の信頼区間を構築することは難しくありません。 重要なのは本質を理解することであり、そうすれば物事は先に進むでしょう。 実際には、ほとんどの場合、95% 信頼区間が使用されます。これは、平均の両側で約 2 標準誤差の幅です。

それは今のところすべてです。 ではごきげんよう!

前のサブセクションでは、未知のパラメータを推定する問題について検討しました。 1 つの数字。 これは「点」推定と呼ばれます。 多くのタスクでは、パラメータを見つけるだけでなく、 適切な数値を設定するだけでなく、その精度と信頼性を評価することもできます。 パラメータの置換によってどのようなエラーが発生する可能性があるかを知る必要があります その推定点 また、これらの誤差が既知の制限を超えないことはどの程度の信頼度で期待できるのでしょうか?

この種の問題は、点推定が行われる場合、少数の観測値に特に関連します。 そしてではほとんどがランダムであり、a を a に近似的に置き換えると、重大なエラーが発生する可能性があります。

見積もりの​​正確性と信頼性を把握するため ,

数学的統計では、いわゆる信頼区間と信頼確率が使用されます。

パラメータを見てみましょう 経験から得られた不偏推定値 A.この場合に起こり得る誤差を推定したいと考えています。 確率 p のイベントが実質的に信頼できるとみなせるように、十分に大きな確率 p (たとえば、p = 0.9、0.95、または 0.99) を割り当てて、次の値 s を見つけてみましょう。

次に、交換中に発生する誤差の実際に起こり得る値の範囲 の上 、±sになります。 絶対値における大きな誤差は、低い確率 a = 1 - p でのみ発生します。 (14.3.1) を次のように書き換えてみましょう。

等式 (14.3.2) は、確率 p でパラメータの未知の値が得られることを意味します。 間隔内に収まる

1つの状況に注意する必要があります。 これまで、ランダム変数が特定の非ランダム区間に該当する確率を繰り返し検討してきました。 ここでは状況が異なります。 はランダムではありませんが、間隔 / p はランダムです。 X 軸上の位置はランダムであり、中心によって決まります。 ; 一般に、s の値は原則として実験データから計算されるため、間隔 2s の長さもランダムです。 したがって、この場合、p 値をポイントに「当たる」確率として解釈するのではなく、 間隔 / p 内で、ランダムな間隔 / p が点をカバーする確率として (図14.3.1)。

米。 14.3.1

確率 p は通常、 信頼確率、および間隔 / p - 信頼区間。間隔の境界 もし。 a x = a-a 2 = a +そして呼ばれます 信頼の境界線。

信頼区間の概念に別の解釈を加えてみましょう。信頼区間はパラメータ値の区間と考えることができます。 あ、実験データと互換性があり、矛盾しないこと。 確かに、確率 a = 1-p のイベントを考えることに同意すると、実際には不可能になります。その場合、パラメータ a の値は、 ああ> s は矛盾する実験データとして認識されなければなりません。また、 |a - あたな 2 。

パラメータを見てみましょう 不偏推定値がある A.量の分布の法則を知っていたら の場合、信頼区間を見つけるタスクは非常に簡単です。次の値 s を見つけるだけで十分です。

問題は、推定値の分布の法則です。 量の分布法則に依存する バツその結果、その未知のパラメータ (特にパラメータ自体) A)。

この問題を回避するには、次のおおよその近似手法を使用できます。s の式内の未知のパラメーターを点推定値に置き換えます。 比較的多くの実験を行った結果、 P(約 20...30) この手法では通常、精度の点で満足のいく結果が得られます。

例として、数学的期待値の信頼区間の問題を考えてみましょう。

生産させてください P バツ、その特性は数学的期待値です Tと分散 D- 未知。 これらのパラメータについて次の推定値が得られました。

数学的期待の信頼確率 p に対応する信頼区間 / p を構築する必要があります。 Tバツ。

この問題を解くとき、量が次のとおりであるという事実を利用します。 T合計を表します P独立した同一分布の確率変数 Xhそして中心極限定理によれば、十分に大きい場合、 Pその分布則は正常に近いです。 実際には、項の数が比較的少ない場合 (約 10 ~ 20)、合計の分布法則はほぼ正規であると考えることができます。 値を仮定します T通常の法律に従って配布されます。 この法則の特性、つまり数学的な期待値と分散はそれぞれ等しい Tそして

(第 13 章、サブセクション 13.3 を参照)。 値を仮定しましょう D私たちは値 Ep を知っており、それを見つけるつもりです。

第6章の式(6.3.5)を用いて、(14.3.5)の左辺の確率を正規分布関数で表現します。

推定値の標準偏差はどこですか T.

式から

Sp の値を求めます。

ここで、arg Ф* (х) は Ф* の逆関数です。 (バツ)、それらの。 正規分布関数が次と等しい引数の値 バツ。

分散 D、それを通して量が表現される 1P、正確にはわかりません。 おおよその値として、推定値を使用できます。 D(14.3.4) そしておよそ次のように入力します。

したがって、信頼区間を構築する問題はほぼ解決され、次のようになります。

ここで、gp は式 (14.3.7) によって決定されます。

s p を計算するときに関数 Ф* (l) のテーブルでの逆補間を回避するには、量の値を与える特別なテーブル (表 14.3.1) をコンパイルすると便利です。

rに応じて。 値 (p は、正規法則において、結果の領域に入る確率が p に等しくなるように、分散の中心から左右にプロットする必要がある標準偏差の数を決定します。

7 p の値により、信頼区間は次のように表されます。

表14.3.1

例 1. 量について 20 の実験が行われました。 バツ;結果を表に示します。 14.3.2.

表14.3.2

数量の数学的期待から推定値を見つけることが必要です バツそして、信頼確率 p = 0.8 に対応する信頼区間を構築します。

解決。我々は持っています:

参照点として l: = 10 を選択し、3 番目の式 (14.2.14) を使用して不偏推定値を求めます。 D :

表によると 14.3.1 私たちが見つけたもの

信頼限界:

信頼区間:

パラメータ値 Tさんこの間隔内にあるデータは、表に示した実験データと一致します。 14.3.2.

分散の信頼区間も同様の方法で構築できます。

生産させてください P確率変数に関する独立した実験 バツ A と分散の両方のパラメータが不明 D不偏推定値が得られました。

分散の信頼区間を近似的に構築する必要があります。

式 (14.3.11) から、次の量が明らかです。 Dを表します

Pの形式の確率変数。 これらの値はそうではありません

それらのいずれかに数量が含まれるため、独立しています。 Tさん他の人に依存しています。 ただし、増加するにつれて、 Pそれらの合計の分布法則も正規に近づきます。 もうすぐ P= 20...30 はすでに正常であると考えられます。

これがそうだと仮定して、この法則の特徴、つまり数学的期待値と分散を見つけてみましょう。 評価以来 D- 偏りのないものであれば M[D] = D。

分散の計算 D Dは比較的複雑な計算に関連付けられているため、導出せずにその式を示します。

ここで、q 4 は大きさの 4 番目の中心モーメントです。 バツ。

この式を使用するには、\u003d 4 と 4 の値を置き換える必要があります。 D(少なくとも近いものは)。 の代わりに D彼の評価を利用することができます D.原則として、4 番目の中心モーメントは、次の形式の値などの推定値で置き換えることもできます。

しかし、一般に限られた数の実験では高次モーメントが大きな誤差を伴って決定されるため、このような置き換えでは精度が非常に低くなります。 しかし、実際には、量分布の法則のタイプによって次のようなことがよく起こります。 バツ事前にわかっています: パラメータのみが不明です。 次に、μ 4 を次のように表現してみることができます。 D.

最も一般的なケースを考えてみましょう。 バツ通常の法律に従って配布されます。 次に、その 4 番目の中心モーメントは分散の観点から表現されます (第 6 章、サブセクション 6.2 を参照)。

そして式 (14.3.12) は次のようになります。 または

(14.3.14) の不明な部分を置き換える D彼の評価 D、どこから得られますか

モーメントμ 4 は次のように表すことができます。 D他の場合でも、値の分布が バツは正常ではありませんが、その外観は知られています。 たとえば、一様密度の法則 (第 5 章を参照) については、次のようになります。

ここで、(a, P) は、法則が指定される間隔です。

したがって、

式 (14.3.12) を使用すると、次のようになります。 およそどこで見つけますか

数量 26 の分配法則の種類が不明な場合でも、値 a/) の概算を行うときは、この法則が正しいと信じる特別な理由がない限り、式 (14.3.16) を使用することをお勧めします。通常のものとは大きく異なります (顕著な正または負の尖度があります)。

近似値 a/) が何らかの方法で得られた場合、数学的期待に対して構築したのと同じ方法で分散の信頼区間を構築できます。

ここで、与えられた確率 p に応じた値はテーブルに従って求められます。 14.3.1.

例 2. 確率変数の分散の約 80% 信頼区間を求める バツ例 1 の条件下で、値が既知である場合 バツ通常に近い法律に従って配布されています。

解決。値は表と同じままです。 14.3.1:

式(14.3.16)によると

式 (14.3.18) を使用して信頼区間を求めます。

標準偏差値の対応する範囲: (0.21; 0.29)。

14.4. 正規法則に従って分布する確率変数のパラメータの信頼区間を構築するための正確な方法

前のサブセクションでは、数学的な期待値と分散の信頼区間を構築するための大まかな近似方法を検討しました。 ここでは、同じ問題を解決するための正確な方法のアイデアを示します。 信頼区間を正確に求めるためには、量の分布法則の形式を事前に知ることが絶対に必要であることを強調します。 バツ、一方、近似法の適用ではこれは必要ありません。

信頼区間を構築するための正確な方法の考え方は、次のようになります。 信頼区間は、特定の不等式を満たす確率を表す条件から求められます。これには、関心のある推定値が含まれます。 A.評価分布の法則 一般的な場合、量の未知のパラメータに依存します バツ。ただし、確率変数から不等式を渡すことができる場合があります。 観測値の他の関数に XpX2、 ..., ×p.その分布法則は未知のパラメータには依存せず、実験の数と量の分布法則の種類にのみ依存します。 バツ。これらの種類の確率変数は、数学的統計において重要な役割を果たします。 それらは量の正規分布の場合について最も詳細に研究されています。 バツ。

たとえば、値の正規分布では、 バツランダムな値

いわゆる 学生分配法P- 1 自由度; この法則の密度は次のような形になります。

ここで、G(x) は既知のガンマ関数です。

確率変数が

には「%2 ディストリビューション」があります P- 1 自由度 (第 7 章を​​参照)、その密度は次の式で表されます。

分布 (14.4.2) と (14.4.4) の導出にはこだわらず、パラメーターの信頼区間を構築するときにそれらをどのように適用できるかを示します。 Dさん

生産させてください P確率変数に関する独立した実験 バツ、パラメータが不明な正規分布 に。これらのパラメータについて、推定値が得られました。

信頼確率 p に対応する両方のパラメーターの信頼区間を構築する必要があります。

まず数学的期待値の信頼区間を構築しましょう。 この区間を次の点に対して対称にとるのが自然です。 T; s p が区間の長さの半分を表すものとします。 値 s p は条件が満たされるように選択する必要があります

確率変数から等式 (14.4.5) の左辺に移動してみます。 T確率変数に Tさん学生法に従って配布されます。 これを行うには、不等式 |m-w?| の両辺を掛けます。

正の値で指定すると: または、表記法 (14.4.1) を使用すると、

条件から値 / p が見つかるような数値 / p を見つけてみましょう

式 (14.4.2) から、(1) が偶関数であることは明らかです。したがって、(14.4.8) は次のようになります。

等式 (14.4.9) は、p に応じて値 / p を決定します。 整数値の表を自由に使える場合

/p の値はテーブル内の逆補間によって見つけることができます。 ただし、 /p 値のテーブルを事前に作成しておくと便利です。 このような表は付録 (表 5) に記載されています。 この表は、信頼水準 p と自由度の数に応じた値を示しています P- 1. 表から / p を決定します。 5と仮定すると

信頼区間の幅の半分 / p と区間自体を求めます。

例 1. 確率変数に対して 5 つの独立した実験を実行しました。 バツ、パラメータが不明な正規分布 Tそしてについて。 実験結果を表に示す。 14.4.1.

表14.4.1

評価を探す T数学的期待値を計算し、それに対する 90% 信頼区間 / p (つまり、信頼確率 p = 0.9 に対応する区間) を構築します。

解決。我々は持っています:

申請書の表5によると、 P - 1 = 4 および p = 0.9 が得られます。 どこ

信頼区間は次のようになります。

例 2. セクション 14.3 の例 1 の条件について、次の値を仮定します。 バツ正規分布している場合、正確な信頼区間を見つけます。

解決。付録の表 5 によると、次のことがわかります。 P - 1 = 19ir =

0.8 / p = 1.328; ここから

セクション 14.3 の例 1 の解法 (e p = 0.072) と比較すると、その矛盾は非常にわずかであることがわかります。 小数点第 2 位までの精度を維持すると、正確な方法と近似的な方法で求められた信頼区間は一致します。

分散の信頼区間の構築に進みましょう。 不偏分散推定量を検討する

そして確率変数を表現します D大きさを通して V(14.4.3)、分布 x 2 (14.4.4) を持つ:

量の分布の法則を知る V、指定された確率 p で該当する区間 /(1) を見つけることができます。

分配の法則 kn_x(v)マグニチュード I 7 は図に示す形になります。 14.4.1.

米。 14.4.1

疑問が生じます: 間隔 / p をどのように選択するか? 大きさの分布の法則がある場合 V対称であった場合 (正規法則やスチューデント分布のように)、区間 /p が数学的期待に関して対称であると考えるのは自然でしょう。 この場合、法律は k p_x (v)非対称。 値の確率が以下になるように間隔 /p を選択することに同意しましょう。 V左右の間隔を越えた部分(図 14.4.1 の斜線部分)は同じで等しい

このプロパティを使用して間隔 /p を構築するには、テーブルを使用します。 4 つのアプリケーション: 数字が含まれています や)そのような

価値のために V、 r 自由度の x 2 分布を持ちます。 私たちの場合には r = n- 1. 修正しましょう r = n- 1 を選択し、テーブルの対応する行を検索します。 4 2つの意味 ×2 - 1 つは確率に対応し、もう 1 つは確率に対応します。

価値観 2時にそして XL?間隔は y2、あなたの左手で、そして や〜右端。

ここで、区間 / p から、境界 D の分散に対する目的の信頼区間 /| を見つけてみましょう。 D2、それは要点をカバーします D確率 p で:

点をカバーする区間 / (, = (?> ь А) を作成しましょう D値がその場合に限り V区間 /r に入ります。 間隔が

この条件を満たします。 確かに、不平等は、 は不等式と等価です

そしてこれらの不等式は確率 p で満たされます。 したがって、分散の信頼区間が求まり、式 (14.4.13) で表されます。

例 3. 値が既知である場合、サブセクション 14.3 の例 2 の条件の下で分散の信頼区間を求めます。 バツ通常配布されます。

解決。我々は持っています 。 付録の表 4 によると

で見つけます r = n - 1 = 19

式 (14.4.13) を使用して、分散の信頼区間を求めます。

標準偏差に対応する区間は (0.21; 0.32) です。 この間隔は、近似法を使用してセクション 14.3 の例 2 で得られた間隔 (0.21; 0.29) をわずかに超えるだけです。

  • 図 14.3.1 は、a に関して対称な信頼区間を考慮しています。 後で説明するように、一般に、これは必要ありません。

この記事では次のことを学びます:

    どうしたの 信頼区間?

    ポイントは何ですか 3 シグマの法則?

    この知識を実際にどのように適用できるでしょうか?

現在、多種多様な製品、販売方向、従業員、活動分野などに関連する情報が過剰に存在しているため、 重要なことを強調するのは難しいかもしれません、まず第一に、これに注意を払い、管理する努力をする価値があります。 意味 信頼区間そしてその限界を超えた実際の値の分析 - 技術 状況を強調するのに役立ちます, 変化するトレンドに影響を与える。ポジティブな要素を開発し、ネガティブな要素の影響を軽減できるようになります。 このテクノロジーは多くの有名な世界的企業で使用されています。

いわゆる「」があります。 アラート」、 どれの マネージャーに知らせる次の値が特定の方向にあること 超えた 信頼区間。 これはどういう意味ですか? これは、既存の傾向をこの方向に変える可能性のある、何らかの異常な出来事が発生したことを示しています。 これは信号ですそれに対して を解決する状況を把握し、何が影響したのかを理解します。

たとえば、いくつかの状況を考えてみましょう。 2011 年の月ごとの 100 製品アイテムの予測制限と 3 月の実際の売上高を計算して、売上予測を計算しました。

  1. による " ひまわり油» 予測の上限を突破し、信頼区間に収まりませんでした。
  2. 「ドライイースト」は予想の下限を上回りました。
  3. による " オートミール「上限突破しました。

その他の製品については、実際の売上高は所定の予測範囲内にありました。 それらの。 彼らの売上は予想の範囲内でした。 そこで、私たちは国境を越える 3 つの製品を特定し、何がそれらに国境を越える影響を与えたのかを把握し始めました。

  1. ひまわり油については、新たな販売網に参入したことにより販売量が増加し、上限を超える結果となりました。 この製品については、このネットワークの販売予測を考慮して、年末までの予測を再計算する価値があります。
  2. 「ドライイースト」は税関で車が詰まり、5日以内に品薄となり、売上減少に影響し下限値を超えた。 原因を突き止めて、この状況を繰り返さないように努めることは価値があるかもしれません。
  3. 「オートミールポリッジ」の販売促進イベントを実施したことにより売上が大幅に増加し、計画を上回りました。

予測限界を超えることに影響を与える 3 つの要因を特定しました。 予測と計画の精度を高めるために、実際の売上が予測を超える可能性がある要因を強調し、それらの予測と計画を個別に構築することは価値があります。 次に、主要な売上予測への影響を検討します。 これらの要因の影響を定期的に評価し、状況をより良い方向に変えることもできます。 ネガティブな要因の影響を減らし、ポジティブな要因の影響を増やすことによって.

信頼区間を使用すると、次のことが可能になります。

  1. ルートを選択してください、これは注目に値します。 これらの方向で影響を与える可能性のあるイベントが発生しました トレンドの変化.
  2. 要因を特定する、それは状況の変化に大きな影響を与えます。
  3. 受け入れる 情報に基づいた決定(例: 購入、計画など)。

ここで、例を使用して信頼区間とは何か、Excel で信頼区間を計算する方法を見てみましょう。

信頼区間とは何ですか?

信頼区間は予測の境界 (上限と下限) であり、その範囲内では 与えられた確率 (シグマ)実際の値が表示されます。

それらの。 当社は予測を計算します - これが当社の主なガイドラインですが、実際の値が当社の予測と 100% 一致する可能性は低いことを理解しています。 そして疑問が生じます、 どの範囲内で実際の値は下がる可能性がありますが、 現在の傾向が続く場合? この質問は答えに役立ちます 信頼区間の計算、つまり - 予測の上限と下限。

与えられた確率シグマとは何ですか?

計算するときできる信頼区間 確率を設定する ヒット実際の値 与えられた予測限界内で。 どうやってするの? これを行うには、シグマの値を設定し、シグマが以下に等しい場合は次のようにします。

    3シグマ- その場合、次の実際の値が信頼区間に入る確率は 99.7%、つまり 300 対 1 になります。または、境界を超える確率は 0.3% です。

    2シグマ- その場合、次の値が境界内に収まる確率は ≈ 95.5%、つまり オッズは約 20 対 1、つまり 4.5% の確率でオーバーアウトする可能性があります。

    1シグマ- その場合、確率は ≈ 68.3%、つまり オッズは約 2 対 1、つまり、次の値が信頼区間外になる確率は 31.7% です。

私たちは策定しました 3シグマの法則、それはそれを言う 命中確率別のランダムな値 信頼区間に入れる与えられた値で スリーシグマは99.7%.

ロシアの偉大な数学者チェビシェフは、3 シグマの与えられた値で予測限界を超える確率が 10% であるという定理を証明しました。 それらの。 3 シグマ信頼区間内に収まる確率は少なくとも 90% ですが、予測とその境界を「目で」計算しようとすると、はるかに重大なエラーが発生します。

Excel で信頼区間を自分で計算するにはどうすればよいですか?

例を使用して、Excel での信頼区間 (つまり、予測の上限と下限) の計算を見てみましょう。 5 年間の月ごとの売上という時系列があります。 添付ファイルを参照してください。

予測限界を計算するには、次のように計算します。

  1. 販売予測().
  2. シグマ - 標準偏差実際の値からモデルを予測します。
  3. スリーシグマ。
  4. 信頼区間。

1. 売上予測。

=(RC[-14] (時系列データ)- ラジコン[-1] (型式値))^2(二乗)


3. 月ごとに、ステージ 8 Sum((Xi-Ximod)^2) からの偏差値を合計しましょう。 1月、2月…を各年ごとにまとめてみましょう。

これを行うには、=SUMIF() という式を使用します。

SUMIF(サイクル内の期間番号を含む配列 (1 から 12 までの月)、サイクル内の期間番号へのリンク、ソース データと期間値の差の 2 乗を含む配列へのリンク)


4. 1 から 12 までのサイクルの各期間の標準偏差を計算します (ステージ 10) 添付ファイルにある).

これを行うには、ステージ 9 で計算された値から根を抽出し、このサイクルの期間数から 1 を引いた値で割ります = SQRT((Sum(Xi-Ximod)^2/(n-1))

Excelの数式を使ってみましょう =ROOT(R8 ((Sum(Xi-Ximod)^2 へのリンク)/(COUNTIF($O$8:$O$67 (サイクル番号を含む配列へのリンク); O8 (配列内でカウントされる特定のサイクル番号へのリンク))-1))

Excel の数式 = COUNTIF を使用する数nを数えます


予測モデルから実際のデータの標準偏差を計算し、各月のシグマ値を取得しました - ステージ 10 添付ファイルにあります。

3. 3 シグマを計算してみましょう。

ステージ 11 で、シグマの数を設定します。この例では「3」です (ステージ 11 添付ファイルにある):

シグマ値の練習にも便利です。

1.64 シグマ - 制限を超える確率が 10% (10 分の 1)。

1.96 シグマ - 限界を超える確率は 5% (20 分の 1)。

2.6 シグマ - 限界を超える確率は 1% (100 分の 1)。

5) スリーシグマの計算, このために、各月の「シグマ」値に「3」を掛けます。

3. 信頼区間を決定します。

  1. 予測上限- 成長と季節性 + (プラス) 3 シグマを考慮した売上予測。
  2. 予測下限値- 成長と季節性を考慮した売上予測 - (マイナス) 3 シグマ。

長期間の信頼区間を計算するのに便利なように (添付ファイルを参照)、以下を使用します。 Excelの数式 =Y8+VLOOKUP(W8,$U$8:$V$19,2,0)、 どこ

Y8- 販売予測;

W8- 3 シグマ値を取得する月の番号。

それらの。 予測上限= 「売上予測」 + 「3 シグマ」 (例では、VLOOKUP(月番号; 3 シグマ値を含むテーブル; 対応する行の月番号に等しいシグマ値を抽出する列; 0))。

予測下限値=「売上予測」マイナス「3シグマ」。

そこで、Excel で信頼区間を計算しました。

これで、予測と、実際の値が所定のシグマ確率に該当する範囲の境界が得られました。

この記事では、シグマとルールとは何かについて説明しました。 スリーシグマ信頼区間を決定する方法とそれを何に使用できるか このテクニック練習中。

正確な予測と成功を祈っています。

どうやって Forecast4AC PRO がお手伝いします信頼区間を計算するとき?:

    Forecast4AC PRO は、1000 を超える時系列の予測の上限または下限を同時に自動的に計算します。

    キーストローク 1 回でチャート上の予測、傾向、実際の売上高と比較して予測の境界を分析する機能。

Forcast4AC PRO プログラムでは、シグマ値を 1 から 3 まで設定できます。

参加しませんか!

ダウンロード 無料アプリ予測とビジネス分析のため:


  • Novo Forecast Lite- 自動 予測計算 V エクセル.
  • 4アナリティクス - ABC-XYZ分析および排出ガス分析 エクセル。
  • Qlik Senseデスクトップ と QlikViewPersonal Edition - データ分析と視覚化のための BI システム。

有料ソリューションの機能をテストします。

  • ノボ・フォーキャスト・プロ- 大規模なデータセットに対する Excel での予測。


サイトの新着情報

>

最も人気のある