建設資材 頻度と割合の信頼区間。 母集団の数学的期待値の信頼区間の構築

頻度と割合の信頼区間。 母集団の数学的期待値の信頼区間の構築

この記事では次のことを学びます:

    どうしたの 信頼区間 ?

    ポイントは何ですか 3 シグマの法則?

    この知識を実際にどのように適用できるでしょうか?

現在、多種多様な製品、販売方向、従業員、活動分野などに関連する情報が過剰に存在しているため、 重要なことを強調するのは難しいかもしれません、まず第一に、これに注意を払い、管理する努力をする価値があります。 意味 信頼区間そしてその限界を超えた実際の値の分析 - 技術 状況を強調するのに役立ちます, 変化するトレンドに影響を与える。ポジティブな要素を開発し、ネガティブな要素の影響を軽減できるようになります。 このテクノロジーは多くの有名な世界的企業で使用されています。

いわゆる「」があります。 アラート」、 どれの マネージャーに知らせる次の値が特定の方向にあること 超えた 信頼区間。 これはどういう意味ですか? これは、既存の傾向をこの方向に変える可能性のある、何らかの異常な出来事が発生したことを示しています。 これは信号ですそれに対して を解決する状況を把握し、何が影響したのかを理解します。

たとえば、いくつかの状況を考えてみましょう。 2011 年の月ごとの 100 製品アイテムの予測制限と 3 月の実際の売上高を計算して、売上予測を計算しました。

  1. による " ひまわり油» 予測の上限を突破し、信頼区間に収まりませんでした。
  2. 「ドライイースト」は予想の下限を上回りました。
  3. による " オートミール「上限突破しました。

その他の製品については、実際の売上高は所定の予測範囲内にありました。 それらの。 彼らの売上は予想の範囲内でした。 そこで、私たちは国境を越える 3 つの製品を特定し、何がそれらに国境を越える影響を与えたのかを把握し始めました。

  1. ひまわり油については、新たな販売網に参入したことにより販売量が増加し、上限を超える結果となりました。 この製品については、このネットワークの販売予測を考慮して、年末までの予測を再計算する価値があります。
  2. 「ドライイースト」は税関で車が詰まり、5日以内に品薄となり、売上減少に影響し下限値を超えた。 原因を突き止めて、この状況を繰り返さないように努めることは価値があるかもしれません。
  3. 「オートミールポリッジ」の販売促進イベントを実施したことにより売上が大幅に増加し、計画を上回りました。

予測限界を超えることに影響を与える 3 つの要因を特定しました。 予測と計画の精度を高めるために、実際の売上が予測を超える可能性がある要因を強調し、それらの予測と計画を個別に構築することは価値があります。 次に、主要な売上予測への影響を検討します。 これらの要因の影響を定期的に評価し、状況をより良い方向に変えることもできます。 ネガティブな要因の影響を減らし、ポジティブな要因の影響を増やすことによって.

信頼区間を使用すると、次のことが可能になります。

  1. ルートを選択してください、これは注目に値します。 これらの方向で影響を与える可能性のあるイベントが発生しました トレンドの変化.
  2. 要因を特定する、それは状況の変化に大きな影響を与えます。
  3. 受け入れる 情報に基づいた決定(例: 購入、計画など)。

ここで、例を使用して信頼区間とは何か、Excel で信頼区間を計算する方法を見てみましょう。

信頼区間とは何ですか?

信頼区間は予測の境界 (上限と下限) であり、その範囲内では 与えられた確率 (シグマ)実際の値が表示されます。

それらの。 当社は予測を計算します - これが当社の主なガイドラインですが、実際の値が当社の予測と 100% 一致する可能性は低いことを理解しています。 そして疑問が生じます、 どの範囲内で実際の値は下がる可能性がありますが、 現在の傾向が続く場合? この質問は答えに役立ちます 信頼区間の計算、つまり - 予測の上限と下限。

与えられた確率シグマとは何ですか?

計算するときできる信頼区間 確率を設定する ヒット実際の値 与えられた予測限界内で。 どうやってするの? これを行うには、シグマの値を設定し、シグマが以下に等しい場合は次のようにします。

    3シグマ- その場合、次の実際の値が信頼区間に入る確率は 99.7%、つまり 300 対 1 になります。または、境界を超える確率は 0.3% です。

    2シグマ- その場合、次の値が境界内に収まる確率は ≈ 95.5%、つまり オッズは約 20 対 1、つまり 4.5% の確率でオーバーアウトする可能性があります。

    1シグマ- その場合、確率は ≈ 68.3%、つまり オッズは約 2 対 1、つまり、次の値が信頼区間外になる確率は 31.7% です。

私たちは策定しました 3シグマの法則、それはそれを言う 命中確率別のランダムな値 信頼区間に入れる与えられた値で スリーシグマは99.7%.

ロシアの偉大な数学者チェビシェフは、3 シグマの与えられた値で予測限界を超える確率が 10% であるという定理を証明しました。 それらの。 3 シグマ信頼区間内に収まる確率は少なくとも 90% ですが、予測とその境界を「目で」計算しようとすると、はるかに重大なエラーが発生します。

Excel で信頼区間を自分で計算するにはどうすればよいですか?

例を使用して、Excel での信頼区間 (つまり、予測の上限と下限) の計算を見てみましょう。 5 年間の月ごとの売上という時系列があります。 添付ファイルを参照してください。

予測限界を計算するには、次のように計算します。

  1. 販売予測().
  2. シグマ - 標準偏差実際の値からモデルを予測します。
  3. スリーシグマ。
  4. 信頼区間。

1. 売上予測。

=(RC[-14] (時系列データ)- ラジコン[-1] (型式値))^2(二乗)


3. 月ごとに、ステージ 8 Sum((Xi-Ximod)^2) からの偏差値を合計しましょう。 1月、2月…を各年ごとにまとめてみましょう。

これを行うには、=SUMIF() という式を使用します。

SUMIF(サイクル内の期間番号を含む配列 (1 から 12 までの月)、サイクル内の期間番号へのリンク、ソース データと期間値の差の 2 乗を含む配列へのリンク)


4. 1 から 12 までのサイクルの各期間の標準偏差を計算します (ステージ 10) 添付ファイルにある).

これを行うには、ステージ 9 で計算された値から根を抽出し、このサイクルの期間数から 1 を引いた値で割ります = SQRT((Sum(Xi-Ximod)^2/(n-1))

Excelの数式を使ってみましょう =ROOT(R8 ((Sum(Xi-Ximod)^2 へのリンク)/(COUNTIF($O$8:$O$67 (サイクル番号を含む配列へのリンク); O8 (配列内でカウントされる特定のサイクル番号へのリンク))-1))

Excel の数式 = COUNTIF を使用する数nを数えます


予測モデルから実際のデータの標準偏差を計算し、各月のシグマ値を取得しました - ステージ 10 添付ファイルにあります。

3. 3 シグマを計算してみましょう。

ステージ 11 で、シグマの数を設定します。この例では「3」です (ステージ 11 添付ファイルにある):

シグマ値の練習にも便利です。

1.64 シグマ - 制限を超える確率が 10% (10 分の 1)。

1.96 シグマ - 限界を超える確率は 5% (20 分の 1)。

2.6 シグマ - 限界を超える確率は 1% (100 分の 1)。

5) スリーシグマの計算, このために、各月の「シグマ」値に「3」を掛けます。

3. 信頼区間を決定します。

  1. 予測上限- 成長と季節性 + (プラス) 3 シグマを考慮した売上予測。
  2. 予測下限値- 成長と季節性を考慮した売上予測 - (マイナス) 3 シグマ。

長期間の信頼区間を計算するのに便利なように (添付ファイルを参照)、以下を使用します。 Excelの数式 =Y8+VLOOKUP(W8,$U$8:$V$19,2,0)、 どこ

Y8- 販売予測;

W8- 3 シグマ値を取得する月の番号。

それらの。 予測上限= 「売上予測」 + 「3 シグマ」 (例では、VLOOKUP(月番号; 3 シグマ値を含むテーブル; 対応する行の月番号に等しいシグマ値を抽出する列; 0))。

予測下限値=「売上予測」マイナス「3シグマ」。

そこで、Excel で信頼区間を計算しました。

これで、予測と、実際の値が所定のシグマ確率に該当する範囲の境界が得られました。

この記事では、シグマとルールとは何かについて説明しました。 スリーシグマ信頼区間を決定する方法とそれを何に使用できるか このテクニック練習中。

正確な予測と成功を祈っています。

どうやって Forecast4AC PRO がお手伝いします信頼区間を計算するとき?:

    Forecast4AC PRO は、1000 を超える時系列の予測の上限または下限を同時に自動的に計算します。

    キーストローク 1 回でチャート上の予測、傾向、実際の売上高と比較して予測の境界を分析する機能。

Forcast4AC PRO プログラムでは、シグマ値を 1 から 3 まで設定できます。

参加しませんか!

ダウンロード 無料アプリ予測とビジネス分析のため:


  • Novo Forecast Lite- 自動 予測計算 V エクセル.
  • 4アナリティクス - ABC-XYZ分析および排出ガス分析 エクセル。
  • Qlik Senseデスクトップ と QlikViewPersonal Edition - データ分析と視覚化のための BI システム。

有料ソリューションの機能をテストします。

  • ノボ・フォーキャスト・プロ- 大規模なデータセットに対する Excel での予測。

信頼区間は統計の分野から来ています。 これは、未知のパラメータを高い信頼性で推定するために役立つ特定の範囲です。 これを説明する最も簡単な方法は、例を使用することです。

たとえば、クライアントのリクエストに対するサーバーの応答速度など、何らかの確率変数を調査する必要があるとします。 ユーザーが特定の Web サイトのアドレスを入力するたびに、サーバーは次のように応答します。 さまざまな速度で。 したがって、調査対象の応答時間はランダムです。 したがって、信頼区間によってこのパラメーターの境界を決定することができ、サーバーは 95% の確率で計算した範囲内にあると言えます。

あるいは、何人がそれについて知っているかを調べる必要があります。 商標企業。 信頼区間が計算されると、たとえば、95% の確率で、これを認識している消費者の割合は 27% から 34% の範囲にあると言えます。

この用語と密接に関係しているのは「量」です。 信頼確率。 これは、目的のパラメータが信頼区間に含まれる確率を表します。 望ましい範囲がどれくらいの大きさになるかは、この値によって異なります。 値が大きいほど信頼区間は狭くなり、その逆も同様です。 通常、90%、95%、または 99% に設定されます。 値 95% が最も一般的です。

この指標は観測値の分散にも影響され、その定義は研究対象の特性が従うという仮定に基づいています。このステートメントはガウスの法則としても知られています。 彼によれば、このような連続確率のすべての分布は、 確率変数、これは確率密度で説明できます。 についての仮定がある場合、 正規分布間違いであることが判明した場合、評価は間違っている可能性があります。

まず、信頼区間を計算する方法を考えてみましょう。ここでは 2 つのケースが考えられます。 分散 (確率変数の広がりの度合い) は、わかっている場合もあれば、わかっていない場合もあります。 既知の場合、信頼区間は次の式を使用して計算されます。

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - 記号、

t - ラプラス分布表のパラメータ、

σ は分散の平方根です。

分散が不明な場合、目的の特徴の値がすべてわかっていれば計算できます。 これには次の式が使用されます。

σ2 = х2ср - (хср)2、ここで

х2ср - 研究された特性の二乗の平均値、

(хср)2 はこの特性の 2 乗です。

この場合、信頼区間を計算する式は少し変わります。

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - サンプル平均、

α - 記号、

t は、Student 分布表 t = t(ɣ;n-1) を使用して求められるパラメータです。

sqrt(n) - サンプルサイズの合計の平方根、

s は分散の平方根です。

この例を考えてみましょう。 7 回の測定結果に基づいて、調査対象の特性が 30 に等しく、サンプル分散が 36 に等しいと決定されたとします。99% の確率で、真の値を含む信頼区間を見つける必要があります。測定されたパラメータの値。

まず、t が何に等しいかを決定しましょう: t = t (0.99; 7-1) = 3.71。 上記の式を使用すると、次のようになります。

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3.71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

分散の信頼区間は、既知の平均値の場合と数学的期待値に関するデータがなく、分散の不偏点推定値のみがわかっている場合の両方で計算されます。 計算式は非常に複雑であり、必要に応じてインターネットでいつでも見つけることができるため、ここでは計算式を示しません。

Excel またはそのように呼ばれるネットワーク サービスを使用して信頼区間を決定すると便利であることに注意してください。

「Katren-Style」では、医療統計に関するコンスタンチン・クラフチクのシリーズの出版を続けています。 以前の 2 つの記事で、著者は や などの概念の説明を扱いました。

コンスタンチン・クラフチク

数学者兼分析者。 医学および人文科学における統計研究の専門家

モスクワ市

臨床研究に関する記事では、「信頼区間」(95 % CI または 95 % CI - 信頼区間) という謎のフレーズが頻繁に登場します。 たとえば、記事には「差異の有意性を評価するために、スチューデントの t 検定を使用して 95% 信頼区間を計算しました。」と書かれているとします。

「95 %​​ 信頼区間」の値は何ですか?また、それを計算する理由は何ですか?

信頼区間とは何ですか? - これは、真の母集団平均が存在する範囲です。 「真実ではない」平均値は存在するのでしょうか? ある意味、そうです。 で、母集団全体で関心のあるパラメーターを測定することは不可能であるため、研究者は限られたサンプルで満足していると説明しました。 このサンプル (たとえば、体重に基づく) には 1 つの平均値 (特定の体重) があり、それによって母集団全体の平均値が判断されます。 ただし、サンプル (特に小さいサンプル) の平均体重が一般母集団の平均体重と一致する可能性はほとんどありません。 したがって、母集団の平均値の範囲を計算して使用する方が正確です。

たとえば、ヘモグロビンの 95% 信頼区間 (95% CI) が 110 ~ 122 g/L であると想像してください。 これは、母集団の真の平均ヘモグロビン値が 110 ~ 122 g/L の間にある可能性が 95% あることを意味します。 言い換えれば、母集団の平均ヘモグロビン値はわかりませんが、95% の確率でこの形質の値の範囲を示すことができます。

信頼区間は、グループ間の平均値の差、または効果の大きさと特に関連します。

長い間上市されている鉄剤と登録されたばかりの鉄剤の 2 つの鉄剤の有効性を比較したとします。 治療経過後、研究対象の患者グループのヘモグロビン濃度を評価し、統計プログラムにより 2 つのグループの平均値の差が 95% の確率で 1.72 ~ 1.72 ~ 14.36 g/l (表 1)。

テーブル 1. 独立したサンプルのテスト
(グループはヘモグロビンレベルで比較されます)

これは次のように解釈されるべきです。新薬を服用する一般集団の一部の患者では、既知の薬を服用した患者よりもヘモグロビンが平均して 1.72 ~ 14.36 g/l 高くなります。

言い換えれば、一般集団では、グループ間の平均ヘモグロビン値の差は 95% の確率でこれらの制限内に収まります。 これが多いか少ないかを判断するのは研究者次第です。 これらすべての重要な点は、1 つの平均値ではなく、ある範囲の値を使用して作業しているため、グループ間のパラメーターの差をより確実に推定できるということです。

統計パッケージでは、研究者の裁量により、信頼区間の境界を独自に狭めたり広げたりできます。 信頼区間の確率を下げることで、平均の範囲が狭まります。 たとえば、90% CI では、平均値の範囲 (または平均値の差) が 95% の場合よりも狭くなります。

逆に、確率を 99% に増やすと、値の範囲が広がります。 グループを比較する場合、CI の下限がゼロマークを超える場合があります。 たとえば、信頼区間の境界を 99 % まで拡張した場合、区間の境界は –1 ~ 16 g/l の範囲になります。 これは、一般集団にはグループがあり、研究対象の特性の平均の差が 0 (M = 0) に等しいことを意味します。

信頼区間を使用すると、統計的な仮説をテストできます。 信頼区間がゼロ値と交差する場合、調査対象のパラメーターに関してグループに差異がないことを仮定する帰無仮説が真になります。 上で説明した例では、境界を 99% まで拡張しました。 一般集団のどこかに、何の違いもないグループが見つかりました。

ヘモグロビンの差の 95% 信頼区間 (g/l)


この図は、2 つのグループ間の平均ヘモグロビン値の差の 95% 信頼区間を示しています。 線はゼロマークを通過するため、ゼロの平均値の間に差があり、グループに差がないという帰無仮説が確認されます。 グループ間の差の範囲は –2 ~ 5 g/L です。これは、ヘモグロビンが 2 g/L 減少するか、5 g/L 増加する可能性があることを意味します。

信頼区間は非常に重要な指標です。 これにより、サンプルが大きい場合は小さいサンプルよりも差異が見つかる可能性が高くなるため、グループ間の違いが本当に平均値の違いによるものなのか、サンプルが大きいことによるものなのかを確認できます。

実際にはこのように見えるかもしれません。 1,000 人のサンプルを採取し、ヘモグロビン レベルを測定したところ、平均値の差の信頼区間が 1.2 ~ 1.5 g/l の範囲であることがわかりました。 この場合の統計的有意性のレベル p

ヘモグロビン濃度が増加していることがわかりますが、統計的有意性はまさにサンプル サイズに起因するもので、ほとんど気づかれない程度に現れています。

信頼区間は、平均だけでなく、割合 (およびリスク比) についても計算できます。 たとえば、開発された薬を服用中に寛解を達成した患者の割合の信頼区間に興味があります。 割合、つまりそのような患者の割合の 95% CI が 0.60 ~ 0.80 の範囲内にあると仮定します。 したがって、私たちの薬は症例の 60 ~ 80% に治療効果があると言えます。

その他の値はすべて、理論上の類似値の推定値であり、サンプルではなく一般母集団が入手できた場合に得られるものです。 しかし、悲しいことに、一般の人は非常に高価で、アクセスできないことがよくあります。

間隔推定の概念

どのサンプル推定にもある程度のばらつきがあります。 は、特定のサンプルの値に応じた確率変数です。 したがって、より信頼性の高い統計的結論を得るには、点推定値だけでなく、確率の高い区間も知る必要があります。 γ (ガンマ) 評価されたインジケーターをカバーします θ (シータ)。

正式には、これらはそのような2つの値です(統計) T1(X)そして T2(X)、 何 T1< T 2 、与えられた確率レベルで γ 条件が満たされています:

要するに、その可能性が高い γ またはそれ以上、真のインジケーターはポイントの間にあります T1(X)そして T2(X)、下限と上限と呼ばれます 信頼区間.

信頼区間を構築するための条件の 1 つは、信頼区間の最大の狭さです。 できるだけ短くする必要があります。 その欲求はごく自然なものです、なぜなら... 研究者は、目的のパラメータの位置をより正確に特定しようとします。

したがって、信頼区間は分布の最大確率をカバーする必要があります。 そして評価自体が中心にあるべきです。

つまり、(推定からの真の指標が)上方に逸脱する確率は、下方に逸脱する確率に等しいということです。 非対称分布の場合、右側の間隔は左側の間隔と等しくないことにも注意してください。

上の図は、信頼確率が大きいほど間隔が広くなり、直接的な関係があることを明確に示しています。

これは、未知のパラメータの区間推定理論への短い紹介でした。 数学的期待値の信頼限界を見つけることに移りましょう。

数学的期待値の信頼区間

元のデータが に分散している場合、平均は正規値になります。 これは、正規値の線形結合にも正規分布があるという規則に従います。 したがって、確率を計算するには、正規分布則の数学的装置を使用できます。

ただし、これには、期待値と分散という 2 つのパラメータを知る必要がありますが、これらは通常は不明です。 もちろん、パラメーターの代わりに推定値 (算術平均と ) を使用することもできますが、その場合、平均の分布は完全に正規分布にはならず、下方にわずかに平坦になります。 この事実はアイルランドの市民ウィリアム・ゴセットによって巧みに指摘され、彼の発見をバイオメトリカ誌の 1908 年 3 月号に発表しました。 秘密保持の目的で、ゴセットは自分自身に「学生」と署名しました。 これが Student t 分布の様子です。

しかし、K. ガウスが天文観測の誤差を分析する際に使用したデータの正規分布は、地球上の生活では非常にまれであり、確立するのは非常に困難です(高精度を得るには約 2,000 回の観測が必要です)。 したがって、正規性の仮定を破棄し、元のデータの分布に依存しない方法を使用することが最善です。

未知の分布のデータから算術平均を計算した場合、その分布はどうなるのかという疑問が生じます。 答えはよく知られた確率論によって与えられます。 中心極限定理(CPT)。 数学では、これにはいくつかの変形がありますが (定式化は長年にわたって洗練されてきました)、それらはすべて、大まかに言えば、多数の独立した確率変数の合計は正規分布の法則に従うというステートメントに要約されます。

算術平均を計算するときは、確率変数の合計が使用されます。 ここから、算術平均には正規分布があり、期待値は元のデータの期待値、分散は であることがわかります。

賢い人は CLT を証明する方法を知っていますが、Excel で行われる実験を利用してこれを検証します。 50 個の均一に分布した確率変数のサンプルをシミュレートしてみましょう (Excel 関数 RANDBETWEEN を使用)。 次に、そのようなサンプルを 1000 個作成し、それぞれの算術平均を計算します。 それらの分布を見てみましょう。

平均値の分布が正規則に近いことがわかります。 サンプルのサイズと数をさらに大きくすると、類似性はさらに良くなります。

CLT の妥当性を自分の目で確認したので、 を使用して、与えられた確率で真の平均または数学的期待値をカバーする算術平均の信頼区間を計算できます。

上限と下限を設定するには、正規分布のパラメータを知る必要があります。 原則として、何もないため、推定値が使用されます。 算術平均そして 標本分散。 繰り返しますが、この方法ではサンプルが大きい場合にのみ良好な近似が得られます。 サンプルが小さい場合は、多くの場合、Student 分布を使用することをお勧めします。 信じないでください! 平均値のスチューデント分布は、元のデータが正規分布している場合にのみ発生します。つまり、ほとんど発生しません。 したがって、必要なデータ量の最低基準を直ちに設定し、漸近的に正しい方法を使用することをお勧めします。 彼らは 30 回の観察で十分だと言います。 50 を選択してください - 間違いはありません。

T1.2– 信頼区間の下限と上限

– サンプルの算術平均

s0– サンプルの標準偏差 (不偏)

n - サンプルサイズ

γ – 信頼確率 (通常は 0.9、0.95、または 0.99 に等しい)

c γ =Φ -1 ((1+γ)/2)– 標準正規分布関数の逆数値。 簡単に言えば、これは算術平均から下限または上限までの標準誤差の数です (これら 3 つの確率は 1.64、1.96、および 2.58 の値に対応します)。

この式の本質は、算術平均を取得し、それから一定の量を確保することです ( γ付き) 標準誤差 ( s0/√n)。 すべてはわかっているので、それを受け入れて検討してください。

パソコンが普及する前は、正規分布関数やその逆関数の値を求めていました。 これらは現在でも使用されていますが、既製の Excel 式を使用する方が効率的です。 上記の式のすべての要素 ( 、 、 ) は Excel で簡単に計算できます。 しかし、信頼区間を計算するための既製の公式があります - TRUST.NORM。 その構文は次のとおりです。

CONFIDENCE.NORM(アルファ;標準オフ;サイズ)

アルファ– 有意水準または信頼水準。上で採用した表記では 1-γ に等しくなります。つまり、 数学的確率期待値は信頼区間の外になります。 信頼水準が 0.95 の場合、アルファは 0.05 になります。

標準オフ– サンプルデータの標準偏差。 標準誤差を計算する必要はありません。Excel 自体が n の平方根で除算します。

サイズ– サンプルサイズ (n)。

CONFIDENCE NORM 関数の結果は、信頼区間を計算する式の 2 番目の項です。 半間隔 したがって、下限点と上限点は平均値±求められた値となります。

したがって、元のデータの分布に依存しない、算術平均の信頼区間を計算するための普遍的なアルゴリズムを構築することが可能です。 普遍性の代償は、その漸近的な性質です。 比較的大きなサンプルを使用する必要がある。 ただし、現代のテクノロジーの時代では、必要な量のデータを収集することは通常は難しくありません。

信頼区間を使用した統計的仮説のテスト

(モジュール111)

統計学で解決される主な問題の 1 つは次のとおりです。 その本質は簡単に次のとおりです。 たとえば、一般人口の期待がある値に等しいと仮定します。 次に、与えられた期待値に対して観察できる標本平均の分布が構築されます。 次に、この条件付き分布のどこに実際の平均が位置するかを調べます。 それが許容限界を超えた場合、そのような平均が現れる可能性は非常に低く、実験を一度繰り返したとしても、それはほとんど不可能であり、提案された仮説と矛盾しますが、この仮説は首尾よく棄却されました。 平均が臨界レベルを超えない場合、仮説は棄却されません (ただし証明もされません!)。

したがって、信頼区間の助けを借りて、今回の期待値の場合には、いくつかの仮説を検証することもできます。 やり方はとても簡単です。 特定のサンプルの算術平均が 100 であるとします。仮説は、期待値がたとえば 90 であるとテストされます。つまり、原始的に質問を投げかけると、次のように聞こえます。平均値が 90 に等しい場合、観察された平均値は 100 であることが判明しましたか?

この質問に答えるには、標準偏差とサンプル サイズに関する情報がさらに必要になります。 標準偏差が 30 で、観測値の数が 64 であると仮定します (根を簡単に抽出するため)。 この場合、平均の標準誤差は 30/8、つまり 3.75 になります。 95% 信頼区間を計算するには、平均値の両側に 2 つの標準誤差 (より正確には 1.96) を加算する必要があります。 信頼区間は約 100±7.5、つまり 92.5 ~ 107.5 になります。

さらなる推論は次のとおりです。 テストされる値が信頼区間内にある場合、仮説と矛盾しません。 ランダムな変動の範囲内に収まります (確率 95%)。 チェックされる点が信頼区間の外にある場合、そのようなイベントが発生する確率は非常に小さく、いずれの場合も許容レベルを下回ります。 これは、仮説が観察データと矛盾するとして拒否されることを意味します。 この場合、期待値に関する仮説は信頼区間の外にあるため (検定値 90 は区間 100±7.5 に含まれていません)、この仮説は棄却される必要があります。 上記の原始的な質問に答えると、「いいえ、そんなことはありません。いずれにせよ、このようなことは非常にまれに起こります」と言うべきです。 多くの場合、それらは、信頼区間が構築された指定されたレベルではなく、仮説を誤って棄却する特定の確率 (p レベル) を示しますが、これについてはまた別の機会に説明します。

ご覧のとおり、平均値 (または数学的期待値) の信頼区間を構築することは難しくありません。 重要なのは本質を理解することであり、そうすれば物事は先に進むでしょう。 実際には、ほとんどの場合、95% 信頼区間が使用されます。これは、平均の両側で約 2 標準誤差の幅です。

それは今のところすべてです。 ではごきげんよう!

周波数と分数の信頼区間

© 2008

国立公衆衛生研究所、オスロ、ノルウェー

この記事では、角度変換と Agresti - Coull 補正を備えた Wald 法を使用した Wald、Wilson、Clopper - Pearson 法を使用した、周波数と比率の信頼区間の計算について説明します。 提示された資料は、頻度と割合の信頼区間を計算する方法に関する一般的な情報を提供し、ジャーナルの読者が自分の研究結果を発表するときに信頼区間を使用することだけでなく、作業を開始する前に専門文献を読むことにも興味を喚起することを目的としています。今後の出版物について。

キーワード: 信頼区間、頻度、割合

以前の出版物の 1 つでは、質的データの説明について簡単に言及し、母集団における研究対象の特性の発生頻度を説明するには、点推定よりも区間推定の方が好ましいと報告しました。 実際、調査はサンプルデータを使用して行われるため、結果の母集団への投影にはサンプリングの不正確さの要素が含まれているはずです。 信頼区間は、推定されるパラメーターの精度の尺度です。 興味深いことに、医師向けの基本統計に関する書籍の中には、度数の信頼区間の話題を完全に無視しているものもあります。 この記事では、頻度の信頼区間を計算するいくつかの方法を見ていき、非反復性や代表性、観測値相互の独立性などのサンプル特性を暗示します。 この記事では、頻度は、特定の値が合計で何回発生するかを示す絶対数としてではなく、研究対象の特性が発生する研究参加者の割合を決定する相対値として理解されます。

生物医学研究では、95% 信頼区間が最も一般的に使用されます。 この信頼区間は、真の割合が 95% の範囲内に収まる領域です。 言い換えれば、集団における形質の出現頻度の真の値は 95% の信頼区間内にあると 95% の信頼性で言えます。

医学研究者向けの統計マニュアルのほとんどは、周波数誤差が次の式を使用して計算されると報告しています。

ここで、p はサンプル内の特性の出現頻度 (0 から 1 までの値) です。 国内の科学論文のほとんどは、サンプル内の形質の出現頻度 (p) とその誤差 (s) を p ± s の形式で示します。 ただし、集団における形質の出現頻度について 95% 信頼区間を提示する方が適切です。これには、次の値が含まれます。

前に。

一部のマニュアルでは、サンプルが小さい場合、1.96 の値を N – 1 自由度の t の値に置き換えることを推奨しています。ここで、N はサンプル内の観測値の数です。 t 値は、ほぼすべての統計学の教科書に記載されている t 分布の表を使用して求められます。 Wald 法での t 分布の使用には、以下で説明する他の方法と比べて目に見える利点がないため、一部の著者は推奨していません。

度数または比率の信頼区間を計算するための上記の方法は、1939 年の Wald と Wolfowitz の出版後に広く使用され始めたため、Abraham Wald (1902 ~ 1950 年) にちなんで Wald と名付けられました。 ただし、この方法自体は 1812 年にピエール シモン ラプラス (1749 ~ 1827) によって提案されました。

Wald 法は非常に人気がありますが、その適用には重大な問題が伴います。 この方法は、サンプル サイズが小さい場合や、特性の発生頻度が 0 または 1 (0% または 100%) になる傾向があり、0 と 1 の頻度では単純に不可能な場合にはお勧めできません。誤差を計算するときに使用される正規分布の近似は、n · p の場合には「機能しません」。< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

新しい変数は正規分布するため、変数 φ の 95% 信頼区間の下限と上限は φ-1.96 および φ+1.96left">

小さなサンプルの場合は 1.96 の代わりに、N – 1 自由度の t 値を代用することをお勧めします。 この方法では負の値が生成されず、Wald 法よりも周波数の信頼区間をより正確に推定できます。 また、国内の多くの医療統計参考書にも記載されていますが、医学研究における普及には至っていません。 角度変換を使用した信頼区間の計算は、0 または 1 に近づく周波数には推奨されません。

医学研究者向けの統計学の基礎に関するほとんどの書籍では、信頼区間の推定方法の説明はここで終わることが多く、この問題は国内だけでなく海外の文献でもよく見られます。 どちらの方法も中心極限定理に基づいており、サンプルが大きいことを意味します。

上記の方法を使用した信頼区間の推定の欠点を考慮して、Clopper と Pearson は 1934 年に、研究対象の形質の二項分布を考慮して、いわゆる正確な信頼区間を計算する方法を提案しました。 この方法は多くのオンライン計算機で利用できますが、この方法で得られる信頼区間はほとんどの場合広すぎます。 同時に、この方法は保守的な評価が必要な場合の使用をお勧めします。 サンプルサイズが減少するにつれて、特に N の場合、方法の保守性の程度は増加します。< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

多くの統計学者によると、頻度の信頼区間の最適な評価は、1927 年に提案されたウィルソン法によって実行されますが、国内の生物医学研究では実際には使用されていません。 この方法では、非常に小さい周波数と非常に大きい周波数の両方の信頼区間を推定できるだけでなく、少数の観測値にも適用できます。 一般に、ウィルソンの公式による信頼区間は次の形式になります。



ここで、 は 95% 信頼区間を計算するときに値 1.96 をとり、N は観測値の数、p はサンプル内の特性の発生頻度です。 この方法はオンライン計算機で利用できるため、問題なく使用できます。 また、n p に対してこの方法を使用することはお勧めしません。< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Wilson 法に加えて、Agresti-Coll 補正を備えた Wald 法も、周波数の信頼区間の最適な推定値を提供すると考えられています。 Agresti-Coll 補正は、分子に 2 を加算し、分母に 4 を加算することを計算する際に、サンプル (p) における特性の発生頻度を Wald の式で p` に置き換えることです。 p` = (X + 2) / (N + 4)、ここで、X は研究対象の特性を持つ研究参加者の数、N はサンプルサイズです。 この変更により、イベント頻度が 0% または 100% に近づき、サンプルが小さい場合を除いて、ウィルソンの式と非常によく似た結果が得られます。 周波数の信頼区間を計算するための上記の方法に加えて、小さなサンプルに対する Wald 法と Wilson 法の両方に対して連続性補正が提案されていますが、研究ではその使用が不適切であることが示されています。

2 つの例を使用して、信頼区間を計算するための上記の方法の適用を考えてみましょう。 最初のケースでは、ランダムに選択された 1,000 人の研究参加者から成る大規模なサンプルを研究します。そのうち 450 人が研究対象の特性 (これは危険因子、結果、またはその他の特性である可能性があります) を持っており、頻度は 0.45、つまり 45 です。 %。 2 番目のケースでは、研究は少数のサンプル、たとえばわずか 20 人を使用して実行され、研究対象の特性を持つ研究参加者は 1 人 (5%) だけです。 Wald 法、Agresti-Coll 補正を使用した Wald 法、および Wilson 法を使用した信頼区間は、Jeff Sauro によって開発されたオンライン計算機 (http://www./wald.htm) を使用して計算されました。 ウィルソンの連続性補正信頼区間は、Wassar Stats: 統計計算の Web サイト (http://faculty.vassar.edu/lowry/prop1.html) によって提供される計算機を使用して計算されました。 角度フィッシャー変換計算は、それぞれ 19 および 999 自由度の臨界 t 値を使用して手動で実行されました。 両方の例の計算結果を表に示します。

本文で説明されている 2 つの例について、6 つの異なる方法で計算された信頼区間

信頼区間の計算方法

P=0.0500、または 5%

X=450、N=1000、P=0.4500、または 45% の 95% CI

–0,0455–0,2541

アグレスティ=コル補正を施したヴァルト

<,0001–0,2541

連続性補正付きウィルソン

クロッパー・ピアソンの「正確な方法」

角度変換

<0,0001–0,1967

表からわかるように、最初の例では、「一般的に受け入れられている」Wald 法を使用して計算された信頼区間は負の領域に入りますが、頻度の場合はこのようなことはあり得ません。 残念なことに、ロシア文学ではこのような事件は珍しいことではない。 頻度とその誤差に関してデータを表現する従来の方法では、この問題が部分的に隠蔽されます。 たとえば、ある形質の発生頻度(パーセンテージ)が 2.1 ± 1.4 と示されている場合、これは 2.1%(95% CI: -0.7; 4.9)ほど「目に不快」ではありませんが、同じこと。 Agresti-Coll 補正と角度変換を使用した計算を備えた Wald 法では、ゼロに近づく下限が得られます。 ウィルソンの連続性補正方法と「正確な方法」では、ウィルソンの方法よりも広い信頼区間が生成されます。 2 番目の例では、すべての方法でほぼ同じ信頼区間が得られます (違いは 1000 分の 1 でのみ表示されます)。この例のイベントの発生頻度は 50% とそれほど変わらず、サンプル サイズは次のとおりであるため、これは驚くべきことではありません。かなり大きい。

この問題に興味のある読者には、R. G. Newcombe と Brown、Cai と Dasgupta の著作をお勧めします。これらの著作では、信頼区間を計算するためにそれぞれ 7 種類と 10 種類の異なる方法を使用する場合の長所と短所が示されています。 国内のマニュアルの中では、理論の詳細な説明に加えて、Wald と Wilson の方法、二項頻度分布を考慮した信頼区間の計算方法が紹介されている、およびという本をお勧めします。 無料のオンライン計算ツール (http://www./wald.htm および http://faculty.vassar.edu/lowry/prop1.html) に加えて、度数の信頼区間 (それだけではありません!) は、 CIA プログラム (信頼区間分析)。http://www からダウンロードできます。 医大。 ソトン。 交流。 英国/シア/ 。

次の記事では、定性データを比較する単変量の方法について説明します。

参考文献

バネルジ A.明確な言語での医療統計: 入門コース / A. Banerjee。 – M.: 実践医学、2007. – 287 p. 医療統計 / 。 – M.: Medical Information Agency、2007. – 475 p. グランツ S.医学および生物学的統計 / S. Glanz。 – M.: プラクティカ、1998 年。 データの種類、分布テスト、記述統計 // 人間の生態学 – 2008. – No. 1. – P. 52–58. ジジン K.S.。 医療統計: 教科書 / 。 – ロストフ n/d: フェニックス、2007. – 160 p. 応用医療統計 / 、 。 - サンクトペテルブルク。 : Foliot、2003. – 428 p. レイキン G.F。 生体認証 / 。 – M.: 高校、1990年。 – 350 p. メディック V.A。 医学における数学的統計 / 、 。 – M.: 財務と統計、2007. – 798 p. 臨床研究における数学的統計 / 、 。 – M.: GEOTAR-MED、2001. – 256 p. ユンケロフ 5 世. そして。 医学研究データの医学的および統計的処理 / 、 。 - サンクトペテルブルク。 : VmedA、2002. – 266 p. アグレスティ A.二項比率の区間推定では、正確より近似の方が優れています / A. アグレスティ、B. クール // アメリカの統計学者。 – 1998. – N 52. – P. 119–126。 アルトマン D.信頼できる統計 // D. Altman、D. Machinen、T. Bryant、M. J. Gardner。 – ロンドン: BMJ Books、2000. – 240 p. ブラウン L.D.二項比率の区間推定 / L. D. Brown、T. T. Cai、A. Dasgupta // 統計科学。 – 2001. – N 2. – P. 101–133。 クロッパー C.J.二項分布の場合に示された信頼限界または基準限界の使用 / C. J. Clopper、E. S. Pearson // Biometrika. – 1934. – N 26. – P. 404–413。 ガルシア ペレス M.A。 二項パラメータの信頼区間について / M. A. Garcia-Perez // 質と量。 – 2005. – N 39. – P. 467–481。 モトゥルスキー H.直感的な生物統計 // H. モトゥルスキー。 – オックスフォード: オックスフォード大学出版局、1995。 – 386 p. ニューカム R.G.単一比率の両側信頼区間: 7 つの方法の比較 / R. G. Newcombe // Statistics in Medicine. – 1998. – N. 17. – P. 857–872。 サウロ J.二項信頼区間を使用した小さなサンプルからの完了率の推定: 比較と推奨事項 / J. Sauro、J. R. Lewis // ヒューマンファクターおよび人間工学学会年次総会の議事録。 – フロリダ州オーランド、2005 年。 ヴァルド A.連続分布関数の信頼限界 // A. Wald、J. Wolfovitz // 数学統計年報。 – 1939. – N 10. – P. 105–118。 ウィルソン E.B.。 確率的推論、継承の法則、および統計的推論 / E. B. ウィルソン // 米国統計協会ジャーナル。 – 1927. – N 22. – P. 209–212。

割合の信頼区間

A. M. グリボフスキー

国立公衆衛生研究所、オスロ、ノルウェー

この記事では、二項比例の信頼区間を計算するためのいくつかの方法、つまり、Wald 法、Wilson 法、arcsine 法、Agresti-Coull 法、および正確な Clopper-Pearson 法を紹介します。 この論文は、二項比率の信頼区間推定の問題について一般的な紹介をしているだけであり、その目的は、読者が自身の実証研究の結果を提示する際に信頼区間を使用するよう刺激するだけでなく、統計の本を参照することを奨励することです。自分のデータを分析して原稿を準備する前に。

キーワード: 信頼区間、割合

連絡先:

ノルウェー、オスロの国立公衆衛生研究所上級顧問



サイトの新着情報

>

最も人気のある