マン・ホイットニー検定は、独立したサンプルの t 検定に代わるノンパラメトリックな代替法を表します。 その利点は、正規分布と等分散の仮定を放棄することです。 データは少なくとも順序スケールで測定される必要があります。
STATISTICA は、データが独立サンプルの t 検定と同じ方法で配置されていることを前提としています。 ファイルには、各観測値を特定のグループに属するものとして一意に識別するために、少なくとも 2 つの異なるコードを持つコード化された (独立した) 変数が含まれている必要があります。
仮定と解釈。 マン・ホイットニー検定は、問題の変数が少なくとも順序尺度 (ランク付け) で測定されることを前提としています。 検定の解釈は、U 検定が最初のサンプルの要素と 2 番目のサンプルの要素のペアごとの比較指標の合計として計算されることを除いて、独立したサンプルの t 検定の結果の解釈と本質的に似ています。 。 U 検定 - 最も強力な (感度の高い) ノンパラメトリック代替法 独立したサンプルの t 検定; 実際、場合によっては、t 検定よりもさらに高い検出力を持ちます。
サンプルサイズが 20 より大きい場合、U 統計量の標本分布はすぐに正規分布に収束します (Siegel、1956 を参照)。 したがって、U 統計とともに、Z 値が表示されます ( 正規分布および対応する p 値。
小さなサンプルの正確な確率。サンプルが小さい場合、STATISTICA は対応する U 統計に関連付けられた正確な確率を計算します。 この確率は、2 つのサンプルの観測値が与えられた場合に U の考えられるすべての値を数えることに基づいています (Dinneen & Blakesley、1973 を参照)。 プログラムは (結果テーブルの最後の列に) 値 2 * p を報告します。ここで、p は 1 から対応する U 統計量の累積 (片側) 確率を引いたものに等しくなります。 通常、これが関連する効果の統計的有意性の大幅な過小評価につながるわけではないことに注意してください (Siegel、1956 を参照)。
テスト統計は次のとおりです。
どこ W- 統計 ウィルコクソン、同じ仮説をテストするように設計されています
さもないと
それで統計は U信じています 総数 2 番目のサンプルの要素が最初のサンプルの要素よりも優れている場合。 仮説が正しければ、
マン・ホイットニー検定は、問題の変数が少なくとも順序尺度 (ランク付け) で測定されることを前提としています。 テストの解釈は結果の解釈と本質的に同じです t-独立したサンプルの基準。ただし、U 基準は、最初のサンプルの要素と 2 番目のサンプルの要素のペアごとの比較の指標の合計として計算されます。 U 検定 - 最も強力な (感度の高い) ノンパラメトリック代替法 t- 独立したサンプルの基準。 実際、場合によっては、それよりもさらに大きな力を持っています。 t-基準。
サンプル サイズが 20 より大きい場合、U 統計のサンプル分布はすぐに正規分布に収束します。 したがって、U 統計とともに、z 値 (正規分布の場合) および対応する p-意味。
この基準の使用方法の詳細については、以下のアプリケーション例のセクションを参照してください。
例
比較された独立したサンプルが同じに属するという仮説を確認してみましょう 人口ノンパラメトリック マンホイットニー U 検定を使用します。 スチューデントの t 検定を使用して、表の 2 列目と 3 列目の基本統計量とスチューデントの t 検定の例で得られた結果を、ノンパラメトリック比較の結果と比較してみましょう。
Wilcoxon U 検定を計算するには、比較サンプルのバリアントを昇順で 1 つの一般化系列に配置し、1 から n1 + n2 までのランクを一般化系列のバリアントに割り当てます。 最初の行は最初のサンプルのバリアントを表し、2 行目は 2 番目のサンプル、3 行目は一般化された系列内の対応するランクを表します。
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
| ||||||||||
同一のオプションがある場合、それらには平均ランクが割り当てられますが、最後のランクの値は n1 + n2 (この場合は 20) に等しくなければならないことに注意してください。 このルールは、ランキングの正確性をチェックするために使用されます。
サンプルごとに個別に、バリアント R1 と R2 のランクの合計を計算します。 私たちの場合には:
R1 = 1 + 2.5 + 2.5 + 5 + 5 + 9 + 9 + 9 + 12 + 14 = 69
R2 = 5 + 9 + 9 + 14 + 14 + 17 + 17 +17 + 19.5 + 19.5 = 141
計算の正しさをチェックするには、別のルール R1 + R2 = 0.5 * (n1 + n2) * (n1 + n2 + 1) を使用できます。 この場合、R1 + R2 = 210 となります。
統計 U1 = 69 - 10*11/2 = 14; U2 = 141 - 10*11/2 = 86。
片側検定を検定するには、最小統計量 U1 = 14 を選択し、それを n1 = n2 = 10 の臨界値および 1% 有意水準 19 と比較します。
基準の計算値が表の値より小さいため、帰無仮説は選択された有意水準で棄却され、サンプル間の差異は統計的に有意であると見なされます。 したがって、パラメトリックなスチューデント t 検定を使用して行われた差異の存在に関する結論は、このノンパラメトリックな方法を使用して確認されます。
マン-ホイットニー U 検定は、定量的に測定された形質のレベルに関して 2 つの独立したサンプルを比較するために使用されるノンパラメトリック統計検定です。 この方法は、2 つの値の間の交差する領域が存在するかどうかを判断することに基づいています。 バリエーションシリーズ(最初のサンプルの一連のパラメーター値によってランク付けされ、2 番目のサンプルでも同じです)。 どうやって 価値が低い基準が大きいほど、サンプル内のパラメーター値間の差異が信頼できる可能性が高くなります。
1. U 基準の開発の歴史
サンプル間の差異を識別するこの方法は、1945 年にアメリカの化学者および統計学者によって提案されました。 フランク・ウィルコクソン.
1947 年に数学者によって大幅に改訂および拡張されました。 H.B. マン(H.B.マン)と DR ホイットニー(D.R.ホイットニー)、今日では通常その名前で呼ばれています。
2. マン-ホイットニー U テストは何に使用されますか?
マン-ホイットニー U 検定は、定量的特性のレベルに関して 2 つの独立したサンプル間の差異を評価するために使用されます。
3. Mann-Whitney U 検定はどのような場合に使用できますか?
マン-ホイットニー U 検定はノンパラメトリック検定であるため、スチューデント t 検定とは異なり、比較する母集団の正規分布を必要としません。
U 検定は、小さなサンプルを比較するのに適しています。各サンプルには少なくとも 3 つの特性値が必要です。 1 つのサンプルに 2 つの値が存在することは許可されていますが、2 番目のサンプルには少なくとも 5 つの値が含まれている必要があります。
マン・ホイットニーの U 検定を適用する条件は、比較されたグループ内に一致する属性値が存在しない (すべての数値が異なる)、またはそのような一致の数が非常に少ないことです。
2 つ以上のグループを比較するためのマン-ホイットニー U 検定の類似物は次のとおりです。 クラスカル・ウォリス検定.
4. マン・ホイットニーの U 検定はどのように計算しますか?
まず、比較された両方のサンプルから、 シングルランクシリーズ、属性の増加度に応じて観測単位を配置し、値が小さいほど低いランクを割り当てます。 複数のユニットの特性の値が等しい場合、それらのそれぞれに連続するランク値の算術平均が割り当てられます。
たとえば、1 つのランク列で 2 位と 3 位 (ランク) を占める 2 つのユニットは、 同じ価値観。 したがって、それぞれに (3 + 2) / 2 = 2.5 に等しいランクが割り当てられます。
コンパイルされた単一のランク付けシリーズでは、ランクの合計数は次のようになります。
N = n 1 + n 2どこ n1は最初のサンプルの要素の数であり、 n2- 2 番目のサンプルの要素の数。
次に、各ユニットのランク値を記憶しながら、1 つのランク付けされたシリーズをそれぞれ 1 番目と 2 番目のサンプルのユニットで構成される 2 つに再度分割します。 最初のサンプルの要素のシェアに該当する順位の合計と、2 番目のサンプルの要素のシェアに該当するランクの合計を個別に計算します。 2 つのランクの合計のうち大きい方を決定します ( 送信) のサンプルに対応します n×要素。
最後に、次の式を使用してマン-ホイットニー U 検定の値を求めます。
5. マンホイットニー U 検定の値をどのように解釈すればよいですか?
結果の U テスト値は、選択した統計的有意性レベルのテーブルを使用して比較されます ( p=0.05または p=0.01) 指定された数の比較サンプルに対する U の臨界値を使用します。
- 結果の値 U が 少ない表形式または 等しい彼に告白します 統計的有意性検討中のサンプルの形質レベル間の差異 (対立仮説が受け入れられます)。 U 値が小さいほど、差分の信頼性が高くなります。
- 結果の値 U が もっと表形式の場合、帰無仮説が受け入れられます。
基準の限界
基準の目的
ノンパラメトリック マン-ホイットニー検定
U - マン・ホイットニー検定は、2 つのサンプル間の差異を評価するように設計されています。 レベル次数スケール (それ以下ではない) から開始して測定される特性。 n 1、n 2 3 または n 1 = 2、n 2 3 5 の場合に小さなサンプル間の差異を検出でき、ローゼンバウム テストよりも強力です。
この方法は、2 つの一連の順序値の間で重複する値の領域が十分に小さいかどうかを判断します。 この場合、1 行目 (サンプル グループ) は、予備推定によると値が高い値の行であり、2 行目は値が低いと思われる行です。
重複する値の領域が小さいほど、差が有意である可能性が高くなります。 これらの違いは、「違い」と呼ばれることもあります。 位置 2つのサンプル。
U 基準の計算された (経験的) 値は、行間の一致領域がどのくらいの大きさかを反映します。 したがって、U em が少ないほど、 であるほど、違いが有意である可能性が高くなります。
1. 形質は順序、間隔、または比例スケールで測定されなければなりません。
2. サンプルは独立している必要があります。
3. 各サンプルには少なくとも 3 つの観測値が必要です。 n 1、n 2 3; 1 つのサンプルに 2 つの観測値が含まれることは許可されていますが、2 番目のサンプルには少なくとも 5 つの観測値が含まれている必要があります。
4. 各サンプルに含まれる観測値は 60 個以下である必要があります。 n 1、n 2 £60。ただし、すでに n 1、n 2 3 20ランキングは非常に手間がかかります。
1. 基準を計算するには、最初のサンプルと 2 番目のサンプルのすべての値を頭の中で 1 つの共通の組み合わせサンプルに組み合わせて順序付ける必要があります。
すべての計算を 4 つの列で構成される表 (表 16) で実行すると便利です。 組み合わせたサンプルの順序値がこのテーブルに入力されます。
ここで:
a)結合されたサンプルの値は値の増加順に並べられます。
b)各サンプルの値はそれぞれの列に書き込まれます。最初のサンプルの値は列番号 2 に書き込まれ、2 番目のサンプルの値は列番号 3 に書き込まれます。
c)各値は別の行に書き込まれます。
d)このテーブルの行の総数は N=n 1 +n 2 です。ここで、n 1 は 1 番目のサンプルの被験者の数、n 2 は 2 番目のサンプルの被験者の数です。
表16
R1 | バツ | y | R2 |
1 | 2 | 3 | 4 |
7,5 | |||
7,5 | |||
….. | ….. | ||
….. | ….. | ||
∑=28,5 | ….. | ….. | ∑=16,5 |
2. 結合されたサンプルの値はランキングルールに従ってランク付けされ、列番号 1 には最初のサンプルの値に対応するランク R 1 が書き込まれ、列番号 4 - ランク R が書き込まれます。 2 は 2 番目のサンプルの値に対応し、
3. ランクの合計は、列 No. 1 (サンプル 1 の場合) と列 No. 4 (サンプル 2 の場合) について別々に計算されます。 合計ランク合計がプールされたサンプルの計算されたランク合計と一致するかどうかを確認することが不可欠です。
4. 2 つのランキング合計のうち大きい方を決定します。 それをT x と表します。
5. 次の式を使用して、基準 U の計算値を決定します。
ここで、n 1 はサンプル 1 の被験者の数です。
n 2 - サンプル 2 の被験者の数、
T x - 2 つのランク合計のうち大きい方、
n x は、ランクの合計が大きいサンプル内の被験者の数です。
6. 推論ルール:マン・ホイットニー検定の臨界値の表 (付録 1.4 を参照) を使用して、n 1 と n 2 に応じて U の臨界値を決定します。
もしあなたなら。 >U cr. 0.05、サンプル間の差異は統計的に有意ではありません。
もしあなたなら。 £U cr. 0.05、サンプル間の差は統計的に有意です。
U 値が小さいほど、差分の信頼性が高くなります。
ここで、T x はランクの最大合計であり、n x はサンプル サイズ n 1 と n 2 の最大です。
サービスの目的。 このオンライン計算機を使用すると、次のように計算できます。 マン・ホイットニーの U 検定.
基準の目的
この基準は、定量的に測定された属性のレベルに関して 2 つのサンプル間の差異を評価することを目的としています。 これにより、n 1、n 2 ≥ 3、または n 1 =2、n 2 ≥ 5 の場合に、小さなサンプル間の差異を識別できます。各サンプルの観測値は 60 個以下である必要があります。この方法は、2 つの系列間の値が交差する領域が十分に小さいかどうかを判断します。 最初の行 (サンプル、グループ) は、予備的な推定によると値が高い値の行であり、2 番目の行は値が低いと思われる行であると仮定します。
重複する値の領域が小さいほど、差が有意である可能性が高くなります。 これらの違いは、2 つのサンプルの位置の違いと呼ばれることもあります。
U 基準の経験値は、行間の一致領域がどのくらい大きいかを反映します。 したがって、U em が小さいほど、差が有意である可能性が高くなります。
仮説
H 0: グループ 2 の形質のレベルがグループ 1 の形質のレベル以上です。
H 1: グループ 2 の形質のレベルは、グループ 1 の形質のレベルよりも低い。
マン・ホイットニー基準を計算するためのアルゴリズム
- すべてのデータを 1 つのシリーズに結合し、異なるサンプルに属するデータをマークします。
- 値をランク付けし、小さい値に低いランクを割り当てます。 ランクの総数は (n 1 + n 2) です。
- ランクの合計をサンプルごとに個別に計算します。
- 2 つのランキングの合計のうち大きい方を決定します。
- 次の式を使用して U 値を決定します。
U = n 1 n 2 + n x (n x + 1)/2 – T x 、
ここで、n 1 – サンプルサイズ No. 1。 n 2 – サンプルサイズ No. 2。 T x – 2 つのランク合計のうち大きい方。 n x – 最大サンプル サイズ: n x = max(n 1, n 2)。 - 表を使用して U cr の臨界値を決定します。 U em > U cr (0.05)の場合。 H 0 は受け入れられます。 U em ≤ U cr (0.05) の場合、H 0 は拒否されます。 U 値が小さいほど、差分の信頼性が高くなります。
例。 D. ウェクスラーの手法を使用して、心理学実験の参加予定者の言語的および非言語的知能のレベルが測定されました。 物理学部と心理学部の学生である18歳から24歳の若い男性の2つのグループが検査されました。 言語的知性の指標が表に示されています。 言語的知性の点で、一方のグループが他方のグループよりも優れていると言えるでしょうか?
F | P |
135 | 130 |
130 | 129 |
131 | 121 |
128 | 129 |
127 | 119 |
137 | 124 |
126 | 125 |
137 | 129 |
131 | 129 |
137 | 130 |
137 | 131 |
127 | 123 |
133 | |
125 |
結果を比較すると、サンプル X の値がサンプル Y の値よりわずかに高いことが示されているため、最初にサンプル X を検討します。
したがって、スコア間の既存の差が有意であるとみなせるかどうかを判断する必要があります。
解決.
提示された表をランク付けしてみましょう。 ランキングの際には、2 つのサンプルを 1 つに結合します。 ランクは、測定された数量の値の昇順に割り当てられます。 最低ランクは最低スコアに対応します。 複数の生徒の得点が一致する場合、そのような得点のランクは、昇順に並べたときに、これらの得点が占める位置の算術平均として考慮する必要があることに注意してください。
マトリックスには1行目の関連ランク(同じランク番号)が含まれているので、並べ替えます。 ランクの再編成は、ランクの重要性を変えることなく実行されます。つまり、ランク番号間の対応関係(以上、以下、または等しい)が維持されなければなりません。 また、ランクを 1 より大きく、値より小さい値に設定することも推奨されません。 数値に等しいパラメータ (この場合は n = 26)。 ランクの再編成はテーブル内で行われます。
順序付けられた列の座席番号 | 専門家の評価に基づく要素の整理 | 新しいランク |
1 | 119 | 1 |
2 | 121 | 2 |
3 | 123 | 3 |
4 | 124 | 4 |
5 | 125 | 5.5 |
6 | 125 | 5.5 |
7 | 126 | 7 |
8 | 127 | 8.5 |
9 | 127 | 8.5 |
10 | 128 | 10 |
11 | 129 | 12.5 |
12 | 129 | 12.5 |
13 | 129 | 12.5 |
14 | 129 | 12.5 |
15 | 130 | 16 |
16 | 130 | 16 |
17 | 130 | 16 |
18 | 131 | 19 |
19 | 131 | 19 |
20 | 131 | 19 |
21 | 133 | 21 |
22 | 135 | 22 |
23 | 137 | 24.5 |
24 | 137 | 24.5 |
25 | 137 | 24.5 |
26 | 137 | 24.5 |
提案されたランキング原則を使用して、ランクのテーブルを取得します。
バツ | ランクX | Y | ランクY |
125 | 5.5 | 119 | 1 |
126 | 7 | 121 | 2 |
127 | 8.5 | 123 | 3 |
127 | 8.5 | 124 | 4 |
128 | 10 | 125 | 5.5 |
130 | 16 | 129 | 12.5 |
131 | 19 | 129 | 12.5 |
131 | 19 | 129 | 12.5 |
133 | 21 | 129 | 12.5 |
135 | 22 | 130 | 16 |
137 | 24.5 | 130 | 16 |
137 | 24.5 | 131 | 19 |
137 | 24.5 | ||
137 | 24.5 | ||
和 | 234.5 | 和 | 116.5 |
このデータは、基準の経験値を計算するための式を使用するのに十分です。
U cr の場合、サンプル間の差異の重要性に関する仮説 H 0 が受け入れられます。< u эмп. В противном случае H 0 отвергается и различие определяется как существенное.
ここで、U kp は臨界点であり、Mann-Whitney テーブルを使用して求められます。
見つけます 臨界点英国ポンド
表から、U kp (0.05) = 45 がわかります。
U kp > u em であるため、対立仮説 H 1 を受け入れます。 サンプリングレベルの違いは重大であると考えられます。
あらゆる属性のレベルによって、定量的に測定されます。 小さなサンプル間のパラメータ値の違いを識別できます。
別名: マン・ホイットニー・ウィルコクソン検定 マン・ホイットニー・ウィルコクソン、MWW )、ウィルコクソン順位和検定(eng. ウィルコクソン順位和検定) またはウィルコクソン・マン・ホイットニー検定 (eng. ウィルコクソン - マン - ホイットニー テスト ).
話
サンプル間の違いを識別するこの方法は、1945 年にフランク ウィルコクソン ( F.ウィルコクソン)。 1947 年に、H. B. マンによって大幅に改訂および拡張されました ( H・B・マン) と D.R. ホイットニー ( D.R.ホイットニー)、今日では通常その名前で呼ばれています。
基準の説明
単純なノンパラメトリック検定。 このテストの検出力は、Rosenbaum Q テストよりも高くなります。
この方法では、2 つのシリーズ (最初のサンプルのランク付けされたパラメーター値のシリーズと 2 番目のサンプルの同じパラメーター値) の間で重複する値の領域が十分に小さいかどうかを判断します。 基準値が低いほど、サンプル内のパラメーター値間の差異が信頼できる可能性が高くなります。
基準の適用性の制限
- 各サンプルには少なくとも 3 つの特性値が必要です。 1 つのサンプルに 2 つの値があることは許可されていますが、2 番目のサンプルには少なくとも 5 つの値があります。
- サンプル データには一致する値が存在しないか (すべての数値が異なります)、そのような一致はほとんど存在しません。
基準の使用
マン・ホイットニー U 検定を適用するには、次の操作を実行する必要があります。
マン・ホイットニーの U 検定の自動計算
クリティカル値テーブル
こちらも参照
- クラスカル-ウォリス検定は、マン-ホイットニー U 検定の多変量一般化です。
文学
- マン H.B.、ホイットニー D.R. 2 つの確率変数のうちの 1 つがもう 1 つよりも確率的に大きいかどうかのテスト。 // 数学統計の年報。 - 1947。 - No. 18。 - P. 50-60。
- ウィルコクソン F.ランキング方式による個別比較。 // バイオメトリクス速報 1. - 1945. - P. 80-83。
- ギュブラー E.V.、ゲンキン A.A.生物医学研究におけるノンパラメトリック統計基準の適用。 -L.、1973年。
- シドレンコ E.V.心理学における数学的処理の方法。 - サンクトペテルブルク、2002 年。
ウィキメディア財団。 2010年。
他の辞書で「Mann-Whitney U-test」が何であるかを確認してください。
マン・ホイットニー検査- - 電気通信のトピック、基本概念 EN Mann Whitney U テスト ... 技術翻訳者向けガイド
マン・ホイットニー U 検定は、定量的に測定された形質のレベルに関して 2 つのサンプル間の差異を評価するために使用されるノンパラメトリック統計検定です。 意味の違いを識別できます... ウィキペディア
マン・ホイットニー U 検定は、定量的に測定された形質のレベルに関して 2 つのサンプル間の差異を評価するために使用されるノンパラメトリック統計検定です。 意味の違いを識別できます... ウィキペディア
マン・ホイットニー U 検定は、定量的に測定された形質のレベルに関して 2 つの独立したサンプル間の差異を評価するために使用される統計検定です。 ... ... ウィキペディアを識別できます
- (英語のマン・ホイットニー U 検定) 定量的に測定された特性のレベルに関して 2 つのサンプル間の差異を評価するために使用されるノンパラメトリック統計検定。 小さなパラメータ間のパラメータ値の違いを識別できます。
コルモゴロフ・スミルノフ適合度検定は、2 つの経験的分布が同じ法則に従うかどうか、または結果の分布が仮定されたモデルに従うかどうかを判断するために使用される統計検定です。 ... ... Wikipedia
Wallis 検定は、複数のサンプルの中央値が等しいかどうかを検定するように設計されています。 この基準は、ウィルコクソン・マン・ホイットニー検定を多次元的に一般化したものです。 クラスカル ウォリス基準はランク基準であるため、どのような条件に対しても不変です。 ... ... Wikipedia
コクランの基準は次の場合に使用されます。 3つの比較同じサイズのさらに多くのサンプル。 次の場合、分散間の不一致は、選択した有意水準でランダムであると見なされます。 確率変数合計した数で... ... ウィキペディア
- (最大基準) 不確実な状況下での意思決定の基準の 1 つ。 極度の悲観主義の基準。 歴史 Wald 基準は、1955 年に同じサイズのサンプルに対して Abraham Wald によって提案され、その後拡張されました。