修理 分散を求める公式。 残差分散

分散を求める公式。 残差分散

変化範囲(または変化の範囲) -これは特性の最大値と最小値の差です。

この例では、労働者のシフト生産量の変動範囲は次のとおりです。第 1 旅団では R = 105-95 = 10 人の子供、第 2 旅団では R = 125-75 = 50 人の子供です。 (5倍以上)。 これは、第 1 旅団の生産量がより「安定」していることを示唆していますが、第 2 旅団には生産量を増加させるための余力がより多くあります。 すべての作業員がこの旅団の最大生産量に達した場合、3 * 125 = 375 個の部品を生産できますが、第 1 旅団では 105 * 3 = 315 個の部品しか生産できません。
特性の極値が母集団にとって一般的でない場合は、四分位または十分位の範囲が使用されます。 四分位範囲 RQ= Q3-Q1 は人口体積の 50% をカバーし、最初の十分位範囲 RD1 = D9-D1 はデータの 80% をカバーし、2 番目の十分位範囲 RD2= D8-D2 – 60% をカバーします。
変動範囲インジケーターの欠点は、その値が形質のすべての変動を反映していないことです。
特性のすべての変動を反映する最も単純な一般的な指標は次のとおりです。 平均 線形偏差 、絶対偏差の算術平均です。 別途オプション平均値から:

,
グループ化されたデータの場合
,
ここで、xi は次の特性の値です。 個別シリーズまたは区間分布の区間の中央。
上記の式では、分子の差は法で計算されます。それ以外の場合、算術平均の特性に従って、分子は常に次のようになります。 ゼロに等しい。 したがって、平均線形偏差が統計の実践で使用されることはほとんどなく、符号を考慮せずに指標を合計することが経済的に意味がある場合にのみ使用されます。 これを利用して、たとえば、労働力の構成、生産の収益性、対外貿易売上高などが分析されます。
形質の差異は、平均値からの偏差の平均二乗です。
単純な分散
,
分散加重
.
分散の計算式は次のように簡略化できます。

したがって、分散は、オプションの二乗平均と母集団オプションの平均の二乗の差に等しくなります。
.
ただし、偏差の二乗の合計により、分散は偏差についての歪んだ考え方を与えるため、平均はそれに基づいて計算されます。 標準偏差 これは、特性の特定のバリアントが平均値からどれだけ逸脱しているかを示します。 分散の平方根を計算して計算します。
グループ化されていないデータの場合
,
バリエーションシリーズ用

どうやって 価値が低い分散と標準偏差の場合、母集団が均一であればあるほど、平均の信頼性 (典型的) が高くなります。
平均線形偏差と標準偏差は名前付きの数値です。つまり、それらは特性の測定単位で表され、内容が同一で意味が似ています。
計算する 絶対的な指標表を使用してバリエーションを検討することをお勧めします。
表 3 – 変動特性の計算 (データの周期の例を使用) シフト生産旅団員)


従業員数

インターバルの真ん中

計算値

合計:

労働者の平均シフト生産量:

平均線形偏差:

生産差異:

個々の労働者の生産高の標準偏差 平均出力:
.

1 モーメント法による分散の計算

分散の計算には面倒な計算が必要です (特に平均値を表す場合) 多数の小数点以下複数桁あります)。 簡略化された式と分散特性を使用することで、計算を簡素化できます。
分散液には次の特性があります。

  1. 特性のすべての値が同じ値 A だけ減少または増加した場合、分散は減少しません。

,

、その後、または
分散の特性を使用し、まず母集団のすべてのバリアントを値 A で減らし、次に間隔 h の値で割ると、次の分散を計算する式が得られます。 バリエーションシリーズ定期的に 瞬間の流れ:
,
ここで、分散はモーメント法を使用して計算されます。
h – 変動系列の間隔の値。
– 新しい(変換された)値のオプション;
A は定数値であり、最高周波数の間隔の中央として使用されます。 または最も頻度が高いオプション。
– 一次モーメントの二乗;
– 二次命令の瞬間。
チームの従業員のシフト生産量に関するデータに基づいて、モーメント法を使用して分散を計算してみましょう。
表 4 - モーメント法を使用した分散の計算


生産労働者のグループ、PC。

従業員数

インターバルの真ん中

計算値

計算手順:


  1. 分散を計算します。

2 代替特性の分散の計算

統計によって研究される特性の中には、相互に排他的な 2 つの意味しか持たない特性があります。 これらは代替標識です。 これらにはそれぞれ、オプション 1 と 0 の 2 つの定量値が与えられます。p で示されるオプション 1 の頻度は、この特性を持つユニットの割合です。 差 1-р=q はオプション 0 の頻度です。したがって、


西

代替符号の算術平均
なぜなら、p+q=1だからです。

代替形質の差異
、 なぜなら 1-р=q
したがって、代替特性の分散は、この特性を持つユニットの割合とこの特性を持たないユニットの割合の積に等しくなります。
値 1 と 0 が同じ頻度で発生する場合、つまり p=q の場合、分散は最大 pq=0.25 に達します。
代替属性の分散は、製品品質などのサンプル調査で使用されます。

3 グループ間の分散。 分散加算ルール

分散は、他の変動特性とは異なり、付加的な量です。 つまり、要素の特性に従ってグループに分割された集合体です。 バツ , 得られる特性の分散 yは、各グループ内の分散(グループ内)とグループ間(グループ間)の分散に分解できます。 次に、集団全体にわたる形質の変動を研究するとともに、各グループ内の変動、およびこれらのグループ間の変動を研究することが可能になります。

合計差異 形質の変動を測定する この変動(偏差)を引き起こしたすべての要因の影響下で全体が変化します。 偏差の二乗平均に等しい 個体値サイン 総平均から計算され、単純分散または加重分散として計算できます。
グループ間分散結果として得られる形質の変化を特徴付ける 因子記号の影響によって引き起こされる バツ、グループ化の基礎を形成しました。 これはグループ平均のばらつきを特徴づけるもので、全体の平均からのグループ平均の偏差の平均二乗に等しくなります。
,
ここで、 は i 番目のグループの算術平均です。
– i 番目のグループのユニット数 (i 番目のグループの周波数)。
– 母集団全体の平均。
グループ内分散ランダムな変動、つまり説明されていない要因の影響によって引き起こされ、グループ化の基礎を形成する要因属性に依存しない変動の部分を反映します。 これは、グループ平均に対する個々の値の変動を特徴づけるものであり、属性の個々の値の平均二乗偏差に等しくなります。 グループ内の算術平均 (グループ平均) から算出され、各グループの単純分散または加重分散として計算されます。
または ,
ここで、 はグループ内のユニットの数です。
各グループのグループ内分散に基づいて、次のことを決定できます。 グループ内分散の全体平均:
.
3 つの分散間の関係は次のように呼ばれます。 差異を追加するためのルールこれによると、合計分散はグループ間の分散とグループ内分散の平均の合計に等しくなります。

。 労働者の料金区分(資格)が労働生産性の水準に与える影響を調査したところ、以下のようなデータが得られました。
表 5 – 平均時間当たり生産量ごとの労働者の分布。



ピー/ピー

第4類の労働者

第5類労働者

出力
労働者、個、

出力
労働者、個、

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

この例では労働者は要素の特性に応じて 2 つのグループに分けられます バツ– ランクによって特徴付けられる資格。 結果として生じる形質 - 生産 - は、その影響 (グループ間変動) と他の要因の両方によって変化します。 ランダム要因(グループ内変動)。 目標は、合計、グループ間、グループ内の 3 つの分散を使用してこれらの変動を測定することです。 経験的決定係数は、結果として得られる特性の変動の割合を示します。 因子記号の影響下で バツ。 残りの総変動量 他の要因の変化によって引き起こされます。
この例では、経験的な決定係数は次のようになります。
または66.7%、
これは、労働者の生産性の変動の 66.7% が資格の違いによるもので、33.3% が他の要因の影響によるものであることを意味します。
経験的な相関関係は、グループ化とパフォーマンス特性の間の密接な関係を示しています。 経験的決定係数の平方根として計算されます。

経験的な相関比は、 のように、0 から 1 までの値を取ることができます。
接続がない場合は =0 です。 この場合 =0、つまりグループ平均は互いに等しく、グループ間の変動はありません。 これは、グループ化特性要因が一般的な変動の形成に影響を与えないことを意味します。
接続が機能している場合は、=1 になります。 この場合、グループ平均の分散は合計分散 () に等しくなります。つまり、グループ内変動はありません。 これは、グループ化特性が研究対象の結果として得られる特性の変動を完全に決定することを意味します。
相関比の値が 1 に近づくほど、特性間の関連性が機能依存に近づきます。
特性間のつながりの近さを定性的に評価するには、チャドックの関係が使用されます。

例では 、これは労働者の生産性と資格の間に密接な関係があることを示しています。

統計におけるばらつきを一般化する主な指標は、分散と標準偏差です。

分散これ 算術平均 全体の平均からの各特性値の二乗偏差。 分散は通常、偏差の二乗平均と呼ばれ、 2 で表されます。 ソース データに応じて、単純平均または加重算術平均を使用して分散を計算できます。

 重み付けされていない (単純な) 分散。

 分散の重み付け。

標準偏差 これは絶対サイズの一般化された特性です バリエーション 集合体のサイン。 これは、属性と同じ測定単位 (メートル、トン、パーセント、ヘクタールなど) で表されます。

標準偏差は分散の平方根であり、 で表されます。

 重み付けされていない標準偏差。

 加重標準偏差。

標準偏差は、平均値の信頼性の尺度です。 標準偏差が小さいほど、算術平均は母集団全体をよりよく反映しています。

標準偏差の計算の前に、分散の計算が行われます。

加重分散を計算する手順は次のとおりです。

1) 加重算術平均を決定します。

2) 平均からのオプションの偏差を計算します。

3) 平均からの各オプションの偏差を二乗します。

4) 偏差の 2 乗に重み (度数) を掛けます。

5) 結果の生成物を要約します。

6) 結果の量を重みの合計で割ります。

例2.1

加重算術平均を計算してみましょう。

平均からの偏差の値とその二乗が表に示されています。 分散を定義しましょう。

標準偏差は次のようになります。

ソースデータが間隔の形式で表示される場合 配信シリーズ の場合は、まず属性の離散値を決定してから、説明されている方法を適用する必要があります。

例2.2

小麦収量に応じた集団農場の播種面積の分布に関するデータを使用した、区間系列の分散の計算を示します。

算術平均は次のとおりです。

分散を計算してみましょう。

6.3. 個別データに基づく計算式による分散の計算

計算手法 差異 複雑で、オプションや頻度の値が大きいと面倒になる可能性があります。 分散の特性を利用して計算を簡略化できます。

分散液は次のような性質を持っています。

1. 変化する特性の重み (周波数) を特定の回数だけ減少または増加しても、分散は変化しません。

2. 特性の各値を同じ一定量ずつ増減します。 分散は変わりません。

3. 各属性値を一定の回数だけ増減します kそれぞれ、分散を減少または増加させます k 2回 標準偏差 で k一度。

4. 任意の値に対する特性の分散は、平均値と任意の値の差の 2 乗あたりの算術平均に対する分散よりも常に大きくなります。

もし  0 の場合、次の等式が得られます。

つまり、特性の分散は、特性値の平均二乗と平均の二乗の差に等しくなります。

分散を計算する場合、各プロパティは独立して使用することも、他のプロパティと組み合わせて使用​​することもできます。

分散を計算する手順は簡単です。

1) 決定する 算術平均 :

2) 算術平均を二乗します。

3) シリーズの各バリアントの偏差を二乗します。

バツ 2 .

4) オプションの二乗和を求めます。

5) オプションの二乗和をその数で割ります。つまり、平均二乗を求めます。

6) 特性の平均二乗と平均の二乗の差を求めます。

例3.1労働者の生産性に関しては、次のデータが利用可能です。

次の計算をしてみましょう。

統計では、現象やプロセスを分析するときに、調査対象の指標の平均レベルに関する情報だけでなく、 個々の単位の値のばらつきまたはばらつき 、つまり 重要な特性研究対象の集団。

最も変動しやすいのは、さまざまな期間およびさまざまな場所での株価、需要と供給、および金利です。

変動を特徴付ける主な指標 、範囲、分散、標準偏差、変動係数です。

変動範囲 特性の最大値と最小値の差を表します。 R = Xmax – Xmin。 この指標の欠点は、形質の変動の境界のみを評価し、これらの境界内の変動性を反映していないことです。

分散 この欠点が欠けています。 これは、特性値の平均値からの偏差の平均二乗として計算されます。

分散を計算する簡単な方法 次の式 (単純かつ重み付け) を使用して実行されます。

これらの公式の適用例は、タスク 1 と 2 に示されています。

実際に広く使用されている指標は次のとおりです。 標準偏差 :

標準偏差は次のように定義されます。 平方根分散から求められ、研究対象の特性と同じ次元を持ちます。

考慮された指標により、変動の絶対値を取得できます。 研究対象の特性の測定単位で評価します。 彼らとは異なり、 変動係数 変動を相対的な観点、つまり平均レベルと比較して測定します。多くの場合、これが望ましいです。

変動係数の計算式。

「統計のばらつきの指標」というトピックの問題の解決例

問題1 。 この地域の銀行の月間平均預金額に対する広告の影響を調査する際、2 つの銀行が調査されました。 受け取った 次の結果:

定義する:
1) 各銀行について: a) 月あたりの平均預金額。 b) 貢献の分散。
2) 2 つの銀行を合わせた平均月間預金額。
3) 広告に応じて 2 つの銀行の預金の差異。
4) 広告を除くすべての要因に応じた 2 つの銀行の預金差異。
5) 加算ルールを使用した合計分散。
6) 決定係数。
7) 相関関係。

解決

1) 広告付き銀行の計算表を作成してみよう 。 平均月次デポジットを決定するには、間隔の中間点を見つけます。 この場合、開いた間隔 (最初) の値は、それに隣接する間隔 (2 番目) の値と条件付きで等しくなります。

加重算術平均の式を使用して平均預金サイズを求めます。

29,000/50 = 580 摩擦。

次の式を使用して寄与度の分散を求めます。

23 400/50 = 468

同様のアクションを実行します 広告のない銀行の場合 :

2) 2 つの銀行の平均預金額を一緒に求めてみましょう。 Хср =(580×50+542.8×50)/100 = 561.4 こすります。

3)公式:σ 2 =pq(代替属性の分散の公式)を使用して、広告に応じて2つの銀行の預金の分散を求める。 ここで、p=0.5 は広告に依存する要因の割合です。 q=1-0.5であれば、σ 2 =0.5×0.5=0.25となる。

4) 他の要因の割合が 0.5 であるため、広告を除くすべての要因に応じて 2 つの銀行の預金の分散も 0.25 になります。

5) 加算ルールを使用して合計分散を決定します。

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 = σ 2 事実 + σ 2 残り = 552.08+345.96 = 898.04

6) 決定係数 η 2 = σ 2 事実 / σ 2 = 345.96/898.04 = 0.39 = 39% - 貢献の大きさは広告に 39% 依存します。

7) 経験的相関比 η = √η 2 = √0.39 = 0.62 – 関係は非常に近いです。

問題 2 。 市場性のある製品の規模に応じて企業をグループ化します。

以下を決定します。 1) 市場性のある製品の価値の分散。 2)標準偏差。 3) 変動係数。

解決

1) 提示された条件による 間隔シリーズ配布物。 これは離散的に表現する必要があります。つまり、間隔 (x") の中央を見つけます。閉じた間隔のグループでは、単純な算術平均を使用して中央を見つけます。上限があるグループでは、この上限との差として次の間隔の半分のサイズ (200-(400 -200):2=100)。

下限があるグループの場合 - この下限と前の間隔の半分のサイズの合計 (800+(800-600):2=900)。

次の式を使用して、市場性のある製品の平均価格を計算します。

Хср = k×((Σ((x"-a):k)×f):Σf)+a。ここで、a=500 は最高周波数でのオプションのサイズ、k=600-400=200 は最大周波数でのオプションのサイズです。最高周波数での間隔のサイズ 結果を表に入れてみましょう。

したがって、調査対象期間の商業生産高の平均値は、一般にХср = (-5:37)×200+500=472.97千ルーブルに等しくなります。

2) 次の式を使用して分散を求めます。

σ 2 = (33/37)*2002-(472.97-500)2 = 35,675.67-730.62 = 34,945.05

3) 標準偏差: σ = ±√σ 2 = ±√34,945.05 ≈ ±186.94 千ルーブル。

4) 変動係数: V = (σ /Хср)*100 = (186.94 / 472.97)*100 = 39.52%

統計で使用される多くの指標の中で、分散の計算に注目する必要があります。 この計算を手動で実行するのはかなり面倒な作業であることに注意してください。 幸いなことに、Excel には計算手順を自動化できる機能があります。 これらのツールを使用するためのアルゴリズムを見てみましょう。

分散は変動の指標であり、分散の平均二乗です。 数学的期待。 したがって、平均値付近の数値の広がりを表します。 分散の計算は次のいずれかで実行できます。 人口、そして選択的に。

方法1:人口に基づく計算

一般集団について Excel でこの指標を計算するには、次の関数を使用します。 DISP.G。 この式の構文は次のとおりです。

DISP.G(数値1;数値2;…)

合計 1 ~ 255 個の引数を使用できます。 引数は次のとおりです。 数値、およびそれらが含まれるセルへの参照。

数値データの範囲に対してこの値を計算する方法を見てみましょう。


方法 2: サンプルによる計算

母集団に基づいて値を計算するのとは異なり、サンプルを計算する場合、分母は数値の合計ではなく、1 少ない数を示します。 これはエラー修正の目的で行われます。 Excel ではこの微妙な違いが考慮されます。 特別な機能、このタイプの計算を目的としています - DISP.V。 その構文は次の式で表されます。

DISP.B(数値1;数値2;…)

前の関数と同様に、引数の数も 1 ~ 255 の範囲で指定できます。


ご覧のとおり、Excel プログラムを使用すると、分散の計算が非常に簡単になります。 この統計は、アプリケーションによって母集団またはサンプルから計算できます。 この場合、すべてのユーザー操作は実際には処理する数値の範囲を指定することになり、主な作業は Excel 自体が行います。 間違いなくお金の節約になりますよ かなりの量ユーザーの時間。

このページでは説明します 標準的な例分散を見つけるには、他の問題を調べて分散を見つけることもできます

例 1. グループ、グループ平均、グループ間分散、および合計分散の決定

例 2. グループ化テーブルの分散と変動係数を求める

例 3. 離散系列の分散の検出

例 4. 次のデータは、20 人の通信制学生のグループで利用できます。 特性の分布の区間系列を構築し、特性の平均値を計算し、その分散を調査する必要があります

間隔グループを作成しましょう。 次の式を使用して間隔の範囲を決定しましょう。

ここで、X max はグループ化特性の最大値です。
X min – グループ化特性の最小値。
n – 間隔の数:

n=5 を受け入れます。 ステップは次のとおりです: h = (192 - 159)/ 5 = 6.6

間隔グループを作成しましょう

さらに計算を行うために、補助テーブルを作成します。

X"i – 間隔の中央。(たとえば、間隔の中央 159 – 165.6 = 162.3)

平均値加重算術平均の公式を使用して生徒の身長を決定します。

次の式を使用して分散を求めてみましょう。

式は次のように変形できます。

この式から次のことがわかります 分散は次の値に等しい オプションの二乗の平均と二乗と平均の差。

バリエーションシリーズのばらつきモーメント法を使用した等間隔の計算は、分散の 2 番目のプロパティ (すべてのオプションを間隔の値で割る) を使用して次の方法で計算できます。 分散の決定モーメント法を使用して計算されるため、次の式を使用する方が手間がかかりません。

ここで、i は間隔の値です。
A は従来のゼロであり、最高周波数の間隔の中央を使用すると便利です。
m1 は 1 次モーメントの 2 乗です。
m2 - 二次モーメント

代替形質の差異 (統計的母集団において、相互に排他的な選択肢が 2 つだけになるように特性が変化する場合、そのような変動性は代替と呼ばれます) は、次の式を使用して計算できます。

で置き換える この式分散 q =1- p の場合、次のようになります。

差異の種類

合計差異この変動を引き起こすすべての要因の影響下で、集団全体にわたる特性の変動を測定します。 これは、特性 x の全体の平均値からの特性 x の個々の値の偏差の二乗平均に等しく、単純分散または加重分散として定義できます。

グループ内分散 ランダムな変動を特徴づけます。 説明されていない要因の影響による変動の一部であり、グループの基礎を形成する要因属性には依存しません。 このような分散は、グループ X 内の属性の個々の値のグループの算術平均からの偏差の二乗平均に等しく、単純分散または加重分散として計算できます。



したがって、 グループ内分散測定グループ内の形質の変動であり、次の式で決定されます。

ここで、xi はグループ平均です。
ni はグループ内のユニットの数です。

たとえば、作業場における労働生産性のレベルに対する労働者の資格の影響を研究するタスクで決定する必要があるグループ内差異は、考えられるすべての要因(機器の技術的状態、設備の可用性)によって引き起こされる各グループの生産量の差異を示しています。ただし、資格カテゴリの違いは除きます(グループ内ではすべての労働者が同じ資格を持っています)。



サイトの新着情報

>

最も人気のある