ハウスプロジェクト 区間分布系列の構築。 配信シリーズ

区間分布系列の構築。 配信シリーズ

実験室作業その1

による 数学的統計

トピック: 実験データの一次処理

3. ポイントを獲得します。 1

5. コントロールの質問.. 2

6. 実行方法 実験室での仕事.. 3

仕事の目標

数理統計手法を用いた経験データの一次処理スキルを習得します。

実験データの全体に基づいて、次のタスクを完了します。

演習 1.区間変動分布系列を構築します。

タスク2。間隔変動系列の頻度ヒストグラムを作成します。

タスク3。経験的な分布関数を作成し、グラフをプロットします。

a) 最頻値と中央値。

b) 条件付き初期瞬間。

c) サンプル平均。

d) 標本分散、修正分散 人口、標準偏差を修正。

e) 変動係数。

f) 非対称性。

g) 尖度。

タスク5。真の値の境界を決定する 数値特性、与えられた信頼性で調査される確率変数。

タスク6。タスクの条件に従って一次処理の結果を内容に基づいて解釈します。

ポイントで得点する

タスク 1 ~ 56点

タスク62点

実験室での作業の擁護(試験問題と実験室での作業に関する口頭面接) - 2点

作品は A4 用紙に書面で提出する必要があり、次の内容が含まれます。

1) タイトルページ(別紙1)

2) 初期データ。

3) 指定されたサンプルに従って作品を提出する。

4) 指定された順序での計算結果 (手動および/または MS Excel を使用して実行)。

5) 結論 - タスクの条件に応じた一次処理の結果の有意義な解釈。

6) 仕事と管理に関する質問に関する口頭面接。



5. テストの問題


実験室作業を実行するための方法論

タスク 1. 区間変分分布系列を構築する

等間隔のオプションを含む変動系列の形式で統計データを表示するには、次のことが必要です。

1.元のデータテーブルで最小値と最大値を見つけます。

2.定義 変化の範囲 :

3. 間隔 h の長さを決定します。サンプルに最大 1000 個のデータが含まれる場合は、次の式を使用します。 ここで、n – サンプルサイズ – サンプル内のデータの量。 計算には lgn を使用します)。

計算された比率は次のように四捨五入されます。 便利な整数値 .

4. 偶数の間隔の最初の間隔の開始を決定するには、値を取得することをお勧めします。 奇数の間隔の場合。

5. グループ化間隔を書き留め、境界の昇順に並べます。

, ,………., ,

ここで、 は最初の間隔の下限です。 を超えない都合の良い数値が使用されます。最後の間隔の上限は を下回ってはなりません。 間隔には確率変数の初期値が含まれており、間隔から分離することをお勧めします。 5~20間隔。

6. グループ化間隔に関する初期データを書き留めます。 ソーステーブルから、指定された間隔内に収まる確率変数値の数を計算します。 いくつかの値が間隔の境界と一致する場合、 その場合、それらは前の間隔のみ、または後の間隔のみに起因すると考えられます。

注1.間隔の長さは同じである必要はありません。 値が密集している領域では、より小さく短い間隔を取得する方が便利であり、頻度の低い間隔ではより大きな間隔を取得する方が便利です。

注2一部の値で「ゼロ」または小さな周波数値が得られた場合は、データを再グループ化し、間隔を拡大する (ステップを増やす) 必要があります。

あなたの優れた成果をナレッジベースに送信するのは簡単です。 以下のフォームをご利用ください

よくできましたサイトへ">

研究や仕事でナレッジベースを使用している学生、大学院生、若い科学者の皆様には、大変感謝していることでしょう。

ポストする http://www.allbest.ru/

タスク1

以下の情報が入手可能です 賃金企業の従業員:

表1.1

従来の用語での賃金の額。 巣穴。 単位

見つけるために間隔分布系列を構築する必要があります。

1) 平均給与。

2) 平均 線形偏差;

4)標準偏差。

5) 変動の範囲。

6) 振動係数。

7) 線形係数バリエーション。

8) 単純な変動係数。

10)中央値。

11)非対称係数。

12)ピアソン非対称指数。

13) 尖度係数。

解決

ご存知のとおり、オプション (認識された値) は昇順に並べられて次のようになります。 離散変化シリーズ。 多数の場合 オプション (10 を超える) では、離散的な変動の場合でも、区間系列が構築されます。

間隔シリーズが等間隔でコンパイルされている場合、変動範囲は指定された間隔数で除算されます。 さらに、結果の値が整数で明確な場合 (これはまれですが)、間隔の長さはこの数値に等しいとみなされます。 その他の場合 生産された 丸める 必然的に V 増加、 それで 残った最後の桁は偶数でした。 明らかに、間隔が長くなると、 間隔の数の積に等しい量による変動の範囲: 計算された間隔の長さと最初の間隔の長さの差による

A) 変動範囲の拡大の大きさが重要でない場合は、特性の最大値に加算されるか、最小値から減算されます。

b) 変動範囲の拡大の大きさが顕著な場合は、範囲の中心が移動しないように、最大​​値に加算し、最大値から減算すると同時にほぼ半分に分割します。 最低値サイン。

不等間隔の間隔系列がコンパイルされる場合、プロセスは簡素化されますが、それでも間隔の長さは最後の偶数桁の数値として表現する必要があるため、その後の数値特性の計算が大幅に簡素化されます。

30 はサンプルサイズです。

スタージェスの公式を使用して区間分布系列を作成してみましょう。

K = 1 + 3.32*log n、

K - グループの数。

K = 1 + 3.32*lg 30 = 5.91=6

次の式を使用して、属性の範囲 - 企業の労働者の賃金 - (x) を求めます。

R= xmax - xmin を 6 で割ります。 R= 195-112=83

この場合、間隔の長さは次のようになります。 レーン=83:6=13.83

最初の間隔の始まりは 112 になります。112 に加算します。 ras = 13.83 の場合、最終値 125.83 が得られます。これは 2 番目の間隔の始まりでもあります。 5 番目のインターバルの終了 - 195。

頻度を見つけるときは、「特徴の値が内部間隔の境界と一致する場合、それは前の間隔に起因すると考えられる」というルールに従う必要があります。

度数の間隔系列と累積度数を取得します。

表1.2

したがって、従業員 3 名に給与が発生します。 手数料は 112 から 125.83 の従来の通貨単位です。 最高の給与 手数料は 181.15 から 195 の従来の通貨単位です。 従業員はたったの6人。

数値特性を計算するには、区間の中央をオプションとして使用して、区間系列を離散系列に変換します。

表1.3

14131,83

加重算術平均公式の使用

従来の通貨単位

平均線形偏差:

ここで、xi は母集団の i 番目の単位について調査されている特性の値です。

研究された形質の平均値。

ポストする http://www.allbest.ru/

L投稿日 http://www.allbest.ru/

従来の通貨単位

標準偏差:

分散:

相対変動範囲(振動係数): c= R:、

相対線形偏差: q = L:

変動係数: V = y:

振動係数は、算術平均を中心とした特性の極値の相対的な変動を示し、変動係数は母集団の程度と均一性を特徴付けます。

c= R: = 83 / 159.485*100% = 52.043%

したがって、極値間の差は、企業の従業員の平均給与より 5.16% (=94.84%-100%) 小さくなります。

q = L: = 17.765/ 159.485*100% = 11.139%

V = y: = 21.704/ 159.485*100% = 13.609%

変動係数は 33% 未満であり、これは企業の労働者の賃金の変動が小さいことを示しています。 平均値は労働者の賃金の典型的な特徴です(人口は均一です)。

インターバル分布シリーズにおいて ファッション式によって決定されます -

モーダル間隔の頻度、つまり、最大数のオプションを含む間隔。

モーダルに先行する間隔の頻度。

モーダルに続く間隔の頻度。

モーダル間隔の長さ。

モーダル間隔の下限。

決定するため 中央値区間シリーズでは次の式を使用します。

ここで、 は中央値に先行する間隔の累積(累積)頻度です。

中央間隔の下限。

間隔頻度の中央値。

中央間隔の長さ。

中央値間隔- 累積頻度 (=3+3+5+7) が頻度の合計の半分を超える間隔 - (153.49; 167.32)。

非対称性と尖度を計算してみましょう。新しいワークシートを作成します。

表1.4

事実データ

計算されたデータ

3次モーメントを計算してみましょう

したがって、非対称性は次のようになります。

0.3553 0.25 であるため、非対称性は重大であると考えられます。

4次モーメントを計算してみましょう

したがって、尖度は次のようになります。

なぜなら< 0, то эксцесс является плосковершинным.

非対称性の程度は、ピアソン非対称係数 (As): 振動サンプル値回転率を使用して決定できます。

ここで、 は分布系列の算術平均です。 - ファッション; - 標準偏差。

したがって、対称 (正規) 分布 = Mo の場合、非対称係数は ゼロに等しい。 As > 0 の場合、より多くのモードがあるため、右手系の非対称性が存在します。

もしそうなら< 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.

分布は対称ではなく、左側に非対称があります。

タスク 2

以前の調査に基づいて分散が 0.24 であることがわかっている場合、確率 0.954 でサンプリング誤差が 0.04 を超えないようにするには、サンプル サイズはどのようにすべきでしょうか?

解決

非反復サンプリングのサンプル サイズは、次の式を使用して計算されます。

t - 信頼係数 (0.954 の確率で 2.0 に等しくなります。確率積分の表から決定されます)、

y2=0.24 - 標準偏差。

10,000人 - サンプルサイズ;

Dx =0.04 - サンプル平均の最大誤差。

95.4% の確率で、0.04 以下の相対誤差を保証するサンプル サイズは少なくとも 566 家族であるべきであると言えます。

タスク3

次のデータは、企業の主な活動からの収入、100万ルーブルについて入手できます。

一連のダイナミクスを分析するには、次の指標を決定します。

1) チェーンとベーシック:

絶対的な増加。

成長率;

成長速度;

2) 平均

ダイナミック行レベル。

絶対的な増加。

成長速度;

増加率;

3) 1% 増加の絶対値。

解決

1. 絶対増加量(Dや)- これは、シリーズの次のレベルと前の (または基本的な) レベルの違いです。

チェーン: DN = yi - yi-1、

基本: DN = yi - y0、

уi - 行レベル、

i - 行レベル番号、

y0 - 基準年レベル。

2. 成長率(Tu)シリーズの後続のレベルと前のレベル (または基準年 2001) の比率です。

チェーン: Tu = ;

基本: Tu =

3. 成長率(TD) 以前のレベルに対する絶対成長率を%で表したものです。

チェーン: Tu = ;

基本: Tu =

4. 1%増加の絶対値(A)- これは、チェーンの絶対的な成長と成長率の比率を % で表したものです。

=

平均行レベル算術平均公式を使用して計算されます。

4 年間の中核的活動からの平均収入レベル:

平均絶対増加量次の式で計算されます。

ここで、n は系列のレベル数です。

年間平均で、中核的活動からの収入は 333 万 3000 ルーブル増加しました。

平均年間成長率幾何平均の式を使用して計算されます。

уn は行の最終レベルです。

y0 - 最初のレベル行。

Tu = 100% = 102.174%

平均年間成長率次の式で計算されます。

て? = Tu - 100% = 102.74% - 100% = 2.74%。

したがって、年間平均すると、企業の主要な活動からの収入は 2.74% 増加しました。

タスク4

計算します:

1. 個別の価格指数。

2. 一般的な貿易売上高指数。

3. 総合価格指数。

4. 商品の販売の物理的量の総合指数。

5. 貿易売上高の絶対増加額を要因別に分析する(価格および販売商品数の変化による)。

6. 取得したすべての指標について簡単な結論を出します。

解決

1. 条件によると、製品 A、B、C の個別の価格指数は -

ipA=1.20; iрБ=1.15; iрВ=1.00。

2. 次の式を使用して、一般的な取引回転率指数を計算します。

I w = = 1470/1045*100% = 140.67%

貿易売上高は 40.67% (140.67%-100%) 増加しました。

平均すると、一次産品価格は10.24%上昇した。

価格上昇による購入者の追加費用の金額は次のとおりです。

w(p) = ? p1q1 - ? p0q1 = 1470 - 1333.478 = 1 億 3652 万 2000 ルーブル。

価格上昇の結果、買い手はさらに1億3,652万2,000ルーブルを費やす必要があった。

4. 貿易売上高の物理量の一般的な指標:

物理的な取引高は 27.61% 増加しました。

5. 定義しましょう 全体的な変化第 1 期と比較した第 2 期の売上高:

w = 1470-1045 = 4 億 2,500 万ルーブル。

価格変更のため:

W(p) = 1470 - 1333.478 = 1億3652万2000ルーブル。

物理ボリュームの変化による:

w(q) = 1333.478 - 1045 = 2億8847万8000ルーブル。

商品の売上高は 40.67% 増加しました。 3商品の価格は平均10.24%上昇した。 物理的な取引高は 27.61% 増加しました。

全体として、販売量は4億2,500万ルーブル増加し、その内訳は価格上昇により1億3,652万2,000ルーブル増加し、販売量の増加により2億8,847万8,000ルーブル増加しました。

タスク5

次のデータは、1 つの業界の 10 工場について利用できます。

植物番号

製品生産量、千個 (バツ)

与えられたデータに基づいて:

I) 要素特性 (製品量) とその結果の特性 (電力消費量) の間に線形相関関係が存在することに関する論理分析の規定を確認し、相関フィールドのグラフ上に初期データをプロットし、次の形式について結論を導き出します。関係の式を示します。

2)接続方程式のパラメータを決定し、得られた理論上の直線を相関場のグラフ上にプロットする。

3) 線形相関係数を計算します。

4) 2) および 3) 項で得られた指標の意味を説明する。

5) 結果のモデルを使用して、次のことを予測します。 消費の可能性生産量4.5千台の工場での電力。

解決

属性のデータ、つまり生産量 (要素) を xi で表します。 符号 - уi による電力消費量 (結果)。 座標 (x, y) を持つ点が相関フィールド OXY 上にプロットされます。

相関フィールドの点は、特定の直線に沿って配置されます。 したがって、関係は線形です。直線 Уx=ax+b の形の回帰式を探します。 これを見つけるには、正規方程式系を使用します。

計算表を作成してみましょう。

見つかった平均を使用してシステムを構成し、パラメータ a と b に関してそれを解きます。

したがって、x に対する y の回帰式が得られます: = 3.57692 x + 3.19231

相関フィールドに回帰直線を作成します。

列 2 の x 値を回帰式に代入して計算値 (列 7) を取得し、それらを y データと比較します。これは列 8 に反映されます。 ちなみに、計算の正しさは次のように確認されます。 y と の平均値の一致。

係数線形相関特性 x と y の間の関係の近さを評価し、次の式を使用して計算されます。

直接回帰の角度係数 a (x における) は、特定された角度の方向を特徴付けます。依存関係符号: a>0 の場合は同じ、a の場合は同じ<0- противоположны. その絶対的な value - 因子特性が測定単位によって変化した場合に、結果として得られる特性の変化の尺度。

直接回帰の自由項は方向を明らかにし、その絶対値は、結果の符号に対する他のすべての要因の影響の定量的尺度です。

もし< 0 の場合、個々のオブジェクトの要素特性のリソースがより少ない量で使用されます。>0 オブジェクトのセット全体の平均よりも高い効率。

事後回帰分析を実行してみましょう。

直接回帰の x における係数は 3.57692 >0 に等しいため、生産量の増加 (減少) に伴い、電力消費量も増加 (減少) します。 生産量が1,000個増加。 電力消費量は平均 357,692 千 kWh 増加します。

2. 直接回帰の自由項は 3.19231 に等しいため、他の要因の影響により、製品出力が電力消費量に与える影響は絶対値で 3.19231 千 kWh 増加します。

3. 相関係数 0.8235 は、電力消費が製品出力に非常に密接に依存していることを示しています。

式によると、 回帰モデル予測がしやすい。 これを行うには、生産量である x の値を回帰式に代入し、電力消費量を予測します。 この場合、x の値は、特定の範囲内だけでなく、その範囲外でも取得できます。

生産台数4.5万台の工場で想定されるエネルギー消費量を予測してみましょう。

3.57692*4.5 + 3.19231= 19.288 45,000 kWh。

使用したソースのリスト

1. ザハレンコフ S.N. 社会経済統計の教科書と実践ガイド。 -Mn.: BSEU、2002 年。

2. エフィモワ M.R.、ペトロヴァ E.V.、ルミャンツェフ V.N. 統計の一般理論。 - M.: インフラ - M.、2000。

3.エリセーヴァI.I. 統計。 - M.: プロスペクト、2002 年。

4. 統計学一般論 / 一般論の下。 編 O.E. バシナ、A.A. スピリナ。 - M.: 財務と統計、2000 年。

5. 社会経済統計: 教育的かつ実践的。 手当 / ザハレンコフ S.N. 他 - Mn.: エレバン州立大学、2004 年。

6. 社会経済統計:教科書。 手当。 /編 ネステロヴィッチ S.R. - 男性: BSEU、2003 年。

7. Teslyuk I.E.、Tarlovskaya V.A.、Terlizhenko N. 統計 - ミンスク、2000。

8. ハルチェンコ L.P. 統計。 - M.: インフラ - M、2002 年。

9. ハルチェンコ L.P.、ドルジェンコワ V.G.、イオニン V.G. 統計。 - M.: インフラ - M、1999 年。

10. 経済統計・編 Yu.N. イワノバ - M.、2000。

Allbest.ru に掲載

...

類似の文書

    の算術平均の計算 間隔シリーズ配布物。 貿易売上高の物理的な量の一般的な指標の決定。 物理量の変化による総生産コストの絶対的な変化の分析。 変動係数の計算。

    テスト、2010/07/19 追加

    卸売、小売、公貿易の本質。 個別および総売上高指数を計算するための式。 区間分布系列の特性の計算 - 算術平均、最頻値と中央値、変動係数。

    コースワーク、2013/05/10 追加

    計画および実際の販売量、計画達成率、売上高の絶対変化を計算します。 絶対成長率、平均成長率、現金収入の増加の決定。 構造平均の計算: 最頻値、中央値、四分位数。

    テスト、2012 年 2 月 24 日追加

    利益量ごとの銀行の分布の区間系列。 結果として得られる区間分布系列の最頻値と中央値を求める グラフィカルな方法そして計算によって。 区間分布系列の特性の計算。 算術平均の計算。

    テスト、2010 年 12 月 15 日追加

    区間系列の平均値を決定するための公式 - 最頻値、中央値、分散。 チェーンおよび基本スキーム、成長率および増分を使用したダイナミクス系列の分析指標の計算。 コスト、価格、経費、売上高の統合インデックスの概念。

    コースワーク、2011/02/27 追加

    バリエーションシリーズを構成するコンセプトと目的、順序とルール。 グループ内のデータの均一性の分析。 形質の変動(変動)の指標。 線形平均の決定と 二乗偏差、振動係数と変動係数。

    テスト、2010 年 4 月 26 日追加

    最頻値と中央値の概念 典型的な特徴、その決定の手順と基準。 離散変動系列および区間変動系列の最頻値と中央値を見つけます。 変動統計系列の追加特性としての四分位数と十分位数。

    テスト、2010/09/11 追加

    グループ化特性に基づいた区間分布系列の構築。 対称形状からの周波数分布の偏差の特性、尖度および非対称指標の計算。 貸借対照表または損益計算書の指標の分析。

    テスト、2014 年 10 月 19 日追加

    経験的系列を離散系列および区間系列に変換します。 意味 平均サイズそのプロパティを使用して離散系列にわたって。 離散的な一連のモード、中央値、変動指標 (分散、偏差、振動係数) を使用した計算。

    テスト、2011/04/17 追加

    組織の分布に関する統計シリーズの構築。 最頻値と中央値のグラフィカルな決定。 決定係数を使用した相関の近さ。 平均従業員数の標本誤差を決定します。

それらは配信シリーズの形式で提示され、形式で提示されます。

分布シリーズはグループ化のタイプの 1 つです。

配布範囲— 特定の変化する特性に従って、調査対象の集団をグループに分けた順序付けされた分布を表します。

分布系列の形成の基礎となる特性に応じて、それらは区別されます。 連体詞と変体詞分布行:

  • 限定的- は、定性的特性に従って構築された分布系列と呼ばれます。
  • 値の昇順または降順で構築された分布系列 定量的特性呼ばれます 変分.
分布の変動系列は 2 つの列で構成されます。

最初の列は、と呼ばれるさまざまな特性の定量的な値を提供します。 オプションと指定されています。 個別のオプション - 整数として表現されます。 間隔オプションの範囲は from と to です。 オプションのタイプに応じて、離散変動系列または間隔変動系列を構築できます。
2 番目の列には次の内容が含まれます 特定のオプションの数、周波数または頻度で表されます。

周波数- これらは、合計で何回発生するかを示す絶対的な数値です。 与えられた値を示す標識。 すべての度数の合計は、母集団全体のユニット数と等しくなければなりません。

周波数() は合計に対する割合で表された頻度です。 パーセンテージとして表されるすべての頻度の合計は、1 の分数で 100% に等しくなければなりません。

分布系列のグラフィック表現

一連の分布はグラフィック画像を使用して視覚的に表示されます。

配布シリーズは次のように表されます。
  • ポリゴン
  • ヒストグラム
  • 累積する
  • オギブズ

ポリゴン

多角形を構築するとき、変化する特性の値が横軸 (x 軸) にプロットされ、頻度または頻度が縦軸 (y 軸) にプロットされます。

図のポリゴン 6.1 は、1994 年のロシア人口の小国勢調査のデータに基づいています。

6.1. 世帯人数分布

状態: データは、料金体系ごとに、ある企業の従業員 25 人の分布について提供されます。
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
タスク: 離散的な変動系列を構築し、それを分布ポリゴンとしてグラフィカルに描画します。
解決:
この例では options は従業員の料金カテゴリです。 頻度を決定するには、対応する料金カテゴリの従業員数を計算する必要があります。

ポリゴンは離散変化シリーズに使用されます。

分布多角形 (図 1) を構築するには、横軸 (X) 軸に沿って変化する特性 - バリアント - の定量値をプロットし、縦軸に沿って頻度または周波数をプロットします。

特性の値が間隔の形式で表現される場合、そのような系列は間隔と呼ばれます。
インターバルシリーズ分布はヒストグラム、累積または累積の形式でグラフで表示されます。

統計表

状態: 預金規模に関するデータは 20 です。 個人ある銀行では(千ルーブル)60。 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
タスク: 等間隔の間隔変動系列を構築します。
解決:

  1. 初期集団は 20 ユニット (N = 20) で構成されます。
  2. スタージェスの公式を使用して、次のように決定します。 必要量使用されたグループ: n=1+3,322*lg20=5
  3. 等間隔の値を計算してみましょう: i=(152 - 2) /5 = 30,000 ルーブル
  4. 初期人口を3万ルーブルの間隔で5つのグループに分けてみましょう。
  5. グループ化の結果を表に示します。

このような連続特性の記録では、同じ値が 2 回(ある区間の上限と別の区間の下限として)出現する場合、その値はその値が上限となるグループに属します。

棒グラフ

ヒストグラムを作成するには、間隔の境界値が横軸に沿って示され、それらに基づいて長方形が作成されます。その高さは頻度(または頻度)に比例します。

図では、 6.2. は、1997 年のロシア人口の年齢層別分布のヒストグラムを示しています。

米。 6.2. ロシアの人口の年齢層別分布

状態: 会社の従業員 30 人の月給による分布が与えられます。

タスク: 区間変動系列をヒストグラム形式でグラフィカルに表示し、累積します。
解決:

  1. 開いた (最初の) 間隔の未知の境界は、2 番目の間隔の値によって決まります: 7000 - 5000 = 2000 ルーブル。 同じ値で、最初の間隔の下限がわかります: 5000 - 2000 = 3000 ルーブル。
  2. 直交座標系でヒストグラムを作成するには、静脈瘤シリーズの間隔に対応する値を持つセグメントを横軸に沿ってプロットします。
    これらのセグメントは下底として機能し、対応する周波数(周波数)は形成される長方形の高さとして機能します。
  3. ヒストグラムを作成しましょう。

累積値を構築するには、累積された周波数 (周波数) を計算する必要があります。 それらは、前の間隔の度数 (頻度) を順番に合計することによって決定され、S と指定されます。累積された度数は、検討中の特徴値以下の特徴値を持つ母集団の数を示します。

累積する

累積周波数 (周波数) にわたる変動系列の特性の分布は、累積を使用して表されます。

累積するまたは、累積曲線は、多角形とは異なり、累積された頻度または頻度から構築されます。 この場合、特性の値が横軸に配置され、累積周波数または周波数が縦軸に配置されます(図6.3)。

米。 6.3. 世帯人数分布の累計

4. 累積周波数を計算してみましょう。
最初の間隔の累積頻度は次のように計算されます: 0 + 4 = 4、2 番目の間隔の場合: 4 + 12 = 16。 3 番目の場合: 4 + 12 + 8 = 24 など。

累積を作成する場合、対応する間隔の累積頻度 (周波数) がその上限に割り当てられます。

オギバ

オギバは、累積値と同様に構築されますが、唯一の違いは、累積周波数が横軸に配置され、特性値が縦軸に配置されることです。

累積のタイプは、濃度曲線またはローレンツ プロットです。 濃度曲線を両軸にプロットするには 長方形システム座標では、スケール スケールが 0 から 100 までのパーセンテージとしてプロットされます。この場合、累積周波数が横軸に示され、特性の体積別のシェア (パーセント) の累積値が横軸に示されます。縦軸。

特性の一様分布は、グラフ上の正方形の対角線に相当します(図6.4)。 偏在している場合、形質の集中度に応じてグラフは凹型の曲線を描きます。

6.4. 濃度曲線

数学統計- 科学的かつ実践的な結論を得るために統計データを処理、体系化し、使用する数学的方法に特化した数学の一分野。

3.1. 数学統計の基本概念

医学的および生物学的問題では、多くの場合、非常に多くの個人の特定の特性の分布を研究する必要があります。 さまざまな個人において、この兆候は次のような特徴を持っています。 違う意味, したがって、これは確率変数です。 たとえば、任意の 医薬品異なる患者に適用すると効果も異なります。 ただし、この薬の有効性を理解するために、それを適用する必要はありません。 みんな病気。 比較的少数の患者グループに対する薬剤の使用結果を追跡し、得られたデータに基づいて、治療プロセスの重要な特徴(有効性、禁忌)を特定することが可能です。

人口- 研究対象となる何らかの属性によって特徴付けられる同種の要素のセット。 この標識は 継続的な分布密度のある確率変数 f(x)。

たとえば、特定の地域における病気の蔓延に関心がある場合、一般集団はその地域の人口全体です。 この病気に対する男性と女性の感受性を別々に調べたい場合は、2 つの一般集団を考慮する必要があります。

一般集団の特性を研究するには、その要素の特定の部分が選択されます。

サンプル- 検査(治療)のために選ばれた一般集団の一部。

これが混乱を引き起こさない場合、サンプルは次のように呼ばれます。 オブジェクトのセット、調査対象に選ばれ、 全体性

価値観試験中に得られた研究された特性。 これらの値はいくつかの方法で表すことができます。

単純 統計系列 - 研究対象の特性の値が取得された順序で記録されます。

20 人の患者の額の皮膚の表面波速度 (m/s) を測定することによって得られた単純な統計系列の例を表に示します。 3.1.

表3.1。単純な統計系列

単純な統計シリーズは、調査結果を記録する主かつ最も完全な方法です。 何百もの要素を含めることができます。 このような全体像を一目で把握することは非常に困難です。 したがって、大きなサンプルは通常、グループに分割されます。 これを行うために、特性の変化領域をいくつか(N)に分割します。 間隔幅が等しく、これらの間隔に該当する属性の相対頻度 (n/n) を計算します。 各間隔の幅は次のとおりです。

間隔の境界には次の意味があります。

サンプル要素が 2 つの隣接する間隔の間の境界である場合、それは次のように分類されます。 間隔。 このようにグループ化されたデータは 間隔統計系列。

は、属性値の間隔と、これらの間隔内での属性の相対的な出現頻度を示す表です。

私たちのケースでは、たとえば、次の間隔統計系列 (N = 5、 d= 4)、表。 3.2.

表 3.2.間隔統計系列

ここで、間隔 28-32 には 28 に等しい 2 つの値が含まれ (表 3.1)、間隔 32-36 には値 32、33、34、および 35 が含まれます。

間隔統計系列をグラフで表すことができます。 これを行うには、属性値の間隔が横軸に沿ってプロットされ、それぞれの軸上に、ベースと同様に、相対頻度に等しい高さの長方形が構築されます。 結果として得られる棒グラフは次のように呼ばれます。 ヒストグラム。

米。 3.1.棒グラフ

ヒストグラムでは、特性の分布の統計的パターンが非常に明確に表示されます。

サンプル サイズが大きく (数千)、列幅が狭い場合、ヒストグラムの形状はグラフの形状に近くなります。 分布密度サイン。

ヒストグラムの列の数は、次の式を使用して選択できます。

ヒストグラムを手動で作成するのは長いプロセスです。 そこで開発された コンピュータプログラム自動構築のため。

3.2. 統計系列の数値特性

多くの統計手順では、母集団の期待値と分散 (または MSE) のサンプル推定値が使用されます。

標本平均(X) は、単純な統計系列のすべての要素の算術平均です。

私たちの例では バツ= 37.05 (m/秒)。

サンプル平均は次のとおりです最高の一般的な平均推定値M.

サンプル分散 s 2サンプル平均からの要素の偏差の二乗の合計を で割ったものに等しい。 n- 1:

この例では、s 2 = 25.2 (m/s) 2 です。

標本分散を計算するとき、式の分母は標本サイズ n ではなく、n-1 であることに注意してください。 これは、式 (3.3) の偏差を計算するときに、未知の数学的期待値の代わりに、その推定値が使用されるという事実によるものです。 標本平均。

標本分散は 最高の一般分散 (σ 2) の推定。

サンプル標準偏差(s)は 平方根サンプル分散から:

私たちの例では s= 5.02 (m/秒)。

選択的 二乗平均平方根偏差は、一般的な標準偏差 (σ) の最良の推定値です。

サンプルサイズが無制限に増加すると、すべてのサンプルの特徴が一般母集団の対応する特徴に近づく傾向があります。

サンプルの特性を計算するにはコンピューターの公式が使用されます。 Excel では、これらの計算により統計関数 AVERAGE、VARIANCE が実行されます。 標準偏差

3.3. 間隔の評価

すべてのサンプルの特性は、 ランダム変数。これは、同じサイズの別のサンプルでは、​​サンプル特性の値が異なることを意味します。 したがって、選択的

特徴はただ 見積り人口の関連する特徴。

選択的評価の欠点は次のように補われます。 間隔推定、代表する 数値間隔その中で与えられた確率で Rd位置した 本当の意味評価されるパラメータ。

させて U r - 一般母集団のパラメータ (一般平均、一般分散など)。

間隔の推定パラメータ U r は間隔と呼ばれます (U1、U2)、条件を満たす:

P(U < Ur < U2) = Рд. (3.5)

確率 Rd呼ばれた 信頼確率。

信頼確率 Pd - 推定量の真の値が以下である確率 内部指定された間隔。

この場合の間隔は、 (U1、U2)呼ばれた 信頼区間推定されるパラメータの場合。

多くの場合、信頼確率の代わりに、関連する値 α = 1 - Р d が使用されます。これは、と呼ばれます。 重要度のレベル。

重要なレベル推定されたパラメータの真の値が次のとおりである確率です。 信頼区間.

α および P d は、0.05 の代わりに 5%、0.95 の代わりに 95% など、パーセンテージで表される場合があります。

間隔推定では、まず適切な値を選択します。 信頼確率 (通常は 0.95 または 0.99)、推定されたパラメーターの値の対応する間隔を見つけます。

いくつかメモしてみましょう 一般的なプロパティ間隔の推定。

1. 重要度が低いほど (重要度が高くなるほど) R d)、間隔の推定値が広くなるほど。 したがって、有意水準が 0.05 の場合、一般平均の区間推定値は 34.7 になります。< M< 39,4, то для уровня 0,01 она будет гораздо шире: 33,85 < M< 40,25.

2. サンプルサイズが大きいほど ん、選択した有意水準での区間推定値が狭くなります。 たとえば、20 個の要素のサンプルから得られた全体平均 (β = 0.05) のパーセント推定値を 5 とすると、34.7 になります。< M< 39,4.

サンプルサイズを 80 に増やすと、同じ有意水準 (35.5) でより正確な推定値が得られます。< M< 38,6.

一般に、信頼できる信頼度推定値を構築するには、推定されたランダム属性が母集団内に分布する法則の知識が必要です。 間隔推定がどのように構築されるかを見てみましょう 全体平均に従って集団内に分布する特性 普通法。

3.4. 正規分布則の一般平均の区間推定

正規分布法則による母集団の一般平均 M の区間推定値の構築は、次の特性に基づいています。 サンプリング量について n態度

自由度 ν = のスチューデント分布に従います。 n- 1.

ここ バツ- サンプル平均、および s- 選択的標準偏差。

スチューデント分布表またはそれに類似したコンピュータを使用すると、特定の信頼確率で次の不等式が成り立つような境界値を見つけることができます。

この不等式は、M の不等式に対応します。

どこ ε - 信頼区間の半値幅。

したがって、M の信頼区間の構築は次の順序で実行されます。

1. 信頼確率 Р d (通常は 0.95 または 0.99) を選択し、それに対して Student 分布表を使用してパラメータ t を見つけます。

2. 信頼区間 ε の半値幅を計算します。

3. 選択した信頼確率を使用して、一般平均の区間推定値を取得します。

簡単に書くと次​​のようになります。

間隔の推定値を見つけるためのコンピューター手順が開発されました。

学生分布表の使い方を説明します。 この表には 2 つの「入り口」があります。左の列は自由度 ν = と呼ばれます。 n-1、一番上の行が有意水準αです。 対応する行と列の交点でスチューデント係数を見つけます。 t.

このメソッドをサンプルに適用してみましょう。 学生分布表の一部を以下に示します。

表3.3. 学生分布表の一部

20 人のサンプルの単純な統計シリーズ (n= 20、ν =19) を表に示します。 3.1. このシリーズについては、式 (3.1 ~ 3.3) を使用して計算すると次のようになります。 バツ= 37,05; s= 5,02.

選びましょう α = 0.05 (Р d = 0.95)。 行「19」と列「0.05」の交差点に次のことがわかります。 t= 2,09.

式 (3.6) を使用して推定の精度を計算してみましょう: ε = 2.09?5.02/λ /20 = 2.34。

区間推定値を作成しましょう。95% の確率で、未知の一般平均は次の不等式を満たします。

37,05 - 2,34 < M< 37,05 + 2,34, или M= 37.05 ± 2.34 (m/s)、R d = 0.95。

3.5. 統計的仮説を検証する方法

統計的仮説

統計的仮説とは何かを定式化する前に、次の例を検討してください。

特定の病気を治療する 2 つの方法を比較するために、それぞれ 20 人からなる 2 つの患者グループが選択され、これらの方法を使用して治療されました。 患者ごとに記録されました 手続きの数、その後、プラスの効果が得られました。 これらのデータに基づいて、各グループのサンプル平均 (X)、サンプル分散が求められました。 (s2)とサンプル標準偏差 (s)。

結果を表に示します。 3.4.

表3.4

プラスの効果を得るために必要な手順の数は確率変数であり、そのすべての情報は現在、指定されたサンプルに含まれています。

テーブルから 3.4 は、最初のグループの標本平均が 2 番目のグループよりも小さいことを示しています。 これは、同じ関係が一般平均にも当てはまることを意味しますか: M 1< М 2 ? Достаточно ли статистических данных для такого вывода? Ответы на эти вопросы и дает 仮説の統計的検証。

統計的仮説- それは母集団の特性に関する仮定です。

性質に関する仮説を検討していきます 一般の人々。

人口が持っている場合 既知の、同一の推定値の分布と値に関する仮定 何らかのパラメータこの分布の仮説は次のように呼ばれます。 パラメトリック。たとえば、サンプルは次のような母集団から抽出されます。 通常の法律分布と等分散。 調べる必要がある 彼らは同じですかこれらの母集団の一般的な平均。

一般集団の分布の法則について何もわかっていない場合、その特性についての仮説が呼び出されます。 ノンパラメトリック。例えば、 彼らは同じですかサンプルが抽出される母集団の分布の法則。

帰無仮説と対立仮説。

仮説を検証するタスク。 重要なレベル

仮説を検証するときに使用される用語を理解しましょう。

H 0 - 帰無仮説 (懐疑論者の仮説) は仮説です 差異がないことについて比較されたサンプル間。 懐疑論者は、研究結果から得られたサンプル推定値間の差異はランダムであると信じています。

H1- 対立仮説 (楽観的仮説) は、比較されたサンプル間の差異の存在に関する仮説です。 楽観主義者は、サンプル推定値間の差異は客観的な理由によって引き起こされ、一般母集団の差異に対応すると信じています。

統計的仮説のテストは、いくつかの仮説を構築できる場合にのみ実行可能です。 サイズ(基準)、公平性の場合の分配法則 H0有名な。 次に、この数量について指定できます 信頼区間、与えられた確率でその中に Rdその意味が落ちてしまいます。 この間隔を次のように呼びます。 クリティカルエリア。基準値が臨界領域に該当する場合、仮説は受け入れられます。 N0。それ以外の場合、仮説 H 1 が受け入れられます。

医学研究では、P d = 0.95 または P d = 0.99 が使用されます。 これらの値は対応します 有意水準α = 0.05 または α = 0.01。

統計的仮説を検証する場合重要度のレベル(α) 帰無仮説が真である場合にそれを棄却する確率です。

仮説検証手順の本質的な目的は次のとおりであることに注意してください。 違いの検出そして彼らの不在を確認するものではありません。 基準値が臨界領域を超えたとき、私たちは「懐疑論者」に対して純粋な心でこう言うことができます。まあ、他に何が欲しいの?! 差異がない場合、95% (または 99%) の確率で、計算値は指定された制限内に収まります。 でもだめです!

そうですね、基準の値が臨界領域に該当する場合、仮説 H 0 が正しいと信じる理由はありません。 これはおそらく 2 つの考えられる理由のいずれかを示しています。

1. サンプルサイズが違いを検出できるほど大きくありません。 継続的な実験が成功をもたらす可能性があります。

2. 違いがあります。 しかし、それらは非常に小さいため、実用的な重要性はありません。 この場合、実験を続ける意味はありません。

次に、医学研究で使用されるいくつかの統計的仮説を検討してみましょう。

3.6. 分散の等価性、フィッシャーの F 基準に関する仮説の検定

いくつかの臨床研究では、 前向きな効果あまり多くはないと証言する 大きさ調査対象のパラメータのうち、どれくらいの量か 安定、その変動を軽減します。 この場合、サンプル調査の結果に基づいて 2 つの一般的な分散を比較することについて疑問が生じます。 この問題は次を使用して解決できます フィッシャーのテスト。

問題の定式化

通常の法律配布物。 サンプルサイズ -

n1そして n2、サンプルの分散等しい s 1 と s 2 2 一般的な差異。

検証可能な仮説:

H0- 一般的な差異 同じだ;

H1- 一般的な差異 異なっています。

サンプルが次の母集団から抽出された場合に表示されます。 通常の法律分布、仮説が正しい場合 H0標本分散の比率はフィッシャー分布に従います。 したがって、公平性をチェックする基準としては、 H0値が取られます F、次の式で計算されます。

どこ s 1 と s 2 は標本分散です。

この比率は、分子の自由度 ν 1 = のフィッシャー分布に従います。 n1- 1 および分母の自由度の数 ν 2 = n 2 - 1。臨界領域の境界は、フィッシャー分布表またはコンピューター関数 BRASPOBR を使用して求められます。

表に示されている例の場合。 3.4 では、ν 1 = ν 2 = 20 - 1 = 19 が得られます。 F= 2.16/4.05 = 0.53。 α = 0.05 では、臨界領域の境界はそれぞれ = 0.40、 = 2.53 です。

基準値が臨界領域に該当するため、仮説が受け入れられます H0:一般的なサンプルの分散 同じだ。

3.7. 平均の平等に関する仮説の検証、学生の t 基準

比較タスク 平均 2 つの一般集団が発生する場合 実用的な重要性まさに 大きさ研究されている特性。 たとえば、2 つの異なる方法による治療期間や、その使用によって生じる合併症の数を比較する場合です。 この場合、Student の t 検定を使用できます。

問題の定式化

一般集団から抽出された 2 つのサンプル (X 1) と (X 2) が得られました。 通常の法律配布と 同じ差異。サンプルサイズ - n 1 および n 2、 サンプルの意味 X 1 および X 2 に等しい、そして サンプルの分散- s 1 2 および s 2 2それぞれ。 比較する必要がある 一般的な平均。

検証可能な仮説:

H0- 一般的な平均 同じだ;

H1- 一般的な平均 異なっています。

仮説が正しい場合には、 H0 t 値は次の式で計算されます。

自由度 ν = ν 1 + + ν2 - 2 でスチューデントの法則に従って分布します。

ここで、ν 1 = n 1 - 1 - 最初のサンプルの自由度の数。 ν 2 = n 2 - 1 - 2 番目のサンプルの自由度の数。

クリティカル領域の境界は、t 分布テーブルまたはコンピューター関数 STUDRIST を使用して検出されます。 スチューデント分布はゼロに関して対称であるため、臨界領域の左右の境界は大きさが等しく、符号が逆になります。

表に示されている例の場合。 3.4 では、次のようになります。

ν 1 = ν 2 = 20 - 1 = 19; ν = 38、 t= -2.51。 α = 0.05 = 2.02 の場合。

基準値が臨界領域の左境界を超えているため、仮説を受け入れます。 H1:一般的な平均 異なっています。同時に、人口平均は 最初のサンプル少ない。

スチューデントの t 検定の適用性

Student の t 検定は、次のサンプルにのみ適用されます。 普通と集計します 一般的な差異は同じです。条件の少なくとも 1 つが違反されている場合、基準の適用性に疑問があります。 一般集団の正常性の要件は通常無視されます。 中心極限定理。実際、分子のサンプル平均間の差 (3.10) は、ν > 30 については正規分布していると考えることができます。しかし、分散の等価性の問題は検証できず、フィッシャー テストで差が検出されなかったという事実への言及は採用できません。考慮に入れてください。 ただし、t 検定は、十分な証拠はありませんが、母集団平均の差を検出するために広く使用されています。

以下で議論します ノンパラメトリック基準、これは同じ目的で正常に使用され、何も必要としません。 正常、どちらでもない 分散の平等。

3.8. 2 つのサンプルのノンパラメトリック比較: マン・ホイットニー基準

ノンパラメトリック検定は、2 つの母集団の分布法則の違いを検出するように設計されています。 一般的に差異に敏感な基準 平均、基準と呼ばれる シフト一般に違いに敏感な基準 分散液、基準と呼ばれる 規模。マン・ホイットニー検定は次の基準を指します。 シフト 2 つの母集団の平均の差を検出するために使用されます。サンプルは次のとおりです。 ランキングスケール。測定された特性はこのスケール上に昇順で配置され、整数 1、2... で番号が付けられます。これらの番号は次のように呼ばれます。 ランク。等しい量には同じランクが割り当てられます。 重要なのは属性自体の値ではなく、 いつもの場所それは他の量の中でランク付けされます。

テーブル内 3.5. 表 3.4 の最初のグループは拡張形式 (1 行目) で表示され、ランク付けされ (2 行目)、同じ値のランクが算術平均に置き換えられます。 たとえば、最初の行の要素 4 と 4 にはランク 2 と 3 が与えられ、その後、次のように置き換えられました。 同じ価値観 2,5.

表3.5

問題の定式化

独立したサンプル (×1)そして (×2)未知の分布法則に従って一般集団から抽出されました。 サンプルサイズ n1そして n2それぞれ。 サンプル要素の値は次のとおりです。 ランキングスケール。これらの一般集団が互いに異なるかどうかを確認する必要がありますか?

検証可能な仮説:

H0- サンプルは同じ一般集団に属します。 H1- サンプルはさまざまな一般集団に属します。

このような仮説をテストするには、(/-Mann-Whitney テストが使用されます。

まず、結合されたサンプル (X) が 2 つのサンプルからコンパイルされ、その要素がランク付けされます。 次に、最初のサンプルの要素に対応するランクの合計が求められます。 この量が仮説を検証するための基準となります。

U= 最初のサンプルのランクの合計。 (3.11)

体積が 20 を超える独立したサンプルの場合、値 U従う 正規分布, 期待値その標準偏差は次のとおりです。

したがって、危険領域の境界は正規分布表に従って求められます。

表に示されている例の場合。 3.4 では、ν 1 = ν 2 = 20 - 1 = 19 が得られます。 U= 339、μ = 410、σ = 37。α = 0.05 の場合、左 = 338、右 = 482 となります。

基準の値は臨界領域の左境界を超えているため、仮説 H 1 が受け入れられます。つまり、一般集団は異なる分布法則を持っています。 同時に、人口平均は 最初のサンプル少ない。

間隔分布系列を構築する場合、次の 3 つの疑問が解決されます。

  • 1. どれくらいの間隔をあけるべきですか?
  • 2. 間隔の長さはどれくらいですか?
  • 3. 間隔の境界内に人口単位を含める手順は何ですか?
  • 1. 間隔の数によって決定できます スタージェスの公式:

2. 間隔の長さ、または間隔ステップ、通常は次の式で決定されます。

どこ R-バリエーションの範囲。

3. 区間の境界内に含まれる人口単位の順序

異なる場合がありますが、区間系列を構築する場合は、分布を厳密に定義する必要があります。

たとえば、[) では、人口単位は下限の境界には含まれますが、上限には含まれず、次の区間に転送されます。 このルールの例外は最後の間隔であり、その上限にはランク付けされたシリーズの最後の番号が含まれます。

間隔の境界は次のとおりです。

  • 閉じた - 属性の 2 つの極値を持つ。
  • open - 属性の 1 つの極値を持つ (前にあんな数字とか、 以上あんな数字)。

理論的な内容を理解するために、以下を紹介します。 背景情報解決策のために エンドツーエンドのタスク。

営業マネージャーの平均数、彼らが販売した同様の商品の数量、この製品の個別の市場価格、およびロシア連邦のいずれかの地域における 30 社の販売量に関する条件付きデータがあります。報告年の四半期 (表 2.1)。

表2.1

横断的なタスクの初期情報

番号

マネージャー、

価格、千ルーブル

販売量、100万ルーブル。

番号

マネージャー、

販売された商品の数量、個。

価格、千ルーブル

販売量、100万ルーブル。

初期情報と追加情報に基づいて、個別のタスクを設定します。 次に、それらを解決するための方法論と解決策そのものを紹介します。

横断的なタスク。 タスク 2.1

テーブルのソース データを使用します。 2.1 必須建てる 個別シリーズ販売された商品の量ごとの企業の分布(表 2.2)。

解決:

表2.2

報告年の第 1 四半期にロシア連邦のいずれかの地域で販売された商品の量ごとに企業を個別に分布した系列

横断的なタスク。 タスク 2.2

必須マネージャーの平均数に従って、30 社のランク付けされたシリーズを作成します。

解決:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

横断的なタスク。 タスク 2.3

テーブルのソース データを使用します。 2.1、 必須:

  • 1. 管理者の数ごとに企業の分布の区間系列を作成します。
  • 2. 企業の分布系列の頻度を計算します。
  • 3. 結論を導き出します。

解決:

スタージェスの公式(2.5)を使って計算してみましょう 間隔の数:

したがって、6 つの間隔 (グループ) を取ります。

間隔の長さ、 または インターバルステップ、式を使用して計算します

注記。区間の境界に人口単位が含まれる順序は次のとおりです。I) では、人口単位は下位の境界には含まれますが、上位の境界には含まれず、次の区間に転送されます。 この規則の例外は最後の間隔 I ] であり、その上限にはランク付けされたシリーズの最後の番号が含まれます。

区間系列を作成します (表 2.3)。

報告年の第 1 四半期におけるロシア連邦のいずれかの地域における企業の分布と平均管理者数の一連の区間

結論。最大の企業グループは管理者の平均数が 25 ~ 30 人であるグループで、これには 8 社 (27%) が含まれています。 マネージャーの平均数が 40 ~ 45 人の最小グループには、1 社 (3%) のみが含まれています。

テーブルのソース データを使用します。 2.1、および管理者の数による企業分布の区間系列 (表 2.3)、 必須経営者の数と企業の売上高との関係を分析的にグループ化し、それに基づいて、これらの特性間の関係の有無についての結論を導き出します。

解決:

分析的なグループ化は、因子の特性に基づいて行われます。 この問題では、因子特性 (x) は管理者の数、結果特性 (y) は売上高です (表 2.4)。

今すぐ構築しましょう 分析的なグループ化(表 2.5)。

結論。構築された分析グループのデータに基づくと、営業マネージャーの数が増加すると、グループ内の企業の平均売上高も増加し、これらの特性間に直接的な関連性が存在することがわかります。

表2.4

分析グループを構築するための補助テーブル

管理者の数、人数、

会社番号

売上高、百万ルーブル、年

" = 59 f = 9.97

I-™ 4 -ゆ.22

74 '25 1PY1

U4 = 7 = 10,61

= ’ =10,31 30

表2.5

報告年の第 1 四半期におけるロシア連邦のいずれかの地域における売上高の企業マネージャーの数への依存性

コントロールの質問
  • 1. 統計的観察の本質とは何ですか?
  • 2. 統計的観察の段階に名前を付けます。
  • 3. 統計観察の組織形態は何ですか?
  • 4. 統計的観察の種類に名前を付けます。
  • 5. 統計概要とは何ですか?
  • 6. 統計レポートの種類に名前を付けます。
  • 7. 統計的グループ化とは何ですか?
  • 8. 統計グループの種類に名前を付けます。
  • 9. 配信シリーズとは何ですか?
  • 10. 名前 構造要素配信シリーズ。
  • 11. 配信シリーズを構築する手順は何ですか?


サイトの新着情報

>

最も人気のある