研究対象の確率変数が連続的である場合、観測値のランキングやグループ化では識別できないことがよくあります。 キャラクターの特性その値を変化させます。 これを説明すると、 個体値 確率変数相互に必要なだけ異なる場合があるため、観測データ全体が異なる場合があります。 同じ価値観値が発生することはまれであり、変異の頻度は互いにほとんど異なりません。
また、可能な値の数が多い離散確率変数の離散系列を構築することも非現実的です。 このような場合は、ビルドする必要があります インターバルバリエーションシリーズ 配布物。
このような系列を構築するには、確率変数の観測値の変動区間全体が系列に分割されます。 部分的な間隔 各部分間隔における値の出現頻度をカウントします。
間隔 バリエーションシリーズ それぞれに該当する変数の値の対応する頻度または相対頻度を持つ、確率変数のさまざまな値の間隔の順序付きセットを呼び出します。
建築用 間隔シリーズ必要:
- 定義する サイズ 部分的な間隔。
- 定義する 幅 間隔。
- 間隔ごとに設定します 上 そして 下限 ;
- 観察結果をグループ化します。
1 。 グループ化間隔の数と幅を選択するという問題は、それぞれのケースで解決する必要があります。 特定のケースベースの 目標 研究、 音量 サンプルと 変動の程度 サンプルの特徴です。
おおよその間隔数 k サンプルサイズのみに基づいて推定できる n 次のいずれかの方法で:
- 式によると スタージェス : k = 1 + 3.32 log n ;
- 表1を使用します。
表1
2 。 一般に、同じ幅のスペースが推奨されます。 間隔の幅を決定するには h 計算します:
- 変動範囲R - サンプル値: R = x 最大 - x 最小 ,
どこ エックスマックス そして xmin - 最大および最小のサンプリング オプション。
- 各間隔の幅 h 次の式で決定されます。 h = R/k .
3 . 結論 最初の間隔 x h1 最小サンプル オプションが選択されるようにする xmin はこの間隔のほぼ中央に位置します。 x h1 = x 最小 - 0.5 時間 .
中間間隔部分区間の長さを前の区間の終わりに加算することによって得られます。 h :
x hi = x hi-1 +h.
間隔境界の計算に基づく間隔スケールの構築は、値が得られるまで継続されます。 ×こんにちは は次の関係を満たします。
×こんにちは< x max + 0,5·h .
4 。 間隔スケールに従って、特性値がグループ化されます - 部分間隔ごとに周波数の合計が計算されます 私は に含まれるオプション 私 番目の間隔。 この場合、区間には、区間の下限以上上限未満の確率変数の値が含まれる。
ポリゴンとヒストグラム
明確にするために、さまざまな統計分布グラフが作成されています。
離散変動系列のデータに基づいて、 ポリゴン 周波数または相対周波数。
周波数ポリゴン ×1 ; n1 ), (×2 ; n2 ), ..., (Xのk ; ンク )。 周波数多角形を構築するには、オプションを横軸にプロットします。 x i 、縦軸は対応する周波数です 私は 。 ポイント ( x i ; 私は )を直線で結ぶと周波数多角形が得られます(図1)。
相対周波数の多角形セグメントが点を結ぶ破線と呼ばれます ( ×1 ; W1 ), (×2 ; W2 ), ..., (Xのk ; 週 )。 相対度数の多角形を構築するには、オプションを横軸にプロットします。 x i 、縦軸は対応する相対周波数です。 ウィ 。 ポイント ( x i ; ウィ ) を直線で結び、相対度数の多角形が得られます。
いつ 連続記号 構築することをお勧めします ヒストグラム .
頻度ヒストグラム底辺が長さの部分的な間隔である長方形で構成される階段状の図形と呼ばれます h 、高さは比率に等しい NIH(アメリカ国立衛生研究所 (周波数密度)。
頻度ヒストグラムを作成するには、部分間隔を横軸に配置し、横軸に平行なセグメントを間隔を置いてその上に描画します。 NIH(アメリカ国立衛生研究所 .
より高い 職業教育
「ロシア国民経済アカデミーと
大統領の下での公務員
ロシア連邦"
(カルーガ支店)
自然科学および数学学科
テスト
「統計学」という学問では、
学生___メイボロダ・ガリーナ・ユリエヴナ______
国務学部通信部・市政グループ G-12-B
教師 ___________________ Hamer G.V.
教育科学候補者、准教授
カルーガ-2013
タスク1。
タスク1.1。 4
問題1.2。 16
問題1.3。 24
問題1.4。 33
タスク2。
タスク2.1。 43
タスク2.2。 48
問題2.3。 53
問題2.4。 58
タスク3。
タスク3.1。 63
問題3.2。 68
問題3.3。 73
問題3.4。 79
タスク4。
問題4.1。 85
問題4.2。 88
問題4.3。 90
問題4.4。 93
使用したソースのリスト。 96
タスク1。
タスク1.1。
この地域の企業の製品生産高と利益額については、以下のデータが入手可能である (表 1)。
表1
企業の生産高と利益額に関するデータ
企業番号 | 製品生産量、100万ルーブル。 | 利益、100万ルーブル | 企業番号 | 製品生産量、100万ルーブル。 | 利益、100万ルーブル |
63,0 | 6,7 | 56,0 | 7,2 | ||
48,0 | 6,2 | 81,0 | 9,6 | ||
39,0 | 6,5 | 55,0 | 6,3 | ||
28,0 | 3,0 | 76,0 | 9,1 | ||
72,0 | 8,2 | 54,0 | 6,0 | ||
61,0 | 7,6 | 53,0 | 6,4 | ||
47,0 | 5,9 | 68,0 | 8,5 | ||
37,0 | 4,2 | 52,0 | 6,5 | ||
25,0 | 2,8 | 44,0 | 5,0 | ||
60,0 | 7,9 | 51,0 | 6,4 | ||
46,0 | 5,5 | 50,0 | 5,8 | ||
34,0 | 3,8 | 65,0 | 6,7 | ||
21,0 | 2,1 | 49,0 | 6,1 | ||
58,0 | 8,0 | 42,0 | 4,8 | ||
45,0 | 5,7 | 32,0 | 4,6 |
初期データによると:
1. ビルドする 統計系列製品の生産高に応じた企業の分布。均等な間隔で 5 つのグループを形成します。
分布系列グラフの構築: 多角形、ヒストグラム、累積。 最頻値と中央値の値をグラフィカルに決定します。
2. 企業の分布系列の特性を出力別に計算します: 算術平均、分散、標準偏差、変動係数。
結論を出します。
3. 分析グループ化の方法を使用して、製造された製品のコストと企業ごとの利益額の間の相関関係の存在と性質を確立します。
4. 経験的な相関比を使用して、生産コストと利益額の間の相関関係の近さを測定します。
一般的な結論を導き出します。
解決:
統計分布系列を構築しましょう
生産量による企業の分布を特徴付ける区間変動系列を構築するには、系列の区間の値と境界を計算する必要があります。
等間隔の系列を作成する場合、間隔のサイズ h次の式で決定されます。
x 最大そして x分– 調査対象の企業の母集団における属性の最大値と最小値。
k- 間隔系列グループの数。
グループ数 kタスク条件で指定します。 k= 5.
x 最大= 8,100万ルーブル、 x分= 2,100万ルーブル。
間隔サイズの計算:
百万ルーブル
間隔の値を順次加算することにより、 h = 1,200 万ルーブルになります。 区間の下限に到達すると、次のグループが得られます。
グループ 1: 2,100 ~ 3,300 万ルーブル。
グループ 2: 3,300 ~ 4,500 万ルーブル。
グループ 3: 4,500 ~ 5,700 万ルーブル。
グループ 4: 5,700 ~ 6,900 万ルーブル。
グループ 5: 6,900 ~ 8,100 万ルーブル。
区間系列を構築するには、各グループに含まれる企業の数を数える必要があります ( 周波数グループ).
生産量によって企業をグループ化するプロセスは、補助表 2 に示されています。この表の列 4 は、分析的なグループ化 (タスクの項目 3) を構築するために必要です。
表2
区間分布系列を構築するための表と
分析グループ
生産量別の企業グループ、百万ルーブル。 | 企業番号 | 製品生産量、100万ルーブル。 | 利益、100万ルーブル |
21-33 | 21,0 | 2,1 | |
25,0 | 2,8 | ||
28,0 | 3,0 | ||
32,0 | 4,6 | ||
合計 | 106,0 | 12,5 | |
33-45 | 34,0 | 3,8 | |
37,0 | 4,2 | ||
39,0 | 6,5 | ||
42,0 | 4,8 | ||
44,0 | 5,0 | ||
合計 | 196,0 | 24,3 | |
45-57 | 45,0 | 5,7 | |
46,0 | 5,5 | ||
47,0 | 5,9 | ||
48,0 | 6,2 | ||
49,0 | 6,1 | ||
50,0 | 5,8 | ||
51,0 | 6,4 | ||
52,0 | 6,5 | ||
53,0 | 6,4 | ||
54,0 | 6,0 | ||
55,0 | 6,3 | ||
56,0 | 7,2 | ||
合計 | 606,0 | 74,0 | |
57-69 | 58,0 | 8,0 | |
60,0 | 7,9 | ||
61,0 | 7,6 | ||
63,0 | 6,7 | ||
65,0 | 6,7 | ||
68,0 | 8,5 | ||
合計 | 375,0 | 45,4 | |
69-81 | 72,0 | 8,2 | |
76,0 | 9,1 | ||
81,0 | 9,6 | ||
合計 | 229,0 | 26,9 | |
合計 | 183,1 |
表 3 のグループ合計行「合計」に基づいて、生産量ごとの企業の分布の区間系列を表す最終的な表 3 が作成されます。
表3
生産量別企業の分布系列
結論。構築されたグループ分けは、生産量による企業の分布が均一ではないことを示しています。 最も一般的なのは、生産量が4,500万から5,700万ルーブルの企業です。 (12社)。 最も一般的ではないのは、生産量が6,900万から8,100万ルーブルの企業です。 (3社)。
分布系列グラフをプロットしてみましょう。
ポリゴン 離散系列を表すためによく使用されます。 ポリゴンを構築するには 長方形システム座標では、引数の値が横軸、つまりバリアント(間隔変動シリーズの場合、間隔の中央が引数として取られます)にプロットされ、縦軸 - 周波数値にプロットされます。 次に、この座標系で点が構築されます。その座標は、変化系列からの対応する数値のペアです。 結果として得られる点は、直線セグメントによって順番に接続されます。 多角形を図 1 に示します。
棒グラフ - 棒グラフ。 これにより、分布の対称性を評価できます。 ヒストグラムを図 2 に示します。
図 1 – 規模別の企業分布のポリゴン
製品リリース
|
図 2 – 規模別の企業分布のヒストグラム
製品リリース
ファッション– 研究対象の母集団で最も頻繁に発生する属性の値。
区間シリーズの場合、モードはヒストグラムからグラフィカルに決定できます (図 2)。 この場合、最も高い長方形が選択されます。この場合はモーダルです (4,500 ~ 5,700 万ルーブル)。 次に、モーダル長方形の右頂点が前の長方形の右上隅に接続されます。 そして、モーダル四角形の左頂点 - 後続の四角形の左上隅となります。 次に、それらの交点から横軸に垂線を下ろします。 これらの線の交点の横軸が分布モードになります。
百万 こする。
結論。検討された一連の企業の中で最も一般的なのは、製品生産量が 5,200 万ルーブルの企業です。
累積する – 壊れた曲線。 これは、累積された周波数 (表 4 で計算) を使用して構築されます。 累積は最初の間隔の下限 (2,100 万ルーブル) から始まり、累積された周波数は間隔の上限に蓄積されます。 累積を図 3 に示します。
|
図 3 - 規模別の企業の累積分布
製品リリース
メディアン・ミー– これは、ランク付けされたシリーズの中央に位置する属性の値です。 中央値の両側に同じ数の人口単位があります。
区間系列では中央値を決定できます グラフィカルな方法累積曲線に従って。 50% (30:2 = 15) に対応する累積周波数スケール上の点から中央値を決定するには、累積と交差するまで横軸に平行な直線を描きます。 次に、指定された直線と累積値の交点から、横軸に垂線を下ろします。 交点の横軸は中央値です。
百万 こする。
結論。検討中の企業群では、企業の半分の生産量は 5,200 万ルーブル以下で、残りの半分は 5,200 万ルーブル以上です。
関連情報。
あなたの優れた成果をナレッジベースに送信するのは簡単です。 以下のフォームをご利用ください
研究や仕事でナレッジベースを使用している学生、大学院生、若い科学者の皆様には、大変感謝していることでしょう。
ポストする http://www.allbest.ru/
タスク1
以下の情報が入手可能です 賃金企業の従業員:
表1.1
従来の用語での賃金の額。 巣穴。 単位 |
||
見つけるために間隔分布系列を構築する必要があります。
1) 平均給与。
2) 平均 線形偏差;
4)標準偏差。
5) 変動の範囲。
6) 振動係数。
7) 線形係数バリエーション。
8) 単純な変動係数。
10)中央値。
11)非対称係数。
12)ピアソン非対称指数。
13) 尖度係数。
解決
ご存知のとおり、オプション (認識された値) は昇順に並べられて次のようになります。 離散変化シリーズ。 多数の場合 オプション (10 を超える) では、離散的な変動の場合でも、区間系列が構築されます。
間隔シリーズが等間隔でコンパイルされている場合、変動範囲は指定された間隔数で除算されます。 さらに、結果の値が整数で明確な場合 (これはまれですが)、間隔の長さはこの数値に等しいとみなされます。 その他の場合 生産された 丸める 必然的に V 側 増加、 それで に 残った最後の桁は偶数でした。 明らかに、間隔が長くなると、 間隔の数の積に等しい量による変動の範囲: 計算された間隔の長さと最初の間隔の長さの差による
A) 変動範囲の拡大の大きさが重要でない場合は、特性の最大値に加算されるか、最小値から減算されます。
b) 変動範囲の拡大の大きさが顕著な場合は、範囲の中心の混乱を避けるために、最大値に加算し、最小値から減算することを同時に行うことで、大まかに半分に分割します。特徴。
不等間隔の間隔系列をコンパイルするとプロセスは簡素化されますが、間隔の長さは最後の偶数桁の数値として表現する必要があるため、後続の計算が大幅に簡素化されます。 数値特性.
30 はサンプルサイズです。
スタージェスの公式を使用して区間分布系列を作成してみましょう。
K = 1 + 3.32*log n、
K - グループの数。
K = 1 + 3.32*lg 30 = 5.91=6
次の式を使用して、属性の範囲 - 企業の労働者の賃金 - (x) を求めます。
R= xmax - xmin を 6 で割ります。 R= 195-112=83
この場合、間隔の長さは次のようになります。 私レーン=83:6=13.83
最初の間隔の始まりは 112 になります。112 に加算します。 私 ras = 13.83 の場合、最終値 125.83 が得られます。これは 2 番目の間隔の始まりでもあります。 5 番目のインターバルの終了 - 195。
頻度を見つけるときは、「特徴の値が内部間隔の境界と一致する場合、それは前の間隔に起因すると考えられる」というルールに従う必要があります。
度数の間隔系列と累積度数を取得します。
表1.2
したがって、従業員 3 名に給与が発生します。 手数料は 112 から 125.83 の従来の通貨単位です。 最高の給与 手数料は 181.15 から 195 の従来の通貨単位です。 従業員はたったの6人。
数値特性を計算するには、区間の中央をオプションとして使用して、区間系列を離散系列に変換します。
表1.3
14131,83 |
加重算術平均公式の使用
従来の通貨単位
平均線形偏差:
ここで、xi は母集団の i 番目の単位について調査されている特性の値です。
研究された形質の平均値。
ポストする http://www.allbest.ru/
L投稿日 http://www.allbest.ru/
従来の通貨単位
標準偏差:
分散:
相対変動範囲(振動係数): c= R:、
相対線形偏差: q = L:
変動係数: V = y:
振動係数は、算術平均を中心とした特性の極値の相対的な変動を示し、変動係数は母集団の程度と均一性を特徴付けます。
c= R: = 83 / 159.485*100% = 52.043%
したがって、極値間の差は、企業の従業員の平均給与より 5.16% (=94.84%-100%) 小さくなります。
q = L: = 17.765/ 159.485*100% = 11.139%
V = y: = 21.704/ 159.485*100% = 13.609%
変動係数は 33% 未満であり、これは企業の労働者の賃金の変動が小さいことを示しています。 それ 平均値は従業員の賃金の典型的な特徴です(人口は均一です)。
インターバル分布シリーズにおいて ファッション式によって決定されます -
モーダル間隔の頻度、つまり、次の値を含む間隔。 最大の数オプション;
モーダルに先行する間隔の頻度。
モーダルに続く間隔の頻度。
モーダル間隔の長さ。
モーダル間隔の下限。
決定するため 中央値区間シリーズでは次の式を使用します。
ここで、 は中央値に先行する間隔の累積(累積)頻度です。
中央間隔の下限。
間隔頻度の中央値。
中央間隔の長さ。
中央値間隔- 累積頻度 (=3+3+5+7) が頻度の合計の半分を超える間隔 - (153.49; 167.32)。
非対称性と尖度を計算してみましょう。新しいワークシートを作成します。
表1.4
事実データ |
計算されたデータ |
||||||
3次モーメントを計算してみましょう
したがって、非対称性は次のようになります。
0.3553 0.25 であるため、非対称性は重大であると考えられます。
4次モーメントを計算してみましょう
したがって、尖度は次のようになります。
なぜなら< 0, то эксцесс является плосковершинным.
非対称性の程度は、ピアソン非対称係数 (As): 振動サンプル値回転率を使用して決定できます。
ここで、 は分布系列の算術平均です。 - ファッション; - 標準偏差。
したがって、対称 (正規) 分布 = Mo の場合、非対称係数は ゼロに等しい。 As > 0 の場合、より多くのモードがあるため、右手系の非対称性が存在します。
もしそうなら< 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.
分布は対称ではなく、左側に非対称があります。
タスク 2
以前の調査に基づいて分散が 0.24 であることがわかっている場合、確率 0.954 でサンプリング誤差が 0.04 を超えないようにするには、サンプル サイズはどのようにすべきでしょうか?
解決
非反復サンプリングのサンプル サイズは、次の式を使用して計算されます。
t - 信頼係数 (0.954 の確率で 2.0 に等しくなります。確率積分の表から決定されます)、
y2=0.24 - 標準偏差。
10,000人 - サンプルサイズ;
Dx =0.04 - サンプル平均の最大誤差。
95.4% の確率で、0.04 以下の相対誤差を保証するサンプル サイズは少なくとも 566 家族であるべきであると言えます。
タスク3
次のデータは、企業の主な活動からの収入、100万ルーブルについて入手できます。
一連のダイナミクスを分析するには、次の指標を決定します。
1) チェーンとベーシック:
絶対的な増加。
成長率;
成長速度;
2) 平均
ダイナミック行レベル。
絶対的な増加。
成長速度;
増加率;
3) 1% 増加の絶対値。
解決
1. 絶対増加量(Dや)- これは、シリーズの次のレベルと前の (または基本的な) レベルの違いです。
チェーン: DN = yi - yi-1、
基本: DN = yi - y0、
уi - 行レベル、
i - 行レベル番号、
y0 - 基準年レベル。
2. 成長率(Tu)シリーズの後続のレベルと前のレベル (または基準年 2001) の比率です。
チェーン: Tu = ;
基本: Tu =
3. 成長率(TD) 以前のレベルに対する絶対成長率を%で表したものです。
チェーン: Tu = ;
基本: Tu =
4. 1%増加の絶対値(A)- これは、チェーンの絶対的な成長と成長率の比率を % で表したものです。
あ =
平均行レベル算術平均公式を使用して計算されます。
4 年間の中核的活動からの平均収入レベル:
平均絶対増加量次の式で計算されます。
ここで、n は系列のレベル数です。
年間平均で、中核的活動からの収入は 333 万 3000 ルーブル増加しました。
平均年間成長率幾何平均の式を使用して計算されます。
уn は行の最終レベルです。
y0 - 最初のレベル行。
Tu = 100% = 102.174%
平均年間成長率次の式で計算されます。
て? = Tu - 100% = 102.74% - 100% = 2.74%。
したがって、年間平均すると、企業の主要な活動からの収入は 2.74% 増加しました。
タスクあ4
計算します:
1. 個別の価格指数。
2. 一般的な貿易売上高指数。
3. 総合価格指数。
4. 商品の販売の物理的量の総合指数。
5. 貿易売上高の絶対増加額を要因別に分析する(価格および販売商品数の変化による)。
6. 取得したすべての指標について簡単な結論を出します。
解決
1. 条件によると、製品 A、B、C の個別の価格指数は -
ipA=1.20; iрБ=1.15; iрВ=1.00。
2. 次の式を使用して、一般的な取引回転率指数を計算します。
I w = = 1470/1045*100% = 140.67%
貿易売上高は 40.67% (140.67%-100%) 増加しました。
平均すると、一次産品価格は10.24%上昇した。
価格上昇による購入者の追加費用の金額は次のとおりです。
w(p) = ? p1q1 - ? p0q1 = 1470 - 1333.478 = 1 億 3652 万 2000 ルーブル。
価格上昇の結果、買い手はさらに1億3,652万2,000ルーブルを費やす必要があった。
4. 貿易売上高の物理量の一般的な指標:
物理的な取引高は 27.61% 増加しました。
5. 定義しましょう 全体的な変化第 1 期と比較した第 2 期の売上高:
w = 1470-1045 = 4 億 2,500 万ルーブル。
価格変更のため:
W(p) = 1470 - 1333.478 = 1億3652万2000ルーブル。
物理ボリュームの変化による:
w(q) = 1333.478 - 1045 = 2億8847万8000ルーブル。
商品の売上高は 40.67% 増加しました。 3商品の価格は平均10.24%上昇した。 物理的な取引高は 27.61% 増加しました。
全体として、販売量は4億2,500万ルーブル増加し、その内訳は価格上昇により1億3,652万2,000ルーブル増加し、販売量の増加により2億8,847万8,000ルーブル増加しました。
タスク5
次のデータは、1 つの業界の 10 工場について利用できます。
植物番号 |
製品生産量、千個 (バツ) |
|
与えられたデータに基づいて:
I) 要素特性 (製品量) とその結果の特性 (電力消費量) の間に線形相関関係が存在することに関する論理分析の規定を確認し、相関フィールドのグラフ上に初期データをプロットし、次の形式について結論を導き出します。関係の式を示します。
2)接続方程式のパラメータを決定し、得られた理論上の直線を相関場のグラフ上にプロットする。
3) 線形相関係数を計算します。
4) 2) および 3) 項で得られた指標の意味を説明する。
5) 結果のモデルを使用して、次のことを予測します。 消費の可能性生産量4.5千台の工場での電力。
解決
属性のデータ、つまり生産量 (要素) を xi で表します。 符号 - уi による電力消費量 (結果)。 座標 (x, y) を持つ点が相関フィールド OXY 上にプロットされます。
相関フィールドの点は、特定の直線に沿って配置されます。 したがって、関係は線形です。直線 Уx=ax+b の形の回帰式を探します。 これを見つけるには、正規方程式系を使用します。
計算表を作成してみましょう。
見つかった平均を使用してシステムを構成し、パラメータ a と b に関してそれを解きます。
したがって、x に対する y の回帰式が得られます: = 3.57692 x + 3.19231
相関フィールドに回帰直線を作成します。
列 2 の x 値を回帰式に代入して計算値 (列 7) を取得し、それらを y データと比較します。これは列 8 に反映されます。 ちなみに、計算の正しさは次のように確認されます。 y と の平均値の一致。
係数線形相関特性 x と y の間の関係の近さを評価し、次の式を使用して計算されます。
直接回帰の角度係数 a (x における) は、特定された角度の方向を特徴付けます。依存関係符号: a>0 の場合は同じ、a の場合は同じ<0- противоположны. その絶対的な value - 因子特性が測定単位によって変化した場合に、結果として得られる特性の変化の尺度。
直接回帰の自由項は方向を明らかにし、その絶対値は、結果の符号に対する他のすべての要因の影響の定量的尺度です。
もし< 0 の場合、個々のオブジェクトの要素特性のリソースがより少ない量で使用されます。>0 とオブジェクトのセット全体の平均よりも高い効率。
事後回帰分析を実行してみましょう。
直接回帰の x における係数は 3.57692 >0 に等しいため、生産量の増加 (減少) に伴い、電力消費量も増加 (減少) します。 生産量が1,000個増加。 電力消費量は平均 357,692 千 kWh 増加します。
2. 直接回帰の自由項は 3.19231 に等しいため、他の要因の影響により、製品出力が電力消費量に与える影響は絶対値で 3.19231 千 kWh 増加します。
3. 相関係数 0.8235 は、電力消費が製品出力に非常に密接に依存していることを示しています。
式によると、 回帰モデル予測がしやすい。 これを行うには、生産量である x の値を回帰式に代入し、電力消費量を予測します。 この場合、x の値は、特定の範囲内だけでなく、その範囲外でも取得できます。
生産台数4.5万台の工場で想定されるエネルギー消費量を予測してみましょう。
3.57692*4.5 + 3.19231= 19.288 45,000 kWh。
使用したソースのリスト
1. ザハレンコフ S.N. 社会経済統計の教科書と実践ガイド。 -Mn.: BSEU、2002 年。
2. エフィモワ M.R.、ペトロヴァ E.V.、ルミャンツェフ V.N. 統計の一般理論。 - M.: インフラ - M.、2000。
3.エリセーヴァI.I. 統計。 - M.: プロスペクト、2002 年。
4. 統計学一般論 / 一般論の下。 編 O.E. バシナ、A.A. スピリナ。 - M.: 財務と統計、2000 年。
5. 社会経済統計: 教育的かつ実践的。 手当 / ザハレンコフ S.N. 他 - Mn.: エレバン州立大学、2004 年。
6. 社会経済統計:教科書。 手当。 /編 ネステロヴィッチ S.R. - 男性: BSEU、2003 年。
7. Teslyuk I.E.、Tarlovskaya V.A.、Terlizhenko N. 統計 - ミンスク、2000。
8. ハルチェンコ L.P. 統計。 - M.: インフラ - M、2002 年。
9. ハルチェンコ L.P.、ドルジェンコワ V.G.、イオニン V.G. 統計。 - M.: インフラ - M、1999 年。
10. 経済統計・編 Yu.N. イワノバ - M.、2000。
Allbest.ru に掲載
...類似の文書
区間分布系列の算術平均の計算。 貿易売上高の物理的な量の一般的な指標の決定。 物理量の変化による総生産コストの絶対的な変化の分析。 変動係数の計算。
テスト、2010/07/19 追加
卸売、小売、公貿易の本質。 個別および総売上高指数を計算するための式。 区間分布系列の特性の計算 - 算術平均、最頻値と中央値、変動係数。
コースワーク、2013/05/10 追加
計画および実際の販売量、計画達成率、売上高の絶対変化を計算します。 絶対成長率、平均成長率、現金収入の増加の決定。 構造平均の計算: 最頻値、中央値、四分位数。
テスト、2012 年 2 月 24 日追加
利益量ごとの銀行の分布の区間系列。 グラフィカルな方法と計算を使用して、結果として得られる間隔分布系列の最頻値と中央値を見つけます。 区間分布系列の特性の計算。 算術平均の計算。
テスト、2010 年 12 月 15 日追加
区間系列の平均値を決定するための公式 - 最頻値、中央値、分散。 チェーンおよび基本スキーム、成長率および増分を使用したダイナミクス系列の分析指標の計算。 コスト、価格、経費、売上高の統合インデックスの概念。
コースワーク、2011/02/27 追加
バリエーションシリーズを構成するコンセプトと目的、順序とルール。 グループ内のデータの均一性の分析。 形質の変動(変動)の指標。 線形平均の決定と 二乗偏差、振動係数と変動係数。
テスト、2010 年 4 月 26 日追加
最頻値と中央値の概念 典型的な特徴、その決定の手順と基準。 離散変動系列および区間変動系列の最頻値と中央値を見つけます。 変動統計系列の追加特性としての四分位数と十分位数。
テスト、2010/09/11 追加
グループ化特性に基づいた区間分布系列の構築。 対称形状からの周波数分布の偏差の特性、尖度および非対称指標の計算。 貸借対照表または損益計算書の指標の分析。
テスト、2014 年 10 月 19 日追加
経験的系列を離散系列および区間系列に変換します。 離散系列のプロパティを使用してその平均値を決定します。 離散的な一連のモード、中央値、変動指標 (分散、偏差、振動係数) を使用した計算。
テスト、2011/04/17 追加
組織の分布に関する統計シリーズの構築。 最頻値と中央値のグラフィカルな決定。 決定係数を使用した相関の近さ。 平均従業員数の標本誤差を決定します。
状態:
従業員の年齢構成(歳)に関するデータがあります: 18、38、28、29、26、38、34、22、28、30、22、23、35、33、27、24、30、32、28 、25、29、26、31、24、29、27、32、25、29、29。
- 区間分布系列を構築します。
- 建てる グラフィック画像行。
- 最頻値と中央値をグラフィカルに決定します。
解決:
1) スタージェスの公式によれば、母集団は 1 + 3.322 lg 30 = 6 つのグループに分割されなければなりません。
最高年齢 - 38 歳、最低年齢 - 18 歳。
区間の幅 区間の終端は整数でなければならないため、母集団を 5 つのグループに分割します。 間隔幅 - 4。
計算を容易にするために、データを昇順に並べます: 18、22、22、23、24、24、25、25、26、26、27、27、28、28、28、29、29、29、 29、29、30、30、31、32、32、33、34、35、38、38。
分布 年齢構成労働者
グラフ的には、系列をヒストグラムまたは多角形として表すことができます。 ヒストグラム - 棒グラフ。 列の底辺は間隔の幅です。 柱の高さは周波数に等しい。
ポリゴン (または分布ポリゴン) - 頻度グラフ。 ヒストグラムを使用してこれを作成するには、長方形の上辺の中点を接続します。 x の極値から間隔の半分に等しい距離で Ox 軸上の多角形を閉じます。
最頻値 (Mo) は、特定の母集団で最も頻繁に発生する、調査対象の特性の値です。
ヒストグラムからモードを決定するには、最も高い四角形を選択し、この四角形の右頂点から前の四角形の右上隅まで線を描き、モーダル四角形の左頂点から最上位の四角形まで線を引く必要があります。後続の長方形の左頂点。 これらの線の交点から、x 軸に対して垂線を引きます。 横軸はファッションになります。 Mo ≈ 27.5。 これは、この人口で最も一般的な年齢が 27 ~ 28 歳であることを意味します。
中央値 (Me) は、順序変化系列の中央にある、調査対象の特性の値です。
累積を使用して中央値を見つけます。 累積 - 累積された頻度のグラフ。 横座標は系列の変形です。 縦座標は累積された周波数です。
累積値の中央値を決定するには、累積度数の 50% (この場合は 15) に対応する縦軸に沿った点を見つけ、その点を通る直線を Ox 軸に平行に引きます。累積との交点に x 軸への垂線を描きます。 横軸は中央値です。 私は約25.9です。 これは、この人口の労働者の半数が 26 歳未満であることを意味します。
社会経済現象とプロセスの研究における最も重要な段階は、一次データの体系化であり、これに基づいて、一次統計資料を要約およびグループ化することによって達成される、一般的な指標を使用して対象全体の概要特性を取得することです。
統計の概要 - これは、研究対象の現象全体に固有の典型的な特徴とパターンを特定するために、セットを形成する特定の個々の事実を一般化する一連の操作の複合体です。 統計的な要約を行うには、次の手順が含まれます。 :
- グループ化特性の選択。
- グループ形成の順序を決定する。
- グループとオブジェクト全体を特徴付けるための統計指標システムの開発。
- 要約結果を提示するための統計表のレイアウトの開発。
統計的なグループ化 これは、調査対象の集団を、それらに不可欠な特定の特性に従って同種のグループに分割することと呼ばれます。 グループ化は、統計データを要約するための最も重要な統計手法であり、統計指標を正しく計算するための基礎となります。
次のタイプのグループ化が区別されます: 類型的、構造的、分析的。 これらすべてのグループ化は、オブジェクトのユニットが何らかの特性に従ってグループに分割されるという事実によって統合されます。
グループ化機能 は、集団の単位が別々のグループに分割される特性です。 から 正しい選択グループ化の特性は、統計研究の結論によって異なります。 グループ化の基礎として、理論に基づいた重要な特性 (定量的または定性的) を使用する必要があります。
グループ化の定量的特徴 数値表現(取引高、年齢、世帯収入など)があり、 グループ化の定性的兆候 人口単位の状態(性別、婚姻状況、企業の業種、所有形態など)を反映します。
グループ分けの基礎が決定された後、研究対象の母集団を何グループに分割するかという問題を決定する必要があります。 グループの数は、研究の目的、グループ化の基礎となる指標の種類、母集団の量、特性の変動の程度によって異なります。
たとえば、所有権の種類による企業のグループ化では、地方自治体、連邦および連邦の対象財産が考慮されます。 グループ化が行われる場合 定量的特性、その場合は逆にする必要があります 特別な注意研究対象のオブジェクトのユニット数とグループ化特性の変動の程度に依存します。
グループの数が決定したら、グループ化の間隔を決定する必要があります。 間隔 - これらは、特定の境界内にあるさまざまな特性の値です。 各間隔には独自の値、上限と下限、またはそれらの少なくとも 1 つがあります。
間隔の下限値 は区間内の特性の最小値と呼ばれ、 上限 - 区間内の特性の最大値。 間隔の値は、上限と下限の差です。
グループ化間隔は、そのサイズに応じて、等しい場合と不等な場合があります。 特性の変動が比較的狭い境界内で現れ、その分布が均一である場合、グループは等間隔で構築されます。 等間隔の値は次の式で求められます。 :
ここで、Xmax、Xmin は集合体における特性の最大値と最小値です。 n - グループの数。
選択された各グループが 1 つの指標によって特徴付けられる最も単純なグループ化は、分布系列を表します。
統計分布系列 - これは、特定の特性に従って人口単位をグループに順序付けて分布するものです。 分布系列の形成の根底にある特性に応じて、属性と バリエーションシリーズ配布物。
限定的 定性的特性、つまり、持たない特性に従って構築された分布系列と呼ばれます。 数値表現(労働の種類別、性別別、職業別の分布など)。 属性分布系列は、特定の本質的な特徴に従って集団の構成を特徴づけます。 複数の期間にわたって取得されたこれらのデータにより、構造の変化を研究することが可能になります。
バリエーションシリーズ は、定量的特性に従って構築された分布系列と呼ばれます。 あらゆるバリエーション シリーズは、オプションと頻度という 2 つの要素で構成されます。 オプション 変動系列内でとられる特性の個々の値は、変動特性の特定の値と呼ばれます。
周波数 数字と呼ばれます 別途オプションまたはバリエーション シリーズの各グループ。つまり、これらは、分布シリーズ内で特定のオプションがどのくらいの頻度で発生するかを示す数値です。 すべての頻度の合計によって、母集団全体のサイズ、つまりその体積が決まります。 周波数 単位の分数または全体に対するパーセンテージで表される頻度は、頻度と呼ばれます。 したがって、頻度の合計は 1 または 100% に等しくなります。
特性の変動の性質に応じて、変動系列はランク付け系列、離散系列、間隔系列の 3 つの形式に区別されます。
ランクバリエーションシリーズ - これは、調査対象の特性の昇順または降順での母集団の個々の単位の分布です。 ランキングを使用すると、定量的なデータを簡単にグループに分割し、最小のデータを即座に検出して、 最高値特性を確認し、最も頻繁に繰り返される値を強調表示します。
離散変化系列 整数値のみを取る離散特性に従って人口単位の分布を特徴付けます。 たとえば、料金カテゴリ、家族の子供の数、企業の従業員の数などです。
特性に継続的な変化があり、特定の制限内で任意の値(「から~まで」)を取ることができる場合、この特性に対して次のことを構築する必要があります。 インターバルバリエーションシリーズ 。 たとえば、企業の収入額、勤続年数、固定資産の費用などです。
「統計の要約とグループ化」というトピックの問題の解決例
問題1 。 過去の学年度に定期購読を通じて学生が受け取った書籍の数に関する情報があります。
系列の要素を指定して、ランク付けされた離散的な変動分布系列を構築します。
解決
このセットは、生徒が受け取る本の数について多くのオプションを表します。 このようなオプションの数を数えて、それらを変分ランク付けおよび変分離散分布系列の形式で整理してみましょう。
問題 2 。 50企業の固定資産コスト、千ルーブルに関するデータがあります。
5 つの企業グループを (等間隔で) 強調する分布シリーズを構築します。
解決
解決するには、企業の固定資産の価値の最大値と最小値を選択します。 これらは30.0ルーブルと10.2千ルーブルです。
間隔のサイズを見つけてみましょう: h = (30.0-10.2):5= 3.96 千ルーブル。
次に、最初のグループには、固定資産額が10.2千ルーブル以上の企業が含まれます。 最大10.2+3.96=14.16千ルーブル。 2番目のグループには、固定資産額が14.16千ルーブル以上の企業が9社含まれます。 最大14.16 + 3.96 = 18.12千ルーブル。 同様に、3 番目、4 番目、5 番目のグループに含まれる企業の数が 16 社になります。
結果の分布系列をテーブルに配置します。
問題 3 。 多くの企業向け 軽工業次のデータを受信しました。
従業員数ごとに企業をグループ化し、等間隔に 6 つのグループを形成します。 グループごとに計算します。
1. 企業数
2. 従業員数
3. 年間製品生産量
4. 労働者1人あたりの平均実際の生産高
5. 固定資産の量
6. 1企業の平均固定資産規模
7. 1つの企業が生産する製品の平均価値
計算結果を表にまとめます。 結論を導き出します。
解決
解決するには、企業の平均従業員数の最大値と最小値を選択します。 43と256です。
間隔のサイズを見つけてみましょう: h = (256-43):6 = 35.5
次に、最初のグループには、平均従業員数が 43 ~ 43 + 35.5 = 78.5 人である企業が含まれます。 2 番目のグループには、平均従業員数が 78.5 ~ 78.5 + 35.5 = 114 人の企業が含まれます。 同様に、3 番目、4 番目、5 番目、6 番目のグループに含まれる企業の数が 12 になります。
結果の分布系列をテーブルに配置し、各グループに必要な指標を計算します。
結論 : 表からわかるように、2 番目のグループの企業が最も多くなっています。 12の企業が含まれています。 最小のグループは 5 番目と 6 番目のグループ (それぞれ 2 社) です。 これらは(従業員数の点で)最大の企業です。
2番目のグループが最大であるため、このグループの企業が年間に生産する製品の量と固定資産の量は他のグループよりも大幅に高くなります。 同時に、このグループに属する企業の労働者 1 人当たりの平均実際の生産高は最大ではありません。 ここでは第4グループの企業がリードしている。 このグループは、かなりの量の固定資産も占めています。
結論として、固定資産の平均サイズと 1 つの企業が生み出す平均生産高は、企業の規模 (労働者数による) に直接比例することに注意します。