Основные характеристики и графические изображения вариационного ряда. Оценка тесноты связи между кол...
1.
Основные
характеристики и графические изображения вариационного ряда.
2.
Оценка
тесноты связи между количественными признаками, ранговые коэффициенты К. Спирмэна
и М. Кендэла.
Содержание.
1. Основные характеристики и графические
изображения вариационного ряда.
2. Задача № 1.
3. Задача № 2.
4. Оценка тесноты связи между количественными
признаками, ранговые коэффициенты К. Спирмэна и М. Кендэла.
1. Основные
характеристики и графические изображения вариационного ряда.
1.
Составной
частью сводной обработки данных статистического наблюдения является построение
рядов распределения. Цель его – выявление основных свойств и закономерностей
исследуемой статистической совокупности. В зависимости от того, является ли
признак, взятый за основу группировки, качественным или количественным,
различают два типа рядов распределения – атрибутивное и вариационное. Ряды
распределения, построенные по качественным признакам, называют атрибутивными.
Примером атрибутивных рядов может служить распределение населения по полу,
характеру труда, национальности, профессии и т.д. Ряды распределения, построенные
по количественному признаку, называют вариационными. Величины того или иного
количественного признака у отдельных единиц совокупности более или менее
различаются между собой. Такое различие в величине признака носит название
вариации.
Для целей анализа
и сравнительной характеристики различных рядов распределения применяются
обобщающие показатели вариационного ряда. Система таких показателей может быть
наглядно представлена при сравнении особенностей нескольких рядов
распределения. Пример:
На данном рисунки кривые
распределения 1 и 2 имеют одинаковый размах вариации и характер распределения
частот, но отличаются величиной варьирующего признака, являющегося центром
группирования (это отмечено на оси Х).
Характеристики
центра группирования составляют одну из групп обобщающих показателей. В
качестве них используют среднюю арифметическую, медиану и моду.
На этом же
рисунки кривые распределения 3 и 4 имеют один и тот же центр группирования и
симметричное расположение частот вокруг него, но отличаются пределами вариации.
По этому можно сказать, что кроме показателей центра группирования, для
характеристики особенностей распределения необходимо показатели степени
вариации. Эти две группы показателей – имеют особое значение при принятии
решения в управлении.
Ряды
распределения могут иметь один и тот же центр группирования, одинаковые пределы
варьирования признака, симметричный характер расположения частот, но разную
степень вытянутости вдоль оси ординат, которая характеризуется показателями
эксцесса. Сравнение различных распределений показывает, что они могут
отличаться характером распределения частот относительно центра; степень
отклонения распределения частот от симметричной формы характеризуется
показателями ассиметрии. Показатели эксцесса и ассиметрии характеризую форму
распределения.
Таким образом, в
зависимости от характеризуемых особенностей распределения обобщающие показатели
можно разбить на три группы:
1.
показатели
центра распределения (центра группировки);
2.
показатели
степени вариации;
3.
показатели
формы распределения.
Графическое
изображение рядов распределения облегчает их анализ и позволяет судить о форме
распределения. Для графического изображения дискретного ряда применяют полигон
распределения. Для его построения на оси абсцисс отмечают точки,
соответствующие величине вариантов значений признака, из них восстанавливаются
перпендикуляры, длина которых соответствует частоте (частости) этих вариантов
по принятому масштабу на оси ординат. Вершины перпендикуляров в
последовательном порядке соединяются отрезками прямых. Для замыкания полигона
крайние вершины соединяются с точками на оси абсцисс, отстоящими на одно
значение в принятом масштабе (от Хмах и Хмin). Такое построение полигона облегчает восприятие его графического
изображения.
Пример построения
полигона:
(распределение
рабочих по квалификации)
Во – первых
необходима создать таблицу данных.
Хi
тарифный разряд рабочего
|
Тi
число рабочих имеющих этот разряд
|
Wi частость
|
Si накопленная частота
|
2
|
1
|
0.05
|
1
|
3
|
5
|
0.25
|
6
|
4
|
8
|
0.40
|
14
|
5
|
4
|
0.20
|
18
|
6
|
2
|
0.10
|
20
|
Итого
|
20
|
1,00
|
|
Для графического
изображения интервальных вариационных рядов применяются гистограммы. Она
строится так: на оси абсцисс откладываются равные отрезки, которые в принятом
масштабе соответствуют величине интервалов вариационного ряда. На отрезках
строят прямоугольники, площади которых пропорциональны частотам (или частностям)
интервала.
Как и в прошлый
раз для построения необходима таблица данных.
Размер прибыли Х
|
Число банков Т
|
Накопленная частота
|
1
|
2
|
3
|
3,7 – 4,6
|
2
|
2
|
4,6 – 5,5
|
4
|
6
|
5,5 – 6,4
|
6
|
12
|
6,4 – 7,3
|
5
|
17
|
7,3 – 8,1
|
3
|
20
|
Итого
|
20
|
|
Сама гистограмма:
Гистограмма может быть преобразована в
полигон распределения, если середины верхних сторон прямоугольников соединяются
отрезками прямых. Две крайние точки прямоугольников замыкаются по оси абсцисс
на середины интервалов, в которых частоты (частности) равны нулю. При
построении гистограммы для вариационного ряда с неравными интервалами следует
по оси ординат наносить показатели плотности интервалов (абсолютные или
относительные). В этом случае высоты прямоугольников гистограммы будут
соответствовать величине плотности распределения.
При увеличении
числа наблюдений из одной и той же совокупности увеличивается число групп
интервального ряда, что приводит к уменьшению величины интервала. При этом
ломанная линия имеет тенденцию превращения в плавную кривую, которую называют
кривой распределения. Кривая распределения характеризует в обобщенном виде
вариацию признака и закономерности распределения частот внутри
однокачественной совокупности.
В ряде случаев
для изображения вариационного рядов используется кумулятивная кривая (кумуля).
Для её построения необходимо рассчитать накопленные частоты и частности.
Накопленные частоты показывают, сколько единиц совокупности имеют значения
признака не больше, чем рассматриваемое значение, и определяются
последовательным суммированием частот интервалов.
Пример построения
кумулятивной кривой. Применяем ту же таблице, что и в примере с гистограммой
(распределение коммерческих банков по размеру прибыли).
При построении
кумуляты интервального ряда распределения нижней границе первого интервала
соответствует частота, равная нулю, а верхней границе – вся частота данного
интервала. Верхней границе второго интервала соответствует накопленная частота,
равная сумме частот первых двух интервалов, и т.д.
Изображение
вариоционного ряда в виде кумуляты особенно удобно при сравнении вариационных
рядов, а также в экономических исследованиях, в састности для анализа
концентрации производства.
2. Задача № 13.
Используя
относительные показатели сравнения, сопоставьте объём хранимых ценных бумаг в
крупнейших депозитных банков:
банк
|
Объём ценных бумаг
|
1
|
300
|
2
|
1748
|
3
|
640
|
4
|
452
|
5
|
283
|
6
|
173
|
Общее количество
ценных бумаг всех банков возьмём, как 100 %. И именно с ними сопоставим кол –
во ценных бумаг отдельных банков.
Б1+Б2+Б3+Б4+Б5+Б6=3596
(100 %),
Банк
|
1
|
2
|
3
|
4
|
5
|
6
|
% ценных бумаг
|
8,3%
|
48,6%
|
17,8%
|
12,6%
|
7,9%
|
4,8%
|
3. Задача № 32.
Выравнивание ряда
функцией – прямой.
Месяцы
|
Млрд. Руб.Yi
|
Условное
обозначение периодов ti
|
Yt
|
Ti в квадрате
|
Выровненный уровень
динамики
|
Yi-Yt
|
(Yi-Yt) в
квадрате
|
1
|
22,8
|
-11
|
-250.8
|
121
|
31.23
|
-8.43
|
71
|
2
|
24,9
|
-9
|
-224.1
|
81
|
32.503
|
-7.6
|
57.8
|
3
|
31
|
-7
|
-217
|
49
|
33.869
|
-2.7
|
8.23
|
4
|
29,5
|
-5
|
-147.5
|
25
|
34.835
|
-5.3
|
28
|
5
|
30,5
|
-3
|
-91.5
|
9
|
35.401
|
-4.9
|
24
|
6
|
35,6
|
-1
|
-35.6
|
1
|
36
|
-0.4
|
0.16
|
7
|
30,4
|
0
|
0
|
0
|
37
|
-6.6
|
43
|
8
|
42,6
|
+1
|
42.6
|
1
|
38.5
|
4.1
|
16.8
|
9
|
45,1
|
+3
|
135.3
|
9
|
39.999
|
5.11
|
26.1
|
10
|
47,3
|
+5
|
236.5
|
25
|
41.365
|
5.936
|
35.2
|
11
|
51
|
+7
|
357
|
49
|
42.531
|
8.46
|
70
|
12
|
53,4
|
+9
|
480.6
|
81
|
43.397
|
10
|
100
|
Итого:
|
450
|
|
285.5
|
|
446.5
|
|
|
Выравнивание ряда
параболой второго порядка.
месяцы
|
Млрд. руб. Yi
|
ti
|
ti в квадрате
|
Yiti
|
Yiti в квадрате
|
ti в четвёртой степени
|
Выровненный уровень
динамики
|
|
1
|
22,8
|
-11
|
121
|
-250,8
|
2758,8
|
14641
|
25,26
|
|
2
|
24,9
|
-9
|
81
|
-224,1
|
2016,9
|
6561
|
28,96
|
|
3
|
31
|
-7
|
49
|
-217
|
1519
|
2401
|
32,22
|
|
4
|
29,5
|
-5
|
25
|
-147,5
|
737,5
|
625
|
35,96
|
|
5
|
30,5
|
-3
|
9
|
-91,5
|
274,5
|
81
|
37,76
|
|
6
|
35,6
|
-1
|
1
|
-35,6
|
35,6
|
1
|
39,33
|
|
7
|
36,4
|
0
|
0
|
0
|
0
|
0
|
39,96
|
|
8
|
42,6
|
1
|
1
|
42,6
|
42,6
|
1
|
40
|
|
9
|
45,1
|
3
|
9
|
135,3
|
405,9
|
81
|
41
|
|
10
|
47,3
|
5
|
25
|
236,5
|
1182,5
|
625
|
41,886
|
|
11
|
51
|
7
|
49
|
357
|
2499
|
2401
|
42,88
|
|
12
|
53,4
|
9
|
81
|
480,6
|
4325,4
|
6561
|
43,96
|
|
+
|
450
|
-3
|
|
285,5
|
15796
|
33979
|
449,97
|
|
Показательная
кривая
месяцы
|
Y
|
t
|
t квадрат
|
Yt
|
Lg Y
|
Lg Y t
|
Выр. ряд
|
1
|
22,8
|
-11
|
121
|
-250,8
|
1,358
|
-14,94
|
58
|
2
|
24,9
|
-9
|
81
|
-224,1
|
1,396
|
-12,564
|
54
|
3
|
31
|
-7
|
49
|
-217
|
1,49
|
-10,43
|
49
|
4
|
29,5
|
-5
|
25
|
-147,5
|
1,47
|
-7,35
|
45
|
5
|
30,5
|
-3
|
9
|
-91,5
|
1,484
|
-4,452
|
40
|
6
|
35,6
|
-1
|
1
|
-35,6
|
1,55
|
-1,55
|
37
|
7
|
36,4
|
0
|
0
|
0
|
1,56
|
0
|
35
|
8
|
42,6
|
1
|
1
|
42,6
|
131,63
|
1,63
|
33
|
9
|
45,1
|
3
|
9
|
135,3
|
1,65
|
4,95
|
30
|
10
|
47,3
|
5
|
25
|
236,5
|
1,67
|
8,35
|
27
|
11
|
51
|
7
|
49
|
357
|
1,71
|
11,97
|
25
|
12
|
53,4
|
9
|
81
|
480,6
|
1,73
|
15,57
|
23
|
Итого:
|
450,1
|
|
|
|
|
|
|
\
Сравнивая
полученные результаты значений выбираем параболу второго порядка.
4. Оценка
тесноты связи между количественными признаками, ранговые коэффициенты К. Спирмена
и М. Кендела.
Оценка интенсивности связи между
количественными признаками (и качественными) проводится с помощью
непараметрических методов. В основу этих методов положен принцип нумерации
значений статистического ряда. Каждый единицы совокупности присваивается
порядковый номер в ряду, который будет упорядочен по уровню признака. С помощью
этого ряд значений признака ранжируется, а номер каждой отдельной единицы будет
её рангом.
Ранговые
коэффициенты К. Спирмэна и М. Кендэла.
Ранговые
коэффициенты Спирмэна и Кендэла применяют для изменения связи между
ранжированными признаками. Эти методы применяют не только для качественных, но
и для количественных показателей, особенно при малом объёме совокупности, так
как непараметрические методы ранговой корреляции не связаны ни с какими
ограничениями относительно характера распределения признака.
Метод Спирмена:
располагают варианты
факторного признака по возрастанию – ранжируют единицы по значению признака Х;
для каждой единицы
совокупности указывают ранг с точки зрения результативного признака У.
Если связь между
признаками прямая, то с увеличением ранга признака Х ранг признака У также
будет возрастать; при тесной связи ранги признаков Х и У в основном совпадут.
При обратной связи возрастанию рангов признака Х будет, как правило,
соответствовать убывание рангов признака У. В случае отсутствия связи
последовательность рангов признака У не будет обнаруживать никакого порядка
возрастания или убывания.
Теснота связи
между признаками оценивается ранговым коэффициентом корреляции Спирмена:
Где d – разность рангов признаков Х и У;
N – число наблюдаемых
единиц.
В случае
отсутствия связи р=0. При прямой связи коэффициент р – положительная правильная
дробь, при обратной – отрицательная.
Кендэллом
предложен другой показатель изменения корреляционной связи, также с использованием
рангов признаков:
Упрощение
расчётов Кендэла:
5. Ряд наблюдений располагается
в возрастающем порядке по признаку Х с указанием соответствующих им рангов по
признаку У.
6. Упорядоченная таким образом
последовательность наблюдений берется как исходная для построения квадратной
матрицы размерностью (n * n). Для заполнения матрицы по каждой
паре наблюдений (i, j) сравнивают ранги признака У:
Cума элементов матрицы, расположенных
выше главной диагонали, и есть искомое значение S.
При достаточном
навыке расчет величины S можно выполнить,
непосредственно сравнивая ранг Ry данного
наблюдения с рангом Ry последующих наблюдений. Для
каждого наблюдения подсчитываются Р – число случаев, когда ранг признака У у
следующих наблюдений меньше, чем у данного, и Q – число случаев, когда у следующих наблюдений ранг признака
У больше, чем у данного. Искомое наблюдение
Правильность
условия контролируется соблюдением условия
Далее
производится расчет по приведённой ранее формуле.
При достаточно
больших n между значениями
ранговых коэффициентов фиксируется соотношение:
Список используемой литературы.
1. М.Р. Ефремова, Е.В. Петрова «Общая
теория статистики», учебник, 2007 г.
2. Л. П. Харченко и др. «Статистика,
курс лекций», 1998г
|