Анализ проводится с
использованием пакета STATISTICA.
2.1 Визуализация данных.
Проверим данные
результирующего показателя (Y) на однородность и близость
к нормальному закону распределения. Для этого построим диаграмму рассеивания.
Рис1.1 Диаграмма
рассеивания У.
По построенной диаграмме
рассеивания можно сделать вывод, что совокупность вполне однородна,
следовательно делаю предположение, что результаты исследования будут адекватны.
Под автокорреляцией
понимают корреляционную зависимость между последовательными или соседними
значениями уровней временного ряда. Члены временного ряда в большинстве случаев
являются статистически зависимыми друг от друга, значение переменной во многом
определяется значениями этой же переменной в предшествующие моменты времени.
Присутствие автокорреляции
в значительной степени искажает взаимосвязь признаков, поэтому для последующего
анализа корреляции и лаговой корреляции автокорреляция уровней ряда исключается
методом последовательных разностей.
Автокорреляционные функции всех признаков строятся с лагом 9
(величина лага определяется по формуле Т/4 , Т=36). Для всех
коэффициентов принят уровень значимости α=5%.[
Рис.
2.1.1 Автокорреляционная функция ряда У (процент людей, болеющих сахарным
диабетом).
Рис.
2.1.2. Автокорреляционная функция ряда У после устранения тенденции.
По виду коррелограммы
установим характерные особенности временного ряда, а также порекомендуем
соответствующую функцию для его моделирования:
Все коэффициенты
автокорреляции (рис.2.1.1.) положительны и постепенно снижаются. Следовательно,
можем сделать вывод о том, что в ряду наблюдается долгосрочная автокорреляция.
После устранения тенденции методом последовательных разностей все коэффициенты
стали небольшими и незначимыми на уровне 5% (рис. 2.1.2), скорей всего, ряд
стал случайным.
Рис
2.2.1. Автокорреляционная функция ряда Х1 (процент людей, которые перенесли вирусный гепатит)
Рис.
2.2.2. Автокорреляционная функция ряда х1 после устранения тенденции.
Все коэффициенты
автокорреляции (рис.2.2.1.) положительны и постепенно снижаются. Следовательно,
можем сделать вывод о том, что в ряду также наблюдается долгосрочная
автокорреляция, как и в предыдущем. После устранения тенденции все коэффициенты
стали небольшими и незначимыми на уровне 5% (рис. 2.2.2), скорей всего, ряд
стал случайным.
Рис.2.3.1. Автокорреляционная функция ряда х2 (процент людей,
страдающих излишним весом)
Рис.
2.3.2. Автокорреляционная функция ряда х2 после устранения тенденции.
Ситуация
аналогичная предыдущей.
Рис.2.4.1. Автокорреляционная функция ряда х3 (процент людей, у
которых болезнь эндокринной системы)
Рис.
2.4.2. Автокорреляционная функция ряда х3 после устранения тенденции.
Рис.2.5.1. Автокорреляционная функция ряда х4 (процент людей,
у которых сахарный диабет передался по наследству(наследственная
предрасположенность)
Рис.
2.5.2. Автокорреляционная функция ряда х4 после устранения тенденции.
Рис.2.6.1. Автокорреляционная функция ряда х5
.
Рис.
2.6.2. Автокорреляционная функция ряда х5 после устранения тенденции.
Построенная для х5
автокорреляционная функция (рис. 2.6.1.) показывает высокую зависимость смежных
уровней ряда (коэффициент автокорреляции r1=0,642). Остальные коэффициенты невелики по значению и статистически
незначимы на уровне 5%, за исключением r4=-0,424. Можно сделать вывод о наличии краткосрочной тенденции. После
устранения тенденции методом последовательных разностей все коэффициенты стали
небольшими и незначимыми на уровне 5% (рис. 2.1.2), скорей всего, ряд стал случайным.
Проанализировав полученные
автокорреляционные функции, можно сделать вывод, что ряды у,х1,х2,х3,х4
(рис2.1.1 - 2.5.1) содержат долгосрочную тенденцию. Для таких рядов лучше всего
подходит трендовая модель вида, , так как наблюдается долгосрочная тенденция. Далее
мы рассмотрим трендовую модель.
Новые
данные
|
Y_1 D(-1)
|
X1_1 D(-1); D(-1)
|
X2_1 D(-1)
|
X3_1 D(-1)
|
X4_1 D(-1); D(-1)
|
Х5_1
D(-1)
|
1
|
0,077
|
-0,004
|
0,012
|
0,027
|
-0,002
|
-0,034
|
2
|
0,023
|
-0,003
|
0,049
|
0,019
|
-0,002
|
-0,070
|
3
|
0,360
|
-0,004
|
0,023
|
0,031
|
0,002
|
-0,038
|
4
|
0,110
|
0,007
|
-0,010
|
0,003
|
-0,028
|
-0,054
|
5
|
0,174
|
0,051
|
0,040
|
0,020
|
0,005
|
0,035
|
6
|
0,026
|
-0,034
|
0,060
|
0,030
|
-0,001
|
0,021
|
7
|
0,080
|
-0,004
|
0,016
|
0,050
|
0,013
|
0,059
|
8
|
0,250
|
0,084
|
0,031
|
0,048
|
0,002
|
0,044
|
9
|
-0,400
|
0,002
|
0,002
|
0,002
|
-0,006
|
0,029
|
10
|
0,176
|
-0,052
|
0,025
|
0,076
|
0,006
|
-0,021
|
11
|
-0,076
|
0,003
|
0,062
|
0,042
|
0,002
|
-0,017
|
12
|
0,190
|
0,018
|
0,047
|
0,131
|
0,007
|
-0,033
|
13
|
0,010
|
-0,029
|
0,034
|
0,053
|
0,002
|
-0,026
|
14
|
0,350
|
0,016
|
0,081
|
0,089
|
0,003
|
-0,013
|
15
|
0,090
|
-0,034
|
0,318
|
0,159
|
-0,001
|
-0,115
|
16
|
0,030
|
0,029
|
0,023
|
0,060
|
-0,002
|
-0,009
|
3 Анализ корреляции и лаговой корреляции
На этом этапе в
исследовании выявляется зависимость уровня процентов людей, болеющих сахарным
диабетом (Y) от показателей, включенных в факторный набор.
При исследовании временных рядов важно не только выявить непосредственное
воздействие уровня факторного признака на результирующий (речь идет о
корреляции), но и учесть возможность существования запаздывания, то есть такой
ситуации, когда влияние одного показателя на другой проявляется через какой-то
временной интервал (это и позволяет сделать лаговая корреляция). Показателем
зависимости между признаками является коэффициент корреляции (или коэффициент
лаговой корреляции), его знак и величина позволяют сделать вывод о наличии,
силе и направлении связи.
Построив функции
перекрестной корреляции Y и факторных признаков,
проанализируем полученные коэффициенты корреляции и лаговой корреляции. Для
всех коэффициентов, кроме х3, принят уровень значимости α=5%, для х3
принят α=10 % .
Рис. 3.1. Функция
перекрестной корреляции У и Х1 (процент людей, которые перенесли
вирусный гепатит)
Анализируя рассчитанные
коэффициенты, можно сделать вывод, что корреляционная связь между уровнем
процентов людей, которые перенесли гепатит и процентом людей, у которых
сахарный диабет передался по наследству (рис. 3.1), невысока и статистически
незначима (коэффициент корреляции rx1y=0,2294). Такая ситуация может быть объяснена тем, что процент людей, которые
перенесли вирусный гепатит оказывает косвенное влияние на процент людей,
болеющих сахарным диабетом.
Рис. 3.2. Функция
перекрестной корреляции У и Х2 (процент людей, страдающих излишним весом)
Статистически значимой
связи между процентом людей, болеющих сахарным диабетом и процентом людей,
страдающих излишним весом (Х2) в ходе исследования обнаружено не
было: коэффициент корреляции и коэффициенты лаговой корреляции между этими
показателями невысоки и статистически незначимы на уровне 5% (рис. 3.2). Такая
ситуация может быть объяснена тем, что не все полные люди обязательно болеют
сахарным диабетом (т.е. х2 оказывает на У не непосредственное, а косвенное
влияние), это могут быть: бывшие спортсмены; женщины после родов; люди,
бросившее курить и др.
Рис. 3.3. Функция
перекрестной корреляции У и Х3 (процент людей, у которых болезнь эндокринной
системы)
Коэффициент лаговой
корреляции с лагом равным 0, значимый на 10%-ном уровне, показывает наличие
прямой сильной связи между признаками Х3 и Y (r=0,7265), что говорит о влиянии на процент людей, болеющих сахарным
диабетом такого показателя, как процент людей, у
которых болезнь эндокринной системы (х3).Это говорит о том, что подтвердилась
гипотеза, так как сахарный диабет – это и есть заболевание эндокринной системы.
Рис. 3.4. Функция
перекрестной корреляции У и Х4 (процент людей, у которых сахарный диабет
передался по наследству (наследственная предрасположенность)).
Коэффициент лаговой
корреляции с лагом 4, значимый на 5%-ном уровне, показывает наличие прямой
умеренной связи между признаками как Х4 и Y (r=0,6283),так и обратной между У и Х4 (r=
-0,605): процент людей, у которых сахарный диабет оказывает большое влияние на
болеющих сахарным диабетом с наследственной предрасположенностью и наоборот, чем
больше людей, у которых наследственная предрасположенность к сахарному диабету,
тем больше в дальнейшем больных сахарным диабетом. Но х4 в большей степени
влияет на у, так как из-за репродуктивной функции людей с наследственной
предрасположенностью все больше рождается людей, больных сахарным диабетом. Это
говорит о том, что подтвердилась гипотеза о воздействии этого показателя на
число больных.
Рис. 3.5. Функция
перекрестной корреляции У и Х5 (процент людей, с острыми кишечными
заболеваниями)
Гипотеза о наличии связи
процента людей с ОКЗ и процентом болеющих сахарным диабетом статистически не
подтвердилась: коэффициент корреляции и коэффициенты лаговой корреляции
оказались невелики и незначимы на уровне 5% (рис. 3.5).
Таблица
парных коэффициентов корреляции показателей с уровнями
Значимости
по новым данным
|
Y
|
X1
|
X2
|
X3
|
X4
|
X5
|
Y
|
1,0000
|
,2211
|
,1599
|
,5640
|
,7294
|
-,1510
|
|
p= ---
|
p=,513
|
p=,620
|
p=,071
|
p=,011
|
p=,658
|
X1
|
,2211
|
1,0000
|
-,2864
|
-,1358
|
-,0557
|
,4157
|
|
p=,513
|
p= ---
|
p=,393
|
p=,691
|
p=,871
|
p=,204
|
X2
|
,1599
|
-,2864
|
1,0000
|
,1763
|
,2854
|
-,4720
|
|
p=,620
|
p=,393
|
p= ---
|
p=,604
|
p=,395
|
p=,056
|
X3
|
,5640
|
-,1358
|
,1763
|
1,0000
|
,1244
|
-,4779
|
|
p=,071
|
p=,691
|
p=,604
|
p= ---
|
p=,634
|
p=,052
|
X4
|
,7294
|
-,0557
|
,2854
|
,1244
|
1,0000
|
-,4435
|
|
p=,011
|
p=,871
|
p=,395
|
p=,634
|
p= ---
|
p=,172
|
X5
|
-,1510
|
,4157
|
-,4720
|
-,4779
|
-,4435
|
1,0000
|
|
p=,658
|
p=,204
|
p=,056
|
p=,052
|
p=,172
|
p= ---
|
2.4.
Построение регрессионной модели.
На предыдущем этапе была
исследована взаимосвязь результирующего признака Y с
каждым из признаков факторного набора. В результате была обнаружена
статистически значимая на уровне 5% прямая умеренная связь Ус фактором х4, причем
влияние фактора х4 на результирующий признак происходит с временным лагом
τ=4, и была обнаружена статистически значимая на уровне 10% прямая
сильная связь между х3 и у, влияние фактора х3 на результирующий признак
происходит с временным лагом τ=0 . Построим множественную регрессионную
модель, отражающую зависимость количества людей, у которых наследственная
предрасположенность к сахарному диабету(х4) болезнь эндокринной системы(х3) на количество
людей с сахарным диабетом(Y). Для построения модели ряд х4
предварительно сдвигаются относительно ряда Y на 4 периода,
а х3 остается на месте.
|
Y_1 D(-1)
|
X1_1 D(-1); D(-1)
|
X2_1 D(-1)
|
X3_1 D(-1)
|
X4_1 D(-1); D(-1)
|
|
1
|
0,077
|
|
0,012
|
0,027
|
|
-0,034
|
2
|
0,023
|
-0,003
|
0,049
|
0,019
|
|
-0,070
|
3
|
0,360
|
-0,004
|
0,023
|
0,031
|
|
-0,038
|
4
|
0,110
|
0,007
|
-0,010
|
0,003
|
|
-0,054
|
5
|
0,174
|
0,051
|
0,040
|
0,020
|
-0,002
|
0,035
|
6
|
0,026
|
-0,034
|
0,060
|
0,030
|
-0,002
|
0,021
|
7
|
0,080
|
-0,004
|
0,016
|
0,050
|
0,002
|
0,059
|
8
|
0,250
|
0,084
|
0,031
|
0,048
|
-0,028
|
0,044
|
9
|
-0,400
|
0,002
|
0,002
|
0,002
|
0,005
|
0,029
|
10
|
0,176
|
-0,052
|
0,025
|
0,076
|
-0,001
|
-0,021
|
11
|
-0,076
|
0,003
|
0,062
|
0,042
|
0,013
|
-0,017
|
12
|
0,190
|
0,018
|
0,047
|
0,131
|
0,002
|
-0,033
|
13
|
0,010
|
-0,029
|
0,034
|
0,053
|
-0,006
|
-0,026
|
14
|
0,350
|
0,016
|
0,081
|
0,089
|
0,006
|
-0,013
|
15
|
0,090
|
-0,034
|
0,318
|
0,159
|
0,002
|
-0,115
|
16
|
0,030
|
0,029
|
0,023
|
0,060
|
0,007
|
-0,009
|
Построение множественной регрессионной
модели:
Таблица1. Результаты регрессионного
анализа
R= ,68548172 R?= ,46988518 Adjusted R?= ,41098354
|
|
|
|
|
|
|
|
|
F(1,9)=7,9775>Fтабл=4,6 p<,01990
Std.Error of estimate: ,15081
|
|
|
|
|
|
|
|
|
Beta
|
Std.Err. of Beta
|
B
|
Std.Err. of B
|
t(9)
|
p-level
|
Intercept
|
|
|
0,07683
|
0,045634
|
1,683522
|
0,000001
|
X4
|
0,685482
|
0,242697
|
13,13043
|
4,648864
|
2,824439
|
0,000027
|
Х3
|
0,601229
|
0,224326
|
0,100278
|
0,037415
|
2,68016
|
0,000234
|
Y=0,07683+0,100278х3+13,13043x4- полученное уравнение.
Исследуем на
адекватность построенное линейное уравнение регрессии:
Для исследования полученной
модели на адекватность воспользуемся:
1.Коэффициентом
детерминации;
2.критерием Фишера;
3.критерием Стьюдента;
4.проведем анализ
остатков.
Общий и скорректированный коэффициент детерминации
R=
,68548172 R?= ,46988518 Adjusted R?= ,41098354
Оба этих коэффициента не
сильно близки к 1. Следовательно, можно сделать вывод об умеренном влиянии
факторных признаков на результирующий показатель.
Критерий Фишера
Проверим на значимость
генеральное уравнение линейной регрессии Y=b0+b1Т
Построим гипотезы:
Но : уравнение не значимо (b0=b1=0);
Н1 : уравнение значимо. (bj¹0).
1.Если Fрасч >Fтабл, то с вероятностью не менее 95% можно утверждать, что принимается
гипотеза Н1.
2.Если модуль Fрасч <Fтабл, то с вероятностью 95% нельзя утверждать, что принимается гипотеза Н1.[10]
a =0.05; n1 =1; n2=14;
F0,05;1;92 =4,6
Fрасчет. =7,9775
Это означает, что с
вероятностью не менее 95% можно утверждать, что уравнение значимо.
Критерий Стьюдента
На основе данных последней
таблицы можно говорить о значимости коэффициентов регрессии βj :
t0= 1,683522
βo значим на уровне 0,000001
t1=2,824439
β1 значим на уровне 0,000027
t2=2,68016
β2 значим на уровне 0,000234
Анализ остатков
Для полученной модели
проведем проверку условий Гаусса-Маркова.
Построим график
распределения остатков на нормальной вероятностной бумаге и гистограмму
остатков.
Рис. 4.1. График
распределения остатков на нормальной вероятностной бумаге.
Рис. 4.2. Гистограмма
остатков
С помощью гистограммы и графика на
нормальной вероятностной бумаге делаем вывод о том, что распределения остатков
близко к нормальному закону распределения. Следовательно, можно
проанализировать выполнение условий Гаусса-Маркова.
Проверка условий
Гаусса-Маркова:
1-ое и 4-ое условия
Рис7. Математическое
ожидание остатков
Из данного графика можно
сделать вывод о том, что математическое ожидание остаточной компоненты равно
нулю, т.к. линия математического ожидания находится на нулевом уровне, и
остатки независимы с объясняющей переменной, т.к. коэф.корреляции=0.
Следовательно, 1 и 4 условия Гаусса-Маркова выполняются.
2-ое условие:
.
Рис8. Дисперсия остатков
Из графика видно, что линия
дисперсий остатков не параллельна оси Х, наклон идет вверх, дисперсия
случайного возмущения увеличивается.
Следовательно, 2-ое условие
Гаусса-Маркова не выполняются
3-е условие (проверка
автокорреляции остатков):
Критерий
Дарбина-Уотсона:
|
Durbin- Watson d
|
Serial Corr.
|
|
Estimate
|
2,558753
|
-0,302355
|
|
Табличное значение
коэффициента d при N = 14, m = 1 составляет dн =1,045 и dв=
1,330; 4-dв=2,670
Т. к. расчетное значение d=2,558753, то принадлежит промежутку (dв;4-dв), автокорреляция отсутствует. Условие выполняется.
Таким образом, можно
сделать вывод, что модель адекватна, хотя выполняются не все условия
Гаусса – Маркова (не выполняется 2 условие), но уравнение значимо по критерию
Фишера и Стьюдента.
Заключение
В результате исследования
было выявлено, что основными причинами болезни сахарного диабета в городе
Красноярске с 1991 года по 2007 год являются наследственная предрасположенность
и больные эндокринной системы, как и предполагалось в первой главе курсовой. Это
означает, что вероятнее всего заболеть тем людям, у которых родственники болеют
сахарным диабетом и тем, у кого имеется болезнь эндокринной системы.
Исследуя эту тему, я
глубоко изучила сахарный диабет, это очень страшная болезнь, которая влияет на
весь человеческий организм.
И чтобы хоть немного
уменьшить вред от диабета нужно самое главное - регулярно посещать врача и
выполнять его рекомендации по поводу
диабета:
1.Соблюдать
диету!
2.Витамины.
Увы, но большая часть людей, включая больных диабетом,
страдает заболеваниями желудка и кишечника, поэтому даже если они регулярно
едят фрукты и овощи или принимают витаминные драже, они все же страдают от
дефицита витаминов. Диабетикам рекомендуется два раза в год делать курсы
внутримышечных инъекций витаминов. После таких курсов часто улучшается общее
самочувствие, уменьшаются боли в ногах, общее течение диабета улучшается.
3.Сосудистые
лекарства, средства, защищающие почки, лекарства от повышенного давления.
Давление у диабетика должно быть нормальным (не выше 140/90)! От этого напрямую
зависит продолжительность жизни. 4.Физиотерапия.
5.Массаж.
Ежедневный массаж стоп поможет избежать осложнений диабета.
6.Физкультура.
Библиографический
список
[1] Эндокринология Сибири: материалы второй
сибирской конференции эндокринологов.2003
[2] Полная энциклопедия «Жизнь и здоровье
женщины»,том 1, М:олма-пресс,2001
[3] www.dialand.ru
[4] Здоровье населения и здоровье Красноярского
края,2005,выпуск 1
[5] Федеральная служба гос. Статистики
«Экономика Красноярского края в 2006 году (статистический ежегодник, № 1-12) г.
Красноярск, 2007
[6] Здравоохранение и социальное обеспечение в
г. Красноярске в 2000 г.: Статистический бюллетень, 2001
[7] Здравоохранение и социальное обеспечение в
г. Красноярске в 2002 г.: Статистический бюллетень, 2003
[8] Госкомстат России Красноярского краевого
комитета государственной статистики/Здравоохранение и социальное обеспечение в
Красноярском крае в 2003 г., 2004
[9] Лапо, В.Ф. Теория вероятностей,
математическая статистика и эконометрика/учебное пособие, книга вторая/
Красноярск,1999
[10] Бородич, С.А., Эконометрика/учебное пособие,
3-е издание/ Минск:000 «Новое знание», 2006
Страницы: 1, 2
|