Чтобы создать -карту или -карту нужно знать
параметры нормального распределения для контролируемого процесса –
математическое ожидание (можно заменить средним средних) и среднее
квадратическое отклонение(также можно взять среднее средних стандартного
отклонения), а далее по формуле определить верхнюю и нижнюю допустимые границы.
Изучая причины
опозданий на работу работников, руководитель нашего завода может составить
диаграмму Парето, которая наглядно покажет, на что нужно обратить внимание в
первую очередь. Пусть, изучая объяснения работников (официальный документ в
случае дисциплинарного проступка) по поводу опозданий за прошлый год, он
выяснил следующее: 10 опозданий было связано с тем, что работники проспали, 35
опозданий было вызвано плохой работой транспорта, 75 с возможностью подработки
на конкурирующем предприятии, 3 случая были связаны с пьянством, и в восьми
случаях причины остались невыясненными. На основе этих данных построим
диаграмму Парето (Приложение, рис. №4).
Диаграмма Парето
наглядно показывает вклад каждой причины в итоговый результат числа опозданий
на работу. Легко заметить, что более 80%, а если посчитать точно, то 83,9%,
вклада составляют две причины – это подработка и плохая работа транспорта. Ими
и следует заниматься в первую очередь. Например, если подработка обеспечивает
работникам дополнительный доход сопоставимый в долевом отношении с доходом по
основному месту работы, то можно подумать о том, чтобы работники подрабатывали
по основному месту трудовой деятельности за ту же или немногим большую плату,
которую предлагает конкурент или искать иные пути выхода из сложившейся
ситуации, если увеличение времени труда может повлечь за собой нарушение
трудового законодательства. Вообще говоря, в данном случае целесообразно
построить функцию от чего зависит желание работников трудиться в свободное от
основной работы время: λ=f(τ1,τ2… τk), и с учетом соответствующих
факторов принимать разумные управленческие решения.
Приложение к примеру №1.
Таблица
№1.
Описательная
статистика
|
Среднее
|
2,864
|
Стандартная ошибка
|
0,46529
|
Медиана
|
3,1
|
Мода
|
3,1
|
Стандартное отклонение
|
2,32646
|
Дисперсия выборки
|
5,4124
|
Эксцесс
|
-0,6169
|
Асимметричность
|
-0,1372
|
Интервал
|
9,2
|
Минимум
|
-2
|
Максимум
|
7,2
|
Сумма
|
71,6
|
Счет
|
25
|
☻
2. Изучение корреляционных связей.
В природе и её
«подразделении» обществе существует множество всевозможных связей, о которых мы
говорим: простые и сложные, прямые и обратные, функциональные, вероятностные
(стохастические) или корреляционные, линейные и нелинейные, биологические и
социальные и т.д. Так, функциональная связь может быть положительной и нелинейной,
более или менее сложной, например, по числу взаимосвязанных переменных, описывающей
какой-то социально-экономический или юридический процесс. В рамках теории
вероятностей и математической статистики разработан ряд методов изучения вероятностных
связей между различными явлениями и процессами, которые дают в результате вычислений
соответствующие оценивающие силу связи коэффициенты: линейный коэффициент
корреляции[64],
эмпирическое корреляционное отношение[65], множественный коэффициент
корреляции[66],
коэффициенты ассоциации и контингенции, коэффициент взаимной
сопряженности Пирсона-Чупрова[67],
а также коэффициент Фехнера, коэффициент Спирмена,
коэффициент корреляции Кендалла [68]
и другие. Мы основное внимание уделим линейному коэффициенту корреляции,
наиболее сложному из перечисленных и тесно связанному с регрессионным анализом,
по смыслу и сути близкому к функциональному анализу и реализованному во всех
математических пакетах анализа. Коэффициент корреляции покажет силу и
направление связи (вверх или вниз) между переменными, а регрессионное уравнение
позволит прогнозировать значения управляемой переменной по значениям
управляющей (управляющих) переменной. При этом важно помнить, что
корреляционная связь не является причинной, поскольку не дает нам абсолютных
гарантий о связи между переменными математической модели, отражающими какие-то
реальные процессы. Мы не можем со сто процентной гарантией утверждать, будто
переменная Х строго определяет поведение переменной Y или определяет её поведение на ту величину,
которую показывает коэффициент детерминации (R2), мы просто высказываем здесь более или менее обоснованное
мнение о том, что одна переменная с такой-то долей вероятности определяет
другую. Это уже не простая гипотеза, а гипотеза проверенная, «продвигающаяся» к
рангу теории. Можно сказать, что функциональная связь равна корреляционной с
коэффициентом корреляции равном (+/-) единице (имеется в виду линейный
коэффициент корреляции). То есть функциональная связь это частный случай связи
корреляционной, если переменные модели имеют истинную спецификацию. Например,
изучая связь между убийствами и самоубийствами, легко обнаружить очень тесную
корреляционную положительную связь близкую к функциональной, но на этом основании
вовсе нельзя утверждать, будто частоты самоубийств управляют частотами убийств
или, наоборот, будто частоты убийств детерминируют частоты самоубийств,
поскольку их реальную динамику определяет общий для них фактор (факторы),
скажем, степень неравенства в распределении доходов народонаселения.
Следовательно, знание связи между переменными убийства и самоубийства может
быть полезно лишь для прогнозирования одной переменной через другую, но не для
объяснения поведения одной переменной через другую.
Для расчета
линейного коэффициента корреляции используют какую-либо одну из подходящих
(равноценных) формул, в итоге дающих один и тот же результат. Использование
конкретной формулы – дело вкуса конкретного исследователя, но в настоящее время
компьютерная программа рассчитывает данный коэффициент автоматически, что освобождает
исследователя от труда вычислять его вручную.
К сожалению, для
объяснения «поведения» преступности и её структурных составляющих обычные
математические функции применять, практически, невозможно, поскольку связи
между преступностью и её детерминирующими факторами являются корреляционными, а
не функциональными. Так, на преступность в Республике Татарстан в период с 1970
по 2007 годы оказывало воздействие достаточно много факторов (переменных),
величина вклада, которых менялась. Кроме того, появлялись одни дополнительные
переменные, а действие других прекращалось, например, из структуры преступности
исчезали одни составы (спекуляция, частно-предпринимательская деятельность,
коммерческое посредничество и другие) и появились новые (превышение полномочий
служащими частных охранных или детективных служб, коммерческий подкуп и
другие); менялось гражданское, уголовно-процессуальное и иное законодательство,
регулирование оперативно-розыскной деятельности; экономические, политические, демографические
факторы, не оставался неизменным уровень потребления населением алкоголя и иных
психоактивных препаратов, оказывающих мощное влияние на динамику преступности и
т.д.
В статистике идет
речь о так называемых вероятностных или статистических связях (иногда их
называют стохастическими, но мне представляется, что правильным является термин
вероятностные связи), когда «причинная» зависимость проявляется не в каждом
конкретном случае, а в среднем при достаточно большом числе наблюдений. Частным
случаем вероятностной связи считается связь корреляционная. Возможную величину
корреляционной связи удобно представить в виде непрерывного отрезка от минус
единицы до плюс единицы: [-1; 1]. Минимальное значение корреляционной связи
равно нулю, что указывает на полное отсутствие связи между изучаемыми
переменными. При движении от нуля к единице возрастает сила положительной
(прямой) связи между переменными, а при движении от нуля к минус единице – сила
отрицательной (обратной) связи, что удобно представить графически:
В учебниках по
теории статистики часто приводят таблицы количественных критериев оценки
тесноты связи, слегка уточнив которые, можно построить нижеследующую таблицу:
Коэффициент корреляции
(+/-)
(по оси ординат)
|
Качественная оценка силы
связи
|
0
|
Связь отсутствует
|
(0; 0,3) (0; -0,3)
|
Практически отсутствует
|
[0,3; 0,5) [-0,3; -0,5)
|
Слабая
|
[0,5; 0,7) [-0,5; -0,7)
|
Умеренная
|
[0,7; 1)
|
Сильная
|
1
|
Функциональная
|
Вместе с тем,
данной «оценочной политики» следует придерживаться весьма осторожно. Иногда и
очень низкие, близкие к нулю коэффициенты корреляции следует принимать во
внимание и не отказываться от соответствующих связей только на том основании,
что коэффициент корреляции между переменными низок. Например, К. Доугерти в
своей работе «Введение в эконометрику» изучал связь между весом новорожденного
ребенка (в граммах) и количеством сигарет, выкуриваемых в день будущей матерью
во время беременности. В итоге им было получено уравнение регрессии с R2=0,012, и при этом Доугерти признал, что
связь является значимой. Низкий коэффициент детерминации (коэффициент
корреляции, возведенный в квадрат) не смутил его: «Наибольшая часть дисперсии
веса новорожденного обусловлена генетической наследственностью ребенка и
продолжительностью беременности; таким образом, коэффициент детерминации в
регрессиях веса новорожденного младенца всегда является очень низким. Те, кто
не имеет достаточного опыта в области регрессионного анализа, стремятся задать
желаемый уровень R2 и считают, что если R2 высок, то уравнение является точным,
а если низок, то данная регрессия оценивалась впустую. Оба вывода неправильны.
В рассматриваемом случае курение во время беременности объясняет только очень
малую долю дисперсии, но, тем не менее, является значимым фактором. Если
предположить, что воздействие всех остальных факторов постоянно, то курение 10
сигарет в день во время беременности снижает вес новорожденного в среднем
приблизительно на 80 граммов. Хотя само по себе это, видимо, не столь серьезно,
тот факт, что курение оказывает неблагоприятное воздействие на вес новорожденного,
вероятно, означает, что оно также оказывает неблагоприятное воздействие на
умственное развитие плода, и это имеет большое значение»[69]. Сам по себе высокий
коэффициент корреляции еще не гарантирует, что связь между изучаемыми
переменными сильна, а низкий может вовсе на свидетельствовать об отсутствии
связи между переменными. Важна правильная спецификация модели, глубокое
понимание качественного смысла переменных, внутренней сути изучаемых явлений и
факторов, воздействующих на них.
Существует парная
корреляция, когда исследуется связь между двумя переменными и множественная
корреляция, когда исследуется связь между одной зависимой и несколькими (две и
более) факторными переменными. В последнем случае изучаются так называемые
частные корреляции.
Корреляционный
анализ обычно проводят вместе с регрессионным, в ходе которого поучают
соответствующее уравнение, связывающее переменные и позволяющее прогнозировать
одну переменную (зависимую) по независимой (независимым). То есть модель получает
аналитическую (параметрическую) форму выражения. Регрессионный анализ может
быть парным и множественным (множественный регрессионный анализ). Регрессионный
анализ может проводиться с введением фиктивных (искусственных) переменных в
левую или правую (левую и правую) части уравнения. Могут выстраиваться системы
совместных уравнений, позволяющие решать различные сложные аналитические
задачи.
Многомерный регрессионный и корреляционный анализ[70]
Область применения - все юридическое
пространство. Множественный корреляционный и регрессионный анализ является
одним из наиболее эффективных и полезных методов проведения научных
исследований, поскольку позволяет (цель): 1) оценить силу связи между
изучаемыми переменными (корреляционный анализ); 2) получить форму связи в виде
уравнения (регрессионный анализ); 3) его результаты легко интерпретируются
(легко определить юридический смысл уравнения). По существу множественный
корреляционный и регрессионный анализ является развитием и углублением метода
парной корреляции и регрессии.
В ходе применения данного
метода устанавливается зависимость «следствия»[71],
зависимой переменной (Y)[72] от ряда «причин», независимых
переменных (Х)[73]:
Y=f(X1,X2…Xn, ε), где f – правило, по которому правая часть
уравнения (объясняющие переменные) формирует левую (объясняемую переменную), ε[74] – случайный член. Важно понять,
что f в данном случае не
предполагает функциональной – однозначной связи, а имеет в виду связь
корреляционную, которая может принимать значения от минус единицы до плюс
единицы. Следовательно, функциональную связь с некоторой натяжкой можно назвать
частным случаем корреляционной, когда коэффициент корреляции r=1 или r=-1. При r=0 связь
между переменными отсутствует.
Y=f(X1,X2…Xn,ε) – неопределенная форма связи,
используемая в демонстрационных целях. В результате исследования необходимо
получить определенное линейное или нелинейное уравнение, например, у=а+b1x1+b2x2…bnxn, где а – свободный
член, b – линейные коэффициенты
регрессии[75];
у=а+ или у=а· и тому подобные, где присутствуют нелинейные члены.
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37
|