Во втором режиме обработка
наблюдений производится параллельно с их получением. Этот вид обработки
называют on-line-обработкой, обработкой данных по
выборке нарастающего объема, последовательной обработкой данных. В этом режиме
появляется возможность экспресс-анализа результатов эксперимента и оперативного
управления его ходом.
ОБЩИЕ СВЕДЕНИЯ ОБ ОСНОВНЫХ СТАТИСТИЧЕСКИХ МЕТОДАХ
При решении задач обработки
экспериментальных данных используются методы, основанные на двух основных
составных частях аппарата математической статистики: теории статистического
оценивания неизвестных параметров, используемых при описании модели
эксперимента, и теории проверки статистических гипотез о параметрах или природе
анализируемой модели.
1. Корреляционный анализ. Его сущность состоит в
определении степени вероятности связи (как правило, линейной) между двумя и более
случайными величинами. В качестве этих случайных величин могут выступать
входные, независимые переменные. В этот набор может включаться и результирующая
(зависимая переменная). В последнем случае корреляционный анализ позволяет
отобрать факторы или регрессоры (в регрессионной модели), оказывающие наиболее
существенное влияние на результирующий признак. Отобранные величины
используются для дальнейшего анализа, в частности при выполнении регрессионного
анализа. Корреляционный анализ позволяет обнаруживать заранее неизвестные
причинно-следственные связи между переменными. При этом следует иметь в виду,
что наличие корреляции между переменными является только необходимым, но не
достаточным условием наличия причинных связей.
Корреляционный анализ
используется на этапе предварительной обработки экспериментальных данных.
2. Дисперсионный анализ. Этот метод предназначен для
обработки экспериментальных данных, зависящих от качественных факторов, и для
оценки существенности влияния этих факторов на результаты наблюдений.
Его сущность состоит в
разложении дисперсии результирующей переменной на независимые составляющие,
каждая из которых характеризует влияние того или иного фактора на эту
переменную. Сравнение этих составляющих позволяет оценить существенность
влияния факторов.
3. Регрессионный анализ. Методы регрессионного
анализа позволяют установить структуру и параметры модели, связывающей
количественные результирующую и факторные переменные, и оценить степень ее
согласованности с экспериментальными данными. Этот вид статистического анализа
позволяет решать главную задачу эксперимента в случае, если наблюдаемые и
результирующие переменные являются количественными, и в этом смысле он является
основным при обработке этого типа экспериментальных данных.
4. Факторный анализ. Его сущность состоит в том,
что "внешние" факторы, используемые в модели и сильно взаимосвязанные
между собой, должны быть заменены другими, более малочисленными
"внутренними факторами, которые трудно или невозможно измерить, но которые
определяют поведение "внешних" факторов и тем самым поведение
результирующей переменной. Факторный анализ делает возможным выдвижение гипотез
о структуре взаимосвязи переменных, не задавая эту структуру заранее и не имея
о ней предварительно никаких сведений. Эта структура определяется по
результатам наблюдений. Полученные гипотезы могут быть проверены в ходе
дальнейших экспериментов. Задачей факторного анализа является нахождение
простой структуры, которая бы достаточно точно отражала и воспроизводила
реальные, существующие зависимости.
ОСНОВНЫЕ ЗАДАЧИ
ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
Конечной целью предварительной
обработки экспериментальных данных является выдвижение гипотез о классе и
структуре математической модели исследуемого явления, определение состава и
объема дополнительных измерений, выбор возможных методов последующей
статистической обработки. Для этого необходимо решить некоторые частные задачи,
среди которых можно выделить следующие:
1. Анализ, отбраковка и
восстановление аномальных (ошибочных) или пропущенных измерений, так как
экспериментальная информация обычно неоднородна по качеству.
2. Экспериментальная проверка
законов распределения полученных данных, оценка параметров и числовых
характеристик наблюдаемых случайных величин или процессов. Выбор методов
последующей обработки, направленной на построение и проверку адекватности
математической модели исследуемому явлению, существенно зависит от закона распределения
наблюдаемых величин.
3. Сжатие и группировка исходной
информации при большом объеме экспериментальных данных. При этом должны быть
учтены особенности их законов распределения, которые выявлены на предыдущем этапе
обработки.
4. Объединение нескольких групп
измерений, полученных, возможно, в различное время или в различных условиях,
для совместной обработки.
5. Выявление статистических
связей и взаимовлияния различных измеряемых факторов и результирующих
переменных, последовательных измерений одних и тех же величин. Решение этой
задачи позволяет отобрать те переменные, которые оказывают наиболее сильное
влияние на результирующий признак. Выделенные факторы используются для
дальнейшей обработки, в частности, методами регрессионного анализа. Анализ
корреляционных связей делает возможным выдвижение гипотез о структуре
взаимосвязи переменных и, в конечном итоге, о структуре модели явления.
Для предварительной обработки
характерно итерационное решение основных задач, когда повторно возвращаются к
решению той или иной задачи после получения результатов на последующем этапе
обработки.
1. КЛАССИФИКАЦИЯ ОШИБОК
ИЗМЕРЕНИЯ
Под измерением понимают
нахождение значения физической величины экспериментальным путем с помощью
специальных технических средств. Измерения могут быть как прямыми, когда
искомую величину находят непосредственно из опытных данных, так и косвенными,
когда искомую величину определяют на основании известной зависимости между этой
величиной и величинами, подвергаемыми прямым измерениям. Значение величины, найденное
измерением, называют результатом измерения.
Несовершенство измерительных приборов
и органов чувств человека, а часто и природа самой измеряемой величины приводят
к тому, что при любых измерениях результаты получаются с определенной
точностью, т. е. эксперимент дает не истинное значение измеряемой величины, а
лишь ее приближенное значение. Под действительным значением физической
величины понимают ее значение, найденное экспериментально и настолько приближающееся
к истинному значению, что для данной цели может быть использовано вместо него.
Точность измерения
определяется близостью его результата к истинному значению измеряемой величины.
Точность прибора определяется степенью приближения его показаний к истинному
значению искомой величины, а точность метода – физическим явлением, на котором
он основан.
Ошибки (погрешности) измерений
характеризуются отклонением результатов измерений от истинного значения
измеряемой величины. Ошибка измерения, как и истинное значение измеряемой
величины, обычно неизвестна. Поэтому одной из основных задач статистической
обработки результатов эксперимента и является оценка истинного значения
измеряемой величины по полученным опытным данным. Другими словами, после неоднократного
измерения искомой величины и получения ряда результатов, каждый из которых
содержит некоторую неизвестную ошибку, ставится задача вычисления приближенного
значения искомой величины с возможно меньшей ошибкой.
Ошибки измерений делят на грубые
ошибки (промахи), систематические и случайные.
Грубые ошибки. Грубые ошибки возникают
вследствие нарушения основных условий измерения или в результате недосмотра
экспериментатора. При обнаружении грубой ошибки результат измерения следует
сразу отбросить и повторить измерение. Внешним признаком результата, содержащего
грубую ошибку, является его резкое отличие по величине от остальных результатов.
На этом основаны некоторые критерии исключения грубых ошибок по их величине
(будут рассмотрены далее), однако самым надежным и эффективным способом
браковки неверных результатов является браковка их непосредственно в процессе
самих измерений.
Систематические ошибки. Систематической является
такая погрешность, которая остается постоянной или закономерно изменяется при повторных
измерениях одной и той же величины. Систематические погрешности появляются
из-за неправильной регулировки приборов, неточности метода измерения,
какого-либо упущения экспериментатора, использования для вычисления неточных
данных.
Систематические ошибки возникают
также при проведении сложных измерений. Экспериментатор может и не догадываться
о них, хотя они могут быть очень большими. Поэтому в таких случаях нужно
тщательно проанализировать методику измерений. Такие ошибки можно обнаружить, в
частности, проведя измерения искомой величины другим методом. Совпадение результатов
измерений обоими методами служит определенной гарантией отсутствия
систематических погрешностей.
При измерениях необходимо сделать все
возможное, чтобы исключить систематические погрешности, так как они могут быть
так велики, что сильно исказят результаты. Выявленные погрешности устраняют
введением поправок.
Случайные ошибки. Случайной ошибкой является
составляющая погрешности измерения, которая изменяется случайным образом, т. е.
это ошибка измерения, остающаяся после устранения всех выявленных систематических
и грубых ошибок. Случайные ошибки вызываются большим числом как объективных,
так и субъективных факторов, которые нельзя выделить и учесть в отдельности.
Поскольку причины, приводящие к случайным ошибкам, не одинаковы, в каждом
эксперименте и не могут быть учтены, исключить такие ошибки нельзя, можно лишь
оценить их значение. С помощью методов теории вероятностей можно учесть их
влияние на оценку истинного значения измеряемой величины со значительно меньшей
ошибкой, чем ошибки отдельных измерений.
Поэтому, когда случайная
погрешность больше погрешности измерительного прибора, необходимо многократно
повторять одно и то же измерение для уменьшения ее значения. Это позволяет
минимизировать случайную погрешность и сделать ее сравнимой с погрешностью
прибора. Если же случайная ошибка меньше погрешности прибора, то уменьшать ее
не имеет смысла.
Кроме этого, ошибки делят на абсолютные,
относительные и инструментальные. Абсолютной ошибкой считают
погрешность, выраженную в единицах измеряемой величины. Относительной ошибкой
является отношение абсолютной ошибки к истинному значению измеряемой величины.
Составляющую ошибки измерения, которая зависит от погрешности применяемых
средств измерения, называют инструментальной погрешностью измерения.
2. ПОГРЕШНОСТИ ПРЯМЫХ
РАВНОТОЧНЫХ ИЗМЕРЕНИЙ. ЗАКОН НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ
Прямые измерения – это такие измерения, когда
значение изучаемой величины находят непосредственно из опытных данных, например
снимая показания прибора, измеряющего значение искомой величины. Для нахождения
случайной погрешности измерение необходимо провести несколько раз. Результаты
таких измерений имеют близкие значения погрешностей и называются равноточными.
Пусть в результате n измерений величины х,
проведенных с одинаковой точностью, получен ряд значений: х1,
х2, …, хn. Как показано в теории ошибок, наиболее близким к истинному
значению х0 измеряемой величины х является среднее
арифметическое значение
. (2.1)
Среднее арифметическое значение
рассматривают только как наиболее вероятное значение измеряемой величины.
Результаты отдельных измерений в
общем случае отличаются от истинного значения х0. При этом
абсолютная погрешность i-го
измерения составляет
xi' = х0 – xi
и может принимать как положительные,
так и отрицательные значения с равной вероятностью. Суммируя все погрешности,
получаем
,
откуда
. (2.2)
В этом выражении второе слагаемое в
правой части при большом n
равно нулю, так как всякой положительной погрешности можно поставить в
соответствие равную ей отрицательную. Тогда х0=. При ограниченном числе
измерений будет лишь приближенное равенство х0. Таким образом, можно назвать
действительным значением.
Во всех практических случаях значение
х0 неизвестно и есть лишь определенная вероятность того, что х0
находится в каком-то интервале вблизи и требуется определить этот интервал,
соответствующий этой вероятности. В качестве оценки абсолютной погрешности
отдельного измерения используют
xi = – xi.
Она определяет точность данного
измерения.
Для ряда измерений определяют
среднюю арифметическую погрешность
.
Она определяет пределы, в которых
лежит более половины измерений. Следовательно, х0 с достаточно
большой вероятностью попадает в интервал от – до +. Результаты измерений величины х
записывают тогда в виде:
.
Величина х измерена тем
точнее, чем меньше интервал, в котором находится истинное значение х0.
Абсолютная погрешность результатов
измерений x сама по себе еще не
определяет точности измерений. Пусть, например, точность некоторого амперметра
составляет 0.1а.
Были проведены измерения силы тока в двух электрических цепях. При этом получили
следующие значения: 320.1а
и 0.20.1а.
Из примера видно, что, хотя абсолютная погрешность измерений одинакова,
точность измерений различна. В первом случае измерения достаточно точны, а во
втором – позволяют судить лишь о порядке величины. Следовательно, при оценке
качества измерения необходимо сравнивать погрешность с измеренным значением,
что дает более наглядное представление о точности измерений. Для этого вводится
понятие относительной погрешности
x = x /. (2.3)
Относительную погрешность обычно
выражают в процентах.
Так как в большинстве случаев
измеряемые величины имеют размерность, то и абсолютные погрешности размерны, а
относительные ошибки безразмерны. Поэтому с помощью последних можно производить
сравнение точности измерений разнородных величин. Наконец, эксперимент должен
быть поставлен таким образом, чтобы относительная погрешность оставалась
постоянной во всем диапазоне измерений.
Следует отметить, что при правильных
и тщательно выполненных измерениях средняя арифметическая погрешность их
результата близка к погрешности измеряемого прибора.
Если измерения искомой величины х
проведены много раз, то частоты появления того или иного значения хi можно представить в виде графика, имеющего
вид ступенчатой кривой – гистограммы (см. рис. 1), где у – число отсчетов;
xi = хi – xi+1 (i изменяется от –n до +n). С увеличением числа измерений
и уменьшением интервала xi гистограмма переходит в
непрерывную кривую, характеризующую плотность распределения вероятности того,
что величина xi окажется в интервале xi.
Под распределением случайной
величины понимают совокупность всех возможных значений случайной величины и
соответствующих им вероятностей. Законом распределения случайной величины
называют всякое соответствие случайной величины возможным значениям их
вероятностей. Наиболее общей формой закона распределения является функция
распределения Р(х). Тогда функция р(х) = Р' (х)
– плотность распределения вероятности или дифференциальная функция
распределения. График плотности распределения вероятностей называется кривой
распределения.
Функция р(х) характерна
тем, что произведение р(х)dx есть вероятность оказаться отдельному, случайно выбранному
значению измеряемой величины в интервале (х, x + dx). В общем случае эта вероятность может определяться
различными законами распределений (нормальный (Гаусса), Пуассона, Бернулли,
биномиальный, отрицательный биномиальный, геометрический, гипергеометрический,
равномерный дискретный, отрицательный экспоненциальный).
Однако чаще всего вероятность появления
величины xi в интервале (х, x + dx) в физических экспериментах описывают нормальным законом
распределения – законом Гаусса (см. рис. 2):
Страницы: 1, 2, 3, 4, 5
|