МЕТОДЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
Проверка статистических гипотез.
СТАТИСТИЧЕСКОЙ ГИПОТЕЗОЙ называют
некоторое утверждение относительно значения (или значений) какого-либо параметра
случайной величины. Например, утверждение: Mx=5 (гипотеза о равенстве
МО
пяти) или утверждение: Dx=Dy (гипотеза о равенстве двух дисперсий). Под
процедурой проверки статистических гипотез понимают последовательность действий,
позволяющих с той или иной степенью достоверности подтвердить или опровергнуть
утверждение гипотезы. Все статистические выводы являются следствием проверки
одной или комплекса гипотез.
В основе проверки любой
гипотезы лежит ПРИНЦИП ПРАКТИЧЕСКОЙ НЕВОЗМОЖНОСТИ
Этот принцип гласит: СОБЫТИЯ С МАЛЫМИ
ВЕРОЯТНОСТЯМИ ПРАКТИЧЕСКИ НЕВОЗМОЖНЫ.
УРОВНЕМ
ЗНАЧИМОСТИ называется максимальное значение вероятности, при котором событие
можно считать еще практически невозможным. Уровень значимости обозначается
греческой буквой α. В практике статистических вычислений приняты следующие
стандартные значения
α: 0,05, 0,02 и 0,01
(5%, 2% и 1% ).
Событие, вероятность которого превышает
α
называется ЗНАЧИМЫМ, а событие, вероятность которого не превышает
α
называется НЕЗНАЧИМЫМ.
При проверке
статистической гипотезы исследователь сам назначает уровень значимости. Суть
проверки гипотезы сводится к следующему. Исследователь предполагает, что гипотеза верна.
Исходя из этого, исследователь делит будущие результаты на две
группы. Первая группа - результаты, вероятность получить которые при
справедливости гипотезы превосходит α. Вторая -
результаты, вероятность получить которые не превосходит
α.
Затем извлекается выборка (или реализуется
эксперимент) и определяется к какой группе относится
результат. Если результат относится к первой группе, то нет оснований отвергать гипотезу
(это вполне вероятный результат). Если результат
принадлежит второй группе, то есть основания для отвержения гипотезы
(это маловероятный результат).
Рассмотрим основные этапы проверки
гипотезы на примере проверки гипотезы о равенстве
МО нормально распределенной
случайной величины заданному значению.
ЭТАП
I. Формулирование гипотезы. H0: Mx=C (гипотеза о равенстве
МО
значению C). Гипотеза о равенстве называется нулевой гипотезой о обозначается
H0.
ЭТАП II. Определение статистики, с
помощью которой будет проверятся гипотеза. Исследователю должен быть известен
закон распределения этой статистики при справедливости гипотезы. Для нашего
случая можно использовать T-статистику:
T = (X - C)*n1/2/S
где n - объем выборки.
ЭТАП III. Исследователь назначает уровень значимости. Пусть α=0,05. По выбранному уровню значимости т.к. известно распределение T-статистики при справедливости исходной гипотезы определяются две граничные величины T-статистики (T1 и T2), которые делят значения T-статистики на две области. При справедливости гипотезы вероятность попадания статистики в интервал (T1,T2) составляет величину 1-α (0,95 в нашем случае), вероятность принятия T-статистикой значений вне интервала (T1,T2) не превышает α (в нашем случае 0,05). Первая область называется ОБЛАСТЬЮ ПРИНЯТИЯ ГИПОТЕЗЫ, вторая - КРИТИЧЕСКОЙ ОБЛАСТЬЮ.
ЭТАП IV. Извлекается выборка и вычисляется статистика. (В нашем случае Tрасч).
ЭТАП V. Если вычисленное значение попадает в область принятия гипотезы (в нашем случае T1<Tрасч<T2), то говорят, что ДАННЫЕ НЕ ПРОТИВОРЕЧАТ ГИПОТЕЗЕ. Если Tрасч<T1 или Tрасч>T2 (вычисленное значение попадает в критическую область) то говорят, что ДАННЫЕ ПРОТИВОРЕЧАТ ГИПОТЕЗЕ.
Необходимо подчеркнуть, что отвергает или принимает гипотезу исследователь. Процедура проверки лишь обосновывает приведенные выше утверждения. Утверждение - данные не противоречат гипотезе используется потому, что возможно справедлива не данная гипотеза, а некая другая, близкая к этой гипотезе (например H0: Mx=C1). Утверждение - данные противоречат гипотезе используется потому, что вероятность получить такой результат хоть и мала, но отлична от нуля.
ЕСЛИ ДАННЫЕ ПРОТИВОРЕЧАТ ГИПОТЕЗЕ И ГИПОТЕЗА ОТВЕРГАЕТСЯ, ТО ВЕРОЯТНОСТЬ ОШИБКИ ИССЛЕДОВАТЕЛЯ (гипотеза все таки верна) НЕ ПРЕВЫШАЕТ α (заданного уровня значимости).
Проверьте усвоение Предыдущий раздел Следующий раздел Оглавление