КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
Корреляционный и регрессионный анализ. Одномерный корреляционный анализ.
Задачей КОРРЕЛЯЦИОННОГО АНАЛИЗА является исследование тенденций ВЗАИМНОГО ИЗМЕНЕНИЯ ДВУХ ИЛИ БОЛЕЕ СЛУЧАЙНЫХ ВЕЛИЧИН. Если исследуется взаимная тенденция изменения двух случайных величин, то говорят об ОДНОМЕРНОМ КОРРЕЛЯЦИОННОМ АНАЛИЗЕ, если более двух - о МНОЖЕСТВЕННОМ КОРРЕЛЯЦИОННОМ АНАЛИЗЕ.
Задачей РЕГРЕССИОННОГО АНАЛИЗА является построение ЗАВИСИМОСТИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ ОДНОЙ ИЛИ НЕСКОЛЬКИХ СЛУЧАЙНЫХ ВЕЛИЧИН ОТ ОДНОЙ ИЛИ НЕСКОЛЬКИХ НЕСЛУЧАЙНЫХ ВЕЛИЧИН.
Если строят зависимость МО одной случайной величины от одной неслучайной, то говорят о ПРОСТОЙ или ОДНОМЕРНОЙ РЕГРЕССИИ.
При построении зависимости МО одной случайной величины от нескольких неслучайных говорят о МНОЖЕСТВЕННОЙ РЕГРЕССИИ.
Построение зависимости МО нескольких случайных величин от нескольких неслучайных является предметом МНОГОМЕРНОГО РЕГРЕССИОННОГО АНАЛИЗА.
Хотя вычисления в регрессионном и корреляционном анализах весьма схожи, между этими методами есть существенная разница. НЕСЛУЧАЙНОСТЬ В РЕГРЕССИОННОМ АНАЛИЗЕ ОЗНАЧАЕТ ИЗМЕРЕНИЕ БЕЗ ОШИБОК (С АБСОЛЮТНОЙ ТОЧНОСТЬЮ). В корреляционном анализе в "случайность" исследуемых величин могут входить ошибки измерений. Использование методов корреляционного и регрессионного анализов требует выполнения определенных предпосылок.
ОДНОМЕРНЫЙ КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
При одномерном корреляционном анализе степень вероятностной связи между двумя случайными величинами x и y характеризуется специальной мерой - КОЭФФИЦИЕНТОМ КОРРЕЛЯЦИИ:
ρ(x,y) = M[(x - Mx)*(y - My)]/(Dx*Dy)1/2
Коэффициент корреляции обладает следующими свойствами:
1. Значения коэффициента корреляции ρ(x,y) лежат в интервале [-1,+1]. 2. Отрицательное значение ρ(x,y) означает, что при увеличении x наблюдается тенденция уменьшения y, положительное - при увеличении x наблюдается увеличение y. Если между x и y существует функциональная линейная зависимость, то коэффициент корреляции принимает значения либо +1, либо -1. 3. Если случайные величины x и y независимы, то коэффициент корреляции равен 0, однако, из равенства 0 коэффициента корреляции не следует независимость случайных величин. |
Последнее свойство требует пояснения. Дело в том, что коэффициент корреляции характеризует не только степень тесноты вероятностной связи между случайными величинами, но и близость этой связи к линейной. Лишь в случае нормальности распределения случайных величин x и y из равенства 0 коэффициента корреляции следует независимость x и y. Поэтому часто при ρ(x,y)=0 величины x и y называют НЕКОРРЕЛИРОВАННЫМИ. Оценка ρ(x,y) вычисляется по выборке совместных наблюдений величин x и y:
r(x,y) = ∑i[(xi - X)*(yi - Y)]/[(n - 1)*Sx*Sy]1/2
где n - объем выборки; i=1,...,n
r(x,y) - оценка коэффициента корреляции ρ(x,y);
X,Y - среднее арифметическое (оценки МО) величин x и y;
S2x, S2y - оценки дисперсий случайных величин x и y.
ПОСЛЕ ВЫЧИСЛЕНИЯ ОЦЕНКИ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ ОБЯЗАТЕЛЬНО НЕОБХОДИМО ПРОВЕРИТЬ ГИПОТЕЗУ О РАВЕНСТВЕ НУЛЮ ИСТИННОГО ЗНАЧЕНИЯ ПАРАМЕТРА ρ(x,y).
Проверка статистической гипотезы о равенстве нулю истинного значения коэффициента корреляции необходима для того, чтобы определить наличие или отсутствие линейной тенденции взаимного изменения двух случайных величин. Для проверки гипотезы используется непосредственно оценка . Значение оценки сравнивается с табличным при заданном уровне значимости α. Если значение оценки превышает табличное, то данные противоречат гипотезе о равенстве нулю истинного значения коэффициента корреляции. В этом случае можно утверждать о существовании линейной тенденции взаимного изменения x и y (вероятность ошибочности этого утверждения не превышает α). Если значение оценки не превышает табличное, то данные не противоречат гипотезе о равенстве нулю истинного значения коэффициента корреляции. В этом случае нельзя утверждать, что существует линейная тенденция связи между x и y.
Рассмотрим пример. Пусть n=10 (ν=n-1=9), оценка коэффициента корреляции составляет 0,74. Зададим уровень значимости (вероятность нашей ошибки при отвержении справедливой гипотезы) альфа равным 0,05. Тогда из таблицы следует, что полученная оценка превышает табличное значение. Следовательно, данные противоречат гипотезе о равенстве нулю истинного значения коэффициента корреляции. МОЖНО УТВЕРЖДАТЬ, ЧТО СУЩЕСТВУЕТ КОРРЕЛЯЦИОННАЯ СВЯЗЬ МЕЖДУ ПЕРЕМЕННЫМИ X И Y.
Число степеней свободы |
rкр при α = 0,05 |
8 | 0,746 |
9 | 0,725 |
10 | 0,701 |
Проверьте усвоение Предыдущий раздел Следующий раздел Оглавление