РЕГРЕССИОННЫЙ АНАЛИЗ
Метод гребневой регрессии.
В условиях высокой коррелированности входных переменных МНК-оценки коэффициентов регрессии проявляют неустойчивость. Это обусловлено тем, что дисперсия оценок увеличивается при увеличении взаимной корреляции входных переменных:
D(bjоц)=σ2e/(n*(1-R2j0)),
где D(bjоц) - дисперсия j-той оценки коэффициента регрессии;
σ2e - дисперсия возмущений;
Rj0 - коэффициент множественной корреляции входной переменной Xj с остальными X1, X2, ..., Xj-1, Xj+1, ... ,Xk.;
n - число наблюдений.
При увеличении тесноты связи между входными переменными Rj0 стремится к 1, что приводит к вырожденности матрицы Xт*X ( D(bjоц) стремится к бесконечности).
В этих условиях предпочтительны оценки смещенные, но имеющие меньшую дисперсию, чем несмещенные МНК-оценки. Выбор таких оценок может быть сделан из условия минимума СКО оценок:
M[(Bоц - B)т*(Bоц - B)] = D(Bоц) + [M(Bоц - B)]2,
где D(Bоц) - дисперсия оценок коэффициентов регрессии Bоц ;
M(Bоц-B) - смещение оценок коэффициентов регрессии Bоц.
Метод, использующий в качестве критерия выбора оптимальных оценок коэффициентов регрессии минимум СКО этих оценок, получил название метода гребневой регрессии.
Для вычисления смещенных оценок в методе гребневой регрессии искусственно вводится параметр k, добавляемый к диагональным элементам матрицы XT*X. Таким образом, рассматривается матрица (XT*X + k*I), где I - единичная матрица, k - параметр смещения (0≤k≤1). На рисунке показано качественное уменьшение дисперсии оценок коэффициентов (кривая 1), увеличение смещения оценок (кривая 2) при изменении параметра смещения k.
Из рисунка видно, что при некотором значении k существует минимум СКО (кривая 3). Оценки Bоц, вычисленные при этом значении k обладают минимальным отличием от истинных значений B, что является важным свойством подобранной таким образом регрессионной модели. Обратите внимание, что обычные МНК-оценки коэффициентов регрессии соответствуют значению k=0.
Таким образом, оценки гребневой регрессии вычисляются как
Воц = (XT*X + k*I)-1XT*Y
В практических процедурах оценивания исходным для принятия решения о методах получения оценок коэффициентов регрессии является график изменения оценок от изменения параметра смещения k. Удобство графика состоит в том, что оценки коэффициентов указываются для нормированных (стандартизованных) переменных. Это позволяет сравнивать влияние входных переменных на выходной контролируемый параметр. Например, пусть оцениваются коэффициенты уравнения регрессии
y=b0+b1*x1+b2*x2+b3*x3.
Из приведенного на рисунке графика видно, что оценка b2оц при увеличении k изменяет знак и приобретает наиболее высокое значение. Такое изменение, как указывалось, обусловлено высокой взаимной коррелированностью x1, x2 и x3. Оптимальное значение k определяется по графику как значение начинающее область малого изменения оценок. Часто это значение лежит в пределах 0,2, ÷ 0,4.
Обращаем Ваше внимание на то, что метод гребневой регрессии эффективнее обычного МНК лишь при наличии значительных корреляций входных переменных (когда при изменении k оценки коэффициентов либо меняют знак, либо изменяется значимость коэффициентов).
Проверьте усвоение Предыдущий раздел Следующий раздел Оглавление