МНОЖЕСТВЕННЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ. МЕТОД ГЛАВНЫХ КОМПОНЕНТ 

Метод гребневой регрессии.

В условиях высокой коррелированности входных переменных МНК-оценки коэффициентов регрессии проявляют неустойчивость. Это обусловлено тем, что дисперсия оценок увеличивается при увеличении взаимной корреляции входных переменных:

 D(bjоц)=σ2e/(n*(1-R2j0)),

где D(bjоц) - дисперсия j-той оценки коэффициента регрессии;

     σ2e - дисперсия возмущений;

     Rj0 - коэффициент множественной корреляции входной переменной Xj с остальными X1, X2, ..., Xj-1, Xj+1, ... ,Xk.;

    n - число наблюдений.

При увеличении тесноты связи между входными переменными Rj0 стремится к 1, что приводит к вырожденности матрицы Xт*X ( D(bjоц) стремится к бесконечности).

В этих условиях предпочтительны оценки смещенные, но имеющие меньшую дисперсию, чем несмещенные МНК-оценки. Выбор таких оценок может быть сделан из условия минимума СКО оценок:

 M[(Bоц - B)т*(Bоц - B)] = D(Bоц) + [M(Bоц - B)]2,

 где D(Bоц) - дисперсия оценок коэффициентов регрессии Bоц ;

        M(Bоц-B) - смещение оценок коэффициентов регрессии Bоц

Метод, использующий в качестве критерия выбора оптимальных оценок коэффициентов регрессии минимум СКО этих оценок, получил название метода гребневой регрессии

Для вычисления смещенных оценок в методе гребневой регрессии искусственно вводится параметр k, добавляемый к диагональным элементам матрицы XT*X. Таким образом, рассматривается матрица (XT*X + k*I), где I - единичная матрица, k - параметр смещения (0k1). На рисунке показано качественное уменьшение дисперсии оценок коэффициентов (кривая 1), увеличение смещения оценок (кривая 2) при изменении параметра смещения k.

Из рисунка видно, что при некотором значении k существует минимум СКО (кривая 3). Оценки Bоц, вычисленные при этом значении k обладают минимальным отличием от истинных значений B, что является важным свойством подобранной таким образом регрессионной модели. Обратите внимание, что обычные МНК-оценки коэффициентов регрессии соответствуют значению k=0.

Таким образом, оценки гребневой регрессии вычисляются как

Воц = (XT*X + k*I)-1XT*Y

В практических процедурах оценивания исходным для принятия решения о методах получения оценок коэффициентов регрессии является график изменения оценок от изменения параметра смещения k. Удобство графика состоит в том, что оценки коэффициентов указываются для нормированных (стандартизованных) переменных. Это позволяет сравнивать влияние входных переменных на выходной контролируемый параметр. Например, пусть оцениваются коэффициенты уравнения регрессии

 y=b0+b1*x1+b2*x2+b3*x3.

Из приведенного на рисунке графика видно, что оценка b2оц при увеличении k изменяет знак и приобретает наиболее высокое значение. Такое изменение, как указывалось, обусловлено высокой взаимной коррелированностью x1, x2 и x3. Оптимальное значение k определяется по графику как значение начинающее область малого изменения оценок. Часто это значение лежит в пределах 0,2, ÷ 0,4.

Обращаем Ваше внимание на то, что метод гребневой регрессии эффективнее обычного МНК лишь при наличии значительных корреляций входных переменных (когда при изменении k оценки коэффициентов либо меняют знак, либо изменяется значимость коэффициентов).

Проверьте усвоение  Предыдущий раздел  Следующий раздел  Оглавление

Hosted by uCoz