МНОЖЕСТВЕННЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ. МЕТОД ГЛАВНЫХ КОМПОНЕНТ
Пример использования метода главных компонент
Пусть имеются следующие показатели экономической деятельности предприятия: трудоемкость (x1), удельный вес покупных изделий в продукции (x2), коэффициент сменности оборудования (x3), удельный вес рабочих в составе предприятия (x4), премии и вознаграждения на одного работника (x5), рентабельность (y). Значения показателей представлены в таблице
x1 |
x2 |
x3 |
x4 |
x5 |
y |
0,51 |
0,2 |
1,47 |
0,72 |
0,67 |
9,8 |
0,36 |
0,64 |
1,27 |
0,7 |
0,98 |
13,2 |
0,23 |
0,42 |
1,51 |
0,66 |
1,16 |
17,3 |
0,26 |
0,27 |
1,46 |
0,69 |
0,54 |
7,1 |
0,27 |
0,37 |
1,27 |
0,71 |
1,23 |
11,5 |
0,29 |
0,38 |
1,43 |
0,73 |
0,78 |
12,1 |
0,01 |
0,35 |
1,5 |
0,65 |
1,16 |
15,2 |
0,02 |
0,42 |
1,35 |
0,82 |
2,44 |
31,3 |
0,18 |
0,32 |
1,41 |
0,8 |
1,06 |
11,6 |
0,25 |
0,33 |
1,47 |
0,83 |
2,13 |
30,1 |
Линейная регрессионная модель должна иметь вид:
y = b0 + b1*x1 + b2*x2 + b3*x3 + b4*x4 + b5*x5
Оценивание коэффициентов b0, ..., b5 дает следующие результаты:
После удаления из модели незначимого коэффициента b4 имеем:
Теперь попытаемся уменьшить размерность модели применив метод главных компонент. Результат применения метода свидетельствует, что входные переменные x1 , x2 , x3, x5 могут быть заменены двумя переменными (главными компонентами):
При этом, 80% рассеяния выходного контролируемого параметра y будет обусловлено изменениями этих переменных (главных компонент). Обозначим эти компоненты как U1 и U2. Из приведенной таблицы результата применения метода главных компонент видно,
что
U1 = 0,41*x1 - 0,57*x2 + 0,49*x3 - 0,52*x5
U2 = 0,61*x1 + 0,38*x2 - 0,53*x3 - 0,44*x5
Корреляция между этими переменными отсутствует по определению. Поэтому единственная линейная регрессионная модель зависимости математического ожидания y от переменных U1 и U2 согласно результатам оценивания представленным в таблице ниже имеет вид:
y = 15,92 - 3,74*U1 - 3,87*U2
Таким образом, размерность задачи снижена с 4-х до 2-х ( в два раза) без особого ущерба точности объяснения данных. Полученная модель объясняет 80% изменчивости y по отношению к модели с входными переменными x1 , x2 , x3, x5. В этом и состоит назначение метода главных компонент - снижение размерности задачи моделирования.
Проверьте усвоение Предыдущий раздел Следующий раздел Оглавление