МЕТОДЫ МНОГОМЕРНЫХ КЛАССИФИКАЦИЙ
Дискриминантный анализ. Классификация при наличии k обучающих выборок
При необходимости возможно разбиение множества объектов (наблюдений) на k классов более двух. В этом случае необходимо построение k дискриминантных функций аналогично тому как это представлено в предыдущем параграфе.
Рассмотрим пример. Пусть имеются следующие наблюдения:
x1 | x2 |
1 | 8 |
2 | 6 |
3 | 10 |
4 | 4 |
5 | 1 |
6 | 4 |
7 | 10 |
8 | 6 |
9 | 8 |
Наблюдения разделены на три множества (наблюдения 1,2,3,
наблюдения 4,5,6 и
наблюдения 7,8,9). Что бы наилучшим образом разделить множества, нужно построить
соответствующую линейную комбинацию переменных
x1 и
x2 - дискриминантную
функцию:
d =
β1*x1 + β2*x2
Обозначим xij среднее значение j-го признака у объектов i-го множества. Тогда для первого множества среднее значение функции будет равно:
d1 = β1*x11 + β2*x12
для второго множества:
d2 = β1*x21 + β2*x22
для третьего множества:
d3 = β1*x31 + β2*x32
Произведя вычисления по рассмотренной ранее схеме получим следующие функции классификации:
для классификации первого и второго множеств:
-4*x1 + 2*x2 =
-3
для классификации второго третьего множеств:
-6,2*x1 - 3,2*x2 =
-57,8
для классификации первого и третьего множеств:
-6,4*x1 - 0,8*x2 =
-38,4
Графики функций представлены на рисунке.
Пусть новое наблюдение имеет значения: x1
= 3,
x2 = 7.
Тогда
значения дискриминантных функций будут следующими:
f12 = -4*x1 + 2*x2 =
-4*3 + 2*7 = - 2 > -3
f23 = -6,2*x1 - 3,2*x2 = -6,2*3 - 3,2*7 = -41 > -57,8
f13 = -6,4*x1 - 0,8*x2 = -6,4*3 - 0,8*7 = -24,8 > -38,4
Если
x1 = 7, x2 =
3, то:
f12 = -4*x1 + 2*x2 =
-4*7 + 2*3 = - 22 < -3
f23
= -6,2*x1 - 3,2*x2 =
-6,2*7 - 3,2*3 = -53 > -57,8
f13
= -6,4*x1 - 0,8*x2 =
-6,4*7 - 0,8*3 = -47,2 < -38,4
Необходимо отметить, что изменение числа переменных существенно влияет на результат дискриминантного анализа. Поэтому для определения необходимости включения (исключения) дискриминантной переменной обычно используют специальные критерии.
Для оценки вклада отдельной переменной в значение дискриминантной функции целесообразно пользоваться стандартизованными коэффициентами дискриминантной функции. Вычислить стандартизованные коэффициенты можно по следующей формуле:
aj = βj*(cij/(p - m))1/2
где: p - общее число исходных переменных;
m - число групп;
cij - элементы ковариационной матрицы.
Стандартизованные коэффициенты не зависят от масштабов измерений переменных. Именно поэтому по абсолютным величинам этих коэффициентов можно определить какая дискриминантная переменная вносит наибольший или наименьший вклад в значение дискриминантной функции.
Проверьте усвоение Предыдущий раздел Следующий раздел Оглавление