МЕТОДЫ МНОГОМЕРНЫХ КЛАССИФИКАЦИЙ   

Дискриминантный анализ. Классификация при наличии k обучающих выборок

    При необходимости возможно разбиение множества объектов (наблюдений) на k классов более двух. В этом случае необходимо построение k дискриминантных функций аналогично тому как это представлено в предыдущем параграфе.

    Рассмотрим пример. Пусть имеются следующие наблюдения:

x1 x2
1 8
2 6
3 10
4 4
5 1
6 4
7 10
8 6
9 8

    Наблюдения разделены на три множества (наблюдения 1,2,3, наблюдения 4,5,6 и наблюдения 7,8,9). Что бы наилучшим образом разделить множества, нужно построить соответствующую линейную комбинацию переменных x1 и  x2 - дискриминантную функцию:

d = β1*x1 + β2*x2

Обозначим xij среднее значение j-го признака у объектов i-го множества. Тогда для первого множества среднее значение функции будет равно:

d1 = β1*x11 + β2*x12

для второго множества:

d2 = β1*x21 + β2*x22

для третьего множества:

d3 = β1*x31 + β2*x32

    Произведя вычисления по рассмотренной ранее схеме получим следующие функции классификации:

для классификации первого и второго множеств:

-4*x1 + 2*x2 = -3

для классификации второго третьего множеств:

-6,2*x1 - 3,2*x2 = -57,8

для классификации первого и третьего множеств:

-6,4*x1 - 0,8*x2 = -38,4

Графики функций представлены на рисунке.

   

Пусть новое наблюдение имеет значения: x1 = 3, x2 = 7. Тогда значения дискриминантных функций будут следующими:

f12 = -4*x1 + 2*x2 = -4*3 + 2*7 = - 2 > -3

f23 = -6,2*x1 - 3,2*x2 = -6,2*3 - 3,2*7 = -41 > -57,8

f13 = -6,4*x1 - 0,8*x2 = -6,4*3 - 0,8*7 = -24,8 > -38,4

Если x1 = 7, x2 = 3, то:

f12 = -4*x1 + 2*x2 = -4*7 + 2*3 = - 22 < -3

f23 = -6,2*x1 - 3,2*x2 = -6,2*7 - 3,2*3 = -53 > -57,8

f13 = -6,4*x1 - 0,8*x2 = -6,4*7 - 0,8*3 = -47,2 < -38,4

    Необходимо отметить, что изменение числа переменных существенно влияет на результат дискриминантного анализа. Поэтому для определения необходимости включения (исключения) дискриминантной переменной обычно используют специальные критерии.

    Для оценки вклада отдельной переменной в значение дискриминантной функции целесообразно пользоваться стандартизованными коэффициентами дискриминантной функции. Вычислить стандартизованные коэффициенты можно по следующей формуле:

aj = βj*(cij/(p - m))1/2

где:  p - общее число исходных переменных;

        m - число групп;

        cij - элементы ковариационной матрицы.

Стандартизованные коэффициенты не зависят от масштабов измерений переменных. Именно поэтому по абсолютным величинам этих коэффициентов можно определить какая дискриминантная переменная вносит наибольший или наименьший вклад в значение дискриминантной функции.

Проверьте усвоение  Предыдущий раздел  Следующий раздел  Оглавление

Hosted by uCoz