МЕТОДЫ И ИНСТРУМЕНТАРИЙ МНОГОМЕРНОГО СТАТИСТИЧЕСКОГО АНАЛИЗА
Введение. Многомерная случайная величина
МНОГОМЕРНЫЕ СТАТИСТИЧЕСКИЕ МЕТОДЫ - являются инструментарием предназначенным для моделирования (исследования) объектов (процессов) вероятностной природы, характеризующихся наличием большого количества контролируемых и регистрируемых показателей. Методы позволяют среди множества альтернативных моделей выбрать наилучшую в статистическом смысле.
В многомерном статистическом анализе изучаются генеральные совокупности нескольких (двух и более) признаков. Это множество признаков может быть представлено вектором
X = (x1, x2, ..., xk)т
где x1, x2, ..., xk - компоненты вектора;
т - знак транспонирования.
Таким образом, объектом исследования в многомерном статистическом анализе является система k случайных величин или k-мерный случайный вектор.
Если все компоненты вектора X непрерывные случайные величины, то говорят о непрерывной k-мерной случайной величине. Если все компоненты вектора X дискретные случайные величины, то говорят о дискретной k-мерной случайной величине. Если среди компонент присутствуют как дискретные, так и непрерывные случайные величины, то говорят о смешанной k-мерной случайной величине.
Описание поведения k-мерной случайной величины означает указание способа вычисления вероятностей получения заданных значений дискретных компонент и вероятностей попадания в заданные интервалы значений непрерывных компонент. В многомерном статистическом анализе наиболее распространенными способами описания являются аналитический и параметрический (графический или табличный затруднен в следствие многомерности). Как и в одномерных статистических методах в многомерных используются две функции: F(X) - функция распределения k-мерной случайной величины и f(X) - функция плотности вероятностей k-мерной случайной величины.
Функция распределения k-мерной случайной величины определяется следующим образом:
F(A) = P{x1<a1, x2<a2, ..., xk<ak} = P(X<A)
где A = (a1, a2, ..., ak)т - k-мерный вектор заданных действительных чисел.
По аналогии F(B) = P{x1<b1, x2<b2, ..., xk<bk} = P(X<B), следовательно, если A<B, то:
P{a1<x1<b1, a2<x2<b2, ..., ak<xk<bk} = P(A<X<B) = F(B) - F(A)
удовлетворяет формуле вычисления вероятности попадания значения k-мерной случайной величины в k-мерный параллелепипед с плоскостями, параллельными координатным осям.
Функция распределения случайного k-мерного вектора является детерминированной, неотрицательной и обладает свойствами:
F(X) = 0, если хотя бы одна компонента вектора X равна -∞;
F(X) = 1, если все компоненты вектора X равны ∞
Функция распределения F(X) непрерывной k-мерной случайной величины является непрерывной по определению. Непрерывная k-мерная случайная величина имеет плотность распределения вероятностей f(X) = f(x1, x2, ..., xk) ≥ 0, удовлетворяющую условию:
Плотность распределения вероятностей обладает свойствами:
Плотности вероятностей подсистемы m случайных величин (1 ≤ m < k) называют частными или маргинальными распределениями. Условными распределениями случайного вектора X называются распределения подсистемы m его компонент (1 ≤ m < k) при условии, что остальные k - m компоненты являются фиксированными. Эти компоненты от нефиксируемых отделяются косой чертой. Например пусть m=2, а k=5, тогда функция вероятности условного распределения компонент x2 и x5 записывается следующим образом: F(x2,x5/x1,x3,x4), а соответственно функция плотности вероятности f(x2,x5/x1,x3,x4).
Подсистема из m компонент и дополнительная подсистема m - k компонент вектора X называются независимыми, если справедливо равенство:
F(x1, x2, ..., xk) = F(xi1, xi2, ..., xim) * F(xim+1, xim+2, ..., xik)
В частности компоненты X называются независимыми, если:
F(x1, x2, ..., xk) = F(x1)*F(x2)* ... *F(xk).
Проверьте усвоение Предыдущий раздел Следующий раздел Оглавление