МЕТОДЫ И ИНСТРУМЕНТАРИЙ МНОГОМЕРНОГО СТАТИСТИЧЕСКОГО АНАЛИЗА

Введение. Многомерная случайная величина

МНОГОМЕРНЫЕ СТАТИСТИЧЕСКИЕ МЕТОДЫ - являются инструментарием предназначенным для моделирования (исследования) объектов (процессов) вероятностной природы, характеризующихся наличием большого количества контролируемых и регистрируемых показателей. Методы позволяют среди множества альтернативных моделей выбрать наилучшую в статистическом смысле.

В многомерном статистическом анализе изучаются генеральные совокупности нескольких (двух и более) признаков. Это множество признаков может быть представлено вектором

  X = (x1, x2, ..., xk)т  

где x1, x2, ..., xk - компоненты вектора;

    т - знак транспонирования.

Таким образом, объектом исследования в многомерном статистическом анализе является система k случайных величин или k-мерный случайный вектор.

Если все компоненты вектора X непрерывные случайные величины, то говорят о непрерывной k-мерной случайной величине. Если все компоненты вектора X дискретные случайные величины, то говорят о дискретной k-мерной случайной величине. Если среди компонент присутствуют как дискретные, так и непрерывные случайные величины, то говорят о смешанной k-мерной случайной величине.

Описание поведения k-мерной случайной величины означает указание способа вычисления вероятностей получения заданных значений дискретных компонент и вероятностей попадания в заданные интервалы значений непрерывных компонент. В многомерном статистическом анализе наиболее распространенными способами описания являются аналитический и параметрический (графический или табличный затруднен в следствие многомерности). Как и в одномерных статистических методах в многомерных используются две функции: F(X) - функция распределения k-мерной случайной величины и   f(X) - функция плотности вероятностей k-мерной случайной величины.

Функция распределения k-мерной случайной величины определяется следующим образом:

F(A) = P{x1<a1, x2<a2, ..., xk<ak} = P(X<A)

где A = (a1, a2, ..., ak)т - k-мерный вектор заданных действительных чисел.

По аналогии F(B) = P{x1<b1, x2<b2, ..., xk<bk} = P(X<B), следовательно, если A<B, то:

P{a1<x1<b1, a2<x2<b2, ..., ak<xk<bk} = P(A<X<B) = F(B) - F(A)

удовлетворяет формуле вычисления вероятности попадания значения k-мерной случайной величины в k-мерный параллелепипед с плоскостями, параллельными координатным осям.

Функция распределения случайного k-мерного вектора является детерминированной, неотрицательной и обладает свойствами:

Функция распределения F(X) непрерывной k-мерной случайной величины является непрерывной по определению. Непрерывная k-мерная случайная величина имеет плотность распределения вероятностей f(X) = f(x1, x2, ..., xk) ≥ 0, удовлетворяющую условию:

Плотность распределения вероятностей обладает свойствами:

Плотности вероятностей подсистемы m случайных величин (1 m < k) называют частными или маргинальными распределениями. Условными распределениями случайного вектора X называются распределения подсистемы m его компонент (1 m < k) при условии, что остальные k - m компоненты являются фиксированными. Эти компоненты от нефиксируемых отделяются косой чертой. Например пусть m=2, а k=5, тогда функция  вероятности условного распределения компонент x2 и x5 записывается следующим образом: F(x2,x5/x1,x3,x4), а соответственно функция плотности вероятности f(x2,x5/x1,x3,x4).

Подсистема из m компонент и дополнительная подсистема m - k компонент вектора X называются независимыми, если справедливо равенство:

F(x1, x2, ..., xk) = F(xi1, xi2, ..., xim) * F(xim+1, xim+2, ..., xik)

В частности компоненты X называются независимыми, если:

F(x1, x2, ..., xk) = F(x1)*F(x2)* ... *F(xk).

 

Проверьте усвоение  Предыдущий раздел  Следующий раздел  Оглавление

Hosted by uCoz