54.2. Аналогично (54.2) числа
(54.5)
называются центральными смешанными моментами, порядка . Наиболее важной групповой характеристикой двух случайных величин среди чисел (54.5) является ковариация
, (54.6)
которая является центральным смешанным моментом порядка . Для ковариации используется также обозначение:
. Если
, то
- совпадает с дисперсией случайной величины
.
Если и
- независимы, то из (54.6) следует, что ковариация
.
Обратное утверждение в общем случае неверно, т.е. из равенства в общем не следует независимость случайных величин
и
. В частности, обратное утверждение справедливо, если
и
- гауссовы случайные величины. Более подробно этот вопрос обсуждается ниже.
54.3. Найдем связь между корреляцией и ковариацией
случайных величин
и
. Из определения ковариации (54.6) следует
.
Таким образом, ковариация и корреляция
связаны соотношением
. (54.7)
55.1. Пусть случайные величины и
имеют математические ожидания
,
, дисперсии
,
, корреляцию
и ковариацию
. Рассмотрим неравенство
. (55.1)
Возведем в квадрат, затем оператором математического ожидания подействуем на каждое слагаемое, тогда (55.1) принимает вид:
,
что далее сводится к неравенству
. (55.2)
Его левая часть может быть как положительной так и отрицательной, правая часть - только положительна. Поэтому неравенство (55.2) обычно записывается в более сильном варианте:
. (55.3)
Таким образом, корреляция случайных величин
и
принимает значения из интервала
.
Соотношение, аналогичное (55.3) можно получить и для ковариации , если в исходном выражении (55.1) вместо
подставить центрированную случайную величину
и вместо
соответственно
. При этом необязательно выполнять все преобразования, аналогичные (55.1) - (55.3), достаточно учесть, что замена
и
приводит к замене
на
,
на
, а также
на
. Поэтому из (55.3) следует
. (55.4)
55.2. Неравенства, определяющие область значений корреляции и ковариации
, аналогичные (55.3), (55.4), можно получить в другом виде на основе следующего очевидного неравенства:
. (55.5)
Отсюда , поэтому справедливо неравенство
. (55.6)
Если в (55.5) заменить соответственно на
и
, то в (55.6)
заменяется на
,
на
и
на
. Поэтому (55.6) принимает вид:
. (55.7)
Для независимых случайных величин и
ковариация
. В отличие от этого рассмотрим другой крайний случай, когда случайные величины
и
связаны функциональной зависимостью:
, (56.1)
где - числа. Вычислим ковариацию
случайных величин
и
:
. (56.2)
Из (56.1) следует . Подставим этот результат в (56.2), тогда
. (56.3)
Из (56.1) определим дисперсию
, (56.4)
откуда . Это равенство подставим в (56.3), тогда
(56.5)
Таким образом, ковариация линейно связанных случайных величин и
принимает максимальное значение
, если
, или минимальное значение
, если
, на отрезке
допустимых значений для
в общем случае (согласно формуле (55.4)).
В связи с этим
можно выдвинуть предположение о том, что ковариация является мерой статистической связи между случайными величинами
и
. Действительно, для двух крайних случаев получены подходящие для этого результаты, а именно: для независимых величин
, а для линейно связанных
максимален. Далее будет показано, что это предположение верно, но не в общем, а только для статистической связи линейного типа. Эта связь характерна тем, что при усилении этой связи растет
, и в пределе связь вырождается в линейную зависимость (56.1).
Однако если связь имеет нелинейный характер, то величина не отражает меру (степень) этой связи. Рассмотрим следующий пример. Пусть
,
, и
- случайная величина с равномерным на интервале
распределением вероятностей. Случайные величины
и
связаны между собой соотношением:
. Таким образом, между величинами
и
существует функциональная связь, а не статистическая, и следовало ожидать, что величина
максимальна. Однако, прямые вычисления приводят к результату
. Действительно,
, (56.6)
где
- плотность распределения вероятностей случайной величины . С учетом этого (56.6) преобразуется:
.
Аналогично
,
теперь ковариация
.
Таким образом, для нелинейной связи между случайными величинами их ковариация не может использоваться как мера статистической связи, поскольку значение ковариации не отражает степень этой связи.
Ковариация и геометрия линий равного уровня плотности вероятности
Ковариация случайных величин и
определяется через их совместную плотность вероятности
соотношением:
. (57.1)
Подынтегральная функция в (57.1) неотрицательна для таких ,
, при которых
, то есть при
,
или
,
. И наоборот, при
,
или
,
подынтегральная функция (57.1) отрицательна либо равна нулю. Знак ковариации зависит от того, какие значения, положительные или отрицательные преобладают в подынтегральной функции. Поэтому знак числа
определяется расположением линий равного уровня плотности вероятности
. На рис. 57.1 представлен пример линий равного уровня функции
, для которой
. Штриховкой
Рис. 57.1.
Линии равного уровня плотности вероятности при .указана часть плоскости, на которой
, и следовательно неотрицательна подынтегральная функция. Поскольку в заштрихованной области (положительные значения подынтегральной функции) плотность
имеет в среднем большее значение, чем в нештрихованной области (отрицательные значения подынтегральной функции), то ковариация
. На рис. 57.2 представлены линии равного уровня плотности
при
. Случай
соответствует симметричному расположению линий относительно прямой
(или
). Например, эти линии могут быть эллипсами, у которых большая полуось совпадает по направлению с прямой
(или
). Другой пример – линии являются окружностями с центром в точке
.
Рис. 57.2. Линии равного уровня плотности
вероятности при .
Отметим, что если , а линии равного уровня имеют ось симметрии, например, на рис. 57.1 линии – это эллипсы, тогда можно выполнить преобразование (вращение) системы координат
, такое, что в новой системе ковариация
. Это означает также и преобразование случайных величин
,
с ненулевой ковариацией к новым случайным величинам, для которых ковариация равна нулю.
Коэффициент корреляции
58.1. Коэффициентом корреляции двух случайных величин и
называется число
. (58.1)
Коэффициент корреляции является ковариацией: двух безразмерных случайных величин
,
, (58.2)
полученных из исходных величин и
путем преобразования специального вида (58.2) (нормировки), которое обеспечивает нулевые средние
,
и единичные дисперсии
,
.
Коэффициент корреляции (58.1) можно представить через ковариацию случайных величин
и
:
. (58.3)
Поскольку , то из (58.3) следует
. (58.4)
Коэффициент корреляции является безразмерной величиной, принимает значения на интервале и поэтому используется как мера статистической связи линейного типа между случайными величинами
и
, в отличие от ковариации
, для которой интервал значений
зависит от дисперсий случайных величин. Рассмотрим примеры вычисления коэффициента корреляции, позволяющие выяснить свойства
как меры статистической связи между случайными величинами.
58.2. Пусть - случайная величина с математическим ожиданием
, дисперсией
и
. Ковариация случайных величин
и
определяется формулой (56.5):
. Подставим это соотношение в (58.3) , тогда:
(58.4)
Таким образом, для случайных величин ,
, связанных линейной зависимостью коэффициент корреляции
принимает либо максимальное значение
, либо минимальное -
.
58.3. Рассмотрим обобщение линейной функции, связывающей случайные величины и
на линейную случайную функцию следующего вида:
(58.5)
где и
- независимые случайные величины. В частном случае
- число и (58.5) – линейная функция, определяющая
через
. Для детерминированной линейной связи
- принимает максимальное значение. Если
- случайная величина, то связь (58.5) становится статистической (стохастической, случайной), то есть не столь жесткой как детерминированная функциональная связь. Это приводит к
. В зависимости от свойств случайной величины
статистическая связь между
и
может быть сильной,
, или слабой,
. Для того, чтобы ответить на вопрос, какова мера связи между случайными величинами
и
(58.5) вычислим их коэффициент корреляции.
Пусть ,
,
,
. Тогда из (58.5) следует, в силу независимости
и
:
.
Выразим дисперсию случайные величины через параметры случайных величин
,
:
. (58.6)
Теперь по формуле (58.3):
. (58.7)
Если , то из (58.7) следует
, что соответствует слабой связи между случайными величинами
и
. Если
, из (58.7) следует
, связь становится сильной и в пределе при
переходит в детерминированную линейную связь.
59.1. Пусть - множество элементов
Расстоянием (метрикой) между элементами
множества
называется неотрицательная функция
, удовлетворяющая следующим трем аксиомам:
, причем
.
.
.
Вторая аксиома называется условием симметрии, а третья – неравенством треугольника. Если аксиому 1 ослабить: , тогда
называется псевдометрикой. Для псевдометрики из условия
не обязательно следует
.
Пусть - множество случайных величин. Для каждой пары
элементов этого множества можно также ввести расстояние
вида
. (59.1)
Покажем, что функция является псевдометрикой. Аксиома 1 – очевидна:
, причем из условия
следует
. Аксиома 2 также очевидна. Рассмотрим аксиому 3. Справедливы следующие преобразования:
(59.2)
Пусть - корреляция двух случайных величин
и
. Известно, что
удовлетворяет неравенству (55.2)
. (59.3)
Подставим (59.3) в (59.2), тогда
, (59.4)
что и доказывает третью аксиому.
... математического ожидания. Таким образом, (72.6) принимает вид . (72.7) 72.2. Функции вида , (72.8) где целые числа , называются начальными моментами порядка случайного процесса . Аналогично центральные моменты определяются соотношениями: . (72.9) Для функций (72.8), (72.9) используется общее название - моментные функции. Наиболее простые ...
... damn(t)/dt =[daij(t)/dt] 1.3 ПОНЯТИЕ ДИНАМЧЕСКОГО ОБЬЕКТА. Физический объект - физическое устройство, характеризуемое некоторым числом свойств, соответствующих целям его использования. В теории систем существенным является не физическое, а математическое описание свойств объекта и соотношений между ними. В теории систем объектом А является абстрактный объект, связанный с множеством ...
... проверить знания студента из первой части курса, которая излагается в первых четырёх модулях. Во вторых вопросах билета проверяются знания классической предельной проблемы теории вероятностей и математической статистики, которые излагаются в следующих пяти модулях. 1. Вероятностная модель с не более чем счётным числом элементарных исходов. Пример: испытания с равновозможными исходами. 2. ...
... несколько уравнений, а в каждом уравнении - несколько переменных. Задача оценивания параметров такой разветвленной модели решается с помощью сложных и причудливых методов. Однако все они имеют одну и ту же теоретическую основу. Поэтому для получения начального представления о содержании эконометрических методов мы ограничимся в последующих параграфах рассмотрением простой линейной регрессии. ...
0 комментариев