Кореляційний момент - приклади. Коваріація та кореляція

Як часто Вам доводилося чути висловлювання, в яких йшлося про те, що одне явище корелюється з іншим?

«Високе зростання корелюється з гарною освітоюта щастям, встановили експерти соціологічної служби Gallup.»

"Ціна на нафту корелюється з курсами валют."

«Біль у м'язах після тренування не корелюється з гіпертрофією м'язових волокон.»

Складається враження, що поняття «кореляція» стало широко використовуватися не тільки в науці, а й у повсякденному житті. Кореляція відбиває ступінь лінійної залежностіміж двома випадковими явищами Тож коли ціни на нафту починають падати, то курс долара щодо рубля починає зростати.

З усього вище сказаного, можна зробити висновок про те, що при описі двовимірних випадкових величин буває недостатньо таких добре відомих характеристик, як математичне очікування, дисперсія, середнє квадратичне відхилення. Тому часто для їх опису використовуються ще дві дуже важливі характеристики: коваріаціяі кореляція.

Коваріація

Коваріацією$cov\left(X,\ Y\right)$ випадкових величин $X$ і $Y$ називається математичне очікування добутку випадкових величин $X-M\left(X\right)$ і $Y-M\left(Y\right)$, тобто:

$$cov\left(X,\Y\right)=M\left(\left(X-M\left(X\right)\right)\left(Y-M\left(Y\right)\right)\right). $$

Буває зручно обчислювати коваріацію випадкових величин $X$ і $Y$ за такою формулою:

$$cov\left(X,\Y\right)=M\left(XY\right)-M\left(X\right)M\left(Y\right),$$

яка може бути отримана з першої формули, використовуючи властивості математичного очікування. Перерахуємо основні властивості коваріації.

1 . Коваріація випадкової величини із собою є її дисперсія.

$$cov\left(X,\X\right)=D\left(X\right).$$

2 . Коваріація симетрична.

$$cov\left(X,\Y\right)=cov\left(Y,\X\right).$$

3 . Якщо випадкові величини $X$ і $Y$ незалежні, то:

$$cov\left(X,\Y\right)=0.$$

4 . Постійний множникможна виносити за знак підступності.

$$cov\left(cX,\Y\right)=cov\left(X,\cY\right)=c\cdot cov\left(X,\Y\right).$$

5 . Коваріація не зміниться, якщо до однієї з випадкових величин (або двох відразу) додати постійну величину:

$$cov\left(X+c,\Y\right)=cov\left(X,\Y+c\right)=cov\left(X+x,\Y+c\right)=cov\left( X, \ Y \ right).

6 . $cov\left(aX+b,\cY+d\right)=ac\cdot cov\left(X,\Y\right)$.

7 . $\left|cov\left(X,\Y\right)\right|\le \sqrt(D\left(X\right)D\left(Y\right))$.

8 . $\left|cov\left(X,\Y\right)\right|=\sqrt(D\left(X\right)D\left(Y\right))\Leftrightarrow Y=aX+b$.

9 . Дисперсія суми (різниці) випадкових величин дорівнює сумі їх дисперсій плюс (мінус) подвоєна коваріація цих випадкових величин:

$$D\left(X\pm Y\right)=D\left(X\right)+D\left(Y\right)\pm 2cov\left(X,\Y\right).$$

Приклад 1 . Дано кореляційну таблицю випадкового вектора$ \ left (X, \ Y \ right) $. Обчислити підступність $cov\left(X,\Y\right)$.

$\begin(array)(|c|c|)
\hline

\hline
-2 & 0,1 & 0 & 0,2 \\
\hline
0 & 0,05 & p_(22) & 0 \\
\hline
1 & 0 & 0,2 & 0,05 \\
\hline
7 & 0,1 & 0 & 0,1 \\
\hline
\end(array)$

Події $\left(X=x_i,\ Y=y_j\right)$ утворюють повну групу подій, тому сума всіх ймовірностей $p_(ij)$, зазначених у таблиці, повинна дорівнювати 1. Тоді $0,1+0+0 ,2+0,05+p_(22)+0+0+0,2+0,05+0,1+0+0,1=1$, звідси $p_(22)=0,2$.

$\begin(array)(|c|c|)
\hline
X\backslash Y&-6&0&3\\
\hline
-2 & 0,1 & 0 & 0,2 \\
\hline
0 & 0,05 & 0,2 & 0 \\
\hline
1 & 0 & 0,2 & 0,05 \\
\hline
7 & 0,1 & 0 & 0,1 \\
\hline
\end(array)$

Користуючись формулою $p_(i) = \ sum _ (j) p_ (ij) $, знаходимо ряд розподілу випадкової величини $ X $.

$\begin(array)(|c|c|)
\hline
X & -2 & 0 & 1 & 7 \\
\hline
p_i & 0,3 & 0,25 & 0,25 & 0,2 \\
\hline
\end(array)$

$$M\left(Xright)=sum^n_(i=1)(x_ip_i)=-2cdot 0,3+0cdot 0,25+1cdot 0,25+7cdot 0 ,2 = 1,05. $ $

$$D\left(X\right)=\sum^n_(i=1)(p_i(\left(x_i-M\left(X\right)\right))^2)=0,3\cdot ( \left(-2-1,05\right))^2+0,25\cdot (\left(0-1,05\right))^2+0,25\cdot (\left(1-1, 05\right))^2+$$

$ $ + \ 0,2 \ cdot ( \ left (7-1,05 \ right)) ^ 2 = 10,1475. $ $

$$\sigma \left(X\right)=\sqrt(D\left(X\right))=\sqrt(10,1475)\approx 3,186.$$

Користуючись формулою $q_(j) = \ sum _ (i) p_ (ij) $, знаходимо ряд розподілу випадкової величини $ Y $.

$\begin(array)(|c|c|)
\hline
Y & -6 & 0 & 3 \\
\hline
p_i & 0,25 & 0,4 & 0,35 \\
\hline
\end(array)$

$$M\left(Yright)=sum^n_(i=1)(y_ip_i)=-6cdot 0,25+0cdot 0,4+3cdot 0,35=-0,45 .$$

$$D\left(Y\right)=\sum^n_(i=1)(p_i(\left(y_i-M\left(Y\right)\right))^2)=0,25\cdot ( \left(-6+0,45\right))^2+0,4\cdot (\left(0+0,45\right))^2+0,35\cdot (\left(3+0, 45 \ right)) ^ 2 = 11,9475. $ $

$$\sigma \left(Y\right)=\sqrt(D\left(Y\right))=\sqrt(11,9475)\approx 3,457.$$

Оскільки $P\left(X=-2,\ Y=-6\right)=0,1\ne 0,3\cdot 0,25$, то випадкові величини $X,\Y$ є залежними.

Визначимо коваріацію $cov \ \ left (X, \ Y \ right) $ випадкових величин $ X, \ Y $ за формулою $cov \ left (X, \ Y \ right) = M \ left (XY \ right)-M \ left(X\right)M\left(Y\right)$. Математичне очікуваннятвори випадкових величин $ X, \ Y $ одно:

$$M\left(XY\right)=\sum_(i,\ j)(p_(ij)x_iy_j)=0,1\cdot \left(-2\right)\cdot \left(-6\right) +0,2\cdot \left(-2\right)\cdot 3+0,05\cdot 1cdot 3+0,1cdot 7cdot \left(-6right)+0,1cdot 7 \ cdot 3 = -1,95. $ $

Тоді $cov\left(X,\Y\right)=M\left(XY\right)-M\left(X\right)M\left(Y\right)=-1,95-1,05\cdot \ left (-0,45 \ right) = -1,4775. $ Якщо випадкові величини незалежні, їх коваріації дорівнює нулю. У нашому випадку $cov(X,Y)\ne 0$.

Кореляція

Коефіцієнт кореляціївипадкових величин $X$ і $Y$ називається число:

$$\rho \left(X,\ Y\right)=((cov\left(X,\ Y\right))\over (\sqrt(D\left(X\right)D\left(Y\right) )))).$$

Перерахуємо основні властивості коефіцієнта кореляції.

1 . $ \ rho \ left (X, \ X \ right) = 1 $.

2 . $\rho \left(X,\ Y\right)=\rho \left(Y,\ X\right)$.

3 . $\rho \left(X,\ Y\right)=0$ для незалежних випадкових величин $X$ і $Y$.

4 . $\rho \left(aX+b,\ cY+d\right)=(sgn \left(ac\right)\rho \left(X,\ Y\right)\ )$, де $(sgn \left( ac\right)\ )$ - знак твору $ac$.

5 . $\left|\rho \left(X,\ Y\right)\right|\le 1$.

6 . $\left|\rho \left(X,\Y\right)\right|=1\Leftrightarrow Y=aX+b$.

Раніше було сказано, що коефіцієнт кореляції $ \rho \ left (X, \ Y \ right) $ відображає ступінь лінійної залежності між двома випадковими величинами $ X $ і $ Y $.

При $\rho \left(X,\ Y\right)>0$ можна дійти невтішного висновку у тому, що з зростанням випадкової величини $X$ випадкова величина$Y$ має тенденцію до збільшення. Це називається позитивною кореляційною залежністю. Наприклад, зростання та вага людини пов'язані позитивною кореляційною залежністю.

При $\rho \left(X,\ Y\right)<0$ можно сделать вывод о том, что с ростом случайной величины $X$ случайная величина $Y$ имеет тенденцию к уменьшению. Это называется отрицательной корреляционной зависимостью. Например, температура и время сохранности продуктов питания связаны между собой отрицательной корреляционной зависимостью.

При $\rho \left(X,\ Y\right)=0$ випадкові величини $X$ і $Y$ називаються некорельованими. Варто зазначити, що некорелірованість випадкових величин $X$ і $Y$ не означає їх статистичну незалежність, це лише про те, що між ними немає лінійної залежності.

Приклад 2 . Визначимо коефіцієнт кореляції $ \ rho \ left (X, \ Y \ right) $ для двовимірної випадкової величини $ \ left (X, \ Y \ right) $ з прикладу 1.

Коефіцієнт кореляції випадкових величин $X,\ Y$ дорівнює $r_(XY) =(cov(X,Y)\over \sigma (X)\sigma (Y)) =(-1,4775\over 3,186\cdot 3,457) =-0,134.$ Оскільки $r_(XY)<0$, то с ростом $X$ случайная величина $Y$ имеет тенденцию к уменьшению (отрицательная корреляционная зависимость).

Визначення:

Кореляційним моментом випадкових величин називають математичне очікування твору відхилень цих величин

Нагадаємо, що наведений вираз є елементом формули дисперсії суми двох випадкових величин:

Примітка:

Кореляційний момент може бути представлений у вигляді:

Доказ:

Теорема:

Кореляційний момент двох незалежних випадкових величин дорівнює 0

Доказ:

Відповідно до зауваження:

Але для незалежних випадкових величин

Тоді для незалежних випадкових величин і:

Визначення:

Безрозмірна величина називається коефіцієнтом кореляції.

Теорема:

Абсолютна величина кореляційного моменту двох випадкових величин вбирається у твори їх середніх квадратичних відхилень:

Доказ:

Введемо до розгляду випадкову величину і знайдемо її дисперсію:

Оскільки будь-яка дисперсія невід'ємна

Аналогічно введемо випадкову величину і знайдемо, що:

Визначення:

Випадкові величини і називаються некорельованими, якщо , і корельованими, якщо .

Теорема:

Коефіцієнт кореляції випадкових величин, пов'язаних з лінійною залежністю, дорівнює .

Доказ:

Знайдемо коефіцієнт кореляції:

Зазначимо деякі властивості коефіцієнта кореляції.

1. З прикладу 1 слід, що й - незалежні випадкові величини, то коефіцієнт кореляції дорівнює 0.

Зауважимо, що зворотне твердження не так.

2. Абсолютна величина коефіцієнта кореляції у випадку вбирається у одиниці:

Доказ випливає з доведеної формули для кореляційного моменту:

Розділимо обидві частини нерівності на твір та отримаємо

3. Коефіцієнт кореляції характеризує відносну (у частках) величину відхилення математичного очікування твору від твору математичних очікувань величин. Оскільки таке відхилення має місце лише залежних величин, можна сказати, що коефіцієнт кореляції характеризує тісноту залежності між і .



Це твердження випливає з доведеної раніше рівності: . Наведемо кореляційний момент до коефіцієнта кореляції:


Куликов А. А. Форекс для початківців. Довідник біржового спекулянта - СПб.: Пітер, 2007; Коммерсант № 62 від 13.04.2007 - Світова торгівля сповільниться.

Bachelier L. Theorie de la speculation. //Annales de l'Ecole Normale Superieure. 1900. V. 17. P. 21-86. Опис ідей Л. Бушельє, їх доля та їх сучасна критика містяться в книгах: Мандельброт Б. Неслухняні ринку, фрактальна революція у фінансах - пров. з англ. - М.: Видавничий дім "Вільямс", 2006. Сорнетте Д. Як передбачати крахи фінансових ринків - пер.з франц. - М.: Видавництво "І-трейд", 2008.

Cootner Paul H. The Random Character of Stock Market Prices – Cambridge, MA, MIT Press

Harry M. Markowitz, Portfolio Selection, Journal of Finance, 7, 1 (March 1952), pp, 79-81.

У представленому розділі використовуються матеріали наступних книг: Шарп У. Ф., Александер Г. Дж., Бейлі Дж. В. Інвестиції – пров. з англ. - М.: ІНФРА-М, 1997; Бромвіч М. Аналіз економічної ефективності капіталовкладень – пров. з англ. - М.: ІНФРА-М, 1996; Ширяєв В. І. Моделі фінансових ринків. Оптимальні портфелі, управління фінансами та ризиками - Навчальний посібник - М.: КомКнига, 2007; Шаповал А. Б. Інвестиції: математичні методи - М.: ФОРУМ: ІНФРА-М, 2007; Коростелева М. У. Методи аналізу ринку капіталу – СПб.: Пітер, 2003.

Тобін Дж. звернув увагу на недостатність показників математичних очікувань і дисперсії для порівняння портфелів. Проте їх застосування виправдане своєю конструктивністю.

Аскінадзі В. М. та ін. Інвестиційна справа - Підручник - М.: Маркет ДС, 2007, стор 238-241 або Ширяєв В. І. Моделі фінансових ринків. Оптимальні портфелі, управління фінансами та ризиками - Навчальний посібник - М.: КомКнига, 2007, стор 17.

Див. Бромвіч М. Аналіз економічної ефективності капіталовкладень - пров. з англ. – М.: ИНФРА-М, 1996, стор. 343. Обговорення альтернативних заходів ризику, наприклад, приведення до нормального типу так званого логнормального розподілу можна знайти у книзі: Шарп У. Ф.., Александер Р. Дж., Бейлі Дж. В. Інвестиції – пров. з англ. - М.: ІНФРА-М, 1997, стор 179-181.

Див Бромвіч М. Ук. Соч. стор. 342.

Вважають, що першим кроком у створенні теорії корисності було формулювання так званого Санкт-Петербурзького феномена. Цікаво, що сформулював цей парадокс Микола Бернуллі, а пояснення дав йому Данило Бернуллі – Див.: Бернуллі Д. Досвід нової теорії виміру жереба / Д. Бернуллі; пров. А. Нардової // Віхи економічної думки / сост. та заг. ред. В. М. Гальперіна. Спб., 1993. Т. 1: Теорія споживчої поведінки та попиту. З. 11-27.

Корисні матеріали з теорії корисності можна знайти в книгах, присвячених теорії ігор, зокрема: Льюс Р.Д., Райфа Х. Ігри та рішення - Пер. з англ. - М: Вид-во іностр. літ., 1961; Нейман фон Джон, Моргенштерн О. Теорія ігор та економічна поведінка - Пер. з англ. - М: Наука, 1970.

Див. Додаток до моделі Г. Марковіца

Див у книзі Ширяєва В. І. Моделі фінансових ринків. Оптимальні портфелі, управління фінансами та ризиками - М.: КомКнига, 2007, стор 25-26.

Аналітичне формулювання моделі Марковіца можна знайти у книгах: Шаповал А. Б. Інвестиції: математичні методи - М.: ФОРУМ: ІНФРА-М, 2007, стор 21-22; Аскінадзі В. М. та ін. Інвестиційна справа - Підручник - М.: Маркет ДС, 2007, стор 288.

Нами використано формулювання, запропоноване в книзі: Аскінадзі В. М. та ін. Інвестиційна справа - Підручник - М.: Маркет ДС, 2007, стор 256-257.

Див. у книзі: Шаповал А. Б. Інвестиції: математичні методи - М.: ФОРУМ: ІНФРА-М, 2007, стор 16-18 (розділ «Модель Марковіца»).

Див: Шарп У. Ук. тв. стор. 213-218, 226-228, стор. 271 – про зв'язок та відмінності ринкової моделі та моделі САРМ; також Аскінадзі В. М. та ін Ук. тв., стор 278-294; Ширяєв В. В. Ук. соч., стор 47-58

Див: Шарп У. Ф., Александер Г. Дж., Бейлі Дж. В. Інвестиції - пров. з англ. - М.: ІНФРА-М, 1997, стор 316-337.

Див: Оцінка бізнесу - за ред. Грязнова А.Г., Федотова М.А. - М.: Фінанси та статистика, 2007, стор 199

Див: Шаповал А. Б. Інвестиції: математичні методи - М.: ФОРУМ: ІНФРА-М, 2007, розділ 3.

Див Мандельброт Б., Хадсон Р. Л. Неслухняні ринки: фрактальна революція у фінансах - пров. з англ. - М.: Видавничий дім "Вільямс", 2006, 187 стор.

Див. там же, стор. 34-39.

Див: Сорнетте Д. Як передбачати крахи фінансових ринків - пров. з франц. - М.: Видавництво "І-трейд", 2008, стор 19-22.

Цей розділ заснований головним чином на матеріалах книги: Економічна теорія (New Palgraiv) – пров. з англ. - М.: ІНФРА-М, 2004, стор 263-273 - глава Гіпотеза ефективного ринку, автор - Бертон Мелкіл (Berton G, Malkiel). Посилання на авторів різних досліджень також зроблено за матеріалами цієї статті. також: Бертон Мелкіл «Випадкова прогулянка Уолл-Стріт - пров. з англ. – Мінськ: Попурі, 2006. Остання книга видається вже 30 років. Цікаво, що наприкінці 90-х вийшла інша книга: Ендрю Лоу. Невипадкова прогулянка Волл-Стріт. Б. Мелкіл є загалом прихильником гіпотези ефективного ринку, а Ендрю Лоу – навпаки.

Див: Чеботарьов Ю.М. Випадковість та Невипадковість біржових цін - М.: СмартБук; І-трейд, 2008, 198.

Інваріантність - незмінність будь-якої величини при зміні фізичних умов або по відношенню до деяких перетворень, наприклад, перетворення координат і часу при переході від однієї інерційної системи відліку до іншої (релятивістська інваріантність). Практично суворий опис «випадкового блукання» у найпростішій версії «вінеровського процесу» можна знайти у книзі: Шаповал А.Б. Інвестиції: математичні методи - Навчальний посібник - М: ФОРУМ: ИНФРА-М, 2007, стор 42-43.

Випадковий процес називається винеровским, якщо виконані такі умови:

1) Процес починається з нуля, тобто;

2) Випадкова величина має нормальний розподіл з нульовим математичним очікуванням та дисперсією рівною для будь-якого моменту часу;

3) Для довільних інтервалів, що не перетинаються, і випадкові величини і незалежні.

Взагалі, посібник Шаповала О.Б. рекомендуємо для ознайомлення з математичними моделями портфельного аналізу, оцінки опціонів. Виклад досить суворий практики і короткий (96 стор.), але вводить у сучасну теорію фінансів. У розділі про портфельний аналіз ми значною мірою використовуємо

матеріал з Вікіпедії:

Послідовність випадкових величин називається мартингалом з дискретним часом, якщо:

Нехай дана інша послідовність випадкових величин. Тоді послідовність випадкових величин називається мартингалом щодо або-мартингалом, якщо:

Нехай дано послідовність випадкових величин. Тоді послідовність випадкових величин називається суб(супер) мартингалом щодо, якщо:

Цей ефект можна пояснити податковим впливом. Наприкінці року інвестори скидають акції, насамперед, дрібних фірм для імітації збитковості та полегшення податкових платежів, ціни акцій падають, а в січні вони можуть повернутися навіть із надлишком догори – Див.: Бертон Мелкіл. Випадкова прогулянка Уолл-Стріт, стор. 316-317.

Ефект вікенду, ефект понеділка не має однозначного пояснення. Ефект говорить про те, що ціни акцій у понеділок нижчі, ніж увечері у п'ятницю. У книзі «Випадкова прогулянка Уолл-Стріт» Бертон Мелкіл уточнює ефект: ціни акцій вранці в понеділок трохи вищі, ніж увечері в п'ятницю, а до вечора понеділка вони знижуються, так що прибутковість стає відносно негативною. Тому слід купувати акції у понеділок увечері. Але перевірка ефекту, проведена автором за матеріалами Нью-Йоркської фондової біржі з травня по липень 2002 року, показала, що ефект проявився лише у восьми уїк-ендах із тринадцяти.

Стратегію «купив та тримай» реалізують так звані «індексні фонди», які тримають структуру своїх вкладень відповідно до популярних біржових індексів. За даними інформаційного порталу "Вклади.ру", в Росії в 2007 році діяло 11 ПІФів як індексні фонди. Перший російський індексний фонд було створено 2003 року. У такі фонди діють вже 30 років. Російські фонди орієнтуються на індекси ММВБ чи РТС (після модифікації 2006 року індекс РТС став враховувати і ліквідність паперів, що потрібно правильної роботи індексного фонду). Строго слідувати індексам індексні фонди, звісно, ​​що неспроможні, оскільки було б нераціонально вносити зміни у вкладення безперервно. Див. матеріали про індексні фонди на порталі приватного інвестора «Вклади.ру»: http://www.vlozhi.ru/

Дроблення акцій знижує їхню номінальну вартість, внаслідок чого вона стає більш доступною дрібним акціонерам. Розширення ринку акцій може підвищити до них інтерес і, відповідно, збільшити попит на них, а отже, і ринкову вартість акцій

Ефективність взаємних фондів щодо ефективності індексних акцій за 1980-1990 роки див: Бертон Мелкіл. Випадкова прогулянка Уолл-Стріт, стор. 238. У 80-ті роки взаємні фонди обганяли індекс S&P 500, у 90-ті роки – відставали. Там же й інші сучасні матеріали щодо ефективності взаємних фондів. Наприклад, за даними з 1968 по 2002 роки проведено зіставлення частки готівки в активах взаємних фондів та індексу S&P 500. Зіставлення показало, що частка готівки в активах фондів була високою саме в ті моменти, коли індекс був низьким, тобто коли треба було, навпаки , Витрачати готівку на купівлю акцій - стор 244-248.

Результати розрахунків див: Бертон Мелкіл. Випадкова прогулянка Уолл-Стріт, стор. 235.

номери журналу «Фінанс» за 2009-2010 роки.

Див Елдер А. Як грати і вигравати на біржі: Психологія. Технічний аналіз. Контроль над капіталом - М: Альпіна Бізнес Бук, 2007, стор 29-35.

Див: Дамодаран А. Інвестиційні байки: викриття міфів про безпрограшні біржові стратегії - пров. з англ. СПб.: Пітер, 2007, стор 396-428.

Див: Хегстром Р. Дж. Інвестування. Останнє вільне мистецтво – пров. з англ. - М.: ЗАТ «Олімп-Бізнес», 2005.

Порівняння середньорічної прибутковості та ризику (квадратичного відхилення прибутковості) акцій компаній великих і дрібних за період з 1926-2001 показало, що середньорічна прибутковість акцій дрібних компаній – 17.5%, а великих – 12.4 при ризику 35.3 та 20.8% відповідно. p align="justify"> Середньоочікуваний щомісячний дохід за період 1963-1990 роки також показує залежність від розміру компанії. У той самий час 90-ті роки ситуація змінилася, великі доходи стали давати підприємства з високою капіталізацією. Справа, мабуть, у тому, що зросла частка інституційних інвесторів, які працюють з акціями великих компаній, і акції дрібних компаній втратили частину ліквідності – Див. Бертон Мелкіл. Випадкова прогулянка Уолл-Стріт, стор 265, 333-334.

Дані за 80-ті роки показують, що з низьким коефіцієнтом дохідності (ставлення ціни акції до чистий прибуток підприємства) показували вищу дохідність. Аналогічно, акції з низьким співвідношенням ціни вартості активів фірми дають зазвичай велику дохідність – Див. Бертон Мелкіл. Випадкова прогулянка Уолл-Стріт, стор. 334-340.

Докази подано за матеріалами книги: Бромвіч Майкл. Аналіз економічної ефективності капіталовкладень - М.: ІНФРА-М, 1996.

Див Б.В. Гніденко. Курс теорії ймовірності - М.: Наука, 1969, стор 179 (розділ 5. Числові характеристики випадкових величин)

Для характеристики кореляційної залежності між величинами використовуються момент корекції і коефіцієнт кореляції.

Визначення 2. Кореляційним моментомµ xy випадкових величин X та Y називають математичне очікування твору відхилень цих величин

Для обчислення кореляційного моменту дискретних величин використовується вираз

(3.12)

а для безперервних – вираз

(3.13)

З а м е ч а н ня. Кореляційний момент µ xy може бути переписаний у вигляді

(3.14)

Дійсно, використовуючи властивості математичного очікування (див. §§ 2.2; 2.6), маємо

Т е о р е м а. Кореляційний момент двох незалежних випадкових величин X та Y дорівнює нулю.

Доказ. Згідно з зауваженням

а оскільки Х та Y незалежні випадкові величини, то (див. §§ 2.2; 2.6)

і, отже, xy =0.

З визначення кореляційного моменту випливає, що має розмірність, рівну добутку розмірностей величин X і Y, тобто. його величина залежить від одиниць виміру випадкових величин. Тому для тих самих двох величин величина кореляційного моменту може мати різні значення в залежності від того, в яких одиницях були виміряні величини. Для усунення цього недоліку умовилися за міру зв'язку (залежності) двох випадкових величин X і Y прийняти безрозмірну величину

де σ х =σ(Х), σ y =σ(Y),звану коефіцієнт кореляції.

П р і м е р 1. Нехай двовимірна дискретна випадкова величина (X, Y) задана законом розподілу:

і, отже,

Склавши ж ймовірності по стовпцях, знайдемо ймовірності можливих значень Y:

Звідси закон розподілу Y:

Y
p 1\3 1\2 1\6

і, отже,

Отже,

Таким чином, коефіцієнт кореляції

Т е о р е м а. Абсолютна величина кореляційного моменту двох випадкових величин вбирається у твори їх середніх квадратичних відхилень:

Доказ. Ввівши на розгляд випадкову величину де знайдемо її дисперсію. Маємо

(будь-яка дисперсія невід'ємна). Звідси

Ввівши випадкову величину , аналогічно знайдемо

В результаті маємо

Визначення 2. Випадкові величини Xі Y називаються некорельованими, якщо = 0, і корельованими, якщо

П р і м е р 1. Незалежні випадкові величини Х і Y є некорельованими, оскільки через співвідношення (3.12) = 0.

П р і м е р 2. Нехай випадкові величини Хі Yпов'язані лінійною залежністю Знайдемо коефіцієнт кореляції. Маємо:

Таким чином, коефіцієнт кореляції випадкових величин, пов'язаних з лінійною залежністю, дорівнює ±1 (точніше, =1, якщо А>0і =-1, якщо А<0).

Зазначимо деякі властивості коефіцієнта кореляції.

З прикладу 1 випливає:

1) Якщо X та Y - незалежні випадкові величини, то коефіцієнт кореляції дорівнює нулю.

Зауважимо, що зворотне твердження, взагалі кажучи, не так. (Доказ див. у роботі .)

2)Абсолютна величина коефіцієнта кореляції вбирається у одиниці:

Дійсно, розділивши обидві частини нерівності (3.16) на твір , приходимо до шуканої нерівності.

3) Як видно з формули (3.15) з урахуванням формули (3.14) коефіцієнт кореляції характеризує відносну величину відхилення математичного очікування твору від твору математичних очікувань М(Х) М(Y)величин Xі Y.Оскільки це відхилення має місце лише залежних величин, можна сказати, що коефіцієнт кореляції характеризує тісноту залежності між X та Y.

3. Лінійна кореляція.Цей вид кореляційної залежності трапляється досить часто.

Кореляційна залежність між випадковими величинами Х та Yназивається лінійною кореляцією,якщо обидві функції регресії є лінійними. І тут обидві лінії регресії є прямими; їх називають прямі регресії.

Виведемо рівняння прямої регресії Yна X,тобто. знайдемо коефіцієнт лінійної функції

Позначимо М(Х) = а, М(Y)= b, М [(Х - а) 2]= , М [(Y - b 2)]= . З використанням властивостей МО (§§ 2.2; 2.6) знаходимо:

М(Y) = М= М(АХ + В) = АМ(Х) + В,

тобто. b = Аа + В,звідки В = b-Аа.

М(ХY)= М[Хg(Х)\= М(АХ 2 + ВХ) = АМ(Х 2) + ВМ(Х)= АМ(Х 2) + (b-Аа)а,

або, згідно з властивістю 1 дисперсії (§§ 2.3; 2.6),

Отриманий коефіцієнт називається коефіцієнтом регресії Y на Xі позначається через:

Таким чином, рівняння прямої регресії Yна Xмає вигляд

Аналогічно можна отримати рівняння прямої регресії X на Y

Коваріація та коефіцієнт кореляції.

Між випадковими величинами може бути функціональна чи стохастична (імовірнісна) залежність. Стохастична залежність проявляється в тому, що умовний закон розподілу однієї випадкової величини змінюється залежно від значень, що приймаються іншою випадковою величиною. Однією з характеристик стохастичної залежності двох випадкових величин є коваріаціявипадкових величин.

Коваріацієювипадкових величин ( X,Y) називається число рівне математичному очікуванню твору відхилень випадкових величин Xі Yвід своїх математичних очікувань:

Іноді коваріацію називають кореляційним моментомабо другим змішаним центральним моментомвипадкових величин ( X,Y).

Використовуючи визначення математичного очікування, отримаємо:

для дискретного розподілу

для безперервного розподілу

При Y= Xковаріація збігається з дисперсією Х.

Розмір кореляційного моменту залежить від одиниць виміру випадкових величин. Це ускладнює порівняння кореляційних моментів різних систем випадкових величин. Для усунення цього недоліку вводиться нова цифрова характеристика – коефіцієнт кореляції, Котрий є

безрозмірною величиною.

Для обчислення замінимо відхилення випадкових величин від математичних очікувань їх нормованими відхиленнями, тобто.

Властивості коефіцієнта кореляції:

Нехай t –змінна величина у сенсі математичного аналізу. Розглянемо дисперсію випадкової величини D(Y – tX) як функцію змінної t.

За якістю дисперсії. Дискримінант у разі може бути менше чи дорівнює нулю, тобто.

Звідки отримаємо

2. Модуль коефіцієнта кореляції змінюється при лінійних перетвореннях випадкових змінних: , де , , – довільні числа.

3. , тоді і лише тоді, коли випадкові величини Xі Yпов'язані лінійно, тобто. існують такі числа a, b,що .

Якщо , то дискримінант, що розглядається в п.1, дорівнює нулю, а тому при деякому значення . Отже, величина і для деякого Зсправедливо рівність , що потрібно довести.

4. Якщо Xі Yстатистично незалежні, то .

Властивості 2,4 перевіряються безпосередньо.

4.5.2. Корельованість та залежність системи випадкових величин.

Необхідною умовою незалежності випадкових величин Xі Yє рівність нулю їхнього кореляційного моменту (або коефіцієнта кореляції). Однак рівність (або ) є лише необхідною, але недостатньою умовою незалежності.

приклад 1.

На малюнку зображені точки, що лежать на параболі , а .

У зв'язку з цим вводиться більш вузьке поняття некорелюваності (якщо) або кореленості (якщо) випадкових величин. Тому незалежність випадкових величин означає і некорельованість() і навпаки, корелюваність () – залежність.

У випадку, коли , точки (X,Y) будуть розкидані навколо прямий тим більше тісно, ​​що більше величина . Таким чином, коефіцієнт кореляції характеризує не будь-якузалежність між Xі Y, а ступінь тісноти лінійної залежностіміж ними.

Так, зокрема, навіть за , тобто. при повній відсутності лінійної залежності, між Xі Yможе існувати як завгодно сильна статистична і навіть нелінійна функціональна залежність (див. приклад1).

При значеннях говорять про позитивну кореляцію між Xі Y, Що означає, що обидві змінні мають однакову тенденцію до зростання або спадання. При кажуть про негативну кореляцію, що означає протилежну тенденцію у зміні випадкових величин Xі Y, тобто. одна зростає, а інша зменшується чи навпаки.

Якщо випадкові величини Xі Yрозподілені нормально, то з їхньої некорельованості випливає і їхня незалежність, оскільки

Якщо то .

Для обчислення коефіцієнта кореляції продовжимо приклад 2 §4.1. Скористаємося формулою

.

M(X× Y)=(-200)×(-100)×0,2 + (-200)×0×0,1 + (-200)×(100)×0,05 + 0×(-100)×0,05 + 0×0×0,25 + 0×100×0,02 + 200×(-100)×0,01 + 200×0×0,02 + 200×100×0,3 = 8800 $;

; ;

.

приклад 2. Закон розподілу системи двох випадкових величин заданий таблицею розподілу

X Y
-1 0,01 0,06 0,05 0,04
0,04 0,24 0,15 0,07
0,05 0,01 0,01 0,09

Знайти одномірні (маргінальні) закони розподілу Xі Y, їх математичні очікування, дисперсії та коефіцієнт кореляції між Xі Y.

Рішення. Ймовірність можливих значень дискретної випадкової величини Х, що входить до системи, визначаються формулою

, до=1, 2, 3, 4.

Тому одномірний розподіл величини Хмає такий вигляд

Математичні очікування випадкових величин Xі Y:

M(X)=1,6; M(Y)=0,18.

Дисперсії випадкових величин Xі Y:

D(X)=0,84; D(Y)=0,47.

Коефіцієнт кореляції між Xі Yобчислюється за формулою

; ;

; ;

Запитання для самоперевірки.

1. Дайте визначення багатовимірної випадкової величини та функції розподілу ймовірностей.

2. Що називається спільним розподілом двовимірної дискретної випадкової величини ( X,Y)? Як воно записується?

3. Як за відомим спільним розподілом двовимірної випадкової величини ( X,Y) знайти маргінальні розподілу складових Xі Y?

4. Що називається умовним розподілом складової Xдвовимірної дискретної величини ( X,Y)?

5. Що називається підступом?

6. Що називається коефіцієнтом кореляції?

7. Вкажіть властивості коефіцієнта кореляції.

8. Чому дорівнює коефіцієнт кореляції випадкових величин Xі Y = 1 – 2X?

9. На яку величину перетворюється коваріація двох випадкових величин Xі Y, якщо X = Y?

10. Чи рівносильні поняття незалежності та некорелеваності?

Завдання

4.1. На двох різних ринках міста продаються три типи автомобілів ( А,В,З).Нижче наведено дані про кількість проданих автомобілів за рік:



Знайти такі ймовірності: Р(а, А), P(a, B), P(a, C), P(b, A), P(b, B), P(b,С), P(A), P(a/A), P(A/a). Скласти таблицю спільних ймовірностей.

4.2. Відпочиваючі на деякому курорті є, як правило, бізнесменами ( B)або людьми вільних професій ( P) (Адвокатами, художниками, лікарями і т.д.). Власник курорту хоче встановити, чи не вигідніше йому випускатиме рекламу двох видів, а не одного. І тому він доручив своєму рекламному відділу підготувати рекламу двох типів – одну бізнесменів (тип I), іншу – людям вільних професій (тип II). Реклама була підготовлена, матеріали надіслані можливим клієнтам, і було отримано 800 заявок. Вони розподілилися в такий спосіб.

а). Знайдіть ймовірність P(B,I); P(B,II); P(I/B).

Для опису системи двох випадкових величин, крім математичних очікувань і дисперсій складових користуються й іншими характеристиками, до яких належать кореляційний моменті коефіцієнт кореляції(коротко було згадано наприкінці Т.8.п.8.6) .

Кореляційним моментом(або підступом,або моментом зв'язку) двох випадкових величин X і Y називається м. о. твори відхилень цих величин (див. рівність (5) п. 8.6):

Наслідок 1.Для кореляційного моменту с.в. X і Yтакож справедливі рівності:

,

де відповідні централізовані С.В. X і Y (Див. п.8.6.).

При цьому: якщо
- двовимірна д.с.в., то коваріація обчислюється за формулою

(8)
;

якщо
- двовимірна н.с.в., то коваріація обчислюється за формулою

(9)

Формули (8) та (9) отримані на підставі формул (6) п.12.1. Має місце обчислювальна формула

(10)

яка виводиться з визначення (9) і на підставі властивостей м.о.

Отже, формул (36) та (37) можна переписати у вигляді

(11)
;

Кореляційний момент служить для характеристики зв'язку між величинами X і Y.

Як буде показано нижче, кореляційний момент дорівнює нулю, якщо Xі Y є незалежними;

Отже, якщо кореляційний момент не дорівнює нулю, тоXіY- Залежні випадкові величини.

Теорема12.1.Кореляційний момент двох незалежних випадкових величинXіYдорівнює нулю, тобто. для незалежних С.В.XіY,

Доказ.Так як X і Yнезалежні випадкові величини, їх відхилення

і

ттакож незалежні. Користуючись властивостями математичного очікування (математичне очікування твору незалежних с. ст. дорівнює твору математичних очікувань співмножників
,
тому

Зауваження.З цієї теореми випливає, що якщо
то с.в. X і Y залежні й у випадках с.в. X і Yназивають корельованими. Однак із того, що
не слідує незалежність с.в. X і Y.

В цьому випадку (
с.в. X і Yназивають некорельованими,тим самим з

незалежності випливає некорельованість; зворотне твердження, взагалі кажучи, неправильне (див. далі приклад 2.)

Розглянемо основні властивостікореляційного моменту.

Cвластивості коваріації:

1. Коваріація симетрична, тобто.
.

Безпосередньо випливає з формули (38).

2. Мають місце рівності: тобто. дисперсія с.в. є підступом її з самою собою.

Ці рівності прямо випливають з визначення дисперсії і рівність (38) відповідно

3. Справедливі рівності:

Ці рівності виводяться з визначення дисперсії, підступності с.в.
і , властивостей 2.

За визначенням дисперсії (з урахуванням централізованості с.
) ми маємо

тепер, на підставі (33) та властивостей 2 і 3, отримаємо першу (зі знаком плюс) властивість 3.

Аналогічно, друга частина свойства3, виводиться з рівність

4. Нехай
постійні числа,
тоді справедливі рівності:

Зазвичай ці властивості називаються властивостями однорідністю першого порядку та періодичністю за аргументами.

Доведемо першу рівність, при цьому використовуватимемо властивості м.о.
.

Теорема 12.2.Абсолютне значеннякореляційного моменту двох довільних випадкових величинXіYвбирається у середнього геометричного їх дисперсій: тобто.

Доказ.Зауважимо, що для незалежних с.в. нерівність виконується (с.м. теорему 12.1). Отже, хай с.в. X і Y залежні. Розглянемо стандартні с.в.
і
та обчислимо дисперсію с.в.
з урахуванням властивості 3, маємо: з одного боку
З іншого боку

Отже, з урахуванням того, що
і - нормовані (стандартизовані) с.в., то їм м.о. дорівнює нулю, а дисперсія дорівнює 1 тому, користуючись властивістю м.о.
отримаємо

а отже, на підставі того, що
отримаємо

Звідси випливає, що.

=

Твердження доведене.

З визначення та властивості коваріації випливає, що вона характеризує і ступінь залежності с.в., та їх розсіювання навколо точки
Розмірність коваріації дорівнює добутку розмірностей випадкових величин Xі Y. Інакше кажучи, величина кореляційного моменту залежить від одиниць виміру випадкових величин. З цієї причини для тих самих двох величин Xі Y, величина кореляційного моменту матиме різні значення залежно від цього, у яких одиницях було виміряно величини.

Нехай, наприклад, Xі Y були виміряні в сантиметрах та
; якщо виміряти Xі Y у міліметрах, то
Ця особливість кореляційного моменту є недоліком цієї числової характеристики, оскільки порівняння кореляційних моментів різних систем випадкових величин стає скрутним.

Для того щоб усунути цей недолік, вводять нову числову характеристику - коефіцієнт кореляції».

Коефіцієнт кореляції
випадкових величин
і називають відношення кореляційного моменту до твору середніх відхилень квадратичних цих величин:

(13)
.

Оскільки розмірність
дорівнює добутку розмірностей величин
і ,
має розмірність величини
σ yмає розмірність величини , то
є просто число (тобто « безрозмірна величина»). Таким чином, величина коефіцієнта кореляції не залежить від вибору одиниць вимірювання с.в., у цьому полягає перевагакоефіцієнта кореляції перед моментом кореляції.

У Т.8. п.8.3 нами було запроваджено поняття нормованоюс.в.
, формула (18), і доведено теорему про те, що
і
(Див. там же теорема 8.2.). Тут доведемо таке твердження.

Теорема 12.3.Для будь-яких двох випадкових величин
і справедлива рівність
.Іншими словами, коефіцієнт кореляції
будь-яких двох з
.в.XіYі кореляційному моменту їх відповідних нормованихс.в.
і .

Доказ.За визначенням нормованих випадкових величин
і

і
.

Враховуючи властивість математичного очікування: і рівність (40) отримаємо

Твердження доведене.

Розглянемо деякі властивості, що часто зустрічають коефіцієнта кореляції.

Властивості коефіцієнта кореляції:

1. Коефіцієнт кореляції за абсолютною величиною не перевищує 1, тобто.

Ця властивість прямо випливає з формули (41) - визначення кофіцієнта кореляції та теореми 13.5. (Див. рівність (40)).

2. Якщо випадкові величини
і незалежні, токоэффициент кореляції дорівнює нулю, тобто.
.

Ця властивість є прямим наслідком рівності (40) та теореми 13.4.

Наступну властивість сформулюємо як окремої теореми.

Теорема 12.4.

Якщо с.в.
і між собою пов'язані лінійною функціональною залежністю, тобто.
то

при цьому

і навпаки, якщо
,
то с.в.
і між собою пов'язані лінійною функціональною залежністю, тобто. існують постійні
і
такі, що має місце рівність

Доказ.Нехай
тоді на підставі властивості 4 коваріації, маємо

і оскільки, тому

Отже,
. Рівність в один бік одержано. Нехай далі,
тоді

слід розглядати два випадки:1)
і 2)
Отже, розглянемо перший випадок. Тоді за визначенням
і отже з рівності
, де
. У нашому випадку
тому з рівності (див. доказ теореми 13.5.)

=
,

отримуємо, що
, значить
постійна. Так як
і оскільки, то
справді,

.

Отже,


.

Аналогічно, показується, що для
має місце (перевірте самостійно!)

,
.

Деякі висновки:

1. Якщо
і незалежні с.в., то

2. Якщо с.в.
і між собою пов'язані лінійно, то
.

3. В інших випадках
:

І тут кажуть, що с.в.
і зв'язані між собою позитивною кореляцією,якщо
у випадках же
негативною кореляцією. Чим ближче
до одиниці, тим більше підстав вважати, що с.
і пов'язані лінійною залежністю.

Зазначимо, що кореляційні моменти та дисперсії системи с.в. зазвичай задаються кореляційною матрицею:

.

Очевидно, що визначник кореляційної матриці задовольняє:

Як було зазначено, якщо дві випадкові величини залежні, всі вони можуть бути як корельованими, так і некорельованими.Іншими словами, кореляційний момент двох залежних величин може бути не дорівнює нулю, але може і дорівнювати нулю.

приклад 1.Закон розподілу дискретної с.в.


Знайти коефіцієнт кореляції

Рішення.Знаходимо закони розподілу складових
і :


Тепер обчислимо м.о. складових:

Цих величин можна було шукати виходячи з таблиці розподілу с.в.

Аналогічно,
знаходите самостійно.

Обчислимо дисперсії складових при цьому користуватимемося обчислювальною формулою:

Складемо закон розподілу
, а потім знайдемо
:

При складанні таблиці закону розподілу слід виконувати дії:

1) залишити лише різні значення всіляких творів
.

2) визначення ймовірності даного значення
, потрібно

складати всі відповідні ймовірності, що знаходяться на перетині основної таблиці, що сприяють настанню цього значення.

У прикладі с.в. приймає всього три різні значення
. Тут перше значення (
) відповідає твору
з другого рядка та
з першого стовпця, тому на їхньому перетині знаходиться імовірнісне число
аналогічно

яке отримано із суми ймовірностей, що знаходяться на перетинах відповідно першого рядка та першого стовпця (0,15 ; 0,40; 0,05) та одне значення
, що знаходиться на перетині другого рядка та другого стовпця, і нарешті,
, що знаходиться на перетині другого рядка та третього стовпця.

З нашої таблиці знаходимо:

Знаходимо кореляційний момент, використовуючи формулу (38):

Знаходимо коефіцієнт кореляції за формулою (41)

Отже, негативна кореляція.

Вправа.Закон розподілу дискретної с. заданий таблицею


Знайти коефіцієнт кореляції

Розглянемо приклад, де виявиться дві залежні випадкові величиниможуть бути некорельованими.

приклад 2.Двовимірна випадкова величина
)
задана функцією щільністю

Доведемо, що
і залежні , але некорельовані довільні величини.

Рішення.Скористаємося раніше обчисленими щільностями розподілу складових
і :

Так як
і залежні величини. Для того, щоб довести некорельованість
і досить переконатися в тому, що

Знайдемо кореляційний момент за формулою:

Оскільки диференціальна функція
симетрична щодо осі OY, то
аналогічно
, в силу симетрії
щодо осі OX. Тому,

виносячи постійний множник

Внутрішній інтеграл дорівнює нулю (підінтегральна функція непарна, межі інтегрування симетричні щодо початку координат), отже,
, тобто. залежні випадкові величини
і між собою не корелюють.

Отже, з корелюваності двох випадкових величин випливає їхня залежність, але з некорелюваності ще не можна укласти про незалежність цих величин.

Однак для нормально розподілених с.в. такий висновок є винятком,тобто. з некорельованості нормально розподіленихс.в. витікає їх незалежність.

Цьому питанню присвячується наступний пункт.



Останні матеріали розділу:

Отримання нітросполук нітруванням
Отримання нітросполук нітруванням

Електронна будова нітрогрупи характеризується наявність семи полярного (напівполярного) зв'язку: Нітросполуки жирного ряду – рідини, що не...

Хроміт, їх відновлювальні властивості
Хроміт, їх відновлювальні властивості

Окисно-відновні властивості сполук хрому з різним ступенем окиснення. Хром. Будова атома. Можливі ступені окислення.

Чинники, що впливають на швидкість хімічної реакції
Чинники, що впливають на швидкість хімічної реакції

Питання №3 Від яких чинників залежить константа швидкості хімічної реакції? Константа швидкості реакції (питома швидкість реакції) - коефіцієнт...