Закон великих чисел. Центральна гранична теорема

Чи не втратите.Підпишіться та отримайте посилання на статтю собі на пошту.

Взаємодіючи щодня у роботі чи навчанні з цифрами та числами, багато хто з нас навіть не підозрює про те, що існує дуже цікавий закон великих чисел, який застосовується, наприклад, у статистиці, економіці та навіть психолого-педагогічних дослідженнях. Він відноситься до теорії ймовірностей і говорить про те, що середнє арифметичне будь-якої великої вибірки з фіксованого розподілу близьке до математичного очікування цього розподілу.

Ви, мабуть, помітили, що зрозуміти сутність цього закону непросто, особливо тим, хто не дуже товаришує з математикою. Виходячи з цього, ми хотіли б розповісти про неї простою мовою (наскільки це можливо, звичайно), щоб кожен міг хоча б приблизно усвідомити для себе, що це таке. Ці знання допоможуть вам краще розібратися в деяких математичних закономірностях, стати більш ерудованим та позитивним чином вплинути на .

Поняття закону великих чисел та його трактування

Крім розглянутого нами вище визначення закону великих чисел теорії ймовірностей, можна навести і його економічне тлумачення. У цьому випадку він є принципом, згідно з яким частоту фінансових втрат конкретного виду можна передбачити з високим ступенем достовірності тоді, коли спостерігається високий рівень втрат подібних видів взагалі.

Крім цього, залежно від рівня збіжності ознак можна виділити слабкий та посилений закони великих чисел. Про слабке йдеться, коли збіжність існує ймовірно, а про посиленому – коли збіжність існує практично у всьому.

Якщо інтерпретувати трохи інакше, слід сказати так: завжди можна знайти таке кінцеве число випробувань, де з будь-якою запрограмованою наперед ймовірністю менше одиниці відносна частота появи якоїсь події буде вкрай мало відрізнятися від його ймовірності.

Таким чином, загальну суть закону великих чисел можна висловити так: результатом комплексної дії великої кількості однакових та незалежних випадкових факторів буде такий результат, який не залежить від випадку. А якщо говорити ще більш простою мовою, то в законі великих чисел кількісні закономірності масових явищ будуть явно виявлятися лише за великої їхньої кількості (тому і називається закон законом великих чисел).

Звідси можна дійти невтішного висновку, що сутність закону у тому, що у числах, які виходять при масовому спостереженні, є деякі правильності, виявити які у невеликій кількості фактів неможливо.

Сутність закону великих чисел та його приклади

Закон великих чисел висловлює найбільш загальні закономірності випадкового та необхідного. Коли випадкові відхилення «гасять» один одного, середні показники, визначені для однієї і тієї ж структури, набувають форми типових. Вони відображають дії суттєвих та постійних фактів у конкретних умовах часу та місця.

Визначені у вигляді закону великих чисел закономірності сильні лише тоді, коли представляють масові тенденції, і вони можуть бути законами окремих випадків. Так, набирає чинності принцип математичної статистики, який говорить, що комплексна дія ряду випадкових факторів здатна стати причиною невипадкового результату. І найяскравіший приклад дії даного принципу – це зближення частоти настання випадкової події та її ймовірності, коли зростає кількість випробувань.

Згадаймо звичайне кидання монетки. Теоретично орел і решка можуть випасти з однією ймовірністю. Це означає, що якщо, наприклад, кинути монетку 10 разів, п'ять із них має випасти решка і п'ять – орел. Але кожен знає, що так не відбувається практично ніколи, адже співвідношення частоти випадання орла та решки може бути і 4 до 6, і 9 до 1, і 2 до 8 і т.д. Однак із збільшенням кількості підкидань монетки, наприклад, до 100, ймовірність того, що випаде орел чи решка, сягає 50%. Якщо ж теоретично проводити нескінченну кількість подібних дослідів, ймовірність випадання монети обома сторонами завжди прагнутиме 50%.

На те, як саме впаде монетка, впливає безліч випадкових факторів. Це і становище монетки на долоні, і сила, з якої відбувається кидок, і висота падіння, його швидкість і т.д. Але якщо дослідів багато, незалежно від того, як впливають фактори, завжди можна стверджувати, що практична ймовірність близька до теоретичної ймовірності.

А ось ще один приклад, який допоможе зрозуміти сутність закону великих чисел: припустимо, що нам потрібно оцінити рівень заробітку людей у ​​якомусь регіоні. Якщо ми розглядатимемо 10 спостережень, де 9 людина отримують 20 тис. рублів, а 1 людина – 500 тис. рублів, середнє арифметичне становитиме 68 тис. рублів, що, звісно, ​​малоймовірно. Але якщо ми візьмемо до уваги 100 спостережень, де 99 осіб отримують 20 тис. рублів, а 1 людина – 500 тис. рублів, то при розрахунку середнього арифметичного отримаємо 24,8 тис. рублів, що ближче до реального стану справ. Збільшуючи кількість спостережень, ми змушуватимемо середнє значення прагнути справжнього показника.

Саме тому для застосування закону великих чисел в першу чергу необхідно набрати статистичний матеріал, щоб отримувати правдиві результати, вивчаючи велику кількість спостережень. Тому й зручно використовувати цей закон, знову ж таки, у статистиці чи соціальній економіці.

Підведемо підсумки

Значення того, що закон великих чисел працює, складно переоцінити для будь-якої галузі наукового знання, і особливо для наукових розробок у галузі теорії статистики та методів статистичного пізнання. Дія закону також має велике значення і для самих об'єктів, що вивчаються, з їх масовими закономірностями. На законі великих чисел і принцип математичної статистики грунтуються майже всі методи статистичного спостереження.

Але, навіть не зважаючи на науку і статистику як такі, можна сміливо зробити висновок, що закон великих чисел – це не просто явище в галузі теорії ймовірностей, але феномен, з яким ми стикаємося практично щодня у своєму житті.

Сподіваємося, тепер сутність закону великих чисел стала вам більш зрозумілою, і ви зможете легко і просто пояснити його комусь іншому. А якщо тема математики та теорії ймовірностей вам цікава в принципі, то рекомендуємо почитати про і . Також познайомтеся з і. І, звичайно ж, зверніть увагу на наш, адже, пройшовши його, ви не тільки оволодієте новими техніками мислення, але й покращите свої когнітивні здібності в цілому, в тому числі математичні.

Закон великих чисел

Практика вивчення випадкових явищ показує, що хоча результати окремих спостережень, навіть проведених в однакових умовах, можуть сильно відрізнятися, в той же час середні результати для значної кількості спостережень стійкі і слабо залежать від результатів окремих спостережень. Теоретичним обґрунтуванням цієї чудової якості випадкових явищ є закон великих чисел. Загальний зміст закону великих чисел- спільна дія великої кількості випадкових факторів призводить до результату, що майже не залежить від випадку.

Центральна гранична теорема

Теорема Ляпунова пояснює широке поширення нормального закону розподілу та пояснює механізм його утворення. Теорема дозволяє стверджувати, що завжди, коли випадкова величина утворюється в результаті додавання великої кількості незалежних випадкових величин, дисперсії яких малі в порівнянні з дисперсією суми, закон розподілу цієї випадкової величини виявляється практично нормальним законом. А оскільки випадкові величини завжди породжуються нескінченною кількістю причин і найчастіше жодна з них не має дисперсії, порівнянної з дисперсією самої випадкової величини, більшість випадкових величин, що зустрічаються в практиці, підпорядковано нормальному закону розподілу.

Зупинимося докладніше на змісті теорем кожної з цих груп

У практичних дослідженнях дуже важливо знати, у яких випадках можна гарантувати, що ймовірність події буде або досить мала, або як завгодно близька до одиниці.

Під законом великих чиселі розуміється сукупність пропозицій, у яких стверджується, що з ймовірністю, як завгодно близькій до одиниці (або нуля), станеться подія, яка залежить від дуже великого, необмежено збільшення кількості випадкових подій, кожна з яких робить на нього лише незначний вплив.

Точніше, під законом великих чисел розуміється сукупність речень, у яких стверджується, що з ймовірністю, як завгодно близькою до одиниці, відхилення середньої арифметичної досить великої кількості випадкових величин від постійної величини -середньої арифметичної їх математичних очікувань, не перевершить заданого як завгодно малого числа.

Окремі, поодинокі явища, які ми спостерігаємо в природі та в суспільному житті, часто виявляються як випадкові (наприклад, реєстрований смертний випадок, стать дитини, що народилася, температура повітря та ін.) внаслідок того, що на такі явища діє багато факторів, не пов'язаних з істотою виникнення чи розвитку явища. Передбачити сумарну дію їх на явище, що спостерігається, не можна, і вони по-різному проявляються в поодиноких явищах. За результатами одного явища не можна нічого сказати про закономірності, властиві багатьом таким явищам.

Однак давно було помічено, що середня арифметична числових характеристик деяких ознак (відносні частоти появи події, результатів вимірювань тощо) при великій кількості повторень досвіду схильна до дуже незначних коливань. У середній хіба що проявляється закономірність, властива суті явищ, у ній взаємно погашається вплив окремих чинників, які робили випадковими результати поодиноких спостережень. Теоретично пояснити таку поведінку середньої можна за допомогою закону великих чисел. Якщо будуть виконані деякі загальні умови щодо випадкових величин, то стійкість середньої арифметичної буде практично достовірною подією. Ці умови і становлять найважливіший зміст закону великих чисел.

Першим прикладом дії цього принципу і може бути зближення частоти настання випадкової події з його ймовірністю у разі зростання числа випробувань – факт, встановлений у теоремі Бернуллі (швейцарський математик Якоб Бернуллі(1654-1705)). Теорема Бернулл є однією з найпростіших форм закону великих чисел і часто використовується на практиці. Наприклад, частоту народження будь-якої якості респондента у вибірці приймають за оцінку відповідної ймовірності).

Видатний французький математик Сімеон Денні Пуассон(1781- 1840) узагальнив цю теорему і поширив її у випадок, коли ймовірність подій у випробуванні змінюється незалежно від результатів попередніх випробувань. Він уперше вжив термін «закон великих чисел».

Великий російський математик Пафнутий Львович Чебишев(1821 – 1894) довів, що закон великих чисел діє у явищах з будь-якою варіацією та поширюється також на закономірність середньої.

Подальше узагальнення теорем закону великих чисел пов'язане з іменами А.А.Маркова, С.Н.Бернштейна, А.Я.Хінчина та А.М.Колмлгорова.

Загальна сучасна постановка завдання, формулювання закону великих чисел, розвиток ідей та методів доказу теорем, що належать до цього закону, належить російським ученим П. Л. Чебишеву, А. А. Маркову та А. М. Ляпунову.

Нерівність Чебишева

Розглянемо спочатку допоміжні теореми: лему і нерівність Чебишева, з допомогою яких легко доводиться закон великих чисел у вигляді Чебишева.

Лемма (Чебишев).

Якщо серед значень випадкової величини Х немає негативних, то ймовірність того, що вона прийме якесь значення, що перевищує позитивне число А, не більше дробу, чисельник якого - математичне очікування випадкової величини, а знаменник - число А:

Доведення.Нехай відомий закон розподілу випадкової величини Х:

(i = 1, 2, ..., ), причому значення випадкової величини ми вважаємо розташованими у зростаючому порядку.

По відношенню до числа значення випадкової величини розбиваються на дві групи: одні не перевищують А, а інші більше А. Припустимо, що до першої групи відносяться перші значень випадкової величини ().

Оскільки , всі члени суми неотрицательны. Тому, відкидаючи перші доданків у виразі отримаємо нерівність:

Оскільки

,

то

що і потрібно було довести.

Випадкові величини можуть мати різні розподіли за однакових математичних очікувань. Однак для них лема Чебишева дасть однакову оцінку ймовірності того чи іншого результату випробування. Цей недолік леми пов'язаний з її спільністю: досягти кращої оцінки відразу для всіх випадкових величин неможливо.

Нерівність Чебишева .

Імовірність того, що відхилення випадкової величини від її математичного очікування перевершить по абсолютній величині позитивне число, не більше дробу, чисельник якого - дисперсія випадкової величини, а знаменник - квадрат

Доведення.Оскільки випадкова величина, яка не набуває негативних значень, то застосуємо нерівність з леми Чебишева для випадкової величини при:


що і потрібно було довести.

Слідство. Оскільки

,

то

- інша форма нерівності Чебишева

Приймемо без доказу факт, що лема і нерівність Чебишева вірні і безперервних випадкових величин.

Нерівність Чебишева є основою якісних і кількісних тверджень закону великих чисел. Воно визначає верхню межу ймовірності того, що відхилення значення випадкової величини від її математичного очікування більше певного заданого числа. Чудово, що нерівність Чебишева дає оцінку ймовірності події для випадкової величини, розподіл якої невідомий, відомі лише її математичне очікування та дисперсія.

Теорема. (Закон великих чисел у формі Чебишева)

Якщо дисперсії незалежних випадкових величин обмежені однією константою С, а число їх досить велике, то як завгодно близька до одиниці ймовірність того, що відхилення середньої арифметичної цих випадкових величин від середньої арифметичної їх математичних очікувань не перевершить по абсолютній величині даного позитивного числа, яким би малим воно не було:

.

Теорему приймемо без підтвердження.

Наслідок 1. Якщо незалежні випадкові величини мають однакові, рівні , математичні очікування, дисперсії їх обмежені однієї і тієї ж постійної С, а число їх досить велике, то скільки б мало не було дане позитивне число , як завгодно близька до одиниці ймовірність того, що відхилення середньої арифметичної цих випадкових величин не перевищить по абсолютній величині .

Те, що за наближене значення невідомої величини приймають середню арифметичну результатів досить великої кількості її вимірювань, вироблених в тих самих умовах, можна обґрунтувати цією теоремою. Справді, результати вимірів є випадковими, оскільки у них діє дуже багато випадкових чинників. Відсутність систематичних помилок означає, що математичні очікування окремих результатів вимірювань однакові і рівні. Отже, згідно із законом великих чисел середня арифметична досить великої кількості вимірів практично як завгодно мало відрізнятиметься від справжнього значення шуканої величини.

(Нагадаємо, що помилки називаються систематичними, якщо вони спотворюють результат вимірювання в ту саму сторону за більш-менш ясним законом. До них відносяться помилки, що з'являються в результаті недосконалості інструментів (інструментальні помилки), внаслідок особистих особливостей спостерігача (особисті помилки) і ін)

Наслідок 2 . (Теорема Бернуллі.)

Якщо ймовірність настання події А в кожному з незалежних випробувань постійна, а їх кількість досить велика, то як завгодно близька до одиниці ймовірність того, що частота появи події як завгодно мало відрізняється від ймовірності її появи:

Теорема Бернуллі стверджує, що якщо ймовірність події однакова у всіх випробуваннях, то зі збільшенням числа випробувань частота події прагне ймовірності події і перестає бути випадковою.

Насправді порівняно рідко зустрічаються досліди, у яких ймовірність появи події у будь-якому досвіді незмінна, частіше вона різна у різних дослідах. До схеми випробувань такого типу відноситься теорема Пуассона:

Наслідок 3 . (Теорема Пуассона.)

Якщо ймовірність появи події в -омипробуванні не змінюється, коли стають відомими результати попередніх випробувань, а їх кількість досить велика, то як завгодно близька до одиниці ймовірність того, що частота появи події як завгодно мало відрізняється від середньої арифметичної ймовірностей:

Теорема Пуассона стверджує, що частота події у серії незалежних випробувань прагне середнього арифметичного його ймовірностей і перестає бути випадковою.

На закінчення зауважимо, що жодна з розглянутих теорем не дає ні точного, ні навіть наближеного значення ймовірності, а вказується лише нижня або верхня межа її. Тому, якщо потрібно встановити точне чи навіть наближене значення ймовірностей відповідних подій, можливості цих теорем дуже обмежені.

Наближені значення ймовірностей при великих значеннях можна отримати лише за допомогою граничних теорем. Вони або на випадкові величини накладаються додаткові обмеження (як це має місце, наприклад, у теоремі Ляпунова), або розглядаються випадкові величини певного виду (наприклад, інтегральної теоремі Муавра-Лапласа).

Теоретичне значення теореми Чебишева, що є дуже загальним формулюванням закону великих чисел, велике. Однак якщо ми будемо застосовувати її при вирішенні питання про можливість застосувати закон великих чисел до послідовності незалежних випадкових величин, то при ствердній відповіді теорема часто вимагатиме, щоб випадкових величин було набагато більше, ніж необхідно для набрання чинності законом великих чисел. Зазначений недолік теореми Чебишева пояснюється її загальним характером. Тому бажано мати теореми, які точніше вказували б нижню (або верхню) межу ймовірності, що шукається. Їх можна отримати, якщо накласти на випадкові величини деякі додаткові обмеження, які для випадкових величин, що зустрічаються на практиці, зазвичай виконуються.

ЗАУВАЖЕННЯ ПРО ЗМІСТ ЗАКОНУ ВЕЛИКИХ ЧИСЕЛ

Якщо число випадкових величин досить велике і вони задовольняють деяким дуже загальним умовам, то, як би вони не були розподілені, практично достовірно, що середня арифметична скільки завгодно мало відхиляєте а від постійної величини - - середньої арифметичної їх математичних очікувань, тобто. є практично незмінною величиною. Такий зміст теорем, які стосуються закону великих чисел. Отже, закон великих чисел - один із виразів діалектичного зв'язку між випадковістю та необхідністю.

Можна навести дуже багато прикладів виникнення нових якісних станів як вияву закону великих чисел, насамперед серед фізичних явищ. Розглянемо один із них.

За сучасними уявленнями гази складаються з окремих частинок-молекул, які знаходяться в хаотичному русі, і не можна точно сказати, де в даний момент перебуватиме, і з якою швидкістю рухатиметься та чи інша молекула. Однак спостереження показують, що сумарна дія молекул, наприклад, тиск газу на

стінку судини, проявляється з вражаючою сталістю. Воно визначається кількістю ударів та силою кожного з них. Хоча перше та друге є справою випадку, прилади не вловлюють коливань тиску газу, що перебуває в нормальних умовах. Пояснюється це тим, що завдяки величезній кількості молекул навіть у найменших обсягах

зміна тиску на помітну величину практично неможлива. Отже, фізичний закон, який стверджує сталість тиску газу, є виявом закону великих чисел.

Постійність тиску та деяких інших характеристик газу свого часу служило вагомим аргументом проти молекулярної теорії будови речовини. Згодом навчилися ізолювати порівняно невелику кількість молекул, домагаючись того, щоб вплив від ділових молекул ще залишалося, і цим закон великих чисел було проявитися достатньою мірою. Тоді вдалося спостерігати коливання тиску газу, що підтверджують гіпотезу про молекулярну будову речовини.

Закон великих чисел лежить в основі різних видів страхування (страхування життя людини на всілякі терміни, майна, худоби, посівів та ін.).

При плануванні асортименту товарів широкого вжитку враховується попит ними населення. У цьому вся попиті проявляється дію закону великих чисел.

Широко застосовуваний у статистиці вибірковий метод знаходить своє наукове обгрунтування у законі великих чисел. Наприклад, якість привезеної з колгоспу на заготівельний пункт пшениці судять за якістю зерен, випадково захоплених у невелику мірку. Зерна в мірці трохи в порівнянні з усією партією, але принаймні мірку вибирають такою, щоб зерен у ній було цілком достатньо для

прояви закону великих чисел із точністю, що задовольняє потреби. Ми маємо право прийняти за показники засміченості, вологості та середньої ваги зерен усієї партії зерна, що надійшло, відповідні показники у вибірці.

Подальші зусилля вчених щодо поглиблення змісту закону великих чисел були спрямовані на отримання найбільш загальних умов застосування цього закону до послідовності випадкових величин. У цьому напрямі довго не було важливих успіхів. Після П. Л. Чебишева та А. А. Маркова тільки в 1926 р. радянському академіку А. Н. Колмогорову вдалося отримати умови, необхідні та достатні для того, щоб до послідовності незалежних випадкових величин був застосований закон великих чисел. У 1928 р. радянський вчений А. Я. Хінчін показав, що достатньою умовою застосування закону великих чисел до послідовності незалежних однаково розподілених випадкових величин є існування у них математичного очікування.

Для практики дуже важливо повністю з'ясувати питання про застосовність закону великих чисел до залежних випадкових величин, оскільки явища у природі та суспільстві перебувають у взаємної залежності і взаємно обумовлюють одне одного. Багато робіт присвячено з'ясуванню обмежень, які необхідно накласти

на залежні випадкові величини, щоб до них можна було застосувати закон великих чисел, причому найважливіші належать видатному російському вченому А. А. Маркову та великим радянським ученим С. Н. Бернштейну та А. Я. Хінчину.

Основний результат цих робіт полягає в тому, що закон великих чисел докладемо до залежних випадкових величин, якщо сильна залежність існує між випадковими величинами з близькими номерами, а між випадковими величинами з далекими номерами залежність досить слабка. Прикладами випадкових величин такого типу є числові характеристики клімату. На погоду кожного дня помітно впливає погода попередніх днів. Отже, багаторічна середня температура, тиск та інші характеристики клімату даної місцевості відповідно до закону великих чисел практично мають бути близькими до своїх математичних очікувань. Останні є об'єктивними характеристиками клімату.

З метою експериментальної перевірки закону великих чисел у різний час було зроблено такі досліди.

1. Досвід Бюффона. Монета кинута 4040 разів. Герб випав 2048 разів. Частина його випадання дорівнювала 0,50694 =

2. Досвід Пірсона. Монета кинута 12 000 та 24 000 разів. Частина випадання герба у першому випадку дорівнювала 0,5016, у Другому - 0,5005.

З. Досвід Вестергаарда. З урни, в якій було порівну білих та чорних куль, отримано при 10 000 витягів (з поверненням чергової вийнятої кулі в урну) 5011 білих та 4989 чорних куль. Частина білих куль становила 0,50110 = (), а чорних - 0,49890.

4. Досвід В. І. Романовського. Чотири монети кинуто 21160 разів. Частоти та частоти різних комбінацій випадання герба та решітки розподілилися наступним чином:

Комбінації числа випадань герба та решки

Частоти

Частини

Емпіричні

Теоретичні

4 та 0

1 181

0,05858

0,0625

3 та 1

4909

0,24350

0,2500

2 та 2

7583

0,37614

0,3750

1 та 3

5085

0,25224

0,2500

1 та 4

0,06954

0,0625

Разом

20160

1,0000

1,0000

Результати експериментальних перевірок закону великих чисел переконують нас у великій близькості досвідчених ймовірностей.

ЦЕНТРАЛЬНА МЕЖНА ТЕОРЕМА

Неважко довести, що суму будь-якого кінцевого числа незалежних нормально розподілених випадкових величин також розподілено за нормальним законом.

Якщо незалежні випадкові величини не розподілені за нормальним законом, можна накласти ними деякі дуже нежорсткі обмеження, та його сума буде все-таки розподілено нормально.

Це завдання поставили і вирішили в основному російські вчені П. Л. Чебишев та його учні А. А. Марков та А. М. Ляпунов.

Теорема (Ляпунів).

Якщо незалежні випадкові величини мають кінцеві математичні очікування та кінцеві дисперсії , Число їх досить велике, а при необмеженому зростанні

,

де - абсолютні центральні моменти третього порядку, то їх сума з достатнім ступенем точності має розподіл

(Фактично ми наводимо не теорему Ляпунова, а один із наслідків з неї, тому що цього слідства цілком достатньо для практичних додатків. Тому умова, яка названа умовою Ляпунова, є сильнішою вимогою, ніж необхідно для доказу власне теореми Ляпунова.)

Сенс умови полягає в тому, що дія кожного доданку (випадкової величини) невелика в порівнянні з сумарною дією їх усіх. Багато випадкових явищ, що зустрічаються в природі та в суспільному житті, протікають саме за такою схемою. У зв'язку з цим теорема Ляпунова має винятково велике значення, а нормальний закон розподілу є одним із основних законів у теорії ймовірностей.

Нехай, наприклад, виготовляється вимірдеякої величини. Різні ухилення значень, що спостерігаються від істинного її значення (математичного очікування) виходять в результаті впливу дуже великої кількості факторів, кожен з яких породжує малу помилку, причому. Тоді сумарна помилка виміру є випадковою величиною, яка за теоремою Ляпунова має бути розподілена за нормальним законом.

При стрільбі з гарматипід впливом дуже великої кількості причин випадкового характеру відбувається розсіювання снарядів на деякій площі. Випадкові на траєкторію снаряда вважатимуться незалежними. Кожна причина викликає лише незначну зміну траєкторії порівняно із сумарною зміною під впливом усіх причин. Тому слід очікувати, що відхилення місця розриву снаряда від мети буде випадковою величиною, розподіленою за нормальним законом.

За теоремою Ляпунова ми маємо право очікувати, що, наприклад, зростання дорослого чоловікає випадковою величиною, розподіленою за нормальним законом. Ця гіпотеза, як і розглянуті в попередніх двох прикладах, добре узгоджується зі спостереженнями. На підтвердження наведемо розподіл за зростанням 1000 дорослих робітників чоловіка відповідні теоретичні чисельності чоловіків, тобто число чоловіків, які повинні мати зростання зазначених груп, якщо виходити з припущення про розподіл зростання чоловіків за нормальним законом.

Зростання, см

кількість чоловіків

експериментальні дані

теоретичні

прогнози

143-146

146-149

149-152

152-155

155-158

158- 161

161- 164

164-167

167-170

170-173

173-176

176-179

179 -182

182-185

185-188

Більш точного збігу експериментальних даних з теоретичними важко було очікувати.

Можна легко довести як наслідок теореми Ляпунова -пропозиція, яка буде потрібна надалі для обґрунтування вибіркового методу.

Пропозиція.

Сума досить великої кількості однаково розподілених випадкових величин, які мають абсолютні центральні моменти третього порядку, розподілена за нормальним законом.

Граничні теореми теорії ймовірностей теореми Муавра-Лапласа пояснюють природу стійкості частоти появи події. Природа ця полягає в тому, що граничним розподілом числа події при необмеженому зростанні числа випробувань (якщо ймовірність події у всіх випробуваннях однакова) є нормальний розподіл.

Система випадкових величин.

Розглянуті вище довільні величини були одномірними, тобто. визначалися одним числом, однак, існують випадкові величини, які визначаються двома, трьома і т.д. числами. Такі випадкові величини називаються двовимірними, тривимірними тощо.

Залежно від типу, що входять до системи випадкових величин, системи можуть бути дискретними, безперервними або змішаними, якщо систему входять різні типи випадкових величин.

Докладніше розглянемо системи двох випадкових величин.

Визначення. Законом розподілуСистема випадкових величин називається співвідношення, що встановлює зв'язок між областями можливих значень системи випадкових величин і ймовірністю появи системи в цих областях.

приклад. З урни, в якій знаходяться 2 білих і три чорні кулі, виймають дві кулі. Нехай - кількість вийнятих білих куль, а випадкова величина визначається так:


Складемо таблицю розподілу системи випадкових величин:

Оскільки - ймовірність того, що білих куль не вийнято (означає, вийнято дві чорні кулі), при цьому , то

.

Ймовірність

.

Ймовірність

Ймовірність - ймовірність того, що білих куль не вийнято (і, значить, вийнято дві чорні кулі), при цьому тоді

Ймовірність - ймовірність того, що вийнята одна біла куля (і, значить, одна чорна), при цьому тоді

Ймовірність - ймовірність того, що вийнято дві білі кулі (і, значить, жодної чорної), при цьому тоді

.

Таким чином, ряд розподілу двовимірної випадкової величини має вигляд:

Визначення. Функцією розподілусистеми двох випадкових величин називається функція двох аргументівF( x, y) , що дорівнює ймовірності спільного виконання двох нерівностейX< x, Y< y.


Зазначимо такі властивості функції розподілу системи двох випадкових величин:

1) ;

2) Функція розподілу є незменшною функцією за кожним аргументом:

3) Правильне таке:

4)


5) Імовірність влучення випадкової точки ( X, Y ) довільний прямокутник зі сторонами, паралельними координатним осям, обчислюється за формулою:


Щільність розподілу двох випадкових величин.

Визначення.Щільністю спільного розподілуймовірностей двовимірної випадкової величини ( X, Y ) називається друга змішана приватна похідна від функції розподілу.

Якщо відома густина розподілу, то функція розподілу може бути знайдена за формулою:

Двовимірна щільність розподілу невід'ємна та подвійний інтеграл з нескінченними межами від двовимірної щільності дорівнює одиниці.

За відомою густиною спільного розподілу можна знайти густини розподілу кожної зі складових двовимірної випадкової величини.

; ;

Умовні закони розподілу.

Як було показано вище, знаючи спільний закон розподілу можна легко знайти закони розподілу кожної випадкової величини, що входить до системи.

Проте, практично частіше стоїть зворотне завдання – за відомими законами розподілу випадкових величин знайти їх спільний закон розподілу.

У випадку це завдання є нерозв'язною, т.к. закон розподілу випадкової величини нічого говорить про зв'язку цієї величини коїться з іншими випадковими величинами.

З іншого боку, якщо випадкові величини залежні між собою, то закон розподілу може бути виражений через закони розподілу складових, т.к. має встановлювати зв'язок між складовими.

Усе це призводить до необхідності розгляду умовних законів розподілу.

Визначення. Розподіл однієї випадкової величини, що входить до системи, знайдений за умови, що інша випадкова величина набула певного значення, називається умовним законом розподілу.

Умовний закон розподілу можна задавати як функцією розподілу, так і щільністю розподілу.

Умовна щільність розподілу обчислюється за формулами:

Умовна щільність розподілу має всі властивості щільності розподілу однієї випадкової величини.

Умовне математичне очікування.

Визначення. Умовним математичним очікуваннямдискретної випадкової величини Y при X = x (х – певне можливе значення Х) називається добуток усіх можливих значень Y з їхньої умовні ймовірності.

Для безперервних випадкових величин:

,

де f( y/ x) - Умовна щільність випадкової величини Y при X = x.

Умовне математичне очікуванняM( Y/ x)= f( x) є функцією від хі називається функцією регресії Х на Y.

приклад.Знайти умовне математичне очікування складової Y при

X = x 1 =1 для дискретної двовимірної випадкової величини, заданою таблицею:

Y

x 1 = 1

x 2 =3

x 3 = 4

x 4 = 8

y 1 =3

0,15

0,06

0,25

0,04

y 2 =6

0,30

0,10

0,03

0,07

Аналогічно визначаються умовна дисперсія та умовні моменти системи випадкових величин.

Залежні та незалежні випадкові величини.

Визначення. Випадкові величини називаються незалежними, якщо закон розподілу однієї з них не залежить від того, яке значення набуває інша випадкова величина.

Поняття залежності випадкових величин є дуже важливим теоретично ймовірностей.

Умовні розподіли незалежних випадкових величин дорівнюють їх безумовним розподілам.

Визначимо необхідні та достатні умови незалежності випадкових величин.

Теорема. Y були незалежні, необхідно і достатньо, щоб функція розподілу системи ( X, Y) Дорівнювала добутку функцій розподілу складових.

Аналогічну теорему можна сформулювати і для густини розподілу:

Теорема. Для того, щоб випадкові величини Х і Y були незалежні, необхідно і достатньо, щоб щільність спільного розподілу системи ( X, Y) Дорівнювала добутку щільностей розподілу складових.

Практично використовуються формули:

Для дискретних випадкових величин:

Для безперервних випадкових величин:

Кореляційний момент служить у тому, щоб охарактеризувати зв'язок між випадковими величинами. Якщо випадкові величини незалежні, їх кореляційний момент дорівнює нулю.

Кореляційний момент має розмірність, що дорівнює добутку розмірностей випадкових величин Х і Y . Цей факт є недоліком цієї числової показники, т.к. при різних одиницях виміру виходять різні кореляційні моменти, що ускладнює порівняння кореляційних моментів різних випадкових величин.

Для того, щоб усунути цей недолік, застосовується інша характеристика – коефіцієнт кореляції.

Визначення. Коефіцієнт кореляції r xy випадкових величин Х і Y називається ставлення кореляційного моменту до твору середніх відхилень квадратичних цих величин.

Коефіцієнт кореляції є безрозмірною величиною. Для незалежних випадкових величин коефіцієнт кореляції дорівнює нулю.

Властивість: Абсолютна величина кореляційного моменту двох випадкових величин Х і Y не перевищує середнього їх геометричного дисперсій.

Властивість: Абсолютна величина коефіцієнта кореляції не перевищує одиниці.

Випадкові величини називаються корельованими, якщо їх кореляційний момент відмінний від нуля, та некорельованими, якщо їхній кореляційний момент дорівнює нулю.

Якщо випадкові величини незалежні, то вони й некорельовані, але з некорелюваності не можна зробити висновок про їхню незалежність.

Якщо дві величини залежні, всі вони можуть бути як корелированными, і некоррелированными.

Часто за заданою густиною розподілу системи випадкових величин можна визначити залежність або незалежність цих величин.

Поряд з коефіцієнтом кореляції ступінь залежності випадкових величин можна охарактеризувати й іншою величиною, що називається коефіцієнтом коваріації. Коефіцієнт коваріації визначається формулою:

приклад.Задано щільність розподілу системи випадкових величин Х інезалежні. Зрозуміло, вони також будуть і некорельовані.

Лінійна регресія.

Розглянемо двовимірну випадкову величину ( X , Y ), де X та Y - Залежні випадкові величини.

Представимо приблизно одну випадкову величину як функцію іншої. Точна відповідність неможлива. Вважатимемо, що ця функція лінійна.

Для визначення цієї функції залишається лише знайти постійні величини aі b.

Визначення. Функціяg( X) називається найкращим наближеннямвипадкової величини Y у сенсі методу найменших квадратів, якщо математичне очікування

Набуває найменшого можливого значення. Також функціяg( x) називається середньоквадратичною регресією Y на X.

Теорема. Лінійна середня квадратична регресія Y на Х обчислюється за такою формулою:

у цій формулі m x= M( X випадкової величини Yщодо випадкової величини Х.Ця величина характеризує величину помилки, що утворюється під час заміни випадкової величиниYлінійною функцієюg( X) = aХ+b.

Видно, що якщо r= ± 1, то залишкова дисперсія дорівнює нулю, і, отже, помилка дорівнює нулю та випадкова величинаYточно представляється лінійною функцією від випадкової величини Х.

Пряма середньоквадратична регресія ХнаYвизначається аналогічно за формулою:Х і Yмають щодо один одного лінійні функції регресії, то кажуть, що величини ХіYпов'язані лінійною кореляційною залежністю.

Теорема. Якщо двовимірна випадкова величина ( X, Y) розподілена нормально, то Х і Y пов'язані лінійною кореляційною залежністю.

Є.Г. Hiкіфорова


Виявлений на великому та різноманітному матеріалі феномен стабілізації частот появи випадкових подій спочатку не мав якогось обґрунтування та сприймався як суто емпіричний факт. Першим теоретичним результатом у цій галузі стала опублікована 1713 р. знаменита теорема Бернуллі, яка започаткувала закони великих чисел.

Теорема Бернуллі за своїм змістом є граничною теоремою, тобто твердженням асимптотичного сенсу, що говорить, що буде з ймовірнісними параметрами при великій кількості спостережень. Батьківщиною всіх сучасних численних тверджень такого типу є теорема Бернуллі.

На сьогодні видається, що математичний закон великих чисел є відображенням деякої загальної якості багатьох реальних процесів.

Маючи бажання надати закону великих чисел можливо більшого охоплення, що відповідає далеко ще не вичерпаним потенційним можливостям застосування цього закону, один із найбільших математиків нашого століття А. Н. Колмогоров наступним чином сформулював його суть: закон великих чисел - «загальний принцип, в силу якого сукупне дія великої кількості випадкових факторів призводить до результату, що майже не залежить від випадку».

Таким чином, закон великих чисел має два трактування. Одна - математична, пов'язана з конкретними математичними моделями, формулюваннями, теоріями, і друга - загальніша, що виходить за ці рамки. Друге трактування пов'язана з феноменом освіти, що нерідко відзначається на практиці, в тій чи іншій мірі спрямованої дії на тлі великої кількості прихованих або видимих ​​діючих факторів, що зовні такої безперервності не мають. Прикладами, пов'язаними з другим трактуванням, є ціноутворення на вільному ринку, формування громадської думки з того чи іншого питання.

Відзначивши це загальне трактування закону великих чисел, звернемося до конкретних математичних формулювань цього закону.

Як ми вже сказали вище, першою і важливою для теорії ймовірностей є теорема Бернуллі. Зміст цього математичного факту, що відбиває одну з найважливіших закономірностей навколишнього світу, зводиться до наступного.

Розглянемо послідовність не пов'язаних між собою (тобто незалежних) випробувань, умови проведення яких відтворюються незмінно від випробування до випробування. Результатом кожного випробування є поява або непоява цікавої для нас події А.

Цю процедуру (схему Бернуллі), очевидно, можна визнати типовою для багатьох практичних областей: «хлопчик – дівчинка» у послідовності новонароджених, щоденні метеорологічні спостереження («був дощ – не був»), контроль потоку виробів («нормальне – дефектне») і т.д.

Частина появи події Апри пвипробуваннях ( т А -

частота появи події Ав пвипробуваннях) має зі зростанням птенденцію до стабілізації свого значення це емпіричний факт.

Теорема Бернуллі.Виберемо будь-яке скільки завгодно мале позитивне число е. Тоді

Підкреслимо, що математичний факт, встановлений Бернуллі у певній математичній моделі (у схемі Бернуллі), не слід змішувати з емпірично встановленою закономірністю стійкості частот. Бернуллі не задовольнявся лише твердженням формули (9.1), але, враховуючи потреби практики, оцінив присутній у цій формулі нерівності. До такого трактування ми ще звернемося нижче.

Закон великих чисел Бернуллі був предметом досліджень багатьох математиків, які прагнули уточнити його. Одне з таких уточнень було отримано англійським математиком Муавром і в даний час зветься теореми Муавра - Лапласа. У схемі Бернуллі розглянемо послідовність нормованих величин:

Інтегральна теорема Муавра – Лапласа.Виберемо якісь два числа х (і х 2 .При цьому х, х 7 тоді при п -» °°

Якщо у правій частині формули (9.3) змінну х хспрямувати до нескінченності, то отримана межа, яка залежить тільки від х 2 (індекс 2 при цьому можна прибрати), буде функцією розподілу, вона називається стандартним нормальним розподілом,або законом Гауса.

Права частина формули (9.3) дорівнює у = F(x 2) - F(x x). F(x 2)-> 1 при х 2-> ° ° і F(x,) -> 0 при х, -> За рахунок вибору досить великого

X] > 0 і досить великого за абсолютною величиною X] п отримаємо нерівність:

Зважаючи на формулу (9.2), ми можемо отримати практично достовірні оцінки:

Якщо достовірність у = 0,95 (тобто ймовірність помилки 0,05) може здатися комусь недостатньою, можна «перестрахуватися» і побудувати трохи ширший довірчий інтервал, використовуючи згадане вище правило трьох сигм:

Цьому інтервалу відповідає дуже високий рівень довіри = 0,997 (див. таблиці нормального розподілу).

Розглянемо приклад, що полягає у киданні монети. Нехай ми кинули монету п = 100 разів. Чи може статися, що часто рсильно відрізнятиметься від ймовірності р= 0,5 (у припущенні симетричності монети), наприклад, дорівнюватиме нулю? Для цього треба, щоб герб не випав жодного разу. Така подія теоретично можлива, проте ми вже розраховували подібні ймовірності, для цієї події вона виявиться рівною Ця величина

надзвичайно мала, її порядок – число з 30 нулями після коми. Подія з такою ймовірністю сміливо можна вважати практично неможливою. Які ж відхилення частоти від ймовірності за великої кількості дослідів практично можливі? Використовуючи теорему Муавра - Лапласа, ми відповідаємо це питання так: з ймовірністю у= 0,95 Частина герба рукладається в довірчий інтервал:

Якщо помилка в 0,05 здається чимало, треба збільшити кількість дослідів (кидань монети). При збільшенні пширина довірчого інтервалу зменшується (на жаль, не так швидко, як нам хотілося б, а обернено пропорційно -Jn).Наприклад, при п= 10 000 отримаємо, що рлежить у довірчому інтервалі з довірчою ймовірністю у= 0,95: 0,5±0,01.

Таким чином, ми розібралися кількісно у питанні про наближення до ймовірності.

Тепер знайдемо ймовірність події щодо його частості та оцінимо помилку цього наближення.

Нехай ми зробили велику кількість дослідів п(кидали монету), знайшли частину події Аі хочемо оцінити його ймовірність нар.

Із закону великих чисел пвипливає, що:

Тепер оцінимо практично можливу помилку наближеної рівності (9.7). Для цього скористаємося нерівністю (9.5) у формі:

Для знаходження рпо ртреба розв'язати нерівність (9.8), для цього її треба звести в квадрат і розв'язати відповідне квадратне рівняння. В результаті отримаємо:

де

Для наближеної оцінки рпо рможна у формулі (9.8) рправоруч замінити на рабо ж у формулах (9.10), (9.11) вважати, що

Тоді отримаємо:

Нехай у п= 400 дослідах отримано значення частоти р= 0,25, тоді за рівня довіри у = 0,95 знайдемо:

А якщо нам потрібно знати можливість точніше, з помилкою, скажімо, не більше 0,01? Для цього треба збільшити кількість дослідів.

Вважаючи у формулі (9.12) ймовірність р= 0,25, прирівняємо величину помилки заданій величині 0,01 і отримаємо рівняння щодо п:

Вирішуючи це рівняння, отримаємо п ~ 7500.

Розглянемо тепер ще одне питання: можна пояснити отримане в дослідах відхилення частоти від ймовірності випадковими причинами чи це відхилення показує, що ймовірність не така, якою ми її припускали? Іншими словами, чи підтверджує досвід прийняту статистичну гіпотезу чи, навпаки, вимагає її відхилити?

Нехай, наприклад, кинувши монету п= 800 разів, ми отримаємо частоту появи герба р= 0,52. У нас виникла підозра, що монета несиметрична. Чи обґрунтовано таку підозру? Щоб відповісти на це питання, виходитимемо з припущення, що монета симетрична (Р = 0,5). Знайдемо довірчий інтервал (при довірчій ймовірності у= 0,95) для частоти появи герба. Якщо отримане у досвіді значення р= 0,52 вкладається в цей інтервал - все в нормі, прийнята гіпотеза про симетрію монети не суперечить досвідченим даним. Формула (9.12) при р= 0,5 дає інтервал 0,5±0,035; отримане значення р = 0,52 вкладається в цей інтервал, отже, доведеться "очистити" монету від підозр у несиметрії.

Аналогічними методами користуються у тому, щоб судити: випадкові чи «значні» різні відхилення від математичного очікування, які у випадкових явищах. Наприклад, чи випадково було отримано недовагу в кількох зразках розфасованих товарів чи він вказує на систематичний обман покупців? Чи випадково підвищився відсоток одужань у хворих, які застосовували новий препарат, чи це пов'язано з дією препарату?

Нормальний закон грає особливо важливу роль у теорії ймовірностей та її практичних додатках. Вище ми вже бачили, що випадкова величина - кількість появ певної події в схемі Бернуллі - при п- ° ° зводиться до нормального закону. Однак має місце набагато загальніший результат.

Центральна гранична теорема.Сума великої кількості незалежних (або слабко залежних) випадкових величин, порівнянних між собою по порядку своїх дисперсій, розподілена за нормальним законом незалежно від того, якими були закони розподілу доданків. Наведене твердження - це грубе якісне формулювання центральної граничної теорії. Ця теорема має багато форм, що відрізняються між собою умовами, яким повинні задовольняти випадкові величини, щоб їх сума зі збільшенням числа доданків «нормалізувалася».

Щільність нормального розподілу Дх) виражається формулою:

де а -математичне очікування випадкової величини Х з= V7) – її стандартне відхилення.

Для обчислення ймовірності попадання х у межі інтервалу (х 1? х 2) використовується інтеграл:

Так як інтеграл (9.14) при густині (9.13) не виражається через елементарні функції («не береться»), то для обчислення (9.14) користуються таблицями інтегральної функції розподілу стандартного нормального розподілу, коли а = 0, а = 1 (такі таблиці є у будь-якому підручнику з теорії ймовірностей):

Імовірність (9.14) за допомогою рівняння (10.15) виражається формулою:

приклад. Знайти ймовірність того, що випадкова величина X,має нормальний розподіл із параметрами а, а, відхилиться від свого математичного очікування за модулем не більше ніж на За.

Користуючись формулою (9.16) та таблицею функції розподілу нормального закону, отримаємо:

приклад. У кожному із 700 незалежних досвідів подія Авідбувається з постійною ймовірністю р= 0,35. Знайти ймовірність того, що подія Авідбудеться:

  • 1) точно 270 разів;
  • 2) менше ніж 270 та більше ніж 230 разів;
  • 3) більше ніж 270 разів.

Знаходимо математичне очікування а = прта стандартне відхилення:

випадкової величини – числа появи події А:

Знаходимо центроване та нормоване значення X:

За таблицями щільності нормального розподілу знаходимо f(x):

Знайдемо тепер Р ш (х,> 270) = Р 700 (270 F(1,98) = = 1 - 0,97615 = 0,02385.

Серйозний крок у дослідженнях проблематики великих чисел було зроблено у 1867 р. П. Л. Чебишевим. Він розглянув загальний випадок, коли від незалежних випадкових величин не потрібно нічого, крім існування математичних очікувань та дисперсій.

Нерівність Чебишева.Для будь-якого малого позитивного числа е виконується нерівність:

Теорема Чебишева.Якщо х х, х 2 , ..., х п -попарно незалежні випадкові величини, кожна з яких має математичне очікування E(Xj) = ciта дисперсію D(x,) =), причому дисперсії рівномірно обмежені, тобто. 1,2 ..., то для скільки завгодного малого позитивного числа евиконується співвідношення:

Слідство. Якщо а, =аіо, -о 2 , i= 1,2 ..., то

Завдання. Скільки разів треба кинути монету, щоб із ймовірністю не меншою, ніж у - 0,997, можна було стверджувати, що частина випадання герба перебуватиме в інтервалі (0,499; 0,501)?

Припустимо, що монета симетрична, р - q - 0,5. Застосуємо теорему Чебишева у формулі (9.19) до випадкової величини X -частоті появи герба в пкидання монети. Вище ми вже показували, що X = Х х + Х 2 + ... +Х„,де X t -випадкова величина, яка набирає значення 1, якщо випав герб, і значення 0, якщо випала решка. Отже:

Запишемо нерівність (9.19) для події, протилежної події, вказаній під знаком ймовірності:

У разі [е = 0,001, cj 2 = /?-р)]т - число випадань герба в пкиданнях. Підставляючи ці величини в останню нерівність і враховуючи, що за умовою завдання має виконуватися нерівність, отримаємо:

Наведений приклад ілюструє можливість використання нерівності Чебишева для оцінок ймовірностей тих чи інших ухилень випадкових величин (а також пов'язаних із обчисленням цих ймовірностей завдань типу цього прикладу). Перевагою нерівності Чебишева і те, що вона вимагає знання законів розподілів випадкових величин. Зрозуміло, якщо такий закон відомий, то нерівність Чебишева дає надто грубі оцінки.

Розглянемо цей приклад, але використовуючи той факт, що кидання монети є окремим випадком схеми Бернуллі. Число успіхів (у прикладі - число гербів) підпорядковується біноміальному закону, а за великого пцей закон можна з інтегральної теореми Муавра - Лапласа подати нормальним законом з математичним очікуванням а = пр = п? 0,5 та зі стандартним відхиленням а = yfnpq - 25 = 0,5 л / л. Випадкова ж величина – частота випадання герба – має математичне очікування = 0,5 та стандартне відхилення

Тоді маємо:

З останньої нерівності отримуємо:

З таблиць нормального розподілу знаходимо:

Бачимо, що нормальне наближення дає кількість кидань монети, що забезпечує задану похибку в оцінюванні ймовірності герба, в 37 разів менше порівняно з оцінкою, отриманою з використанням нерівності Чебишева (але нерівність Чебишева дає можливість подібних розрахунків і в тому випадку, коли ми не володіємо інформацією про закон розподілу досліджуваної випадкової величини).

Розглянемо тепер прикладне завдання, яке вирішується за допомогою формули (9.16).

Завдання про конкуренцію. Дві конкуруючі залізничні компанії мають по одному поїзду, що курсує між Москвою та Санкт-Петербургом. Ці поїзди обладнані приблизно однаково, вирушають і прибувають також приблизно в один і той самий час. Припустимо, що п= 1000 пасажирів незалежно і навмання вибирають собі поїзд, тому як математичну модель вибору поїзда пасажирами використовуємо схему Бернуллі з пвипробуваннями та ймовірністю успіху р= 0,5. Компанія має вирішити питання, скільки місць передбачити в поїзді з урахуванням двох взаємно суперечливих умов: з одного боку, не хочеться мати порожні місця, з іншого - не хочеться, щоб з'явилися незадоволені відсутністю місць (наступного разу вони віддадуть перевагу конкуруючим фірмам). Зрозуміло, можна передбачити у поїзді п= 1000 місць, але тоді наперед будуть порожні місця. Випадкова величина – кількість пасажирів у поїзді – в рамках прийнятої математичної моделі з використанням інтегральної теорії Муавра – Лапласа підпорядковується нормальному закону з математичним очікуванням а = пр = п/2 та дисперсією а 2 = npq = п/4послідовно. Імовірність того, що на поїзд прийде більше sпасажирів визначається співвідношенням:

Задамо рівень ризику а, тобто ймовірність того, що прийде більше sпасажирів:

Звідси:

Якщо а- корінь ризику останнього рівняння, що знаходиться за таблицями функції розподілу нормального закону, отримуємо:

Якщо, наприклад, п = 1000, а= 0,01 (такий рівень ризику означає, що кількість місць sбуде достатнім у 99 випадках зі 100), то х а ~ 2,33 та s = 537 місць. При цьому, якщо обидві компанії приймуть однакові рівні ризику а= 0,01, то два поїзди матимуть загалом 1074 місця, 74 з яких будуть порожніми. Аналогічно можна обчислити, що 514 місць було б достатньо 80% всіх випадків, а 549 ​​місць - 999 з 1000 випадків.

Подібні міркування застосовні і в інших завданнях конкуруючого обслуговування. Наприклад, якщо ткінотеатрів змагаються через одних і тих же пглядачів, то слід прийняти р= -. Отримаємо,

що кількість місць sу кінотеатрі має визначатися співвідношенням:

Загальна кількість порожніх місць при цьому дорівнює:

Для а = 0,01, п= 1000 та т= 2, 3, 4 значення цього числа приблизно рівні відповідно 74, 126, 147.

Розглянемо ще один приклад. Нехай поїзд складається з п - 100 вагонів. Вага кожного вагона – випадкова величина з математичним очікуванням а - 65 т та середнім квадратичним очікуванням про = 9 т. Локомотив може везти поїзд, якщо його вага не перевищує 6600 т; інакше доводиться підчіпляти другий локомотив. Потрібно знайти ймовірність того, що цього робити не доведеться.

ваг окремих вагонів: , що мають одне і те ж математичне очікування а - 65 і ту саму дисперсію d -про 2 = 81. За правилом математичних очікувань: Е(х) - 100 * 65 = 6500. За правилом складання дисперсій: D(x) = 100 х 81 = 8100. Виймаючи корінь, знайдемо середнє квадратичне відхилення. Для того, щоб один локомотив міг везти поїзд, потрібно, щоб вага поїзда Xвиявився граничним, тобто потрапив у межі інтервалу (0; 6600). Випадкову величину х - суму 100 доданків - вважатимуться розподіленою нормально. За формулою (9.16) отримаємо:

Звідси випливає, що локомотив «впорається» з поїздом приблизно з ймовірністю 0,864. Зменшимо тепер кількість вагонів у поїзді на два, тобто візьмемо п= 98. Підраховуючи тепер ймовірність того, що локомотив «впорається» з поїздом, отримаємо величину порядку 0,99, тобто практично достовірну подію, хоча для цього довелося забрати всього два вагони.

Отже, якщо маємо справу з сумами великої кількості випадкових величин, можна використовувати нормальний закон. Звичайно, при цьому виникає питання: скільки потрібно скласти випадкових величин, щоб закон розподілу суми вже нормалізувався? Це від того, які закони розподілу доданків. Бувають такі хитромудрі закони, що нормалізація настає тільки при дуже великій кількості доданків. Але ці закони вигадують математики, а природа, як правило, спеціально не влаштовує таких неприємностей. Зазвичай практично для того, щоб можна було користуватися нормальним законом, буває достатньо п'яти-шести доданків.

Швидкість, з якою нормалізується закон розподілу суми однаково розподілених випадкових величин, можна проілюструвати на прикладі випадкових величин з рівномірним розподілом на інтервалі (0, 1). Крива такого розподілу має вигляд прямокутника, що несхоже на нормальний закон. Складемо дві такі незалежні величини – отримаємо випадкову величину, розподілену за так званим законом Сімпсона, графічне зображення якого має вигляд рівнобедреного трикутника. Теж не схоже на нормальний закон, але вже краще. А якщо скласти три такі рівномірно розподілені випадкові величини, вийде крива, що складається з трьох відрізків парабол, дуже схожа на нормальну криву. Якщо ж скласти шість таких випадкових величин, вийде крива, яка не відрізняється від нормальної. На цьому заснований широко застосовуваний метод отримання нормально розподіленої випадкової величини, датчиками рівномірно розподілених (0, 1) випадкових чисел оснащені всі сучасні ЕОМ.

Як один із практичних способів перевірки цього рекомендується наступний спосіб. Будуємо довірчий інтервал для частоти події з рівнем у= 0,997 за правилом трьох сигм:

і якщо обидва його кінця не виходять за межі відрізка (0, 1), то можна користуватися нормальним законом. Якщо ж якась із меж довірчого інтервалу виявляється за межами відрізка (0, 1), то нормальним законом користуватися не можна. Проте в деяких умовах біноміальний закон для частоти деякої випадкової події, якщо він не прагне нормального, то може прагнути іншого закону.

У багатьох додатках як математичну модель випадкового досвіду використовується схема Бернуллі, у якій кількість випробувань пвелике, випадкове подія досить рідко, тобто. р = прЧимало, а й не велике (вагається в інтервалі О -5- 20). У цьому випадку має місце граничне співвідношення:

Формула (9.20) називається пуассонівським наближенням для біномного закону, оскільки ймовірнісний розподіл у її правій частині називається законом Пуассона. Говорять, що пуассонівський розподіл є імовірнісним розподілом для рідкісних подій, оскільки він має місце, коли виконуються межі: п -»°°, р-»0, але X = пров.

приклад. Дні народження. Яка ймовірність Р т (к)того, що у суспільстві з 500 осіб долюдина народилися у день Нового року? Якщо ці 500 осіб обрані навмання, то можна застосувати схему Бернуллі з ймовірністю успіху Р = 1/365. Тоді

Розрахунки ймовірностей для різних додають такі величини: Р у = 0,3484...; Р 2 = 0,2388...; Р 3 = 0,1089...; Р 4 = 0,0372...; Р 5 = 0,0101...; Р 6= 0,0023... Відповідні наближення за формулою Пуассона при X = 500 1/365 = 1,37

дають такі величини: Ру = 0,3481...; Р 2 = 0,2385...; Р ' = 0,1089; Р 4 = 0,0373...; Р 5 = 0,0102...; Р 6 = 0,0023... Усі помилки лише у четвертому десятковому знаку.

Наведемо приклади ситуацій, де можна використати закон рідкісних подій Пуассона.

На телефонній станції неправильне з'єднання відбувається з малою ймовірністю р,зазвичай р~ 0,005. Тоді формула Пуассона дозволяє знайти ймовірність неправильних з'єднань за заданої загальної кількості з'єднань. п ~ 1000, коли Х = пр =1000 0,005 = 5.

При випіканні булочок у тісто кладуть родзинки. Слід очікувати, що завдяки розмішування частота булок з родзинками приблизно підпорядковуватиметься розподілу Пуассона Р п (до, X),де X -щільність родзинок у тесті.

Радіоактивна речовина випромінює я-частинки. Подія полягає в тому, що число й-часток, що досягають протягом часу tзаданої ділянки простору, що приймає фіксоване значення до,підпорядковується закону Пуассона.

Число живих клітин із зміненими хромосомами під дією рентгенівських променів слідує розподілу Пуассона.

Отже, закони великих чисел дозволяють вирішувати завдання математичної статистики, пов'язані з оцінюванням невідомих ймовірностей елементарних результатів випадкового досвіду. Завдяки цим знанням ми робимо методи теорії ймовірностей практично змістовними та корисними. Закони великих чисел дозволяють також вирішувати завдання отримання інформації про невідомі елементарні ймовірності та в іншій формі - формі перевірки статистичних гіпотез.

Розглянемо докладніше формулювання та ймовірнісний механізм розв'язання задач перевірки статистичних гіпотез.

Функція розподілу випадкової величини та її властивості.

Функцією розподілувипадкової величини Х називається функція F(Х), що виражає для кожного х ймовірність того, що випадкова величина Х прийме значення менше х: F(x)=P(X

Функцію F(x)іноді називають інтегральною функцієюрозподілу або інтегральним законом розподілу

Властивості функції розподілу:

1.Функція розподілу випадкової величини є невід'ємною функцією, укладеною між нулем і одиницею:

0 ≤ F(x) ≤ 1.

2. Функція розподілу випадкової величини є незменшуюча функція по всій числової осі.

3. На мінус нескінченності функція розподілу дорівнює нулю, плюс нескінченності дорівнює одиниці, тобто: F(-∞)= , F(+∞)= .

4.Вероятность потрапляння випадкової величини до інтервалу [х1,х2) (включаючи х1) дорівнює прирощенню її функції розподілу цьому інтервалі, тобто. Р(х 1 ≤ Х< х 2) = F(x 2) - F(x 1).


Нерівність Маркова та Чебишева

Нерівність Маркова

Теорема: Якщо випадкова величина Х приймає тільки невід'ємні значення і має математичне очікування, то для будь-якого позитивного числа А правильна рівність: P(x>A) ≤ .

Оскільки події Х > А та Х ≤ А протилежні, то замінюючи Р(Х >А) виражаємо 1 - Р(Х ≤ А), прийдемо до іншої форми нерівності Маркова: P(X ≥ A) ≥1 - .

Нерівність Маркова застосовується до будь-яких невід'ємних випадкових величин.

Нерівність Чебишева

Теорема:Для будь-якої випадкової величини, яка має математичне очікування та дисперсію, справедлива нерівність Чебишева:

Р (|Х – a| > ε) ≤ D(X)/ε 2 або Р (|Х – a| ≤ ε) ≥ 1 – DX/ε 2 де а= М(Х), ε>0.


Закон великих чисел «у формі» теореми Чебишева.

Теорема Чебишева:Якщо дисперсії nнезалежних випадкових величин Х1, Х2,…. Х nобмежені однієї і тієї ж постійної, то при необмеженому збільшенні числа nсередня арифметична випадкових величин сходиться за ймовірністю середньої арифметичної їх математичних очікувань а 1 ,а 2 ….,а n, тобто .

Сенс закону великих чисел полягає в тому, що середні значення випадкових величин прагнуть їхнього математичного очікування при n→ ∞ ймовірно. Відхилення середніх значень від математичного очікування стає скільки завгодно малим з ймовірністю, близькою до одиниці, якщо n досить велике. Іншими словами, можливість будь-якого відхилення середніх значень від аскільки завгодно мала зі зростанням n.



30. Теорема Бернуллі.

Теорема Бернуллі:Частина події в nповторних незалежних випробуваннях, у кожному з яких воно може статися з однією і тією ж ймовірністю р, при необмеженому збільшенні числа nсходитися за ймовірністю до ймовірності р цієї події в окремому випробуванні: \

Теорема Бернуллі є наслідком теореми Чебишева, бо частину події можна як середню арифметичну n незалежних альтернативних випадкових величин, мають той самий закон розподілу.

18. Математичне очікування дискретної та безперервної випадкової величини та їх властивості.

Математичним очікуваннямназивається сума творів всіх її значень на відповідні їм ймовірності

Для дискретної випадкової величини:

Для безперервної випадкової величини:

Властивості математичного очікування:

1. Математичне очікування постійної величини дорівнює найпостійнішій: М(С)=С

2. Постійний множник можна винести за знак математичного очікування, тобто М(кХ)=кМ(Х).

3. Математичне очікування алгебраїчної суми кінцевого числа випадкових величин так само сумі їх математичних очікувань, тобто. M(X±Y)=M(X)±M(Y).

4. Математичне очікування твору кінцевого числа незалежних випадкових величин дорівнює твору їх математичних очікувань: M(XY)=M(X)*M(Y).

5. Якщо всі значення випадкової величини збільшити (зменшити) на постійну, то на цю ж постійну З збільшитися (зменшитися) математичне очікування цієї випадкової величини: M(X±C)=M(X)±C.

6. Математичне очікування відхилення випадкової величини від її математичного очікування дорівнює нулю: M=0.

Якщо явище стійкості середніхмає місце насправді, то в математичній моделі, за допомогою якої ми вивчаємо випадкові явища, повинна існувати теорема, що відображає цей факт.
У разі цієї теореми введемо обмеження на випадкові величини X 1 , X 2 , …, X n:

а) кожна випадкова величина Х iмає математичне очікування

M(Х i) = a;

б) дисперсія кожної випадкової величини кінцева або, можна сказати, що дисперсії обмежені зверху одним і тим самим числом, наприклад З, тобто.

D(Х i) < C, i = 1, 2, …, n;

в) випадкові величини попарно незалежні, тобто будь-які дві X iі X jпри i¹ jнезалежні.

Тоді, очевидно

D(X 1 + X 2 + … + X n)=D(X 1) + D(X 2) + ... + D(X n).

Сформулюємо закон великих чисел у вигляді Чебишева.

Теорема Чебишева:при необмеженому збільшенні числа nнезалежних випробувань « середня арифметична значень випадкової величини, що спостерігаються, сходиться по ймовірності до її математичного очікування. », тобто для будь-якого позитивного ε

Р(| а| < ε ) = 1. (4.1.1)

Сенс вираження «Середня арифметична = сходиться ймовірно до a» полягає в тому, що ймовірність того, що буде скільки завгодно мало відрізнятися від a, необмежено наближається до 1 зі зростанням числа n.

Доведення.Для кінцевого числа nнезалежних випробувань застосуємо нерівність Чебишева для випадкової величини = :

Р(|- M()| < ε ) ≥ 1 – . (4.1.2)

Враховуючи обмеження а – в, обчислимо M( ) та D( ):

M( ) = = = = = = а;

D( ) = = = = = = .

Підставляючи M( ) та D( ) у нерівність (4.1.2), отримаємо

Р(| а| < ε )≥1 .

Якщо в нерівності (4.1.2) взяти скільки завгодно мале ε >0і n® ¥, то отримаємо

що й доводить теорему Чебишева.

З розглянутої теореми випливає важливий практичний висновок: невідоме значення математичного очікування випадкової величини ми маємо право замінити середнім арифметичним значенням, отриманим за досить великому числу дослідів. При цьому, чим більше дослідів для обчислення, тим з більшою ймовірністю (надійністю) очікується, що пов'язана з цією заміною помилка ( – а) не перевершить задану величину ε .

З іншого боку, можна вирішувати інші практичні завдання. Наприклад, за значенням ймовірності (надійності) Р=Р(| а|< ε )і максимальної припустимої помилки ε визначити необхідну кількість дослідів n; по Рі пвизначити ε; по ε і пвизначити межу ймовірності події | а |< ε.

Окремий випадок. Нехай при nвипробуваннях спостерігаються nзначень випадкової величини X,має математичне очікування M(X) та дисперсію D(X). Отримані значення можна як випадкові величини Х 1 ,Х 2 ,Х 3 , ... ,Х n,. Це слід розуміти так: серія з пвипробувань проводиться неодноразово, тому в результаті i-го випробування, i= l, 2, 3, ..., п, у кожній серії випробувань з'явиться те чи інше значення випадкової величини X, не відоме заздалегідь. Отже, i-e значення x iвипадкової величини, отримане в i-м випробуванні змінюється випадковим чином, якщо переходити від однієї серії випробувань до іншої. Таким чином, кожне значення x iможна вважати випадковою величиною X i.


Припустимо, що випробування задовольняють наступним вимогам:

1. Випробування незалежні. Це означає, що результати Х 1 , Х 2 ,
Х 3 , ..., Х nвипробувань – незалежні випадкові величини.

2. Випробування проводяться в однакових умовах - це означає, з точки зору теорії ймовірностей, що кожна з випадкових величин Х 1 ,Х 2 ,Х 3 , ... ,Х nмає такий самий закон розподілу, що і вихідна величина Xтому M(X i) = M(XD(X i) = D(X), i = 1, 2, .... п.

Враховуючи вищезазначені умови, отримаємо

Р(| а| < ε )≥1 . (4.1.3)

Приклад 4.1.1. Xдорівнює 4. Скільки потрібно зробити незалежних дослідів, щоб із ймовірністю не менше 0,9 можна було очікувати, що середнє арифметичне значення цієї випадкової величини відрізнятиметься від математичного очікування менш ніж на 0,5?

Рішення. За умовою завдання ε = 0,5; Р(| а|< 0,5) 0,9. Застосувавши формулу (4.1.3) для випадкової величини Х, отримаємо

P(|- M(X)| < ε ) ≥ 1 .

Зі співвідношення

1 = 0,9

визначимо

п= = = 160.

Відповідь: потрібно зробити 160 незалежних дослідів.

Якщо припустити, що середня арифметична розподілена нормально, то отримуємо:

Р(| а|< ε )= 2Φ () 0,9.

Звідки, скориставшись таблицею функції Лапласа, отримаємо
1,645, або 6,58, тобто. n ≥49.

Приклад4.1.2.Дисперсія випадкової величини Хдорівнює D( Х) = 5. Зроблено 100 незалежних дослідів, за якими обчислено . Замість невідомого значення математичного очікування априйнято . Визначити максимальну величину помилки, що допускається при цьому з ймовірністю не менше 0,8.

Рішення.За умовою завдання n= 100, Р(| а|< ε ) ≥0,8. Застосуємо формулу (4.1.3)

Р(| а|< ε ) ≥1 .

Зі співвідношення

1 = 0,8

визначимо ε :

ε 2 = = = 0,25.

Отже, ε = 0,5.

Відповідь: максимальна величина помилки ε = 0,5.

4.2. Закон великих чисел у формі Бернуллі

Хоча основу будь-якого статистичного висновку лежить поняття ймовірності, ми лише у випадках можемо визначити ймовірність події безпосередньо. Іноді цю ймовірність можна встановити з міркувань симетрії, рівної можливості тощо, але універсального методу, який дозволяв би для довільної події вказати його ймовірність, немає. Теорема Бернуллі дає можливість наближеної оцінки ймовірності, якщо для події, що цікавить нас. Аможна проводити повторні незалежні випробування. Нехай зроблено пнезалежних випробувань, у кожному з яких ймовірність появи деякої події Апостійна і рівна нар.

Теорема Бернуллі.При необмеженому зростанні кількості незалежних випробувань пвідносна частота появи події Асходиться ймовірно до ймовірності pпояви події А,Т. е.

P(½ - p½≤ ε) = 1, (4.2.1)

де ε - скільки завгодно мале позитивне число.

Для кінцевого nза умови, що , нерівність Чебишева для випадкової величини матиме вигляд:

P(| - p |< ε ) 1 .(4.2.2)

Доведення.Застосуємо теорему Чебишева. Нехай X i- Число появи події Ав i-ом випробуванні, i= 1, 2, . . . , n. Кожна з величин X iможе прийняти лише два значення:

X i= 1 (подія Анастало) з ймовірністю p,

X i= 0 (подія Ане настало) з ймовірністю q= 1- p.

Нехай Y n=. Сума X 1 + X 2 + … + X nдорівнює числу mпояви події Ав nвипробуваннях (0 m n), а значить, Y n= - Відносна частота появи події Ав nвипробуваннях. Математичне очікування та дисперсія X iрівні відповідно:

M( ) = 1∙p + 0∙q = p,

Приклад 4.2.1.З метою встановлення частки шлюбу продукції було перевірено за схемою зворотної вибірки 1000 одиниць. Яка ймовірність того, що встановлена ​​цією вибіркою частка шлюбу за абсолютною величиною відрізнятиметься від частки шлюбу по всій партії не більше ніж на 0,01, якщо відомо, що в середньому на кожні 10 000 виробів припадає 500 бракованих?

Рішення.За умовою завдання кількість незалежних випробувань n= 1000;

p= = 0,05; q= 1 – p= 0,95; ε = 0,01.

Застосовуючи формулу (4.2.2), отримаємо

P(| p|< 0,01) 1 – = 1 – = 0,527.

Відповідь: з ймовірністю не менше 0,527 очікується, що вибіркова частка шлюбу (відносна частота появи шлюбу) відрізнятиметься від частки шлюбу у всій продукції (від ймовірності шлюбу) не більше ніж на 0,01.

Приклад 4.2.2.При штампуванні деталей можливість шлюбу становить 0,05. Скільки потрібно перевірити деталей, щоб із ймовірністю не менше 0,95 можна було очікувати, що відносна частота бракованих виробів відрізнятиметься від ймовірності шлюбу менш ніж на 0,01?

Рішення.За умовою завдання р= 0,05; q= 0,95; ε = 0,01;

P(| p|<0,01) 0,95.

З рівності 1 = 0,95 знаходимо n:

n= = =9500.

Відповідь: необхідно перевірити 9500 деталей.

Зауваження.Оцінки необхідного числа спостережень, отримані під час застосування теореми Бернуллі (чи Чебишева), дуже перебільшено. Існують більш точні оцінки, запропоновані Бернштейном і Хінчіним, але потребують складнішого математичного апарату. Щоб уникнути перебільшення оцінок, іноді користуються формулою Лапласа

P(| p|< ε ) ≈ 2Φ .

Недоліком цієї формули є відсутність оцінки похибки, що допускається.



Останні матеріали розділу:

Основний план дій та способи виживання Вночі тихо, вдень вітер посилюється, а надвечір затихає
Основний план дій та способи виживання Вночі тихо, вдень вітер посилюється, а надвечір затихає

5.1. Поняття про місце існування людини. Нормальні та екстремальні умови життєпроживання. Виживання 5.1.1. Поняття про довкілля людини...

Англійські звуки для дітей: читаємо транскрипцію правильно
Англійські звуки для дітей: читаємо транскрипцію правильно

А ви знали, що англійський алфавіт складається з 26 літер та 46 різних звуків? Одна й та сама буква може передавати кілька звуків одночасно.

Контрольний тест з історії на тему Раннє Середньовіччя (6 клас)
Контрольний тест з історії на тему Раннє Середньовіччя (6 клас)

М.: 2019. – 128 с. М.: 2013. – 160 с. Посібник включає тести з історії Середніх віків для поточного та підсумкового контролю та відповідає змісту...