Законът за големите числа. Централна гранична теорема

Не губете.Абонирайте се и получете линк към статията в имейла си.

Взаимодействайки ежедневно в работа или учене с числа и числа, много от нас дори не подозират, че има много интересен закон на големите числа, използван например в статистиката, икономиката и дори психологическите и педагогическите изследвания. Отнася се до теорията на вероятностите и казва, че средноаритметичната стойност на всяка голяма извадка от фиксирано разпределение е близка до математическото очакване на това разпределение.

Вероятно сте забелязали, че не е лесно да се разбере същността на този закон, особено за тези, които не са особено приятелски настроени към математиката. Въз основа на това бихме искали да говорим за това на прост език (доколкото е възможно, разбира се), така че всеки да може поне приблизително да разбере какво е това. Това знание ще ви помогне да разберете по-добре някои математически модели, да станете по-ерудирани и да повлияете положително.

Концепции на закона за големите числа и неговото тълкуване

В допълнение към горното определение на закона за големите числа в теорията на вероятностите можем да дадем неговата икономическа интерпретация. В този случай той представлява принципа, че честотата на определен вид финансова загуба може да бъде предвидена с висока степен на сигурност, когато има високо ниво на загуби от такъв тип като цяло.

Освен това, в зависимост от нивото на конвергенция на характеристиките, можем да различим слабите и засилените закони на големите числа. Говорим за слабо, когато съществува конвергенция във вероятността, и за силно, когато съществува конвергенция в почти всичко.

Ако го тълкуваме малко по-различно, тогава трябва да кажем следното: винаги е възможно да се намери такъв краен брой опити, където с всяка предварително програмирана вероятност, по-малка от единица, относителната честота на възникване на дадено събитие ще се различава много малко от неговата вероятност.

По този начин общата същност на закона за големите числа може да бъде изразена по следния начин: резултатът от сложното действие на голям брой еднакви и независими случайни фактори ще бъде такъв резултат, който не зависи от случайността. И казано на още по-прост език, тогава в закона на големите числа, количествените закони на масовите явления ще се проявят ясно само когато има голям брой от тях (затова законът на големите числа се нарича закон).

От това можем да заключим, че същността на закона е, че в числата, които се получават чрез масово наблюдение, има някаква коректност, която е невъзможно да се открие в малък брой факти.

Същността на закона за големите числа и неговите примери

Законът за големите числа изразява най-общите закономерности на случайното и необходимото. Когато случайните отклонения се "гасят" взаимно, средните, определени за една и съща структура, приемат формата на типични. Те отразяват действието на съществени и постоянни факти при конкретните условия на времето и мястото.

Закономерностите, определени от закона за големите числа, са силни само когато представляват масови тенденции и не могат да бъдат закони за отделни случаи. Така влиза в сила принципът на математическата статистика, който гласи, че комплексното действие на редица случайни фактори може да доведе до неслучаен резултат. И най-яркият пример за действието на този принцип е сближаването на честотата на възникване на случайно събитие и неговата вероятност, когато броят на опитите се увеличи.

Нека си спомним обичайното хвърляне на монета. Теоретично главите и опашките могат да изпаднат с еднаква вероятност. Това означава, че ако, например, монета бъде хвърлена 10 пъти, 5 от тях трябва да излязат глави и 5 трябва да излязат глави. Но всеки знае, че това почти никога не се случва, защото съотношението на честотата на главите и опашките може да бъде 4 към 6, и 9 към 1, и 2 към 8 и т.н. Въпреки това, с увеличаване на броя на хвърлянията на монети, например до 100, вероятността да паднат глави или опашки достига 50%. Ако теоретично се проведат безкраен брой такива експерименти, вероятността монета да падне от двете страни винаги ще клони към 50%.

Как точно ще падне монетата се влияе от огромен брой случайни фактори. Това е позицията на монетата в дланта на ръката ви и силата, с която се прави хвърлянето, и височината на падане, и скоростта му и т.н. Но ако има много експерименти, независимо от това как действат факторите, винаги може да се твърди, че практическата вероятност е близка до теоретичната вероятност.

И ето още един пример, който ще ви помогне да разберете същността на закона за големите числа: да предположим, че трябва да оценим нивото на доходите на хората в определен регион. Ако разгледаме 10 наблюдения, при които 9 души получават 20 хиляди рубли, а 1 човек - 500 хиляди рубли, средноаритметичната стойност ще бъде 68 хиляди рубли, което, разбира се, е малко вероятно. Но ако вземем предвид 100 наблюдения, където 99 души получават 20 хиляди рубли, а 1 човек - 500 хиляди рубли, тогава при изчисляване на средноаритметичното получаваме 24,8 хиляди рубли, което вече е по-близо до реалното състояние на нещата. Чрез увеличаване на броя на наблюденията ще принудим средната стойност да клони към истинската стойност.

Поради тази причина, за да се приложи законът за големите числа, първо е необходимо да се събере статистически материал, за да се получат верни резултати чрез изучаване на голям брой наблюдения. Ето защо е удобно този закон да се използва отново в статистиката или социалната икономика.

Обобщаване

Значението на факта, че законът за големите числа работи, е трудно да се надценява за всяка област на научното познание и особено за научните разработки в областта на теорията на статистиката и методите на статистическото познание. Действието на закона е от голямо значение и за самите изследвани обекти с техните масови закономерности. Почти всички методи за статистическо наблюдение се основават на закона за големите числа и принципа на математическата статистика.

Но дори и без да вземем предвид науката и статистиката като такива, можем спокойно да заключим, че законът за големите числа не е просто феномен от областта на теорията на вероятностите, а феномен, с който се сблъскваме почти всеки ден в живота си.

Надяваме се, че сега същността на закона за големите числа ви е станала по-ясна и можете лесно и просто да го обясните на някой друг. И ако темата за математиката и теорията на вероятностите е интересна за вас по принцип, тогава препоръчваме да прочетете за и. Също така се запознайте с и. И, разбира се, обърнете внимание на нашия, защото след като го преминете, вие не само ще овладеете нови техники на мислене, но и ще подобрите когнитивните си способности като цяло, включително математическите.

Закон за големите числа

Практиката на изучаване на случайни явления показва, че въпреки че резултатите от отделни наблюдения, дори и тези, проведени при едни и същи условия, могат да се различават значително, в същото време средните резултати за достатъчно голям брой наблюдения са стабилни и слабо зависят от резултати от индивидуални наблюдения. Теоретичната обосновка за това забележително свойство на случайните явления е законът за големите числа. Общото значение на закона за големите числа е, че съвместното действие на голям брой случайни фактори води до резултат, който е почти независим от случайността.

Централна гранична теорема

Теоремата на Ляпунов обяснява широкото разпространение на нормалния закон за разпределение и обяснява механизма на неговото формиране. Теоремата ни позволява да твърдим, че всеки път, когато случайна променлива се образува в резултат на добавяне на голям брой независими случайни променливи, чиито дисперсии са малки в сравнение с дисперсията на сумата, законът за разпределение на тази случайна променлива се оказва да бъде практически нормален закон. И тъй като случайните променливи винаги се генерират от безкраен брой причини и най-често никоя от тях няма вариация, сравнима с вариацията на самата случайна променлива, повечето от случайните променливи, срещани в практиката, са подчинени на нормалния закон за разпределение.

Нека се спрем по-подробно на съдържанието на теоремите на всяка от тези групи.

В практическите изследвания е много важно да се знае в какви случаи е възможно да се гарантира, че вероятността за събитие ще бъде или достатъчно малка, или произволно близка до единица.

Под закон на големите числаи се разбира като набор от изречения, в които се посочва, че с вероятност, произволно близка до единица (или нула), ще се случи събитие, което зависи от много голям, неопределено нарастващ брой случайни събития, всяко от които има само леко влияние върху него.

По-точно, законът на големите числа се разбира като набор от изречения, в които се посочва, че с вероятност, произволно близка до единица, отклонението на средното аритметично на достатъчно голям брой случайни променливи от постоянна стойност, аритметичното средната стойност на техните математически очаквания, няма да надвишава дадено произволно малко число.

Отделни, единични явления, които наблюдаваме в природата и в социалния живот, често се явяват случайни (например регистрирана смърт, пол на родено дете, температура на въздуха и др.) поради факта, че много фактори, които не са свързани с същността на възникването или развитието на дадено явление. Невъзможно е да се предвиди общото им въздействие върху наблюдаваното явление и те се проявяват по различен начин в отделните явления. Въз основа на резултатите от едно явление не може да се каже нищо за моделите, присъщи на много такива явления.

Въпреки това, отдавна е отбелязано, че средната аритметична стойност на числените характеристики на определени характеристики (относителната честота на възникване на събитие, резултатите от измерванията и т.н.) с голям брой повторения на експеримента е обект на много леки колебания. В средното се проявява закономерността, присъща на същността на явленията, в него взаимно се елиминира влиянието на отделните фактори, които правят резултатите от индивидуалните наблюдения случайни. Теоретично това поведение на средната стойност може да се обясни с помощта на закона за големите числа. Ако са изпълнени някои много общи условия по отношение на случайните променливи, тогава стабилността на средноаритметичната стойност ще бъде практически сигурно събитие. Тези условия съставляват най-важното съдържание на закона за големите числа.

Първият пример за действието на този принцип може да бъде сближаването на честотата на възникване на случайно събитие с неговата вероятност с увеличаване на броя на опитите - факт, установен в теоремата на Бернули (швейцарски математик Якоб Бернули(1654-1705)).Теоремата на Бернул е една от най-простите форми на закона за големите числа и често се използва в практиката. Например, честотата на поява на което и да е качество на респондента в извадката се приема като оценка на съответната вероятност).

Изключителен френски математик Симеон Дени Поасон(1781-1840) обобщи тази теорема и я разшири до случая, когато вероятността от събития в даден опит варира независимо от резултатите от предишни опити. Той беше и първият, който използва термина "закон за големите числа".

Велик руски математик Пафнутий Лвович Чебишев(1821 - 1894) доказа, че законът за големите числа действа в явления с всякакви вариации и също така се простира до редовността на средната стойност.

По-нататъшно обобщение на теоремите на закона за големите числа е свързано с имената А.А.Марков, С.Н.Бернштейн, А.Я.Хинчин и А.Н.Колмгоров.

Общата съвременна формулировка на проблема, формулирането на закона за големите числа, развитието на идеи и методи за доказване на теореми, свързани с този закон, принадлежат на руски учени П. Л. Чебишев, А. А. Марков и А. М. Ляпунов.

НЕРАВЕНСТВОТО НА ЧЕБИШЕВ

Нека първо разгледаме спомагателни теореми: лемата и неравенството на Чебишев, които могат да се използват за лесно доказване на закона за големите числа във формата на Чебишев.

Лема (Чебишев).

Ако няма отрицателни стойности на случайната променлива X, тогава вероятността тя да приеме някаква стойност, която надвишава положителното число A, не е по-голяма от дроб, чийто числител е математическото очакване на случайната променлива, а знаменателят е числото А:

Доказателство.Нека е известен законът за разпределение на случайната променлива X:

(i = 1, 2, ..., ), и считаме, че стойностите на случайната променлива са подредени във възходящ ред.

Във връзка с числото A, стойностите на случайната променлива са разделени на две групи: някои не надвишават A, докато други са по-големи от A. Да предположим, че първата група включва първите стойности на случайната променлива ( ).

Тъй като , Тогава всички членове на сумата са неотрицателни. Следователно, изхвърляйки първите членове в израза, получаваме неравенството:

Тъй като

,

тогава

Q.E.D.

Случайните променливи могат да имат различни разпределения с едни и същи математически очаквания. За тях обаче лемата на Чебишев ще даде същата оценка на вероятността за един или друг резултат от теста. Този недостатък на лемата е свързан с нейната общност: невъзможно е да се постигне по-добра оценка за всички случайни променливи наведнъж.

Неравенството на Чебишев .

Вероятността отклонението на случайна променлива от нейното математическо очакване да надхвърли по абсолютна стойност положително число

Доказателство.Тъй като произволна променлива не приема отрицателни стойности, прилагаме неравенството от лемата на Чебишев за случайна променлива за :


Q.E.D.

Последица. Тъй като

,

тогава

- друга форма на неравенството на Чебишев

Приемаме без доказателство факта, че лемата и неравенството на Чебишев са верни и за непрекъснати случайни променливи.

Неравенството на Чебишев е в основата на качествените и количествените твърдения на закона за големите числа. Той определя горната граница на вероятността отклонението на стойността на случайна променлива от нейното математическо очакване да е по-голямо от дадено число. Забележително е, че неравенството на Чебишев дава оценка на вероятността за събитие за случайна променлива, чието разпределение е неизвестно, известни са само нейните математически очаквания и дисперсия.

Теорема. (Закон за големите числа във формата на Чебишев)

Ако дисперсиите на независими случайни променливи са ограничени от една константа C и техният брой е достатъчно голям, тогава вероятността е произволно близка до единица, че отклонението на средното аритметично на тези случайни променливи от средното аритметично на техните математически очаквания няма да бъде надвишава даденото положително число по абсолютна стойност, колкото и малко да е то, нито е било:

.

Приемаме теоремата без доказателство.

Следствие 1. Ако независимите случайни променливи имат еднакви, равни математически очаквания, дисперсиите им са ограничени от една и съща константа C и техният брой е достатъчно голям, тогава, без значение колко малко е даденото положително число, вероятността отклонението на средната стойност е произволно близка до единица аритметика на тези случайни променливи от няма да надвишава по абсолютна стойност .

Фактът, че приблизителната стойност на неизвестно количество се приема като средноаритметично от резултатите от достатъчно голям брой измервания, направени при едни и същи условия, може да бъде оправдан от тази теорема. Всъщност резултатите от измерването са случайни, тъй като се влияят от много случайни фактори. Липсата на системни грешки означава, че математическите очаквания на резултатите от отделните измервания са еднакви и еднакви. Следователно, според закона за големите числа, средноаритметичната стойност на достатъчно голям брой измервания практически произволно ще се различава малко от истинската стойност на желаната стойност.

(Припомнете си, че грешките се наричат ​​систематични, ако изкривяват резултата от измерването в една и съща посока според повече или по-малко ясен закон. Те включват грешки, които се появяват в резултат на несъвършенството на инструментите (инструментални грешки), поради лични характеристики на наблюдателя (лични грешки) и др.)

Следствие 2 . (Теорема на Бернули.)

Ако вероятността за настъпване на събитие А във всеки от независимите опити е постоянна и техният брой е достатъчно голям, тогава вероятността е произволно близка до единица, че честотата на настъпване на събитието се различава произволно малко от вероятността за неговото събитие:

Теоремата на Бернули гласи, че ако вероятността за събитие е една и съща във всички опити, тогава с увеличаване на броя на опитите честотата на събитието клони към вероятността на събитието и престава да бъде случайна.

На практика експериментите са сравнително редки, при които вероятността за настъпване на събитие във всеки експеримент е непроменена, по-често тя е различна в различните експерименти. Теоремата на Поасон се отнася до тестова схема от този тип:

Следствие 3 . (Теорема на Поасон.)

Ако вероятността за възникване на събитие в -тест не се променя, когато станат известни резултатите от предишни опити и техният брой е достатъчно голям, тогава вероятността честотата на възникване на събитие да се различава произволно малко от средните аритметични вероятности е произволно близо до единица:

Теоремата на Поасон гласи, че честотата на събитие в поредица от независими опити клони към средноаритметичната стойност на неговите вероятности и престава да бъде случайна.

В заключение отбелязваме, че нито една от разгледаните теореми не дава нито точна, нито дори приблизителна стойност на желаната вероятност, а е посочена само нейната долна или горна граница. Следователно, ако се изисква да се установи точната или поне приблизителната стойност на вероятностите за съответните събития, възможностите на тези теореми са много ограничени.

Приблизителни вероятности за големи стойности могат да бъдат получени само с помощта на гранични теореми. В тях или се налагат допълнителни ограничения върху случайните променливи (какъвто е случаят например в теоремата на Ляпунов), или се разглеждат случайни променливи от определен тип (например в интегралната теорема на Моавр-Лаплас).

Теоретичното значение на теоремата на Чебишев, която е много обща формулировка на закона за големите числа, е голяма. Ако обаче я приложим към въпроса дали е възможно да приложим закона за големите числа към поредица от независими случайни променливи, тогава, ако отговорът е да, теоремата често ще изисква да има много повече случайни променливи от е необходимо, за да влезе в сила законът за големите числа. Този недостатък на теоремата на Чебишев се обяснява с нейния общ характер. Следователно е желателно да има теореми, които биха посочили по-точно долната (или горната) граница на желаната вероятност. Те могат да бъдат получени чрез налагане на някои допълнителни ограничения върху случайните променливи, които обикновено са изпълнени за случайни променливи, срещани в практиката.

БЕЛЕЖКИ КЪМ СЪДЪРЖАНИЕТО НА ЗАКОНА ЗА ГОЛЕМИТЕ ЧИСЛА

Ако броят на случайните променливи е достатъчно голям и те отговарят на някои много общи условия, тогава, независимо как са разпределени, практически е сигурно, че тяхната средна аритметична стойност се отклонява произволно малко от постоянна стойност - средната аритметична на техните математически очаквания, т.е. е практически постоянна. Такова е съдържанието на теоремите, свързани със закона за големите числа. Следователно законът за големите числа е един от изразите на диалектическата връзка между случайността и необходимостта.

Могат да се дадат много примери за появата на нови качествени състояния като проява на закона на големите числа, предимно сред физическите явления. Нека разгледаме един от тях.

Според съвременните концепции газовете се състоят от отделни частици-молекули, които са в хаотично движение и е невъзможно да се каже точно къде ще бъде в даден момент и с каква скорост ще се движи тази или онази молекула. Въпреки това, наблюденията показват, че общият ефект на молекулите, като например налягането на газ върху

съдова стена, се проявява с удивително постоянство. Определя се от броя на ударите и силата на всеки от тях. Въпреки че първото и второто са въпрос на случайност, уредите не отчитат флуктуации в налягането на газ при нормални условия. Това се обяснява с факта, че поради огромния брой молекули, дори и в най-малките обеми

промяна в налягането със забележима величина е почти невъзможна. Следователно физическият закон, който гласи за постоянството на налягането на газа, е проявление на закона за големите числа.

Постоянността на налягането и някои други характеристики на газ по едно време послужиха като сериозен аргумент срещу молекулярната теория за структурата на материята. Впоследствие те се научиха да изолират сравнително малък брой молекули, като гарантираха, че влиянието на отделните молекули все още остава и по този начин законът за големите числа не може да се прояви достатъчно. Тогава беше възможно да се наблюдават колебания в налягането на газа, потвърждавайки хипотезата за молекулярната структура на материята.

Законът за големите числа е в основата на различни видове застраховки (застраховки живот на хора за различни периоди, имущество, добитък, реколта и др.).

При планирането на асортимента от потребителски стоки се взема предвид търсенето им от населението. В това изискване се проявява действието на закона за големите числа.

Извадковият метод, широко използван в статистиката, намира своето научно оправдание в закона за големите числа. Например, качеството на пшеницата, донесена от колхоза до пункта за закупуване, се оценява по качеството на зърната, случайно уловени в малка мярка. В мярката има малко зърна в сравнение с цялата партида, но във всеки случай мярката е избрана така, че в нея да има достатъчно зърна за

проявление на закона за големите числа с точност, която удовлетворява потребността. Ние имаме право да вземем съответните показатели в пробата като показатели за плевелност, съдържание на влага и средно тегло на зърната от цялата партида входящо зърно.

По-нататъшните усилия на учените за задълбочаване на съдържанието на закона за големите числа бяха насочени към получаване на най-общите условия за приложимостта на този закон към последователност от случайни променливи. Дълго време нямаше фундаментални успехи в тази посока. След П. Л. Чебишев и А. А. Марков едва през 1926 г. съветският академик А. Н. Колмогоров успява да получи необходимите и достатъчни условия, за да може законът за големите числа да бъде приложим към последователност от независими случайни величини. През 1928 г. съветският учен А. Я. Хинчин показа, че достатъчно условие за приложимостта на закона за големите числа към последователност от независими еднакво разпределени случайни величини е наличието на тяхното математическо очакване.

За практиката е изключително важно да се изясни напълно въпросът за приложимостта на закона за големите числа към зависимите случайни променливи, тъй като явленията в природата и обществото са взаимно зависими и взаимно се обуславят. Беше посветена много работа за изясняване на ограниченията, които трябва да бъдат наложени

в зависими случайни променливи, така че законът за големите числа да може да се приложи към тях, най-важните от които са тези на изключителния руски учен А. А. Марков и големите съветски учени С. Н. Бернштейн и А. Я. Хинчин.

Основният резултат от тези документи е, че законът за големите числа е приложим към зависими случайни променливи, ако съществува само силна зависимост между случайни променливи с близки числа и между случайни променливи с отдалечени числа, зависимостта е достатъчно слаба. Примери за случайни величини от този тип са числените характеристики на климата. Времето за всеки ден се влияе значително от времето от предишните дни и влиянието забележимо отслабва с разстоянието на дните един от друг. Следователно дългосрочната средна температура, налягане и други характеристики на климата на дадена област, в съответствие със закона за големите числа, на практика трябва да бъдат близки до техните математически очаквания. Последните са обективни характеристики на местния климат.

За да се провери експериментално закона за големите числа, следните експерименти бяха проведени по различно време.

1. Опит Буфон. Монетата е обърната 4040 пъти. Гербът пада 2048 пъти. Честотата на неговото появяване е равна на 0,50694 =

2. Опит Пиърсън. Монетата се хвърля 12 000 и 24 000 пъти. Честотата на загубата на герба в първия случай се оказа 0,5016, във втория - 0,5005.

З. Опит Вестергаард. От урната, в която имаше по равно бели и черни топки, с 10 000 извличания (с връщане на следващата изтеглена топка в урната) бяха получени 5011 бели и 4989 черни топки. Честотата на белите топки е 0,50110 = (), а на черните - 0,49890.

4. Опитът на V.I. Романовски. Четири монети се хвърлят 21160 пъти. Честотите и честотите на различни комбинации от герб и решетка бяха разпределени както следва:

Комбинации от номера на герб и опашки

Честоти

Честоти

емпиричен

Теоретичен

4 и 0

1 181

0,05858

0,0625

3 и 1

4909

0,24350

0,2500

2 и 2

7583

0,37614

0,3750

1 и 3

5085

0,25224

0,2500

1 и 4

0,06954

0,0625

Обща сума

20160

1,0000

1,0000

Резултатите от експерименталните тестове на закона за големите числа ни убеждават, че експерименталните честоти са близки до вероятностите.

ЦЕНТРАЛНА ГРАНИЧНА ТЕОРЕМА

Лесно е да се докаже, че сборът от всеки краен брой независими нормално разпределени случайни променливи също е разпределен според нормалния закон.

Ако независимите случайни променливи не са разпределени според нормалния закон, тогава върху тях могат да бъдат наложени някои много свободни ограничения и тяхната сума все още ще бъде нормално разпределена.

Този проблем беше поставен и решен главно от руските учени П. Л. Чебишев и неговите ученици А. А. Марков и А. М. Ляпунов.

Теорема (Ляпунов).

Ако независимите случайни променливи имат крайни математически очаквания и крайни вариации , броят им е достатъчно голям и то с неограничено увеличение

,

където са абсолютните централни моменти от трети ред, тогава тяхната сума с достатъчна степен на точност има разпределение

(Всъщност ние представяме не теоремата на Ляпунов, а едно от нейните следствия, тъй като това следствие е напълно достатъчно за практически приложения. Следователно условието , което се нарича условието на Ляпунов, е по-силно изискване, отколкото е необходимо за доказателството на Ляпунов самата теорема.)

Смисълът на условието е, че действието на всеки член (случайна променлива) е малко в сравнение с общото действие на всички тях. Много случайни явления, които се случват в природата и в социалния живот, протичат точно по този модел. В това отношение теоремата на Ляпунов е от изключително голямо значение, а нормалният закон за разпределение е един от основните закони в теорията на вероятностите.

нека например измерваненякакъв размер. Различни отклонения на наблюдаваните стойности от истинската им стойност (математическо очакване) се получават в резултат на влиянието на много голям брой фактори, всеки от които генерира малка грешка , и . Тогава общата грешка на измерване е случайна величина, която според теоремата на Ляпунов трябва да бъде разпределена по нормалния закон.

При стрелба с пистолетпод въздействието на много голям брой случайни причини снарядите се разпръскват върху определена площ. Случайните ефекти върху траекторията на снаряда могат да се считат за независими. Всяка причина причинява само малка промяна в траекторията в сравнение с общата промяна, дължаща се на всички причини. Следователно трябва да се очаква, че отклонението на мястото на разкъсване на снаряда от целта ще бъде случайна променлива, разпределена според нормалния закон.

По теоремата на Ляпунов имаме право да очакваме, че напр. височина на възрастен мъже случайна променлива, разпределена по нормалния закон. Тази хипотеза, както и тези, разгледани в предишните два примера, са в добро съгласие с наблюденията.За да потвърдим, ние представяме разпределението по височина на 1000 възрастни работници мъже и съответните теоретични числа мъже, т.е. броят на мъжете, които трябва да има растеж на тези групи, въз основа на предположението за разпределение растеж на мъжете според нормалния закон.

Височина, см

брой мъже

експериментални данни

теоретичен

прогнози

143-146

146-149

149-152

152-155

155-158

158- 161

161- 164

164-167

167-170

170-173

173-176

176-179

179 -182

182-185

185-188

Трудно би могло да се очаква по-точно съответствие между експерименталните и теоретичните данни.

Човек може лесно да докаже, като следствие от теоремата на Ляпунов, предложение, което ще бъде необходимо в това, което следва, за да обоснове метода на вземане на проби.

Изречение.

Сумата от достатъчно голям брой еднакво разпределени случайни променливи с абсолютни централни моменти от трети ред се разпределя по нормалния закон.

Граничните теореми на теорията на вероятностите, теоремите на Moivre-Laplace обясняват естеството на стабилността на честотата на възникване на събитие. Това естество се състои във факта, че ограничаващото разпределение на броя на събитията на събитие с неограничено увеличаване на броя на опитите (ако вероятността за събитие във всички изпитания е една и съща) е нормално разпределение.

Система от случайни величини.

Разгледаните по-горе случайни променливи бяха едномерни, т.е. се определят от едно число, но има и случайни величини, които се определят от две, три и т.н. числа. Такива случайни променливи се наричат ​​двумерни, тримерни и т.н.

В зависимост от вида на случайните променливи, включени в системата, системите могат да бъдат дискретни, непрекъснати или смесени, ако системата включва различни видове случайни променливи.

Нека разгледаме по-подробно системите от две случайни променливи.

Определение. разпределителен законсистема от случайни променливи се нарича връзка, която установява връзка между областите на възможните стойности на системата от случайни променливи и вероятностите за възникване на системата в тези области.

Пример. От урна, съдържаща 2 бели и 3 черни топки, се изтеглят две топки. Нека е броят на изтеглените бели топки, а случайната променлива е дефинирана, както следва:


Нека направим таблица на разпределението на системата от случайни променливи:

Тъй като е вероятността да не бъдат извадени бели топки (следователно са извадени две черни топки), докато , тогава

.

Вероятност

.

Вероятност

Вероятност е вероятността да не бъдат извадени бели топки (и следователно да бъдат извадени две черни топки), докато , тогава

Вероятност е вероятността една бяла топка (и следователно една черна) да бъде изтеглена, докато , тогава

Вероятност - вероятността да бъдат изтеглени две бели топки (и следователно да няма черни), докато , тогава

.

Така серията на разпределение на двумерна случайна променлива има формата:

Определение. разпределителна функциясистема от две случайни променливи се нарича функция от два аргументаЕ( х, г) , равна на вероятността за съвместно изпълнение на две неравенствах< х, Y< г.


Отбелязваме следните свойства на функцията на разпределение на система от две случайни променливи:

1) ;

2) Функцията на разпределение е ненамаляваща функция по отношение на всеки аргумент:

3) Вярно е следното:

4)


5) Вероятността за попадение в произволна точка ( X, Y ) в произволен правоъгълник със страни, успоредни на координатните оси, се изчислява по формулата:


Плътност на разпределение на система от две случайни променливи.

Определение.Плътност на разпределение на ставитевероятности на двумерна случайна променлива ( X, Y ) се нарича втора смесена частна производна на функцията на разпределение.

Ако плътността на разпределението е известна, тогава функцията на разпределение може да се намери по формулата:

Плътността на двумерното разпределение е неотрицателна и двойният интеграл с безкрайни граници на двумерната плътност е равен на единица.

От известната съвместна плътност на разпределение може да се намери плътността на разпределение на всеки от компонентите на двумерна случайна променлива.

; ;

Условни закони на разпределение.

Както е показано по-горе, знаейки закона за съвместно разпределение, можете лесно да намерите законите за разпределение за всяка случайна променлива, включена в системата.

На практика обаче по-често се среща обратната задача - според известните закони за разпределение на случайни променливи да се намери техният общ закон за разпределение.

В общия случай този проблем е неразрешим, т.к законът за разпределение на случайна променлива не казва нищо за връзката на тази променлива с други случайни променливи.

Освен това, ако случайните променливи зависят една от друга, тогава законът за разпределение не може да бъде изразен чрез законите за разпределение на компонентите, тъй като трябва да установи връзка между компонентите.

Всичко това води до необходимостта от разглеждане на законите за условно разпределение.

Определение. Разпределението на една включена в системата случайна променлива, намерена при условие, че друга случайна променлива е приела определена стойност, се нарича закон за условно разпределение.

Условният закон на разпределение може да бъде определен както чрез функцията на разпределение, така и чрез плътността на разпределението.

Условната плътност на разпределение се изчислява по формулите:

Условната плътност на разпределение има всички свойства на плътността на разпределение на една случайна променлива.

Условно математическо очакване.

Определение. Условно очакванедискретна случайна променлива Y при X = x (x е определена възможна стойност на X) се нарича произведение на всички възможни стойности Y върху техните условни вероятности.

За непрекъснати случайни променливи:

,

където f( г/ х) е условната плътност на случайната променлива Y, когато X = x.

Условно очакванеМ( Y/ х)= f( х) е функция на хи се обади регресионна функция X на Y.

Пример.Намерете условното очакване на компонента Y при

X=x1 =1 за дискретна двумерна случайна променлива, дадена от таблицата:

Y

x1=1

х2=3

х3=4

х4=8

y1=3

0,15

0,06

0,25

0,04

y2=6

0,30

0,10

0,03

0,07

Условната дисперсия и условните моменти на системата от случайни величини се определят по подобен начин.

Зависими и независими случайни променливи.

Определение. Извикват се случайни променливи независима, ако законът за разпределение на една от тях не зависи от това каква стойност приема другата случайна променлива.

Концепцията за зависимостта на случайните променливи е много важна в теорията на вероятностите.

Условните разпределения на независимите случайни променливи са равни на техните безусловни разпределения.

Нека дефинираме необходимите и достатъчни условия за независимост на случайните променливи.

Теорема. Y са независими, е необходимо и достатъчно разпределителната функция на системата ( х, Y) беше равно на произведението на функциите на разпределение на компонентите.

Подобна теорема може да се формулира за плътността на разпределението:

Теорема. За да могат случайните променливи X и Y са независими, е необходимо и достатъчно общата плътност на разпределение на системата ( х, Y) е равно на произведението на плътностите на разпределение на компонентите.

Практически се използват следните формули:

За дискретни случайни променливи:

За непрекъснати случайни променливи:

Корелационният момент служи за характеризиране на връзката между случайните величини. Ако случайните величини са независими, тогава техният корелационен момент е нула.

Корелационният момент има размерност, равна на произведението на размерностите на случайните величини X и Y . Този факт е недостатък на тази числена характеристика, тъй като с различни мерни единици се получават различни корелационни моменти, което затруднява съпоставянето на корелационните моменти на различните случайни величини.

За да се отстрани този недостатък, се прилага друга характеристика - коефициентът на корелация.

Определение. Коефициент на корелация rxy случайни променливи X и Y е отношението на корелационния момент към произведението на стандартните отклонения на тези величини.

Коефициентът на корелация е безразмерна величина. За независими случайни променливи коефициентът на корелация е нула.

Имот: Абсолютната стойност на корелационния момент на две случайни променливи X и Y не надвишава средното геометрично на техните дисперсии.

Имот: Абсолютната стойност на коефициента на корелация не надвишава единица.

Извикват се случайни променливи корелираниако техният корелационен момент е различен от нула, и некорелираниако техният корелационен момент е нула.

Ако случайните променливи са независими, тогава те са некорелирани, но от некорелацията не може да се заключи, че са независими.

Ако две величини са зависими, тогава те могат да бъдат корелирани или некорелирани.

Често, според дадена плътност на разпределение на система от случайни променливи, може да се определи зависимостта или независимостта на тези променливи.

Наред с коефициента на корелация степента на зависимост на случайните величини може да се характеризира и с друга величина, която се нарича коефициент на ковариация. Коефициентът на ковариация се определя по формулата:

Пример.Плътността на разпределение на системата от случайни променливи X инезависима. Разбира се, те също ще бъдат несвързани.

Линейна регресия.

Помислете за двумерна случайна променлива ( X, Y), където X и Y са зависими случайни променливи.

Нека представим приблизително една случайна променлива като функция на друга. Точно съвпадение не е възможно. Приемаме, че тази функция е линейна.

За да се определи тази функция, остава само да се намерят постоянните стойности аи b.

Определение. функцияж( х) Наречен най-добро приближениеслучайна величина Y в смисъла на метода на най-малките квадрати, ако математическото очакване

Приема възможно най-малката стойност. Също така функцияж( х) Наречен средна квадратична регресия Y към X.

Теорема. Линейна средноквадратична регресия Y върху X се изчислява по формулата:

в тази формула m x= М( X случайна променлива Yспрямо случайна променлива Х.Тази стойност характеризира големината на грешката в резултат на замяната на случайна променливаYлинейна функцияж( х) = аX +b.

Вижда се, че ако r= ± 1, тогава остатъчната дисперсия е нула и следователно грешката е нула и случайната променливаYе точно представена от линейна функция на случайната променлива Х.

Директна средноквадратична регресия хнаYсе определя аналогично по формулата: X и Yимат функции на линейна регресия една спрямо друга, тогава казваме, че количествата хиYсвързан линейна корелационна зависимост.

Теорема. Ако двумерна случайна променлива ( х, Y) е нормално разпределен, тогава X и Y са свързани с линейна корелационна зависимост.

напр. Никифорова


Феноменът на стабилизиране на честотите на възникване на случайни събития, открит върху голям и разнообразен материал, първоначално нямаше никакво оправдание и се възприемаше като чисто емпиричен факт. Първият теоретичен резултат в тази област е известната теорема на Бернули, публикувана през 1713 г., която полага основите на законите на големите числа.

Теоремата на Бернули по своето съдържание е гранична теорема, т.е. твърдение с асимптотично значение, което казва какво ще се случи с вероятностните параметри при голям брой наблюдения. Родоначалникът на всички съвременни многобройни твърдения от този тип е именно теоремата на Бернули.

Днес изглежда, че математическият закон на големите числа е отражение на някакво общо свойство на много реални процеси.

Имайки желание да даде на закона за големите числа възможно най-голямо покритие, съответстващо на далеч не изчерпаните потенциални възможности за прилагане на този закон, един от най-големите математици на нашия век А. Н. Колмогоров формулира същността му по следния начин: законът за големите числа е „общ принцип, по силата на който действието на голям брой случайни фактори води до почти независим от случайността резултат.

Така законът за големите числа има, така да се каже, две тълкувания. Единият е математически, свързан с конкретни математически модели, формулировки, теории, а вторият е по-общ, излизащ извън тази рамка. Второто тълкуване е свързано с феномена на формирането, което често се отбелязва в практиката, в различна степен на насочено действие на фона на голям брой скрити или видими действащи фактори, които нямат такава приемственост навън. Примери, свързани с второто тълкуване, са ценообразуването на свободния пазар, формирането на обществено мнение по определен въпрос.

След като отбелязахме това общо тълкуване на закона за големите числа, нека се обърнем към конкретните математически формулировки на този закон.

Както казахме по-горе, първата и фундаментално най-важна за теорията на вероятностите е теоремата на Бернули. Съдържанието на този математически факт, който отразява една от най-важните закономерности на околния свят, се свежда до следното.

Помислете за поредица от несвързани (т.е. независими) тестове, условията за които се възпроизвеждат неизменно от тест на тест. Резултатът от всеки тест е появата или неявяването на интересуващото ни събитие. НО.

Тази процедура (схема на Бернули) очевидно може да се разпознае като типична за много практически области: "момче - момиче" в последователността на новородените, ежедневни метеорологични наблюдения ("валеше - не валеше"), контрол на потока от произведени продукти ("нормален - дефектен") и др.

Честота на възникване на събитието НОпри Пизпитания ( t A -

честота на събитието НОв Птестове) има с растеж Птенденция за стабилизиране на стойността му, това е емпиричен факт.

Теорема на Бернули.Нека изберем произволно малко положително число e. Тогава

Подчертаваме, че математическият факт, установен от Бернули в определен математически модел (в схемата на Бернули), не трябва да се бърка с емпирично установената закономерност на честотната стабилност. Бернули не се задоволява само с твърдението на формула (9.1), но, като взема предвид нуждите на практиката, той дава оценка на неравенството, присъстващо в тази формула. Ще се върнем към тази интерпретация по-долу.

Законът за големите числа на Бернули е бил обект на изследване от голям брой математици, които се стремят да го усъвършенстват. Едно такова уточнение е получено от английския математик Моавър и в момента се нарича теорема на Моавър-Лаплас. В схемата на Бернули разгледайте последователността от нормализирани количества:

Интегрална теорема на Моавр - Лаплас.Изберете произволни две числа Х (и x 2 .В този случай х, х 7, тогава кога П -» °°

Ако от дясната страна на формула (9.3) променливата x xклонят към безкрайност, тогава получената граница, която зависи само от x 2 (в този случай индексът 2 може да бъде премахнат), ще бъде функция на разпределение, тя се нарича стандартно нормално разпределение,или Закон на Гаус.

Дясната страна на формула (9.3) е равна на y = F(x 2) - F(x x). F(x2)-> 1 at х 2-> °° и F(x,) -> 0 за x, -> Като изберете достатъчно голям

X] > 0 и достатъчно голяма по абсолютна стойност X] n получаваме неравенството:

Като вземем предвид формула (9.2), можем да извлечем практически надеждни оценки:

Ако надеждността на y = 0,95 (т.е. вероятността за грешка от 0,05) може да изглежда недостатъчна за някого, можете да играете на сигурно и да изградите малко по-широк доверителен интервал, като използвате правилото за трите сигми, споменато по-горе:

Този интервал съответства на много високо ниво на достоверност y = 0,997 (вижте таблиците за нормално разпределение).

Помислете за примера с хвърляне на монета. Да хвърлим монета n = 100 пъти. Може ли да се случи честотата Рще бъде много различна от вероятността Р= 0,5 (приемайки симетрията на монетата), например, ще бъде ли равно на нула? За да направите това, е необходимо гербът да не изпада нито веднъж. Такова събитие е теоретично възможно, но вече сме изчислили такива вероятности, за това събитие ще бъде равно на Тази стойност

е изключително малък, редът му е число с 30 знака след десетичната запетая. Събитие с такава вероятност спокойно може да се счита за практически невъзможно. Какви отклонения на честотата от вероятността при голям брой експерименти са практически възможни? Използвайки теоремата на Moivre-Laplace, ние отговаряме на този въпрос, както следва: с вероятност при= 0,95 честота на герба Рсе вписва в доверителния интервал:

Ако грешката от 0,05 не изглежда малка, е необходимо да се увеличи броят на експериментите (хвърляне на монета). С увеличение Пширината на доверителния интервал намалява (за съжаление, не толкова бързо, колкото бихме искали, но обратно пропорционално на -Йн).Например, когато П= 10 000 получаваме това Рлежи в доверителния интервал с доверителната вероятност при= 0,95 : 0,5 ± 0,01.

По този начин ние се справихме количествено с въпроса за приближаването на честотата към вероятността.

Сега нека намерим вероятността за събитие от неговата честота и да оценим грешката на това приближение.

Нека направим голям брой експерименти П(хвърли монета), намери честотата на събитието НОи искате да оцените неговата вероятност Р.

От закона за големите числа Пследва, че:

Нека сега оценим практически възможната грешка на приблизителното равенство (9.7). За целта използваме неравенство (9.5) във формата:

За намиране РНа Рнеобходимо е да се реши неравенство (9.8), за това е необходимо да се повдигне на квадрат и да се реши съответното квадратно уравнение. В резултат на това получаваме:

където

За приблизителна оценка РНа Рможе да бъде във формулата (9.8) Ротдясно, заменете с Рили във формули (9.10), (9.11) считаме, че

Тогава получаваме:

Нека влезе П= 400 експеримента са получили честотна стойност Р= 0,25, тогава при ниво на достоверност y = 0,95 намираме:

Но какво ще стане, ако трябва да знаем вероятността по-точно, с грешка, да речем, не повече от 0,01? За да направите това, трябва да увеличите броя на експериментите.

Приемайки във формула (9.12) вероятността Р= 0,25, приравняваме стойността на грешката към дадената стойност от 0,01 и получаваме уравнение за П:

Решавайки това уравнение, получаваме n~ 7500.

Нека сега разгледаме още един въпрос: може ли отклонението на честотата от вероятността, получено в експерименти, да се обясни със случайни причини или това отклонение показва, че вероятността не е такава, каквато я приемаме? С други думи, дали опитът потвърждава приетата статистическа хипотеза или, напротив, изисква тя да бъде отхвърлена?

Нека, например, хвърляне на монета П= 800 пъти, получаваме честотата на върха Р= 0,52. Подозирахме, че монетата не е симетрична. Основателно ли е това подозрение? За да отговорим на този въпрос, ще изхождаме от предположението, че монетата е симетрична (p = 0,5). Нека намерим доверителния интервал (с доверителната вероятност при= 0,95) за честотата на появяване на герба. Ако получената в експеримента стойност Р= 0,52 се вписва в този интервал - всичко е нормално, приетата хипотеза за симетрията на монетата не противоречи на експерименталните данни. Формула (9.12) за Р= 0,5 дава интервал от 0,5 ± 0,035; получена стойност p = 0,52 се вписва в този интервал, което означава, че монетата ще трябва да бъде „изчистена“ от съмнения за асиметрия.

Подобни методи се използват, за да се прецени дали различните отклонения от математическото очакване, наблюдавани при случайни явления, са случайни или „значителни“. Например, имаше ли случайно поднормено тегло в няколко проби от опаковани стоки или това показва системна измама на купувачите? Случайно ли се е увеличил процентът на възстановяване при пациенти, които са използвали новото лекарство, или това се дължи на ефекта на лекарството?

Нормалният закон играе особено важна роля в теорията на вероятностите и нейните практически приложения. Вече видяхме по-горе, че една случайна променлива - броят на случванията на някакво събитие в схемата на Бернули - когато П-» °° се свежда до нормалния закон. Има обаче много по-общ резултат.

Централна гранична теорема.Сумата от голям брой независими (или слабо зависими) случайни променливи, сравними една с друга по реда на техните дисперсии, се разпределя според нормалния закон, независимо от това какви са законите на разпределение на членовете. Горното твърдение е груба качествена формулировка на теорията за централната граница. Тази теорема има много форми, които се различават една от друга в условията, на които трябва да отговарят случайните променливи, за да може тяхната сума да се „нормализира“ с увеличаване на броя на членовете.

Плътността на нормалното разпределение Dx) се изразява с формулата:

където а -математическо очакване на случайна променлива X s= V7) е неговото стандартно отклонение.

За да се изчисли вероятността x да попадне в интервала (x 1? x 2), се използва интегралът:

Тъй като интегралът (9.14) при плътност (9.13) не се изразява чрез елементарни функции („не се взема“), таблиците на интегралната функция на разпределение на стандартното нормално разпределение се използват за изчисляване (9.14), когато а = 0, a = 1 (такива таблици има във всеки учебник по теория на вероятностите):

Вероятност (9.14) с помощта на уравнение (10.15) се изразява с формулата:

Пример. Намерете вероятността случайната променлива х,с нормално разпределение с параметри а, a, се отклоняват от своето математическо очакване по модул не повече от 3a.

Използвайки формула (9.16) и таблицата на функцията на разпределение на нормалния закон, получаваме:

Пример. Във всяко от 700-те независими преживявания, събитие НОсе случва с постоянна вероятност Р= 0,35. Намерете вероятността събитието НОще се случи:

  • 1) точно 270 пъти;
  • 2) по-малко от 270 и повече от 230 пъти;
  • 3) повече от 270 пъти.

Намиране на математическото очакване а = и т.ни стандартно отклонение:

случайна променлива - броят на случванията на събитието НО:

Намиране на центрирана и нормализирана стойност Х:

Според таблиците за плътност на нормалното разпределение намираме f(x):

Да намерим сега R w (x,> 270) = P 700 (270 F(1,98) == 1 - 0,97615 = 0,02385.

Сериозна стъпка в изучаването на проблемите на големите числа е направена през 1867 г. от П. Л. Чебишев. Той разглежда много общ случай, когато нищо не се изисква от независими случайни променливи, освен наличието на математически очаквания и отклонения.

Неравенството на Чебишев.За произволно малко положително число e е валидно следното неравенство:

Теорема на Чебишев.Ако x x, x 2, ..., x n -по двойки независими случайни променливи, всяка от които има математическо очакване E(Xj) = ciи дисперсия D(x,) =), а дисперсиите са равномерно ограничени, т.е. 1,2 ..., тогава за произволно малко положително число дрелацията е изпълнена:

Последица. Ако а,= aio, -o 2 , т.е= 1,2 ..., тогава

Задача. Колко пъти трябва да се хвърли монета, така че с вероятност най-малко y - 0,997, може ли да се твърди, че честотата на герба ще бъде в интервала (0,499; 0,501)?

Да предположим, че монетата е симетрична, p - q - 0,5. Прилагаме теоремата на Чебишев във формула (9.19) към случайната променлива Х-честотата на поява на герба в Пхвърляне на монета. Вече показахме това по-горе X = X x + X 2 + ... +Х„,където X t -случайна променлива, която приема стойност 1, ако гербът падне, и стойност 0, ако опашките паднат. Така:

Записваме неравенство (9.19) за събитие, противоположно на събитието, посочено под знака на вероятността:

В нашия случай [e \u003d 0,001, cj 2 \u003d /? -p)] t е броят на гербовете в Пхвърляне. Замествайки тези количества в последното неравенство и като вземем предвид, че според условието на задачата неравенството трябва да бъде изпълнено, получаваме:

Даденият пример илюстрира възможността за използване на неравенството на Чебишев за оценка на вероятностите за определени отклонения на случайни променливи (както и проблеми като този пример, свързани с изчисляването на тези вероятности). Предимството на неравенството на Чебишев е, че не изисква познаване на законите за разпределение на случайни променливи. Разбира се, ако такъв закон е известен, тогава неравенството на Чебишев дава твърде груби оценки.

Помислете за същия пример, но използвайки факта, че хвърлянето на монета е специален случай на схемата на Бернули. Броят на успехите (в примера - броят на гербовете) се подчинява на биномния закон и с голям Птози закон може да бъде представен чрез интегралната теорема на Моавър - Лаплас като нормален закон с математическо очакване a = pr = n? 0,5 и със стандартно отклонение a = yfnpq- 25=0,5л/л. Случайната променлива - честотата на герба - има математическо очакване = 0,5 и стандартно отклонение

Тогава имаме:

От последното неравенство получаваме:

От нормалните таблици за разпределение намираме:

Виждаме, че нормалното приближение дава броя на хвърлянията на монети, който осигурява дадена грешка при оценката на вероятността на герба, която е 37 пъти по-малка от оценката, получена с помощта на неравенството на Чебишев (но неравенството на Чебишев дава възможност да се извърши подобни изчисления дори в случай, че нямаме информация за закона за разпределение на изследваната случайна променлива).

Нека сега разгледаме една приложна задача, решена с помощта на формула (9.16).

Проблем с конкуренцията. Две конкурентни железопътни компании имат по един влак, който се движи между Москва и Санкт Петербург. Тези влакове са оборудвани по приблизително еднакъв начин, те също тръгват и пристигат приблизително по едно и също време. Нека се преструваме, че П= 1000 пътници независимо и произволно избират влак за себе си, следователно като математически модел за избор на влак от пътниците използваме схемата на Бернули с Пизпитания и шансове за успех Р= 0,5. Компанията трябва да реши колко места да осигури във влака, като вземе предвид две взаимно противоречиви условия: от една страна, не искат да имат празни места, от друга страна, не искат да изглеждат недоволни от липсата на места (следващия път ще предпочетат конкурентни фирми). Разбира се, можете да предоставите във влака П= 1000 места, но тогава със сигурност ще има празни места. Случайната величина - броят на пътниците във влака - в рамките на приетия математически модел, използващ интегралната теория на Де Моавър - Лаплас, се подчинява на нормалния закон с математическото очакване a = pr = n/2 и дисперсия a 2 = npq = стр/4последователно. Вероятността влакът да дойде е повече от спътници се определя от съотношението:

Задайте нивото на риск а, т.е. вероятността повече от спътници:

Оттук:

Ако а- коренът на риска от последното уравнение, който се намира в таблиците на функцията на разпределение на нормалния закон, получаваме:

ако напр. П = 1000, а= 0,01 (това ниво на риск означава, че броят на местата сще бъде достатъчно в 99 случая от 100), тогава x a ~ 2.33 и s= 537 места. Освен това, ако и двете компании приемат еднакви нива на риск а= 0,01, тогава двата влака ще имат общо 1074 места, 74 от които ще бъдат празни. По същия начин може да се изчисли, че 514 места биха били достатъчни в 80% от всички случаи и 549 места в 999 от 1000 случая.

Подобни съображения важат и за други проблеми с конкурентните услуги. Например ако Tкината се състезават за същото Пзрители, трябва да се приеме Р= -. Получаваме

че броят на местата св киното трябва да се определя от съотношението:

Общият брой празни места е равен на:

За а = 0,01, П= 1000 и T= 2, 3, 4 стойностите на това число са приблизително равни съответно на 74, 126, 147.

Нека разгледаме още един пример. Нека влакът бъде П - 100 вагона. Теглото на всеки вагон е случайна променлива с математическо очакване а - 65 тона и средно квадратично очакване o = 9 тона Локомотивът може да превозва влак, ако теглото му не надвишава 6600 тона; в противен случай трябва да закачите втория локомотив. Трябва да намерим вероятността това да не е необходимо.

тегло на отделните вагони: има едно и също математическо очакване а - 65 и същата дисперсия д- o 2 \u003d 81. Според правилото на математическите очаквания: E(x) - 100 * 65 = 6500. Според правилото за добавяне на отклонения: D(x) \u003d 100 x 81 \u003d 8100. Вземайки корена, намираме стандартното отклонение. За да може един локомотив да тегли влак, е необходимо теглото на влака хсе оказа лимитиращ, т.е. попадна в границите на интервала (0; 6600). Случайната променлива x - сумата от 100 члена - може да се счита за нормално разпределена. По формула (9.16) получаваме:

От това следва, че локомотивът ще "се справи" с влака с приблизително 0,864 вероятност. Нека сега намалим броя на вагоните във влака с два, т.е П= 98. Изчислявайки сега вероятността локомотивът да „се справи“ с влака, получаваме стойност от порядъка на 0,99, т.е. почти сигурно събитие, въпреки че за това трябваше да бъдат премахнати само два вагона.

Така че, ако имаме работа със суми на голям брой случайни променливи, тогава можем да използваме нормалния закон. Естествено, това повдига въпроса: колко случайни променливи трябва да се добавят, така че законът за разпределение на сумата вече да е „нормализиран“? Зависи какви са законите на разпределение на термините. Има толкова сложни закони, че нормализацията се случва само с много голям брой членове. Но тези закони са измислени от математиците, докато природата, като правило, специално не организира такива проблеми. Обикновено на практика, за да може да се използва нормалният закон, са достатъчни пет-шест мандата.

Скоростта, с която се "нормализира" законът за разпределение на сумата от еднакво разпределени случайни величини, може да се илюстрира на примера на случайни величини с равномерно разпределение на интервала (0, 1). Кривата на такова разпределение има формата на правоъгълник, което вече е различно от нормалния закон. Нека добавим две такива независими величини - получаваме случайна променлива, разпределена по така наречения закон на Симпсън, чието графично представяне има формата на равнобедрен триъгълник. И това не изглежда като нормален закон, но е по-добре. И ако добавите три такива равномерно разпределени случайни променливи, ще получите крива, състояща се от три сегмента от параболи, много подобна на нормална крива. Ако добавите шест такива случайни променливи, ще получите крива, която не се различава от нормалната. Това е в основата на широко използвания метод за получаване на нормално разпределена случайна променлива, докато всички съвременни компютри са оборудвани със сензори за равномерно разпределени (0, 1) случайни числа.

Следният метод се препоръчва като един практически начин да проверите това. Ние изграждаме доверителен интервал за честотата на събитие с ниво при= 0,997 според правилото на трите сигми:

и ако двата му края не излизат извън сегмента (0, 1), тогава може да се използва нормалният закон. Ако някоя от границите на доверителния интервал е извън сегмента (0, 1), тогава нормалният закон не може да се използва. Но при определени условия биномният закон за честотата на някое случайно събитие, ако не клони към нормалното, може да клони към друг закон.

В много приложения схемата на Бернули се използва като математически модел на случаен експеримент, в който броят на опитите Пголямо, случайно събитие е доста рядко, т.е. Р = и т.нне малък, но не голям (колеба се в диапазона O -5 - 20). В този случай е валидна следната връзка:

Формулата (9.20) се нарича апроксимация на Поасон за биномния закон, тъй като вероятностното разпределение от дясната му страна се нарича закон на Поасон. Казва се, че разпределението на Поасон е разпределение на вероятностите за редки събития, тъй като се появява, когато са изпълнени ограниченията: П -»°°, Р-»0, но х = pr oo.

Пример. Рождени дни. Каква е вероятността R t (k)че в общество от 500 души да сехора, родени на Нова година? Ако тези 500 души бъдат избрани на случаен принцип, тогава схемата на Бернули може да бъде приложена с вероятност за успех P = 1/365. Тогава

Вероятностни изчисления за различни да седайте следните стойности: RU = 0,3484...; R 2 = 0,2388...; R 3 = 0,1089...; P 4 = 0,0372...; R 5 = 0,0101...; R 6= 0,0023... Съответни приближения по формулата на Поасон за X= 500 1/365 = 1,37

дайте следните стойности: Ru = 0,3481...; R 2 = 0,2385...; Р b = 0,1089; R 4 = 0,0373...; P 5 = 0,0102...; P 6 = 0,0023... Всички грешки са само в четвъртия знак след десетичната запетая.

Нека дадем примери за ситуации, в които може да се използва законът на Поасон за редките събития.

На телефонната централа е малко вероятно да се получи неправилна връзка. R,обикновено Р~ 0,005. Тогава формулата на Поасон ви позволява да намерите вероятността от неправилни връзки за даден общ брой връзки n~ 1000 когато X = пр =1000 0,005 = 5.

При печене на кифлички в тестото се слагат стафиди. Трябва да се очаква, че поради разбъркването честотата на рулцата със стафиди ще следва приблизително разпределението на Поасон P n (k, X),където Х-плътност на стафидите в тестото.

Радиоактивно вещество излъчва n-частици. Събитието, което броят на d-частиците достига с течение на времето Tдадена площ от пространството, приема фиксирана стойност да се,се подчинява на закона на Поасон.

Броят на живите клетки с променени хромозоми под въздействието на рентгенови лъчи следва разпределението на Поасон.

И така, законите на големите числа позволяват решаването на проблема с математическата статистика, свързан с оценката на неизвестни вероятности за елементарни резултати от случаен опит. Благодарение на тези знания, ние правим методите на теорията на вероятностите практически значими и полезни. Законите на големите числа също позволяват да се реши проблемът с получаването на информация за неизвестни елементарни вероятности в друга форма - формата на тестване на статистически хипотези.

Нека разгледаме по-подробно формулировката и вероятностния механизъм за решаване на проблеми с тестване на статистически хипотези.

Функция на разпределение на случайна променлива и нейните свойства.

разпределителна функцияслучайна променлива X се нарича функция F(X), изразяваща за всяко x вероятността случайната променлива X да приеме стойност, по-малка от x: F(x)=P(X

Функция F(x)понякога се нарича интегрална функцияразпространение или интегрален закон за разпределение.

Свойства на функцията на разпределение:

1. Функцията на разпределение на случайна променлива е неотрицателна функция, затворена между нула и едно:

0 ≤ F(x) ≤ 1.

2. Функцията на разпределение на случайна променлива е ненамаляваща функция върху цялата числова ос.

3. При минус безкрайност функцията на разпределение е равна на нула, при плюс безкрайност е равна на единица, т.е.: F(-∞)= , F(+∞)= .

4. Вероятността случайна променлива да попадне в интервала [x1,x2) (включително x1) е равна на увеличението на нейната функция на разпределение на този интервал, т.е. P(x 1 ≤ X< х 2) = F(x 2) - F(x 1).


Неравенството на Марков и Чебишев

Марковско неравенство

Теорема: Ако случайна променлива X приема само неотрицателни стойности и има математическо очакване, тогава за всяко положително число A равенството е вярно: P(x>A) ≤ .

Тъй като събитията X > A и X ≤ A са противоположни, замествайки P(X > A) изразяваме 1 - P (X ≤ A), стигаме до друга форма на неравенството на Марков: P(X ≥ A) ≥1 - .

Неравенството на Марков k е приложимо за всякакви неотрицателни случайни променливи.

Неравенството на Чебишев

Теорема:За всяка случайна променлива с математическо очакване и дисперсия неравенството на Чебишев е вярно:

P (|X - a| > ε) ≤ D(X) / ε 2 или P (|X - a| ≤ ε) ≥ 1 - DX / ε 2, където a \u003d M (X), ε>0.


Законът за големите числа "под формата" на теоремата на Чебишев.

Теорема на Чебишев:Ако отклоненията ннезависими случайни променливи X1, X2,…. х нса ограничени от същата константа, след това с неограничено нарастване на броя нсредноаритметичното на случайните променливи се сближава по вероятност със средното аритметично на техните математически очаквания a 1 ,a 2 ....,a n , т.е. .

Смисълът на закона за големите числа е, че средните стойности на случайните променливи се стремят към своето математическо очакване, когато н→ ∞ по вероятност. Отклонението на средните стойности от математическото очакване става произволно малко с вероятност, близка до единица, ако n е достатъчно голямо. С други думи, вероятността от всяко отклонение на средствата от апроизволно малък с растеж н.



30. Теорема на Бернули.

Теорема на Бернули:Честота на събитията в нповтарящи се независими опити, във всяко от които може да се случи с еднаква вероятност p, с неограничено увеличение на броя нсходят по вероятност до вероятността p за това събитие в отделен опит: \

Теоремата на Бернули е следствие от теоремата на Чебишев, тъй като честотата на събитие може да бъде представена като средноаритметично на n независими алтернативни случайни променливи, които имат същия закон на разпределение.

18. Математическо очакване на дискретна и непрекъсната случайна величина и техните свойства.

математическо очакванее сумата от продуктите на всички негови стойности и съответните им вероятности

За дискретна случайна променлива:

За непрекъсната случайна променлива:

Свойства на математическото очакване:

1. Математическото очакване на постоянна стойност е равно на самата константа: M(S)=S

2. Постоянният фактор може да бъде изваден от знака за очакване, т.е. M(kX)=kM(X).

3. Математическото очакване на алгебричната сума на краен брой случайни променливи е равно на същата сума от техните математически очаквания, т.е. M(X±Y)=M(X)±M(Y).

4. Математическото очакване на произведението на краен брой независими случайни променливи е равно на произведението на техните математически очаквания: M(XY)=M(X)*M(Y).

5. Ако всички стойности на случайна променлива се увеличат (намалят) с константа C, тогава математическото очакване на тази случайна променлива ще се увеличи (намали) със същата константа C: M(X±C)=M(X)±C.

6. Математическото очакване на отклонението на случайна променлива от нейното математическо очакване е нула: М=0.

Ако явлението устойчивост среденсе случва в действителност, тогава в математическия модел, с който изучаваме случайни явления, трябва да има теорема, отразяваща този факт.
При условията на тази теорема въвеждаме ограничения върху случайните променливи х 1 , х 2 , …, X n:

а) всяка случайна променлива Х iима математическо очакване

М(Х i) = а;

б) дисперсията на всяка случайна променлива е крайна или можем да кажем, че дисперсиите са ограничени отгоре с едно и също число, напр. ОТ, т.е.

д(Х i) < C, i = 1, 2, …, н;

в) случайните променливи са независими по двойки, т.е. произволни две X iи Xjпри i¹ йнезависима.

Тогава очевидно

д(х 1 + х 2 + … + X n)=д(х 1) + D(х 2) + ... + D(X n).

Нека формулираме закона за големите числа във формата на Чебишев.

Теорема на Чебишев:с неограничено увеличаване на броя ннезависими тестове" средноаритметичната стойност на наблюдаваните стойности на случайна променлива се сближава по вероятност с нейното математическо очакване ”, т.е. за всеки положителен ε

Р(| a| < ε ) = 1. (4.1.1)

Значението на израза "средно аритметично = се сближава по вероятност до " е, че вероятността, че ще се различава произволно малко от а, се доближава до 1 неограничено като число н.

Доказателство.За краен брой ннезависими тестове прилагаме неравенството на Чебишев за случайна променлива = :

Р(|–М()| < ε ) ≥ 1 – . (4.1.2)

Като вземем предвид ограниченията a - b, изчисляваме М( ) и д( ):

М( ) = = = = = = а;

д( ) = = = = = = .

Заместване М( ) и д( ) в неравенство (4.1.2), получаваме

Р(| a| < ε )≥1 .

Ако в неравенството (4.1.2) вземем произволно малък ε >0 и н® ¥, тогава получаваме

което доказва теоремата на Чебишев.

От разгледаната теорема следва важен практически извод: имаме право да заменим неизвестната стойност на математическото очакване на случайна величина със средноаритметичната стойност, получена от достатъчно голям брой експерименти. В този случай колкото повече експерименти трябва да се изчислят, толкова по-вероятно (надеждно) може да се очаква грешката, свързана с тази замяна ( - а) няма да надвишава дадената стойност ε .

Освен това могат да бъдат решени и други практически проблеми. Например, според стойностите на вероятността (надеждността) Р=Р(| a|< ε ) и максимално допустимата грешка ε определя необходимия брой експерименти н; На Ри Пдефинирам ε; На ε и Попределяне на вероятността от събитие | a |< ε.

специален случай. Нека при ннаблюдавани опити нстойности на случайна променлива х,има математическо очакване М(х) и дисперсия д(х). Получените стойности могат да се разглеждат като случайни променливи х 1 ,х 2 ,х 3 , ... ,X n,. Трябва да се разбира, както следва: поредица от Птестовете се провеждат многократно, така че като резултат iти тест, i= l, 2, 3, ..., П, във всяка серия от тестове ще се появи една или друга стойност на случайна променлива х, не е известно предварително. Следователно, i-e стойност x iслучайна променлива, получена в i th тест, се променя на случаен принцип, ако преминете от една серия тестове към друга. Така че всяка стойност x iможе да се счита за случаен X i .


Да приемем, че тестовете отговарят на следните изисквания:

1. Тестовете са независими. Това означава, че резултатите х 1 , х 2 ,
х 3 , ..., X nтестовете са независими случайни променливи.

2. Тестовете се провеждат при едни и същи условия - това означава, от гледна точка на теорията на вероятностите, че всяка от случайните променливи х 1 ,х 2 ,х 3 , ... ,X nима същия закон на разпределение като първоначалната стойност х, Ето защо М(X i) (хд(X i) = д(х), i = 1, 2, .... П.

Имайки предвид горните условия, получаваме

Р(| a| < ε )≥1 . (4.1.3)

Пример 4.1.1. хе равно на 4. Колко независими експеримента са необходими, за да може с вероятност най-малко 0,9 да се очаква, че средноаритметичното на тази случайна променлива ще се различава от математическото очакване с по-малко от 0,5?

Решение.Според условието на проблема ε = 0,5; Р(| a|< 0,5) 0,9. Прилагане на формула (4.1.3) за случайната величина х, получаваме

П(|–М(х)| < ε ) ≥ 1 .

От връзката

1 = 0,9

дефинирам

П= = = 160.

Отговор: необходимо е да се направят 160 независими експеримента.

Ако приемем, че средната аритметична нормално разпределени, получаваме:

Р(| a|< ε )= 2Φ () 0,9.

Откъде, използвайки таблицата на функцията на Лаплас, получаваме
1,645, или ≥ 6,58 т.е. н ≥49.

Пример 4.1.2.Дисперсия на случайна променлива хе равно на D( х) = 5. Проведени са 100 независими експеримента, според които . Вместо неизвестната стойност на математическото очакване априет . Определете максималната допустима грешка в този случай с вероятност най-малко 0,8.

Решение.Според задачата н= 100, Р(| a|< ε ) ≥0,8. Прилагаме формулата (4.1.3)

Р(| a|< ε ) ≥1 .

От връзката

1 = 0,8

дефинирам ε :

ε 2 = = = 0,25.

Следователно, ε = 0,5.

Отговор: максимална стойност на грешката ε = 0,5.

4.2. Закон за големите числа във формата на Бернули

Въпреки че концепцията за вероятност е в основата на всяко статистическо заключение, ние можем само в няколко случая да определим директно вероятността за събитие. Понякога тази вероятност може да се установи от съображения за симетрия, равни възможности и т.н., но няма универсален метод, който би позволил да се посочи нейната вероятност за произволно събитие. Теоремата на Бернули дава възможност да се определи приблизително вероятността, ако за събитието, което ни интересува НОмогат да се извършват повторни независими тестове. Нека произведени Пнезависими тестове, във всеки от които вероятността за настъпване на някакво събитие НОпостоянен и равен Р.

Теорема на Бернули.С неограничено увеличение на броя на независимите изпитания Потносителна честота на възникване на събитието НОсе сближава от вероятност към вероятност стрнастъпване на събитие НО,T. д.

П(½ - стр½≤ ε) = 1, (4.2.1)

където ε е произволно малко положително число.

За финал нпри условие че , неравенството на Чебишев за случайна променлива ще има формата:

П(| –p|< ε ) 1 .(4.2.2)

Доказателство.Прилагаме теоремата на Чебишев. Позволявам X i– брой появявания на събитието НОв iти тест, i= 1, 2, . . . , н. Всяко от количествата X iможе да приема само две стойности:

X i= 1 (събитие НОслучи) с вероятност стр,

X i= 0 (събитие НОне се случи) с вероятност р= 1–стр.

Позволявам Y n= . Сума х 1 + х 2 + … + X nе равно на числото мсъбития НОв нтестове (0 м н), което означава Y n= – относителна честота на възникване на събитието НОв нтестове. Математическо очакване и дисперсия X iса равни съответно:

М( ) = 1∙стр + 0∙р = стр,

Пример 4.2.1.За да се определи процентът на дефектните продукти, бяха тествани 1000 броя по схемата за връщане на проби. Каква е вероятността абсолютната стойност на процента на отхвърляне, определена от тази проба, да се различава от процента на отхвърляне за цялата партида с не повече от 0,01, ако е известно, че средно има 500 дефектни артикула на всеки 10 000 артикула ?

Решение.Според условието на проблема, броят на независимите опити н= 1000;

стр= = 0,05; р= 1 – стр= 0,95; ε = 0,01.

Прилагайки формула (4.2.2), получаваме

П(| p|< 0,01) 1 – = 1 – = 0,527.

Отговор: с вероятност най-малко 0,527 може да се очаква, че фракцията на дефектите в извадката (относителната честота на поява на дефекти) ще се различава от дела на дефектите във всички продукти (от вероятността за дефекти) с не повече от 0,01 .

Пример 4.2.2.При щамповане на части вероятността за брак е 0,05. Колко части трябва да бъдат проверени, така че с вероятност най-малко 0,95 да се очаква, че относителната честота на дефектните продукти ще се различава от вероятността за дефекти с по-малко от 0,01?

Решение.Според задачата Р= 0,05; р= 0,95; ε = 0,01;

П(| p|<0,01) 0,95.

От равенство 1 = 0,95 намирам н:

н= = =9500.

Отговор: 9500 артикула трябва да бъдат проверени.

Коментирайте.Оценките за необходимия брой наблюдения, получени чрез прилагане на теоремата на Бернули (или Чебишев), са силно преувеличени. Има по-прецизни оценки, предложени от Bernstein и Khinchin, но изискващи по-сложен математически апарат. За да се избегне преувеличаване на оценките, понякога се използва формулата на Лаплас

П(| p|< ε ) ≈ 2Φ .

Недостатъкът на тази формула е липсата на оценка на допустимата грешка.



Скорошни статии в раздела:

Дати и събития от Великата отечествена война
Дати и събития от Великата отечествена война

В 4 часа сутринта на 22 юни 1941 г. войските на нацистка Германия (5,5 милиона души) пресичат границите на Съветския съюз, германските самолети (5 хиляди) започват ...

Всичко, което трябва да знаете за радиацията Източници и единици на радиация
Всичко, което трябва да знаете за радиацията Източници и единици на радиация

5. Радиационни дози и мерни единици Въздействието на йонизиращите лъчения е сложен процес. Ефектът от облъчването зависи от големината ...

Мизантропия или какво ще стане, ако мразя хората?
Мизантропия или какво ще стане, ако мразя хората?

Лош съвет: Как да станеш мизантроп и радостно да мразиш всички Тези, които уверяват, че хората трябва да бъдат обичани независимо от обстоятелствата или ...