Імовірнісні та статистичні методи застосовні. Ймовірнісно-статистичні методи моделювання економічних систем

Як використовуються теорія ймовірностей та математична статистика?Ці дисципліни – основа імовірнісно-статистичних методів прийняття рішень. Щоб скористатися їх математичним апаратом, необхідно завдання прийняття рішень висловити термінах вероятностно-статистических моделей. Застосування конкретного імовірнісно-статистичного методу прийняття рішень складається з трьох етапів:

Перехід від економічної, управлінської, технологічної дійсності до абстрактної математико-статистичної схемою, тобто. побудова імовірнісної моделі системи управління, технологічного процесу, процедури прийняття рішень, зокрема за результатами статистичного контролю тощо.

Проведення розрахунків та отримання висновків суто математичними засобами в рамках імовірнісної моделі;

Інтерпретація математико-статистичних висновків стосовно реальної ситуації та прийняття відповідного рішення (наприклад, про відповідність або невідповідність якості продукції встановленим вимогам, необхідність налагодження технологічного процесу тощо), зокрема, висновки (про частку дефектних одиниць продукції в партії, про конкретному вигляді законів розподілу контрольованих параметрів технологічного процесу та ін.).

Математична статистика використовує поняття, методи та результати теорії ймовірностей. Розглянемо основні питання побудови ймовірнісних моделей прийняття рішень на економічних, управлінських, технологічних та інших ситуаціях. Для активного та правильного використання нормативно-технічних та інструктивно-методичних документів з імовірнісно-статистичних методів прийняття рішень потрібні попередні знання. Так, необхідно знати, за яких умов слід застосовувати той чи інший документ, яку вихідну інформацію необхідно мати для вибору та застосування, які рішення повинні бути прийняті за результатами обробки даних і т.д.

Приклади застосування теорії ймовірностей та математичної статистики.Розглянемо кілька прикладів, коли вероятностно-статистические моделі є добрим інструментом на вирішення управлінських, виробничих, економічних, народногосподарських завдань. Так, наприклад, у романі А.Н.Толстого «Ходіння по муках» (т.1) говориться: «майстерня дає двадцять три відсотки шлюбу, цієї цифри ви й тримаєтеся, - сказав Струков Івану Іллічу».

Постає питання, як розуміти ці слова у розмові заводських менеджерів, оскільки одна одиниця продукції може бути дефектна на 23%. Вона може бути або придатною або дефектною. Напевно, Струков мав на увазі, що у партії великого обсягу міститься приблизно 23% дефектних одиниць продукції. Тоді виникає запитання, а що означає «приблизно»? Нехай із 100 перевірених одиниць продукції 30 виявляться дефектними, чи з 1000 – 300, чи з 100000 – 30000 тощо., чи треба звинувачувати Струкова у брехні?

Або інший приклад. Монетка, яку використовують як жереб, має бути «симетричною», тобто. при її киданні в середньому в половині випадків повинен випадати герб, а в половині випадків – грати (решітка, цифра). Але що означає «у середньому»? Якщо провести багато серій по 10 кидань у кожній серії, то часто зустрічатимуться серії, в яких монета чотири рази випадає гербом. Для симетричної монети це відбуватиметься у 20,5% серій. А якщо на 100 000 кидань виявиться 40 000 гербів, то чи можна вважати монету симетричною? Процедура прийняття рішень будується з урахуванням теорії ймовірностей і математичної статистики.

Розглянутий приклад може бути недостатньо серйозним. Однак, це не так. Жеребкування широко використовується при організації промислових техніко-економічних експериментів, наприклад, при обробці результатів вимірювання показника якості (моменту тертя) підшипників залежно від різних технологічних факторів (впливу консерваційного середовища, методів підготовки підшипників перед вимірюванням, впливу навантаження підшипників у процесі вимірювання тощо). п.). Припустимо, необхідно порівняти якість підшипників залежно від результатів зберігання в різних консерваційних маслах, тобто. в оліях складу Аі У. При плануванні такого експерименту виникає питання, які підшипники слід помістити в олію складу А, а які – в олію складу Уале так, щоб уникнути суб'єктивізму і забезпечити об'єктивність прийнятого рішення.

Відповідь це питання може бути отримано з допомогою жереба. Аналогічний приклад можна навести і з контролем якості продукції. Щоб вирішити, чи відповідає чи не відповідає контрольована партія продукції встановленим вимогам, з неї відбирається вибірка. За результатами контролю вибірки робиться висновок про всю партію. У цьому випадку дуже важливо уникнути суб'єктивізму при формуванні вибірки, тобто необхідно, щоб кожна одиниця продукції контрольованої партії мала однакову можливість бути відібраною у вибірку. У виробничих умовах відбір одиниць продукції вибірку зазвичай здійснюють за допомогою жереба, а, по спеціальним таблицям випадкових чисел чи з допомогою комп'ютерних датчиків випадкових чисел.

Аналогічні проблеми забезпечення об'єктивності порівняння виникають при зіставленні різних схем організації виробництва, оплати праці, під час проведення тендерів та конкурсів, підбору кандидатів на вакантні посади тощо. Усюди потрібне жеребкування або подібні до неї процедури. Пояснимо на прикладі виявлення найбільш сильної та другої за силою команди при організації турніру з олімпійської системи (який програв вибуває). Нехай завжди сильніша команда перемагає слабшу. Зрозуміло, що найсильніша команда однозначно стане чемпіоном. Друга за силою команда вийде у фінал тоді і лише тоді, коли до фіналу вона не матиме ігор з майбутнім чемпіоном. Якщо таку гру буде заплановано, то друга за силою команда у фінал не потрапить. Той, хто планує турнір, може або достроково «вибити» другу за силою команду з турніру, звівши її в першій зустрічі з лідером, або забезпечити їй друге місце, забезпечивши зустрічі з більш слабкими командами аж до фіналу. Щоб уникнути суб'єктивізму, проводять жеребкування. Для турніру з 8 команд ймовірність того, що у фіналі зустрінуться дві найсильніші команди, дорівнює 4/7. Відповідно до ймовірності 3/7 друга за силою команда залишить турнір достроково.

За будь-якого виміру одиниць продукції (за допомогою штангенциркуля, мікрометра, амперметра тощо) є похибки. Щоб з'ясувати, чи є систематичні похибки, необхідно зробити багаторазові виміри одиниці виробленої продукції, характеристики якої відомі (наприклад, стандартного зразка). При цьому слід пам'ятати, що, крім систематичної похибки, присутня і випадкова похибка.

Тому постає питання, як за результатами вимірювань дізнатися, чи є систематична похибка. Якщо відзначати лише, чи є отримана при черговому вимірі похибка позитивною чи негативною, це завдання можна звести до попередньої. Справді, порівняємо вимір із киданням монети, позитивну похибку – з випаданням герба, негативну – решітки (нульова похибка за достатньої кількості поділів шкали майже будь-коли зустрічається). Тоді перевірка відсутності систематичної похибки еквівалентна перевірці симетричності монети.

Метою цих міркувань є зведення завдання перевірки відсутності систематичної похибки завдання перевірки симетричності монети. Проведені міркування призводять до так званого «критерію знаків» математичної статистики.

При статистичному регулюванні технологічних процесів на основі методів математичної статистики розробляються правила та плани статистичного контролю процесів, спрямовані на своєчасне виявлення розладки технологічних процесів та вжиття заходів до їх налагодження та запобігання випуску продукції, що не відповідає встановленим вимогам. Ці заходи спрямовані на скорочення витрат виробництва та втрат від постачання неякісних одиниць продукції. При статистичному приймальному контролі з урахуванням методів математичної статистики розробляються плани контролю якості шляхом аналізу вибірок із партій продукції. Складність у тому, щоб вміти правильно будувати вероятностно-статистические моделі прийняття рішень, основі яких можна відповісти на поставлені вище питання. У математичній статистиці для цього розроблені ймовірнісні моделі та методи перевірки гіпотез, зокрема гіпотез про те, що частка дефектних одиниць продукції дорівнює певному числу р 0 наприклад, р 0 = 0,23 (згадайте слова Струкова з роману А.Н.Толстого).

Завдання оцінювання.У низці управлінських, виробничих, економічних, народногосподарських ситуацій виникають завдання іншого – завдання оцінки показників і параметрів розподілів ймовірностей.

Розглянемо приклад. Нехай на контроль надійшла партія з Nелектроламп. З цієї партії випадково відібрано вибірку обсягом nелектроламп. Виникає низка природних питань. Як за результатами випробувань елементів вибірки визначити середній термін служби електроламп та з якою точністю можна оцінити цю характеристику? Як зміниться точність, якщо взяти вибірку більшого обсягу? При якому числі годинника Тможна гарантувати, що не менше 90% електроламп прослужать Тта більше годин?

Припустимо, що під час випробування вибірки обсягом nелектроламп дефектними виявилися Хелектроламп. Тоді виникають такі питання. Які межі можна вказати для числа Dдефектних електроламп у партії, для рівня дефектності D/ Nі т.п.?

Або при статистичному аналізі точності та стабільності технологічних процесів слід оцінити такі показники якості, як середнє значення контрольованого параметра та ступінь його розкиду в аналізованому процесі. Відповідно до теорії ймовірностей як середнє значення випадкової величини доцільно використовувати її математичне очікування, а статистичної характеристики розкиду – дисперсію, середнє квадратичне відхилення чи коефіцієнт варіації. Звідси виникає питання: як оцінити ці статистичні характеристики за вибірковими даними та з якою точністю це вдається зробити? Аналогічних прикладів можна навести дуже багато. Тут важливо було показати, як теорія ймовірностей та математична статистика можуть бути використані у виробничому менеджменті при прийнятті рішень у галузі статистичного управління якістю продукції.

Що таке "математична статистика"?Під математичною статистикою розуміють розділ математики, присвячений математичним методам збору, систематизації, обробки та інтерпретації статистичних даних, а також використання їх для наукових або практичних висновків. Правила та процедури математичної статистики спираються на теорію ймовірностей, що дозволяє оцінити точність і надійність висновків, одержуваних у кожному завданні на підставі наявного статистичного матеріалу. При цьому статистичними даними називаються відомості про кількість об'єктів у будь-якій більш менш широкої сукупності, що володіють тими або іншими ознаками.

На кшталт розв'язуваних завдань математична статистика зазвичай ділиться на три розділи: опис даних, оцінювання та перевірка гіпотез.

За видом статистичних даних математична статистика ділиться на чотири напрями:

Одномірна статистика (статистика випадкових величин), у якій результат спостереження описується дійсним числом;

багатовимірний статистичний аналіз, де результат спостереження над об'єктом описується кількома числами (вектором);

Статистика випадкових процесів та часових рядів, де результат спостереження – функція;

Статистика об'єктів нечислової природи, в якій результат спостереження має нечислову природу, наприклад, є множиною (геометричною фігурою), впорядкуванням або отриманим результатом вимірювання за якісною ознакою.

Історично першою з'явилися деякі області статистики об'єктів нечислової природи (зокрема, завдання оцінювання частки шлюбу та перевірки гіпотез про неї) та одновимірна статистика. Математичний апарат їм простіше, тому з їхньої прикладі зазвичай демонструють основні ідеї математичної статистики.

Тільки методи обробки даних, тобто. Математична статистика є доказовими, які спираються на імовірнісні моделі відповідних реальних явищ і процесів. Йдеться про моделі поведінки споживачів, виникнення ризиків, функціонування технологічного обладнання, отримання результатів експерименту, перебігу захворювання тощо. Імовірнісну модель реального явища слід вважати побудованою, якщо аналізовані величини та зв'язки між ними виражені в термінах теорії ймовірностей. Відповідність імовірнісної моделі дійсності, тобто. її адекватність обґрунтовують, зокрема, за допомогою статистичних методів перевірки гіпотез.

Неймовірні методи обробки даних є пошуковими, їх можна використовувати лише при попередньому аналізі даних, оскільки вони не дають можливості оцінити точність та надійність висновків, отриманих на підставі обмеженого статистичного матеріалу.

Імовірнісні та статистичні методи застосовні усюди, де вдається побудувати та обґрунтувати ймовірнісну модель явища чи процесу. Їх застосування обов'язково, коли зроблені з урахуванням вибіркових даних висновки переносяться всю сукупність (наприклад, з вибірки протягом усього партію продукції).

У конкретних галузях застосування використовуються як імовірнісно-статистичні методи широкого застосування, так і специфічні. Наприклад, розділ виробничого менеджменту, присвяченого статистичним методам управління якістю продукції, використовують прикладну математичну статистику (включаючи планування експериментів). За допомогою її методів проводиться статистичний аналіз точності та стабільності технологічних процесів та статистична оцінка якості. До специфічних методів належать методи статистичного приймального контролю якості продукції, статистичного регулювання технологічних процесів, оцінки та контролю надійності та ін.

Широко застосовуються такі прикладні імовірнісно-статистичні дисципліни, як теорія надійності та теорія масового обслуговування. Зміст першої їх ясно з назви, друга займається вивченням систем типу телефонної станції, яку у випадкові моменти часу надходять виклики - вимоги абонентів, набираючих номери у своїх телефонних апаратах. Тривалість обслуговування цих вимог, тобто. тривалість розмов також моделюється випадковими величинами. Великий внесок у розвиток цих дисциплін зробили член-кореспондент АН СРСР А.Я. Хінчін (1894-1959), академік АН УРСР Б.В.Гнеденко (1912-1995) та інші вітчизняні вчені.

Коротко про історію математичної статистики.Математична статистика як наука починається з робіт знаменитого німецького математика Карла Фрідріха Гауса (1777-1855), який на основі теорії ймовірностей досліджував та обґрунтував метод найменших квадратів, створений ним у 1795 р. та застосований для обробки астрономічних даних (з метою уточнення орбіти малої Церера). Його ім'ям часто називають один із найбільш популярних розподілів ймовірностей – нормальний, а в теорії випадкових процесів основний об'єкт вивчення – гауссівські процеси.

Наприкінці ХІХ ст. – на початку ХХ ст. великий внесок у математичну статистику зробили англійські дослідники, передусім К.Пірсон (1857-1936) та Р.А.Фішер (1890-1962). Зокрема Пірсон розробив критерій «хі-квадрат» перевірки статистичних гіпотез, а Фішер – дисперсійний аналіз, теорію планування експерименту, метод максимальної правдоподібності оцінки параметрів.

У 30-ті роки ХХ ст. поляк Єжи Нейман (1894-1977) та англієць Е.Пірсон розвинули загальну теорію перевірки статистичних гіпотез, а радянські математики академік О.М. Колмогоров (1903-1987) та член-кореспондент АН СРСР Н.В.Смирнов (1900-1966) заклали основи непараметричної статистики. У сорокові роки ХХ ст. румун А. Вальд (1902-1950) побудував теорію послідовного статистичного аналізу.

Математична статистика бурхливо розвивається й у час. Так, за останні 40 років можна виділити чотири принципово нові напрями досліджень:

Розробка та впровадження математичних методів планування експериментів;

Розвиток статистики об'єктів нечислової природи як самостійного спрямування прикладної математичної статистики;

Розвиток статистичних методів, стійких до малих відхилень від використовуваної ймовірнісної моделі;

Широке розгортання робіт із створення комп'ютерних пакетів програм, призначених щодо статистичного аналізу даних.

Імовірнісно-статистичні методи та оптимізація.Ідея оптимізації пронизує сучасну прикладну математичну статистику та інші статистичні методи. А саме, методи планування експериментів, статистичного приймального контролю, статистичного регулювання технологічних процесів та ін. прикладної математичної статистики

У виробничому менеджменті, зокрема, при оптимізації якості продукції і на вимоги стандартів особливо важливо застосовувати статистичні методи на початковому етапі життєвого циклу продукції, тобто. на етапі науково-дослідної підготовки дослідно-конструкторських розробок (розробка перспективних вимог до продукції, аванпроекту, технічного завдання на дослідно-конструкторську розробку). Це пояснюється обмеженістю інформації, доступної на початковому етапі життєвого циклу продукції, та необхідністю прогнозування технічних можливостей та економічної ситуації на майбутнє. Статистичні методи повинні застосовуватися на всіх етапах розв'язання задачі оптимізації – при шкалюванні змінних, розробці математичних моделей функціонування виробів та систем, проведенні технічних та економічних експериментів тощо.

У завданнях оптимізації, у тому числі оптимізації якості продукції та вимог стандартів, використовують усі галузі статистики. А саме, статистику випадкових величин, багатовимірний статистичний аналіз, статистику випадкових процесів та часових рядів, статистику об'єктів нечислової природи. Вибір статистичного методу для аналізу конкретних даних доцільно проводити згідно з рекомендаціями.

Частина 1. Фундамент прикладної статистики

1.2.3. Суть імовірнісно-статистичних методів прийняття рішень

Як підходи, ідеї та результати теорії ймовірностей та математичної статистики використовуються при прийнятті рішень?

Базою є імовірнісна модель реального явища чи процесу, тобто. математична модель, у якій об'єктивні співвідношення виражені термінах теорії ймовірностей. Імовірності використовуються передусім для опису невизначеностей, які необхідно враховувати під час прийняття рішень. Маються на увазі як небажані можливості (ризики), так і привабливі (щасливий випадок). Іноді випадковість вноситься в ситуацію свідомо, наприклад, під час жеребкування, випадкового відбору одиниць для контролю, проведення лотерей або опитувань споживачів.

Теорія ймовірностей дозволяє за одними ймовірностями розрахувати інші, які цікавлять дослідника. Наприклад, за ймовірністю випадання герба можна розрахувати ймовірність того, що при 10 кидання монет випаде не менше 3 гербів. Подібний розрахунок спирається на ймовірну модель, згідно з якою кидання монет описуються схемою незалежних випробувань, крім того, випадання герба і решітки рівноможливі, а тому ймовірність кожної з цих подій дорівнює ½. Більш складною є модель, де замість кидання монети розглядається перевірка якості одиниці виробленої продукції. Відповідна ймовірна модель спирається на припущення про те, що контроль якості різних одиниць продукції описується схемою незалежних випробувань. На відміну від моделі з киданням монет, необхідно ввести новий параметр – ймовірність рте, що одиниця продукції є дефектною. Модель буде повністю описана, якщо прийняти, що всі одиниці продукції мають однакову можливість виявитися дефектними. Якщо останнє припущення неправильне, число параметрів моделі зростає. Наприклад, можна прийняти, що кожна одиниця продукції має свою можливість виявитися дефектною.

Обговоримо модель контролю якості із загальною для всіх одиниць продукції ймовірністю дефектності р. Щоб під час аналізу моделі «дійти до числа», необхідно замінити рна деяке конкретне значення. Для цього необхідно вийти з рамок ймовірнісної моделі та звернутися до даних, отриманих під час контролю якості. Математична статистика вирішує зворотне завдання стосовно теорії ймовірностей. Її мета – на основі результатів спостережень (вимірювань, аналізів, випробувань, дослідів) отримати висновки про ймовірності, що лежать в основі ймовірнісної моделі. Наприклад, на основі частоти появи дефектних виробів під час контролю можна зробити висновки про ймовірність дефектності (див. теорему Бернуллі вище). На основі нерівності Чебишева робилися висновки про відповідність частоти появи дефектних виробів гіпотезі про те, що ймовірність дефектності набуває певного значення.

Таким чином, застосування математичної статистики спирається на ймовірну модель явища або процесу. Використовуються два паралельних ряду понять – які стосуються теорії (імовірнісної моделі) і які стосуються практики (вибірці результатів спостережень). Наприклад, теоретичній ймовірності відповідає частота, знайдена за вибіркою. Математичне очікування (теоретичний ряд) відповідає вибіркове середнє арифметичне (практичний ряд). Як правило, вибіркові показники є оцінками теоретичних. При цьому величини, що належать до теоретичного ряду, «перебувають у головах дослідників», відносяться до світу ідей (за давньогрецьким філософом Платоном), недоступні для безпосереднього виміру. Дослідники мають у своєму розпорядженні лише вибіркові дані, за допомогою яких вони намагаються встановити властивості теоретичної ймовірнісної моделі, що їх цікавлять.

Навіщо ж потрібна імовірнісна модель? Справа в тому, що тільки з її допомогою можна перенести властивості, встановлені за результатами аналізу конкретної вибірки, на інші вибірки, а також на так звану генеральну сукупність. Термін «генеральна сукупність» використовується, коли йдеться про велику, але кінцеву сукупність одиниць, що вивчаються. Наприклад, про сукупність всіх жителів Росії або сукупність всіх споживачів розчинної кави в Москві. Мета маркетингових чи соціологічних опитувань у тому, щоб твердження, отримані за вибіркою із сотень чи тисяч жителів, перенести на генеральні сукупності кілька мільйонів. Під час контролю якості у ролі генеральної сукупності виступає партія продукції.

Щоб перенести висновки з вибірки більш широку сукупність, необхідні ті чи інші припущення про зв'язок вибіркових характеристик з характеристиками цієї більшої сукупності. Ці припущення ґрунтуються на відповідній імовірнісній моделі.

Звичайно, можна обробляти вибіркові дані, не використовуючи ту чи іншу ймовірну модель. Наприклад, можна розраховувати вибіркове середнє арифметичне, підраховувати частоту виконання тих чи інших умов тощо. Проте результати розрахунків відноситимуться лише до конкретної вибірки, перенесення отриманих з їх допомогою висновків на будь-яку іншу сукупність некоректне. Іноді подібну діяльність називають "аналіз даних". Порівняно з імовірнісно-статистичними методами, аналіз даних має обмежену пізнавальну цінність.

Отже, використання імовірнісних моделей на основі оцінювання та перевірки гіпотез за допомогою вибіркових характеристик – ось суть імовірнісно-статистичних методів прийняття рішень.

Підкреслимо, що логіка використання вибіркових характеристик до ухвалення рішень з урахуванням теоретичних моделей передбачає одночасне використання двох паралельних рядів понять, одне із яких відповідає імовірнісним моделям, а другий – вибірковим даним. На жаль, у ряді літературних джерел, зазвичай застарілих чи написаних у рецептурному дусі, немає різниці між вибірковими і теоретичними характеристиками, що призводить читачів до подивів і помилок при практичному використанні статистичних методів.

Попередня

Ймовірнісно-статистичні методи моделювання економічних систем


Вступ


Під завданням ідентифікації закону розподілу випадкової величини, що спостерігається (структурно-параметричної ідентифікації), як правило, розуміють завдання вибору такої параметричної моделі закону розподілу ймовірностей, яка найкраще відповідає результатам експериментальних спостережень. Випадкові помилки засобів вимірів негаразд часто підпорядковуються нормальному закону, точніше, негаразд часто описуються моделлю нормального закону. В основі вимірювальних приладів та систем лежать різні фізичні принципи, різні методи вимірювання та різні перетворення вимірювальних сигналів. Похибки вимірювань як величини є наслідком впливу безлічі факторів, випадкового та невипадкового характеру, що діють постійно чи епізодично. Тому зрозуміло, що при виконанні певних передумов (теоретичних і технічних) похибки вимірювань досить добре описуються моделлю нормального закону.

Взагалі кажучи, слід розуміти, що справжній закон розподілу (якщо він, звичайно, існує), який описує похибки конкретної вимірювальної системи, залишається (залишиться) невідомим, незважаючи на всі наші спроби його ідентифікувати. На підставі даних вимірювань і теоретичних міркувань ми можемо лише підібрати ймовірну модель, яка в певному сенсі найкраще наближає цей істинний закон. Якщо побудована модель адекватна, тобто застосовувані критерії не дають підстав для її відхилення, то на основі даної моделі можна обчислити всі ймовірнісні характеристики випадкової складової похибки вимірювального засобу, які будуть відрізнятися від справжніх значень тільки за рахунок не виключеної систематичної (неспостережуваної або нереєстрованої) ) складової похибки вимірів. Її трохи і характеризує правильність вимірів. Безліч можливих законів розподілу ймовірностей, які можна використовувати для опису випадкових величин, що спостерігаються, не обмежена. Безглуздо ставити за мету завдання ідентифікації знаходження справжнього закону розподілу спостережуваної величини. Ми можемо лише вирішувати завдання вибору найкращої моделі з деякої множини. Наприклад, з того безлічі параметричних законів і се мейств розподілів, які у додатках, і згадка про які можна знайти у літературних джерелах.

Класичний підхід до структурно-параметричної ідентифікації закону розподілу. Під класичним підходом розумітимемо алгоритм вибору закону розподілу, що цілком базується на апараті математичної статистики.


1. Елементарні поняття про випадкові події, величини та функції


Ми вже бачили, що для багатьох експериментів немає ніяких відмінностей у підрахунку ймовірностей подій, тоді як елементарні результати цих експериментів дуже різняться. Але нас і мають цікавити саме ймовірність подій, а не структура простору елементарних результатів. Тому час у всіх таких «схожих» експериментах замість різних елементарних результатів використовувати, наприклад, числа. Інакше кажучи, кожному елементарному результату поставити у відповідність деяке речове число, і працювати тільки з числами.

Нехай задано імовірнісний простір.

Визначення 26.Функція називається випадковою величиною, якщо для будь-якої борелівської множини безліч є подією, тобто. належить - алгебри .

Безліч , Що складається з тих елементарних наслідків , для яких належить називається повним прообразом безлічі.

Примітка 9 . Взагалі, нехай функція діє з безлічі у безліч , та задані -алгебри і підмножин і відповідно. Функція називається вимірною, якщо для будь-якої множини його повний прообраз належить.

Зауваження 10. Читач, який не бажає забивати собі голову абстракціями, пов'язаними з -алгебрами подій і з вимірністю, може сміливо вважати, що будь-яка безліч елементарних наслідків є подія, і, отже, випадкова величина є довільнафункція з в . Неприємностей на практиці це не тягне за собою, так що все подальше в цьому параграфі можна пропустити.

Тепер, позбавившись нецікавих читачів, спробуємо зрозуміти, навіщо випадковій величині потрібна вимірність.

Якщо задана випадкова величина , нам може знадобитися обчислити ймовірності виду , , , (і взагалі різні ймовірності попадання в борелівські множини на прямий). Це можливо лише якщо множини, що стоять під знаком ймовірності, є подіями - адже ймовірністьє функція, визначена тільки на -алгебри подій. Вимога вимірності рівнозначна тому, що для будь-якої борелівської множини визначено ймовірність.

Можна вимагати у визначенні чогось іншого. Наприклад, щоб подією було потрапляння до будь-якого інтервалу: , чи будь-який полуинтервал: .

Переконаємося, наприклад, що еквівалентні визначення 26 та 27:

Визначення 27. Функція називається випадковою величиною, якщо для будь-яких речових безліч належить -алгебри .

Доведення еквівалентності визначень 26, 27.

Якщо - Випадкова величина в сенсі визначення 26, то вона буде випадковою величиною і в сенсі визначення 27, оскільки будь-який інтервал є борелівським безліччю.

Доведемо, що вірне та протилежне. Нехай для будь-якого інтервалу виконано . Ми повинні довести, що те саме вірно і для будь-яких борелівських множин.

Зберемо в безлічі всі підмножини речової прямої, прообрази яких є подіями. Безліч вже містить усі інтервали . Покажемо тепер, що безліч є -алгеброю. За визначенням, тоді і тільки тоді, коли безліч належить.

1. Переконаємося, що . Але і, отже, .

2. Переконаємося, що для будь-кого . Нехай . Тоді , так як - -алгебра.

3. Переконаємося, що для будь-яких . Нехай для всіх . Але - -алгебра, тому

Ми довели, що - -Алгебра і містить всі інтервали на прямий. Але - найменша з -алгебр, що містять усі інтервали на прямий. Отже, містить: .

Наведемо приклади вимірних та незмірних функцій.

Приклад 25. Підкидаємо кубик. Нехай , і дві функції з в задані так: , . Поки що не задана -алгебра , не можна говорити про вимірність. Функція, вимірна щодо якоїсь -алгебри , може бути такий інший .

Якщо є безліч усіх підмножин , то і є випадковими величинами, оскільки будь-яка безліч елементарних наслідків належить , у тому числі й або . Можна записати відповідність між значеннями випадкових величин і та ймовірностями приймати ці значення у вигляді «таблиці розподілу ймовірностей»або, коротко, «таблиці розподілу»:

Тут.


2. Нехай -алгебра подій складається з чотирьох множин:



тобто. подією є, крім достовірного та неможливого подій, випадання парного чи непарного числа очок. Переконаємося, що за такої порівняно бідної -алгебри ні ні є випадковими величинами, оскільки вони незмірні. Візьмемо, скажімо, . Бачимо, що і


2. Числові характеристики випадкових величин


Математичне очікування.Математичним очікуванням дискретної випадкової величини Х, яка приймає кінцеве число значень хi з ймовірностями рi, називається сума:


(6а)


Математичним очікуванням безперервної випадкової величини Х називається інтеграл від добутку її значень х на щільність розподілу ймовірностей f(x):


(6б)


Невласний інтеграл (6б) передбачається абсолютно схожим (інакше говорять, що математичне очікування М (Х) немає). Математичне очікування характеризує середнє значення випадкової величини Х. Його розмірність збігається із розмірністю випадкової величини. Властивості математичного очікування:



Дисперсія.Дисперсією випадкової величини Х називається число:



Дисперсія є характеристикою розсіювання значень випадкової величини Х щодо середнього значення М (Х). Розмірність дисперсії дорівнює розмірності випадкової величини у квадраті. Виходячи з визначень дисперсії (8) та математичного очікування (5) для дискретної випадкової величини та (6) для безперервної випадкової величини отримаємо аналогічні вирази для дисперсії:



Тут m = М(Х).

Властивості дисперсії:


(10)


Середнє квадратичне відхилення:


(11)


Так як розмірність середнього квадратичного відхилення та ж, що й у випадкової величини, воно частіше, ніж дисперсія, використовується як міра розсіювання.

Моменти розподілу.Поняття математичного очікування та дисперсії є окремими випадками більш загального поняття для числових характеристик випадкових величин - моментів розподілу. Моменти розподілу випадкової величини вводяться як математичні очікування деяких найпростіших функцій випадкової величини. Так, моментом порядку k щодо точки х0називається математичне очікування М (Х - х0) k. Моменти щодо початку координат х = 0 називаються початковими моментами та позначаються:


(12)


Початковий момент першого порядку є центр розподілу випадкової величини, що розглядається:


(13)


Моменти щодо центру розподілу х = m називаються центральними моментами та позначаються:


(14)


З (7) слід, що центральний момент першого порядку завжди дорівнює нулю:


(15)


Центральні моменти не залежать від початку відліку значень випадкової величини, так як при зрушенні на постійне значення її центр розподілу зрушується на те ж значення, а відхилення від центру не змінюється:


Х – m = (Х – С) – (m – С).


Тепер очевидно, що дисперсія – це центральний момент другого порядку:


(16)


Асиметрія.Центральний момент третього порядку:


(17)


служить з метою оцінки асиметрії розподілу. Якщо розподіл симетрично щодо точки х = m, то центральний момент третього порядку дорівнюватиме нулю (як і всі центральні моменти непарних порядків). Тому, якщо центральний момент третього порядку відмінний від нуля, то розподіл не може бути симетричним. Величину асиметрії оцінюють за допомогою безрозмірного коефіцієнта асиметрії:


(18)


Знак коефіцієнта асиметрії (18) свідчить про правосторонню чи лівосторонню асиметрію (рис. 2).


Рис. 1. Види асиметрії розподілів


Ексцес.Центральний момент четвертого порядку:


(19)


служить для оцінки так званого ексцесу, що визначає ступінь крутості (гостровершинності) кривої розподілу поблизу центру розподілу по відношенню до кривої нормального розподілу. Тому що для нормального розподілу , то як ексцес приймається величина:


(20)


На рис. 3 наведено приклади кривих розподілу з різними значеннями ексцесу. Для нормального розподілу Е = 0. Криві, більш гостроверхі, ніж нормальна, мають позитивний ексцес, більш плосковершинні - негативний.


Рис. 2. Криві розподіли з різним ступенем крутості (ексцесом)


p align="justify"> Моменти більш високих порядків в інженерних додатках математичної статистики зазвичай не застосовуються.

Модадискретна випадкова величина - це її найбільш ймовірне значення. Модою безперервної випадкової величини називається її значення, у якому щільність ймовірності максимальна (рис. 2). Якщо крива розподілу має один максимум, то розподіл називається унімодальним. Якщо крива розподілу має більше одного максимуму, розподіл називається полімодальним. Іноді зустрічаються розподіли, криві яких мають максимум, а мінімум. Такі розподіли називаються антимодальними. Загалом мода і математичне очікування випадкової величини не збігаються. У окремому випадку, для модального, тобто. що має моду, симетричного розподілу та за умови, що існує математичне очікування, останнє збігається з модою та центром симетрії розподілу.

Медіанавипадкової величини Х - це її значення Ме, для якого має місце рівність: тобто. рівноймовірно, що випадкова величина Х виявиться меншою або більшою за Ме. Геометрично медіана - це абсцис точки, в якій площа під кривою розподілу ділиться навпіл. У разі симетричного модального розподілу медіана, мода та математичне очікування збігаються.


. Статистична оцінка законів розподілу випадкових величин


Генеральною сукупністю - називається сукупність всіх об'єктів, що підлягають вивченню, або можливих результатів усіх спостережень, що проводяться в однакових умовах над одним об'єктом.

Вибірковою сукупністю або вибіркою називається сукупність об'єктів чи результатів спостереження над об'єктом, відібраних випадково з генеральної сукупності.

Об'ємом вибіркиназивається число об'єктів чи спостережень у вибірці.

Конкретні значення вибірки називаються спостережуваними значеннями випадкової величини Х. Значення, що спостерігаються, заносяться в протокол. Протокол є таблицею. Складений протокол є первинною формою запису обробки отриманого матеріалу. Для отримання достовірних, надійних висновків вибірка має бути досить представницькою за обсягом. Велика вибірка – це невпорядковане безліч чисел. Для дослідження вибірку призводять до наочно упорядкованого вигляду. Для цього в протоколі знаходять найбільше та найменше значення випадкової величини. Вибірка, відсортована за зростанням, наведено у таблиці 1.

Таблиця 1. Протокол

8,66-5,49-4,11-3,48-2,9-2,32-1,82-1,09-0,440,64-8,31-4,71-3,92-3,41-2,85-2,31-1,82-1,01-0,430,71-8,23-4,68-3,85-3,33-2,83-2,29-1,8-0,99-0,430,73-7,67-4,6-3,85-3,25-2,77-2,27-1,77-0,95-0,310,99-6,64-4,43-3,81-3,08-2,72-2,25-1,73-0,89-0,31,03-6,6-4,38-3,8-3,07-2,67-2,19-1,38-0,70,041,05-6,22-4,38-3,77-3,01-2,6-2,15-1,32-0,560,081,13-5,87-4,25-3,73-3,01-2,49-2,09-1,3-0,510,151,76-5,74-4,18-3,59-2,99-2,37-2,01-1,28-0,490,262,95-5,68-4,14-3,49-2,98-2,33-1,91-1,24-0,480,534,42

Розмахом вибіркиназивається різницю між найбільшим і найменшим значенням випадкової величини Х:

Розмах вибірки розбивають на k інтервалів – розрядів. Число розрядів встановлюють залежно від величини розмаху вибірки від 8 до 25, у цій роботі приймемо k = 10.

Тоді довжина інтервалу дорівнюватиме:

У протоколі підрахуємо число значень, що спостерігаються, що потрапили в кожен інтервал, позначимо їх m1, m2,…, m10. .

Назвемо mi частотою влученнявипадкової величини i інтервал. Якщо яке-небудь значення випадкової величини, що спостерігається, збігається з кінцем інтервалу, то це значення випадкової величини за домовленістю відносять в один з інтервалів.

Після того як визначили частоти mi, визначимо частостідовільної величини, тобто. знайдемо відношення частот mi до загального числа значень n, що спостерігаються.

Частина, умова повноти

Знайдемо середину кожного інтервалу: .

Складемо таблицю 2

Таблиця значень меж інтервалів та відповідних частостей , де i = 1, 2, 3, …, k називається статистичним рядом. Графічним зображенням статистичного ряду називається гістограма. Вона будується так: по осі абсцис відкладають інтервали і кожному такому інтервалі, як у підставі, будується прямокутник, площа якого дорівнює відповідної частоти.

, - Висота прямокутника, .


Таблиця 2

Номер інтервалуЛіва межа інтервалуПрава межа інтервалуІнтервалСередина інтервалуЧастота інтервалуЧасткість інтервалуВисота прямо-кутника1-8,66-7,352(-8,66; -7,352)-8,00640,040,03062-7,342 ,030,02293-6,044-4,736(-6,044; -4,736)-5,3940,040,03064-4,736-3,428(-4,736; -3,428)-4,082200,20,12 3,428; -0,158140,140,107080,4961,804(0,496; 1,804)1,1590,090,068891,8043,112(1,804; 3,112)2,45810,010,12,3 )3,76610,010,0076Сумма1001

Малюнок 3


Статистичною функцією розподілу називається частота випадкової величини, яка не перевищує заданого значення Х:

Для дискретної випадкової величини Х статистична функція розподілу знаходиться за такою формулою:

Запишемо статистичну функцію розподілу у розгорнутому вигляді:

де - це середина інтервалу i, а - це відповідні частоти, де i = 1, 2, ..., k.

Графік статистичної функції розподілу є ступінчаста лінія, точками розриву якої є середини інтервалів, а кінцеві стрибки дорівнюють відповідним частотам.


Малюнок 3


Обчислення числових характеристик статистичного ряду

Статистичне математичне очікування,

Статистична дисперсія,

Статистичне середньоквадратичне відхилення.

Статистичним математичним очікуваннямабо статистичним середнімназивається середньоарифметичне значень випадкової величини Х, що спостерігаються.

Статистичною дисперсієюназивається середньоарифметичне значення величини

При великому обсязі вибірки обчислення за формулами приводять до громіздких викладок. Для спрощення розрахунків використовують статистичний ряд із кордонами та частостями , де i = 1, 2, 3, …, k, знаходять середини інтервалів , а потім усі елементи вибірки , які потрапили в інтервал , замінюють єдиним значенням тоді таких значень буде у кожному інтервалі.

де - Середнє значення відповідного інтервалу ;- Частина інтервалу

Таблиця 4. Числові показники

Частина PiXiPi(Xi-m) -0,21568,971940,35894-4,0820,20-0,81642,847050,56945-2,7740,26-0,72120,143880,03746-1,4660,18-0,26 -0,1580,14-0,02215,002740,700481,150,090,103512,564761,130892,4580,010,024623,548500,2355103,37903 -2,3947 Статистична дисперсія 5,3822Статистичне середнє квадратичне відхилення2,3200

Визначає положення центру угруповання значень випадкової величини, що спостерігаються.

, характеризують розсіювання значень випадкової величини, що спостерігаються навколо

У кожному статистичному розподілі неминуче присутні елементи випадковості. Проте за дуже велику кількість спостережень ці випадковості згладжуються, і випадкові явища виявляють властиву йому закономірність.

При обробці статистичного матеріалу доводиться вирішувати питання, як підібрати для даного статистичного ряду теоретичну криву. Ця теоретична крива розподілу має виражати суттєві риси статистичного розподілу - це завдання називається завданням згладжування чи вирівнювання статистичного ряду.

Іноді загальний вигляд розподілу випадкової величини Х випливає із самої природи цієї випадкової величини.

Нехай випадкова величина Х – це результат виміру деякої фізичної величини приладу.

Х = точне значення фізичної величини + помилка приладу.

Випадкова помилка приладу при вимірі має сумарну природу та розподілена за нормальним законом. Отже такий самий розподіл має випадкова величина Х, тобто. нормальний розподіл із щільністю ймовірності:


Де , , .


Параметри і визначаються так, щоб числові характеристики теоретичного розподілу дорівнювали відповідним числовим характеристикам статистичного розподілу. При нормальному розподілі вважають, що ,,, Тоді функція нормального розподілу набуде вигляду:

Таблиця 5. Вирівнююча крива

Номер інтервалуСередина інтервалу Xi Табульована функція Нормальна крива 1-8,0060-2,41870,02140,00922-6,6980-1,85490,07140,03083-5,3900-1,29110,17340,07474-4,0820-0,72230 2,7740-0,16350,39360,1697M-2,394700,39890,17206-1,46600,40030,36820,15877-0,15800,96410,25070,125 09170,04480,0193103,76602,65550,01170,0051

Теоретичну нормальну криву будуємо за точками на одному графіку з гістограмою статистичного ряду (Помилка! Джерело посилання не знайдено).


Малюнок 6


Вирівнювання статистичної функції розподілу

Статистичну функцію розподілу вирівнюємо функцією розподілу нормального закону:



де ,,- Функція Лапласа.


Таблиця 7. Функція розподілу

Номер інтервалуСередина інтервалу Xi Функція Лапласа Функція розподілу 1-8,0060-2,4187-0,49220,00782-6,6980-1,8549-0,46820,03183-5,3900-1,2911-0,40170,09834-4,0820-0, 7273-0,26650,23355-2,7740-0,1635-0,06490,4351m-2,3947000,50006-1,46600,40030,15550,65557-0,15501 52790,43670,936792,45802,09170,48180,9818103,76602,65550,49600,9960

Будуємо графік теоретичної функції розподілу за точками / разом із графіком статистичної функції розподілу.


Малюнок 6


Нехай вивчається випадкова величина Х з математичним очікуванням та дисперсією , обидва параметри невідомі.

Нехай х1, х2, х3, …, хn – вибірка, отримана в результаті проведення n незалежних спостережень випадкової величини Х. Щоб підкреслити випадковий характер величин х1, х2, х3, …, хn перепишемо їх у вигляді:

Х1, Х2, Х3, …, Хn, де Хi - значення випадкової величини Х в i-му досвіді.

Потрібно на підставі цих досвідчених даних оцінити математичне очікування та дисперсію випадкової величини. Такі оцінки називаються точковими, як оцінку m і D можна прийняти статистичне математичне очікування і статистичну дисперсію, де



До проведення досвіду вибірка Х1, Х2, Х3, …, Хn є сукупність незалежних випадкових величин, які мають математичне очікування та дисперсію, а значить розподіл ймовірності такі самі як і сама випадкова величина Х. Таким чином:


Де i = 1, 2, 3, …, n.


Виходячи з цього, знайдемо математичне очікування та дисперсію випадкової величини (користуючись властивостями математичного очікування).

Таким чином, математичне очікування статистичного середнього дорівнює точному значенню математичного очікування m вимірюваної величини, а дисперсія статистичного середнього у n разів менше дисперсії окремих результатів вимірів.


при


Це означає, що при великому обсязі вибірки статистичне середні N є величиною майже невипадковою, вона лише незначно відхиляється від точного значення випадкової величини m. Цей закон називається законом великих чисел Чебишева.

Точкові оцінки невідомих значень математичного очікування та дисперсії мають велике значення на початковому етапі обробки статичних даних. Їх недолік у тому, що невідомо з якою точністю вони дають параметр, що оцінюється.

Нехай за цією вибіркою Х1, Х2, Х3, …, Хn отримані точні статистичні оцінки і тоді числові характеристики випадкової величини Х будуть приблизно рівні . Для вибірки невеликого обсягу питання поточності оцінки істотне, т.к. між m та , D та будуть недостатньо великі відхилення. Крім того, при вирішенні практичних завдань потрібно не тільки знайти наближені значення m і D, але й оцінити їх точність і надійність. Нехай , тобто. є точковою оцінкою для m. Очевидно, що тим точніше визначає m, чим менше модуль різниці . Нехай , де ?>0, тоді, чим менше ?, тим точніше, оцінка m. Таким чином, ?>0 характеризує точність оцінки параметра. Проте статистичні методи неможливо категорично стверджувати, що оцінка істинного значення m задовольняє , можна лише говорити про ймовірність ?, з якою ця нерівність виконується:

Таким чином, ?- це довірча ймовірністьабо надійність оцінки, значення ? вибираються заздалегідь залежно від завдання, що розв'язується. Надійність ? прийнято обирати 0.9; 0.95; 0.99; 0,999. Події з такою ймовірністю практично достовірні. За заданою вірогідністю можна знайти число ?>0 з .

Тоді отримаємо інтервал , який накриває з ймовірністю ? справжнє значення математичного очікування m, довжина цього інтервалу дорівнює 2 ?. Цей інтервал називається довірчим інтервалом. А такий спосіб оцінки невідомого параметра m - інтервальним.



Нехай дана вибірка Х1, Х2, Х3, …, Хn, і нехай по цій вибірці знайдено , ,.

Потрібно знайти довірчий інтервал для математичного очікування m з довірчою ймовірністю ?. Величина є величина випадкова з математичним очікуванням, .

Випадкова величина має сумарну природу, при великому обсязі вибірки вона розподілена згідно із законом близьким до нормального. Тоді ймовірність попадання випадкової величини в інтервал дорівнюватиме:


Де


Де - Функція Лапласа.

З формули (3) та таблиць функції Лапласа знаходимо число ?>0 та записуємо довірчий інтервал для точного значення випадкової величини Х з надійністю?

У цій роботі значення ? замінимо , і тоді формула (3) набуде вигляду:

Знайдемо довірчий інтервал , В якому знаходиться математичне очікування. При ? = 0.99, n = 100, ,.

за таблицями Лапласа знаходимо:

Звідси? = 0,5986.

Довірчий інтервал, у якому з ймовірністю 99% є точне значення математичного очікування.


Висновок

випадковий розмір розподіл економічний

Вирішення завдань структурно-параметричної ідентифікації при обмежених обсягах вибірок, якими, як правило, мають метрологи, загострює проблему. У цьому випадку ще більш важливими виявляються коректність застосування статистичних методів аналізу. користування оцінок, що володіють найкращими статистичними властивостями, та критеріїв, що мають найбільшу потужність.

При вирішенні завдань ідентифікації краще спиратися на класичний підхід. При ідентифікації рекомендується розглядати ширше безліч законів розподілу, зокрема моделі як сумішей законів. У цьому випадку для будь-якого емпіричного розподілу ми завжди зможемо побудувати адекватну, статистично суттєво більш обґрунтовану математичну модель.

Слід орієнтуватися на використання та розробку програмних систем, що забезпечують вирішення завдань структурно-параметричної ідентифікації законів розподілів за будь-якої форми реєстрованих спостережень (вимірювань), що включають сучасні методи статис тичного аналізу, орієнтуватися на широке, але коректне використання у дослідженнях методів комп'ютерного моделювання. Ми вже бачили, що для багатьох експериментів немає ніяких відмінностей у підрахунку ймовірностей подій, тоді як елементарні результати цих експериментів дуже різняться. Але нас і мають цікавити саме ймовірність подій, а не структура простору елементарних результатів. Тому час у всіх таких «схожих» експериментах замість різних елементарних результатів використовувати, наприклад, числа. Інакше кажучи, кожному елементарному результату поставити у відповідність деяке речове число, і працювати тільки з числами.

3.5.1. Імовірнісно-статистичний метод дослідження.

У багатьох випадках необхідно досліджувати не лише детерміновані, а й випадкові імовірнісні (статистичні) процеси. Ці процеси розглядаються з урахуванням теорії ймовірностей.

Сукупність випадкової величини x становить первинний математичний матеріал. Під сукупністю розуміють багато однорідних подій. Сукупність, що містить різні варіанти масового явища, називають генеральною сукупністю, або великою вибіркою N.Зазвичай вивчають лише частину генеральної сукупності, яка називається виборною сукупністю чи малою вибіркою.

Ймовірністю Р(х)події хназивають відношення числа випадків N(x),які призводять до настання події х, до загального числа можливих випадків N:

P(x)=N(x)/N.

Теорія імовірностірозглядає теоретичні розподілу випадкових величин та його характеристики.

Математична статистиказаймається способами обробки та аналізу емпіричних подій.

Ці дві споріднені науки становлять єдину математичну теорію масових випадкових процесів, що широко застосовується для аналізу наукових досліджень.

Дуже часто застосовують методи ймовірностей та математичної статистики в теорії надійності, живучості та безпеки, яка широко використовується в різних галузях науки та техніки.

3.5.2. Метод статистичного моделювання чи статистичних випробувань (метод Монте-Карло).

Цей метод є чисельним методом вирішення складних завдань і заснований на використанні випадкових чисел, що моделюють ймовірнісні процеси. Результати вирішення цим методом дозволяють встановити емпірично залежність досліджуваних процесів.

Вирішення завдань методом Монте-Карло ефективне лише з використанням швидкодіючих ЕОМ. Для вирішення завдань методом Монте-Карло необхідно мати статистичний ряд, знати закон його розподілу, середнє математичне очікування т(х),середньоквадратичне відхилення.

З допомогою цього можна отримати як завгодно задану точність рішення, тобто.

-> т(х)

3.5.3. Метод системного аналізу.

Під системним аналізом розуміють сукупність прийомів і методів вивчення складних систем, що є складну сукупність взаємодіючих між собою елементів. Взаємодія елементів системи характеризується прямими та зворотними зв'язками.

Сутність системного аналізу полягає в тому, щоб виявити ці зв'язки та встановити їх вплив на поведінку всієї системи загалом. Найбільш повно і глибоко можна виконати системний аналіз методами кібернетики, яка є наукою про складні динамічні системи, здатні сприймати, зберігати і переробляти інформацію з метою оптимізації та управління.

Системний аналіз складається із чотирьох етапів.

Перший етап полягає у постановці завдання: визначають об'єкт, цілі та завдання дослідження, а також критерії для вивчення об'єкта та управління ним.

Під час другого етапу визначають межі системи, що вивчається, і визначають її структуру. Всі об'єкти та процеси, що мають відношення до поставленої мети, розбивають на два класи ~ власне досліджувану систему та зовнішнє середовище. Розрізняють замкнутіі відкритісистеми. При дослідженні замкнутих систем впливом довкілля з їхньої поведінка нехтують. Потім виділяють окремі складові системи - її елементи, встановлюють взаємодію між ними і зовнішнім середовищем.

Третій етап системного аналізу полягає у складанні математичної моделі досліджуваної системи. Спочатку виробляють параметризацію системи, описують основні елементи системи та елементарні на неї з допомогою тих чи інших параметрів. При цьому розрізняють параметри, що характеризують безперервні та дискретні, детерміновані та ймовірнісні процеси. Залежно від особливостей процесів використовують той чи інший математичний апарат.

В результаті третього етапу системного аналізу формуються закінчені математичні моделі системи, описані формальною, наприклад алгоритмічною, мовою.

На четвертому етапі аналізують отриману математичну модель, знаходять її екстремальні умови з метою оптимізації процесів та управління системами та формулюють висновки. Оцінку оптимізації проводять за критерієм оптимізації, який приймає в цьому випадку екстремальні значення (мінімум, максимум, мінімакс).

Зазвичай вибирають якийсь один критерій, а для інших встановлюють гранично гранично-допустимі значення. Іноді застосовують змішані критерії, що є функцією від первинних параметрів.

З обраного критерію оптимізації становлять залежність критерію оптимізації від параметрів моделі досліджуваного об'єкта (процесу).

Відомі різні математичні методи оптимізації досліджуваних моделей: методи лінійного, нелінійного чи динамічного програмування; методи імовірнісно-статистичні, засновані на теорії масового обслуговування; теорія ігор, що розглядає розвиток процесів як випадкові ситуації.

Запитання для самоконтролю знань

Методологія теоретичних досліджень.

Основні розділи етапу теоретичних розробок наукового дослідження.

Типи моделей та види моделювання об'єкта дослідження.

Аналітичні методи дослідження.

Аналітичні методи дослідження із застосуванням експерименту.

Імовірнісно-аналітичний метод дослідження.

Методи статичного моделювання (метод Монте-Карло).

Спосіб системного аналізу.

Надіслати свою гарну роботу до бази знань просто. Використовуйте форму нижче

Студенти, аспіранти, молоді вчені, які використовують базу знань у своєму навчанні та роботі, будуть вам дуже вдячні.

Розміщено на http://www.allbest.ru/

Розміщено на http://www.allbest.ru/

Вступ

1. Розподіл "хі-квадрат"

Висновок

додаток

Вступ

Як підходи, ідеї та результати теорії ймовірностей використовуються у нашому житті? математичний квадрат теорія

Базою є імовірнісна модель реального явища чи процесу, тобто. математична модель, у якій об'єктивні співвідношення виражені термінах теорії ймовірностей. Імовірності використовуються, перш за все, для опису невизначеностей, які необхідно враховувати під час прийняття рішень. Маються на увазі як небажані можливості (ризики), так і привабливі ("щасливий випадок"). Іноді випадковість вноситься в ситуацію свідомо, наприклад, під час жеребкування, випадкового відбору одиниць для контролю, проведення лотерей або опитувань споживачів.

Теорія ймовірностей дозволяє за одними ймовірностями розрахувати інші, які цікавлять дослідника.

Імовірнісна модель явища чи процесу є фундаментом математичної статистики. Використовуються два паралельні ряди понять - які стосуються теорії (імовірнісної моделі) і які стосуються практики (вибірці результатів спостережень). Наприклад, теоретичній ймовірності відповідає частота, знайдена за вибіркою. Математичне очікування (теоретичний ряд) відповідає вибіркове середнє арифметичне (практичний ряд). Як правило, вибіркові показники є оцінками теоретичних. При цьому величини, що належать до теоретичного ряду, "перебувають у головах дослідників", відносяться до світу ідей (за давньогрецьким філософом Платоном), недоступні для безпосереднього виміру. Дослідники мають у своєму розпорядженні лише вибіркові дані, за допомогою яких вони намагаються встановити властивості теоретичної ймовірнісної моделі, що їх цікавлять.

Навіщо ж потрібна імовірнісна модель? Справа в тому, що тільки з її допомогою можна перенести властивості, встановлені за результатами аналізу конкретної вибірки, на інші вибірки, а також на так звану генеральну сукупність. Термін "генеральна сукупність" використовується, коли йдеться про велику, але кінцеву сукупність одиниць, що вивчаються. Наприклад, про сукупність всіх жителів Росії або сукупність всіх споживачів розчинної кави в Москві. Мета маркетингових чи соціологічних опитувань у тому, щоб твердження, отримані за вибіркою із сотень чи тисяч жителів, перенести на генеральні сукупності кілька мільйонів. Під час контролю якості у ролі генеральної сукупності виступає партія продукції.

Щоб перенести висновки з вибірки більш широку сукупність, необхідні ті чи інші припущення про зв'язок вибіркових характеристик з характеристиками цієї більшої сукупності. Ці припущення ґрунтуються на відповідній імовірнісній моделі.

Звичайно, можна обробляти вибіркові дані, не використовуючи ту чи іншу ймовірну модель. Наприклад, можна розраховувати вибіркове середнє арифметичне, підраховувати частоту виконання тих чи інших умов тощо. Проте результати розрахунків відноситимуться лише до конкретної вибірки, перенесення отриманих з їх допомогою висновків на будь-яку іншу сукупність некоректне. Іноді таку діяльність називають "аналіз даних". Порівняно з імовірнісно-статистичними методами, аналіз даних має обмежену пізнавальну цінність.

Отже, використання імовірнісних моделей на основі оцінювання та перевірки гіпотез за допомогою вибіркових характеристик – ось суть імовірнісно-статистичних методів прийняття рішень.

1. Розподіл "хі-квадрат"

За допомогою нормального розподілу визначаються три розподіли, які часто використовуються при статистичній обробці даних. Це розподіли Пірсона ("хі - квадрат"), Стьюдента та Фішера.

Ми зупинимося на розподілі ("хі – квадрат"). Вперше цей розподіл було досліджено астрономом Ф. Хельмертом у 1876 році. У зв'язку з гауссівською теорією помилок він досліджував суми квадратів n незалежних стандартно нормально розподілених випадкових величин. Пізніше Карл Пірсон (Karl Pearson) дав ім'я цієї функції розподілу "хі - квадрат". І зараз розподіл носить його ім'я.

Завдяки тісному зв'язку з нормальним розподілом, ч2-розподіл відіграє важливу роль у теорії ймовірностей та математичної статистики. ч2-розподіл, та багато інших розподілів, які визначаються за допомогою ч2-розподілу (наприклад - розподіл Стьюдента), описують вибіркові розподіли різних функцій від нормально розподілених результатів спостережень і використовуються для побудови довірчих інтервалів та статистичних критеріїв.

Розподіл Пірсона (хі - квадрат) - розподіл випадкової величини де X1, X2, ..., Xn - нормальні незалежні випадкові величини, причому математичне очікування кожної їх дорівнює нулю, а середнє квадратичне відхилення - одиниці.

Сума квадратів

розподілено згідно із законом ("хі - квадрат").

У цьому кількість доданків, тобто. n, називається "числом ступенів свободи" розподілу хі - квадрат. Зі збільшенням числа ступенів свободи розподіл повільно наближається до нормального.

Щільність цього розподілу

Отже, розподіл ч2 залежить від одного параметра n – числа ступенів свободи.

Функція розподілу ч2 має вигляд:

якщо ч2?0. (2.7.)

На Малюнку 1 зображено графік густини ймовірності та функції ч2 - розподілу для різних ступенів свободи.

Рисунок 1 Залежність щільності ймовірності ц (x) у розподілі ч2 (хі - квадрат) при різному числі ступенів свободи

Моменти розподілу "хі-квадрат":

Розподіл "хі-квадрат" використовують при оцінюванні дисперсії (за допомогою довірчого інтервалу), при перевірці гіпотез згоди, однорідності, незалежності, насамперед для якісних (категоризованих) змінних, що приймають кінцеву кількість значень, та в багатьох інших завданнях статистичного аналізу даних.

2. "Хі-квадрат" у завданнях статистичного аналізу даних

Статистичні методи аналізу даних застосовуються практично у всіх сферах діяльності людини. Їх використовують завжди, коли необхідно отримати та обґрунтувати будь-які судження про групу (об'єктів чи суб'єктів) з деякою внутрішньою неоднорідністю.

Сучасний етап розвитку статистичних методів можна відраховувати з 1900 року, коли англієць К. Пірсон заснував журнал "Biometrika". Перша третина ХХ ст. пройшла під знаком параметричної статистики. Вивчалися методи, засновані на аналізі даних параметричних сімейств розподілів, що описуються кривими сімейства Пірсона. Найбільш популярним був нормальний розподіл. Для перевірки гіпотез використовувалися критерії Пірсона, Стьюдента, Фішера. Було запропоновано метод максимальної правдоподібності, дисперсійний аналіз, сформульовано основні ідеї планування експерименту.

Розподіл "хі-квадрат" є одним із найбільш широко використовуваних у статистиці для перевірки статистичних гіпотез. На основі розподілу "хі-квадрат" побудований один із найпотужніших критеріїв згоди - критерій "хі-квадрату" Пірсона.

Критерієм згоди називають критерій перевірки гіпотези про передбачуваний закон невідомого розподілу.

Критерій ч2 (хі-квадрат) використовується для перевірки гіпотези різних розподілів. У цьому полягає його перевага.

Розрахункова формула критерію дорівнює

де m і m" - відповідно емпіричні та теоретичні частоти

розглянутого розподілу;

n – число ступенів свободи.

Для перевірки нам необхідно порівнювати емпіричні (спостерігаються) та теоретичні (обчислені у припущенні нормального розподілу) частоти.

При повному збігу емпіричних частот з частотами, обчисленими або очікуваними S (Е - Т) = 0 і критерій ч2 теж дорівнюватиме нулю. Якщо ж S (Е - Т) не дорівнює нулю, це вкаже на невідповідність обчислених частот емпіричним частотам ряду. У разі необхідно оцінити значимість критерію ч2, який теоретично може змінюватися від нуля до нескінченності. Це здійснюється шляхом порівняння фактично отриманої величини ч2ф з його критичним значенням (ч2st). (a) та числа ступенів свободи (n).

Розподіл ймовірних значень випадкової величини ч2 безперервно та асиметрично. Воно залежить від числа ступенів свободи (n) і наближається до нормального розподілу зі збільшенням числа спостережень. Тому застосування критерію ч2 для оцінки дискретних розподілів пов'язані з деякими похибками, які позначаються його величині, особливо у нечисленних вибірках. Для отримання більш точних оцінок вибірка, що розподіляється в варіаційний ряд, повинна мати щонайменше 50 варіантів. Правильне застосування критерію ч2 вимагає також, щоб частоти варіантів у крайніх класах були б менше 5; якщо їх менше 5, то вони поєднуються з частотами сусідніх класів, щоб у сумі становили величину більшу або рівну 5. Відповідно до об'єднання частот зменшується і число класів (N). Число ступенів свободи встановлюється за вторинним числом класів з урахуванням кількості обмежень свободи варіації.

Так як точність визначення критерію ч2 значною мірою залежить від точності розрахунку теоретичних частот (Т), для отримання різниці між емпіричними та обчисленими частотами слід використовувати неокруглені теоретичні частоти.

Як приклад візьмемо дослідження, опубліковане на сайті, присвяченому застосуванню статистичних методів у гуманітарних науках.

Критерій "Хі-квадрат" дозволяє порівнювати розподіл частот через незалежно від того, розподілені вони нормально чи ні.

Під частотою розуміється кількість появ будь-якої події. Зазвичай, з частотою появи події мають справу, коли змінні виміряні в шкалі найменувань та інші характеристики, крім частоти підібрати неможливо або проблематично. Інакше кажучи, коли змінна має якісні властивості. Також багато дослідників схильні переводити бали тесту до рівнів (високий, середній, низький) і будувати таблиці розподілів балів, щоб дізнатися кількість людей за цими рівнями. Щоб довести, що в одному з рівнів (в одній із категорій) кількість людей дійсно більша (менша) так само використовується коефіцієнт Хі-квадрат.

Розберемо найпростіший приклад.

Серед молодших підлітків було проведено тест виявлення самооцінки. Бали тесту були переведені на три рівні: високий, середній, низький. Частоти розподілилися так:

Високий (В) 27 чол.

Середній (С) 12 чол.

Низький (Н) 11 чол.

Очевидно, що дітей із високою самооцінкою більшість, проте це потрібно довести статистично. Для цього використовуємо критерій хі-квадрат.

Наше завдання – перевірити, чи відрізняються отримані емпіричні дані від теоретично рівноймовірних. Для цього потрібно знайти теоретичні частоти. У нашому випадку теоретичні частоти - це рівноймовірні частоти, які знаходяться шляхом складання всіх частот і поділу на кількість категорій.

У нашому випадку:

(В + С + Н) / 3 = (27 +12 +11) / 3 = 16,6

Формула для розрахунку критерію хі-квадрат:

ч2 = ?(Е - Т)І/Т

Будуємо таблицю:

Емпірич. (Е)

Теоретич. (Т)

(Е - Т)І/Т

Знаходимо суму останнього стовпця:

Тепер потрібно знайти критичне значення критерію таблиці критичних значень (Таблиця 1 у додатку). Для цього нам знадобиться кількість ступенів свободи (n).

n = (R - 1) * (C - 1)

де R – кількість рядків у таблиці, C – кількість стовпців.

У нашому випадку лише один стовпець (маються на увазі вихідні емпіричні частоти) і три рядки (категорії), тому формула змінюється – виключаємо стовпці.

n = (R - 1) = 3-1 = 2

Для ймовірності помилки p?0,05 та n = 2 критичне значення ч2 = 5,99.

Отримане емпіричне значення більше критичного - відмінності частот достовірні (ч2 = 9,64; p? 0,05).

Як бачимо, розрахунок критерію дуже простий і не займає багато часу. Практична цінність критерію хі-квадрат величезна. Цей метод виявляється найбільш цінним під час аналізу відповіді питання анкет.

Розберемо складніший приклад.

Наприклад, психолог хоче дізнатися, чи справді те, що вчителі більш упереджено ставляться до хлопчиків, ніж до дівчаток. Тобто. більш схильні хвалити дівчаток. Для цього психологом були проаналізовані характеристики учнів, написані вчителями, на предмет частоти трьох слів: "активний", "старальний", "дисциплінований", синоніми слів так само підраховувалися.

Дані про частоту слів були занесені в таблицю:

Для обробки отриманих даних використовуємо критерій хі-квадрат.

І тому побудуємо таблицю розподілу емпіричних частот, тобто. тих частот, які ми спостерігаємо:

Теоретично, ми очікуємо, що частоти розподіляться рівноймовірно, тобто. частота розподілиться пропорційно між хлопчиками та дівчатками. Побудуємо таблицю теоретичних частот. Для цього помножимо суму по рядку на суму по стовпцю і розділимо число, що вийшло, на загальну суму (s).

Підсумкова таблиця для обчислень виглядатиме так:

Емпірич. (Е)

Теоретич. (Т)

(Е - Т)І/Т

Хлопчики

"Активний"

"Дивний"

"Дисциплінований"

"Активний"

"Дивний"

"Дисциплінований"

Сума: 4,21

ч2 = ?(Е - Т)І/Т

де R - кількість рядків у таблиці.

У нашому випадку хі-квадрат = 4,21; n = 2.

За таблицею критичних значень критерію знаходимо: при n = 2 та рівні помилки 0,05 критичне значення ч2 = 5,99.

Отримане значення менше критичного, а отже, приймається нульова гіпотеза.

Висновок: вчителі не надають значення стать дитини при написанні їй характеристики.

Висновок

Студенти багатьох спеціальностей вивчають в кінці курсу вищої математики розділ "теорія ймовірностей і математична статистика", реально вони знайомляться лише з деякими основними поняттями та результатами, яких явно мало для практичної роботи. З деякими математичними методами дослідження студенти зустрічаються у спеціальних курсах (наприклад, таких як "Прогнозування та техніко-економічне планування", "Техніко-економічний аналіз", "Контроль якості продукції", "Маркетинг", "Контролінг", "Математичні методи прогнозування ", "Статистика" та ін. - у разі студентів економічних спеціальностей), проте виклад у більшості випадків носить дуже скорочений та рецептурний характер. В результаті знань у фахівців із прикладної статистики недостатньо.

Тому велике значення має курс "Прикладна статистика" у технічних вишах, а в економічних вишах – курсу "Економетрика", оскільки економетрика – це, як відомо, статистичний аналіз конкретних економічних даних.

Теорія ймовірності та математична статистика дають фундаментальні знання для прикладної статистики та економетрики.

Вони потрібні фахівцям для практичної роботи.

Я розглянула безперервну ймовірнісну модель і постаралася на прикладах показати її використання.

І наприкінці своєї роботи я дійшла висновку, що грамотна реалізація основних процедур математико-статичного аналізу даних, статична перевірка гіпотез неможлива без знання моделі "хі-квадрат", а також уміння користуватись її таблицею.

Список використаної літератури

1. Орлов А.І. Прикладна статистика М: Видавництво "Іспит", 2004.

2. Гмурман В.Є. Теорія ймовірностей та математична статистика. М.: Вища школа, 1999. – 479с.

3. Айвозян С.А. Теорія ймовірностей та прикладна статистика, т.1. М.: Юніті, 2001. – 656с.

4. Хамітов Г.П., Ведернікова Т.І. Імовірності та статистика. Іркутськ: БДУЕП, 2006 – 272с.

5. Єжова Л.М. Економетрики. Іркутськ: БДУЕП, 2002. – 314с.

6. Мостеллер Ф. П'ятдесят цікавих ймовірнісних завдань із рішеннями. М.: Наука, 1975. – 111с.

7. Мостеллер Ф. Імовірність. М.: Світ, 1969. – 428с.

8. Яглом А.М. Можливість та інформація. М.: Наука, 1973. – 511с.

9. Чистяков В.П. Курс теорії ймовірностей. М.: Наука, 1982. – 256с.

10. Кремер Н.Ш. Теорія ймовірностей та математична статистика. М.: ЮНІТІ, 2000. - 543с.

11. Математична енциклопедія, т.1. М.: Радянська енциклопедія, 1976. – 655с.

12. http://psystat.at.ua/ - Статистика в психології та педагогіці. Критерій Хі-квадрат.

додаток

Критичні точки розподілу ч2

Таблиця 1

Розміщено на Allbest.ru

...

Подібні документи

    Імовірнісна модель та аксіоматика О.М. Колмогорова. Випадкові величини та вектори, класична гранична проблема теорії ймовірностей. Первинне оброблення статистичних даних. Точкові оцінки числових показників. Статистична перевірка гіпотез.

    методичка, доданий 02.03.2010

    Правила виконання та оформлення контрольних робіт для заочного відділення. Завдання та приклади вирішення задач з математичної статистики та теорії ймовірності. Таблиці довідкових даних розподілів, густина стандартного нормального розподілу.

    методичка , доданий 29.11.2009

    Основні методи формалізованого опису та аналізу випадкових явищ, обробки та аналізу результатів фізичних та чисельних експериментів теорії ймовірності. Основні поняття та аксіоми теорії ймовірності. Основні поняття математичної статистики.

    курс лекцій, доданий 08.04.2011

    Визначення закону розподілу ймовірностей результатів виміру математичної статистики. Перевірка відповідності емпіричного розподілу теоретичному. Визначення довірчого інтервалу, у якому лежить значення вимірюваної величини.

    курсова робота , доданий 11.02.2012

    Схожість послідовностей випадкових величин та ймовірнісних розподілів. Метод характеристичних функций. Перевірка статистичних гіпотез та виконання центральної граничної теореми для заданих послідовностей незалежних випадкових величин.

    курсова робота , доданий 13.11.2012

    Основні етапи обробки даних натуральних спостережень методом математичної статистики. Оцінка отриманих результатів, їх використання при прийнятті управлінських рішень у галузі охорони природи та природокористування. Перевірка статистичних гіпотез.

    практична робота , доданий 24.05.2013

    Сутність закону розподілу та його практичне застосування для вирішення статистичних завдань. Визначення дисперсії випадкової величини, математичного очікування та середньоквадратичного відхилення. Особливості однофакторного дисперсійного аналізу.

    контрольна робота , доданий 07.12.2013

    Імовірність та її загальне визначення. Теореми складання та множення ймовірностей. Дискретні випадкові величини та його числові характеристики. Закон великих чисел. Статистичне розподілення вибірки. Елементи кореляційного та регресійного аналізу.

    курс лекцій, доданий 13.06.2015

    Програма курсу, основні поняття та формули теорії ймовірностей, їх обґрунтування та значення. Місце та роль математичної статистики в дисципліні. Приклади та роз'яснення щодо вирішення найпоширеніших завдань з різних тем даних навчальних дисциплін.

    методичка, доданий 15.01.2010

    Теорія ймовірностей та математична статистика є науками про методи кількісного аналізу масових випадкових явищ. Безліч значень випадкової величини називається вибіркою, а елементи множини – вибірковими значеннями випадкової величини.



Останні матеріали розділу:

Дати та події великої вітчизняної війни
Дати та події великої вітчизняної війни

О 4-й годині ранку 22 червня 1941 року війська фашистської Німеччини (5,5 млн осіб) перейшли кордони Радянського Союзу, німецькі літаки (5 тис) почали...

Все, що ви повинні знати про радіацію Джерела радіації та одиниці її виміру
Все, що ви повинні знати про радіацію Джерела радіації та одиниці її виміру

5. Дози випромінювання та одиниці виміру Дія іонізуючих випромінювань є складним процесом. Ефект опромінення залежить від величини...

Мізантропія, або Що робити, якщо я ненавиджу людей?
Мізантропія, або Що робити, якщо я ненавиджу людей?

Шкідливі поради: Як стати мізантропом і всіх радісно ненавидіти Ті, хто запевняє, що людей треба любити незалежно від обставин або...