Яка модель використовується у ймовірно статистичних методах. Ймовірнісні та статистичні методи

Надіслати свою гарну роботу до бази знань просто. Використовуйте форму нижче

Студенти, аспіранти, молоді вчені, які використовують базу знань у своєму навчанні та роботі, будуть вам дуже вдячні.

Розміщено на http://www.allbest.ru/

Розміщено на http://www.allbest.ru/

Вступ

1. Розподіл "хі-квадрат"

Висновок

додаток

Вступ

Як підходи, ідеї та результати теорії ймовірностей використовуються у нашому житті? математичний квадрат теорія

Базою є імовірнісна модель реального явища чи процесу, тобто. математична модель, у якій об'єктивні співвідношення виражені термінах теорії ймовірностей. Імовірності використовуються, перш за все, для опису невизначеностей, які необхідно враховувати під час прийняття рішень. Маються на увазі як небажані можливості (ризики), так і привабливі ("щасливий випадок"). Іноді випадковість вноситься в ситуацію свідомо, наприклад, під час жеребкування, випадкового відбору одиниць для контролю, проведення лотерей або опитувань споживачів.

Теорія ймовірностей дозволяє за одними ймовірностями розрахувати інші, які цікавлять дослідника.

Імовірнісна модель явища чи процесу є фундаментом математичної статистики. Використовуються два паралельні ряди понять - які стосуються теорії (імовірнісної моделі) і які стосуються практики (вибірці результатів спостережень). Наприклад, теоретичній ймовірності відповідає частота, знайдена за вибіркою. Математичне очікування (теоретичний ряд) відповідає вибіркове середнє арифметичне (практичний ряд). Як правило, вибіркові характеристики є оцінками теоретичних. При цьому величини, що належать до теоретичного ряду, "перебувають у головах дослідників", відносяться до світу ідей (за давньогрецьким філософом Платоном), недоступні для безпосереднього виміру. Дослідники мають у своєму розпорядженні лише вибіркові дані, за допомогою яких вони намагаються встановити властивості теоретичної ймовірнісної моделі, що їх цікавлять.

Навіщо ж потрібна імовірнісна модель? Справа в тому, що тільки з її допомогою можна перенести властивості, встановлені за результатами аналізу конкретної вибірки, на інші вибірки, а також на так звану генеральну сукупність. Термін "генеральна сукупність" використовується, коли йдеться про велику, але кінцеву сукупність одиниць, що вивчаються. Наприклад, про сукупність всіх жителів Росії або сукупність всіх споживачів розчинної кави в Москві. Мета маркетингових чи соціологічних опитувань у тому, щоб твердження, отримані за вибіркою із сотень чи тисяч жителів, перенести на генеральні сукупності кілька мільйонів. Під час контролю якості у ролі генеральної сукупності виступає партія продукції.

Щоб перенести висновки з вибірки більш широку сукупність, необхідні ті чи інші припущення про зв'язок вибіркових характеристик з характеристиками цієї більшої сукупності. Ці припущення ґрунтуються на відповідній імовірнісній моделі.

Звичайно, можна обробляти вибіркові дані, не використовуючи ту чи іншу ймовірну модель. Наприклад, можна розраховувати вибіркове середнє арифметичне, підраховувати частоту виконання тих чи інших умов тощо. Проте результати розрахунків відноситимуться лише до конкретної вибірки, перенесення отриманих з їх допомогою висновків на будь-яку іншу сукупність некоректне. Іноді таку діяльність називають "аналіз даних". Порівняно з імовірнісно-статистичними методами, аналіз даних має обмежену пізнавальну цінність.

Отже, використання імовірнісних моделей на основі оцінювання та перевірки гіпотез за допомогою вибіркових характеристик – ось суть імовірнісно-статистичних методів прийняття рішень.

1. Розподіл "хі-квадрат"

За допомогою нормального розподілу визначаються три розподіли, які часто використовуються при статистичній обробці даних. Це розподіли Пірсона ("хі - квадрат"), Стьюдента та Фішера.

Ми зупинимося на розподілі ("хі – квадрат"). Вперше цей розподіл було досліджено астрономом Ф. Хельмертом у 1876 році. У зв'язку з гауссівською теорією помилок він досліджував суми квадратів n незалежних стандартно нормально розподілених випадкових величин. Пізніше Карл Пірсон (Karl Pearson) дав ім'я цієї функції розподілу "хі - квадрат". І зараз розподіл носить його ім'я.

Завдяки тісному зв'язку з нормальним розподілом, ч2-розподіл відіграє важливу роль у теорії ймовірностей та математичної статистики. ч2-розподіл, та багато інших розподілів, які визначаються за допомогою ч2-розподілу (наприклад - розподіл Стьюдента), описують вибіркові розподіли різних функцій від нормально розподілених результатів спостережень і використовуються для побудови довірчих інтервалів та статистичних критеріїв.

Розподіл Пірсона (хі - квадрат) - розподіл випадкової величини де X1, X2, ..., Xn - нормальні незалежні випадкові величини, причому математичне очікування кожної їх дорівнює нулю, а середнє квадратичне відхилення - одиниці.

Сума квадратів

розподілено згідно із законом ("хі - квадрат").

У цьому кількість доданків, тобто. n, називається "числом ступенів свободи" розподілу хі - квадрат. Зі збільшенням числа ступенів свободи розподіл повільно наближається до нормального.

Щільність цього розподілу

Отже, розподіл ч2 залежить від одного параметра n – числа ступенів свободи.

Функція розподілу ч2 має вигляд:

якщо ч2?0. (2.7.)

На Малюнку 1 зображено графік густини ймовірності та функції ч2 - розподілу для різних ступенів свободи.

Рисунок 1 Залежність щільності ймовірності ц (x) у розподілі ч2 (хі - квадрат) при різному числі ступенів свободи

Моменти розподілу "хі-квадрат":

Розподіл "хі-квадрат" використовують при оцінюванні дисперсії (за допомогою довірчого інтервалу), при перевірці гіпотез згоди, однорідності, незалежності, насамперед для якісних (категоризованих) змінних, що приймають кінцеву кількість значень, та в багатьох інших завданнях статистичного аналізу даних.

2. "Хі-квадрат" у завданнях статистичного аналізу даних

Статистичні методи аналізу даних застосовуються практично у всіх сферах діяльності людини. Їх використовують завжди, коли необхідно отримати та обґрунтувати будь-які судження про групу (об'єктів чи суб'єктів) з деякою внутрішньою неоднорідністю.

Сучасний етап розвитку статистичних методів можна відраховувати з 1900 року, коли англієць К. Пірсон заснував журнал "Biometrika". Перша третина ХХ ст. пройшла під знаком параметричної статистики. Вивчалися методи, засновані на аналізі даних параметричних сімейств розподілів, що описуються кривими сімейства Пірсона. Найбільш популярним був нормальний розподіл. Для перевірки гіпотез використовувалися критерії Пірсона, Стьюдента, Фішера. Було запропоновано метод максимальної правдоподібності, дисперсійний аналіз, сформульовано основні ідеї планування експерименту.

Розподіл "хі-квадрат" є одним із найбільш широко використовуваних у статистиці для перевірки статистичних гіпотез. На основі розподілу "хі-квадрат" побудований один із найпотужніших критеріїв згоди - критерій "хі-квадрату" Пірсона.

Критерієм згоди називають критерій перевірки гіпотези про передбачуваний закон невідомого розподілу.

Критерій ч2 (хі-квадрат) використовується для перевірки гіпотези різних розподілів. У цьому полягає його перевага.

Розрахункова формула критерію дорівнює

де m і m" - відповідно емпіричні та теоретичні частоти

розглянутого розподілу;

n – число ступенів свободи.

Для перевірки нам необхідно порівнювати емпіричні (спостерігаються) та теоретичні (обчислені у припущенні нормального розподілу) частоти.

При повному збігу емпіричних частот з частотами, обчисленими або очікуваними S (Е - Т) = 0 і критерій ч2 теж дорівнюватиме нулю. Якщо ж S (Е - Т) не дорівнює нулю, це вкаже на невідповідність обчислених частот емпіричним частотам ряду. У разі необхідно оцінити значимість критерію ч2, який теоретично може змінюватися від нуля до нескінченності. Це здійснюється шляхом порівняння фактично отриманої величини ч2ф з його критичним значенням (ч2st). (a) та числа ступенів свободи (n).

Розподіл ймовірних значень випадкової величини ч2 безперервно та асиметрично. Воно залежить від числа ступенів свободи (n) і наближається до нормального розподілу зі збільшенням числа спостережень. Тому застосування критерію ч2 для оцінки дискретних розподілів пов'язані з деякими похибками, які позначаються його величині, особливо у нечисленних вибірках. Для отримання більш точних оцінок вибірка, що розподіляється в варіаційний ряд, повинна мати щонайменше 50 варіантів. Правильне застосування критерію ч2 вимагає також, щоб частоти варіантів у крайніх класах були б менше 5; якщо їх менше 5, то вони поєднуються з частотами сусідніх класів, щоб у сумі становили величину більшу або рівну 5. Відповідно до об'єднання частот зменшується і число класів (N). Число ступенів свободи встановлюється за вторинним числом класів з урахуванням кількості обмежень свободи варіації.

Так як точність визначення критерію ч2 значною мірою залежить від точності розрахунку теоретичних частот (Т), для отримання різниці між емпіричними та обчисленими частотами слід використовувати неокруглені теоретичні частоти.

Як приклад візьмемо дослідження, опубліковане на сайті, присвяченому застосуванню статистичних методів у гуманітарних науках.

Критерій "Хі-квадрат" дозволяє порівнювати розподіл частот через незалежно від того, розподілені вони нормально чи ні.

Під частотою розуміється кількість появ будь-якої події. Зазвичай, з частотою появи події мають справу, коли змінні виміряні в шкалі найменувань та інші характеристики, крім частоти підібрати неможливо або проблематично. Інакше кажучи, коли змінна має якісні властивості. Також багато дослідників схильні переводити бали тесту до рівнів (високий, середній, низький) і будувати таблиці розподілів балів, щоб дізнатися кількість людей за цими рівнями. Щоб довести, що в одному з рівнів (в одній із категорій) кількість людей дійсно більша (менша) так само використовується коефіцієнт Хі-квадрат.

Розберемо найпростіший приклад.

Серед молодших підлітків було проведено тест виявлення самооцінки. Бали тесту були переведені на три рівні: високий, середній, низький. Частоти розподілилися так:

Високий (В) 27 чол.

Середній (С) 12 чол.

Низький (Н) 11 чол.

Очевидно, що дітей із високою самооцінкою більшість, проте це потрібно довести статистично. Для цього використовуємо критерій хі-квадрат.

Наше завдання – перевірити, чи відрізняються отримані емпіричні дані від теоретично рівноймовірних. Для цього потрібно знайти теоретичні частоти. У нашому випадку теоретичні частоти - це рівноймовірні частоти, які знаходяться шляхом складання всіх частот і поділу на кількість категорій.

У нашому випадку:

(В + С + Н) / 3 = (27 +12 +11) / 3 = 16,6

Формула для розрахунку критерію хі-квадрат:

ч2 = ?(Е - Т)І/Т

Будуємо таблицю:

Емпірич. (Е)

Теоретич. (Т)

(Е - Т)І/Т

Знаходимо суму останнього стовпця:

Тепер потрібно знайти критичне значення критерію таблиці критичних значень (Таблиця 1 у додатку). Для цього нам знадобиться кількість ступенів свободи (n).

n = (R - 1) * (C - 1)

де R – кількість рядків у таблиці, C – кількість стовпців.

У нашому випадку лише один стовпець (маються на увазі вихідні емпіричні частоти) і три рядки (категорії), тому формула змінюється – виключаємо стовпці.

n = (R - 1) = 3-1 = 2

Для ймовірності помилки p?0,05 та n = 2 критичне значення ч2 = 5,99.

Отримане емпіричне значення більше критичного - відмінності частот достовірні (ч2 = 9,64; p? 0,05).

Як бачимо, розрахунок критерію дуже простий і не займає багато часу. Практична цінність критерію хі-квадрат величезна. Цей метод виявляється найбільш цінним під час аналізу відповіді питання анкет.

Розберемо складніший приклад.

Наприклад, психолог хоче дізнатися, чи справді те, що вчителі більш упереджено ставляться до хлопчиків, ніж до дівчаток. Тобто. більш схильні хвалити дівчаток. Для цього психологом були проаналізовані характеристики учнів, написані вчителями, на предмет частоти трьох слів: "активний", "старальний", "дисциплінований", синоніми слів так само підраховувалися.

Дані про частоту слів були занесені в таблицю:

Для обробки отриманих даних використовуємо критерій хі-квадрат.

І тому побудуємо таблицю розподілу емпіричних частот, тобто. тих частот, які ми спостерігаємо:

Теоретично, ми очікуємо, що частоти розподіляться рівноймовірно, тобто. частота розподілиться пропорційно між хлопчиками та дівчатками. Побудуємо таблицю теоретичних частот. Для цього помножимо суму по рядку на суму по стовпцю і розділимо число, що вийшло, на загальну суму (s).

Підсумкова таблиця для обчислень виглядатиме так:

Емпірич. (Е)

Теоретич. (Т)

(Е - Т)І/Т

Хлопчики

"Активний"

"Дивний"

"Дисциплінований"

"Активний"

"Дивний"

"Дисциплінований"

Сума: 4,21

ч2 = ?(Е - Т)І/Т

де R - кількість рядків у таблиці.

У нашому випадку хі-квадрат = 4,21; n = 2.

За таблицею критичних значень критерію знаходимо: при n = 2 та рівні помилки 0,05 критичне значення ч2 = 5,99.

Отримане значення менше критичного, а отже, приймається нульова гіпотеза.

Висновок: вчителі не надають значення стать дитини при написанні їй характеристики.

Висновок

Студенти багатьох спеціальностей вивчають в кінці курсу вищої математики розділ "теорія ймовірностей і математична статистика", реально вони знайомляться лише з деякими основними поняттями та результатами, яких явно мало для практичної роботи. З деякими математичними методами дослідження студенти зустрічаються у спеціальних курсах (наприклад, таких як "Прогнозування та техніко-економічне планування", "Техніко-економічний аналіз", "Контроль якості продукції", "Маркетинг", "Контролінг", "Математичні методи прогнозування ", "Статистика" та ін. - у разі студентів економічних спеціальностей), проте виклад у більшості випадків носить дуже скорочений та рецептурний характер. В результаті знань у фахівців із прикладної статистики недостатньо.

Тому велике значення має курс "Прикладна статистика" у технічних вишах, а в економічних вишах – курсу "Економетрика", оскільки економетрика – це, як відомо, статистичний аналіз конкретних економічних даних.

Теорія ймовірності та математична статистика дають фундаментальні знання для прикладної статистики та економетрики.

Вони потрібні фахівцям для практичної роботи.

Я розглянула безперервну ймовірнісну модель і постаралася на прикладах показати її використання.

І наприкінці своєї роботи я дійшла висновку, що грамотна реалізація основних процедур математико-статичного аналізу даних, статична перевірка гіпотез неможлива без знання моделі "хі-квадрат", а також уміння користуватись її таблицею.

Список використаної літератури

1. Орлов А.І. Прикладна статистика М: Видавництво "Іспит", 2004.

2. Гмурман В.Є. Теорія ймовірностей та математична статистика. М.: Вища школа, 1999. – 479с.

3. Айвозян С.А. Теорія ймовірностей та прикладна статистика, т.1. М.: Юніті, 2001. – 656с.

4. Хамітов Г.П., Ведернікова Т.І. Імовірності та статистика. Іркутськ: БДУЕП, 2006 – 272с.

5. Єжова Л.М. Економетрики. Іркутськ: БДУЕП, 2002. – 314с.

6. Мостеллер Ф. П'ятдесят цікавих ймовірнісних завдань із рішеннями. М.: Наука, 1975. – 111с.

7. Мостеллер Ф. Імовірність. М.: Світ, 1969. – 428с.

8. Яглом А.М. Можливість та інформація. М.: Наука, 1973. – 511с.

9. Чистяков В.П. Курс теорії ймовірностей. М.: Наука, 1982. – 256с.

10. Кремер Н.Ш. Теорія ймовірностей та математична статистика. М.: ЮНІТІ, 2000. - 543с.

11. Математична енциклопедія, т.1. М.: Радянська енциклопедія, 1976. – 655с.

12. http://psystat.at.ua/ - Статистика в психології та педагогіці. Критерій Хі-квадрат.

додаток

Критичні точки розподілу ч2

Таблиця 1

Розміщено на Allbest.ru

...

Подібні документи

    Імовірнісна модель та аксіоматика О.М. Колмогорова. Випадкові величини та вектори, класична гранична проблема теорії ймовірностей. Первинне оброблення статистичних даних. Точкові оцінки числових показників. Статистична перевірка гіпотез.

    методичка, доданий 02.03.2010

    Правила виконання та оформлення контрольних робіт для заочного відділення. Завдання та приклади вирішення задач з математичної статистики та теорії ймовірності. Таблиці довідкових даних розподілів, густина стандартного нормального розподілу.

    методичка , доданий 29.11.2009

    Основні методи формалізованого опису та аналізу випадкових явищ, обробки та аналізу результатів фізичних та чисельних експериментів теорії ймовірності. Основні поняття та аксіоми теорії ймовірності. Основні поняття математичної статистики.

    курс лекцій, доданий 08.04.2011

    Визначення закону розподілу ймовірностей результатів виміру математичної статистики. Перевірка відповідності емпіричного розподілу теоретичному. Визначення довірчого інтервалу, у якому лежить значення вимірюваної величини.

    курсова робота , доданий 11.02.2012

    Схожість послідовностей випадкових величин та ймовірнісних розподілів. Метод характеристичних функций. Перевірка статистичних гіпотез та виконання центральної граничної теореми для заданих послідовностей незалежних випадкових величин.

    курсова робота , доданий 13.11.2012

    Основні етапи обробки даних натуральних спостережень методом математичної статистики. Оцінка отриманих результатів, їх використання при прийнятті управлінських рішень у галузі охорони природи та природокористування. Перевірка статистичних гіпотез.

    практична робота , доданий 24.05.2013

    Сутність закону розподілу та його практичне застосування для вирішення статистичних завдань. Визначення дисперсії випадкової величини, математичного очікування та середньоквадратичного відхилення. Особливості однофакторного дисперсійного аналізу.

    контрольна робота , доданий 07.12.2013

    Імовірність та її загальне визначення. Теореми складання та множення ймовірностей. Дискретні випадкові величини та його числові характеристики. Закон великих чисел. Статистичне розподілення вибірки. Елементи кореляційного та регресійного аналізу.

    курс лекцій, доданий 13.06.2015

    Програма курсу, основні поняття та формули теорії ймовірностей, їх обґрунтування та значення. Місце та роль математичної статистики в дисципліні. Приклади та роз'яснення щодо вирішення найпоширеніших завдань з різних тем даних навчальних дисциплін.

    методичка, доданий 15.01.2010

    Теорія ймовірностей та математична статистика є науками про методи кількісного аналізу масових випадкових явищ. Безліч значень випадкової величини називається вибіркою, а елементи множини – вибірковими значеннями випадкової величини.

Як використовуються теорія ймовірностей та математична статистика?Ці дисципліни – основа імовірнісно-статистичних методів прийняття рішень. Щоб скористатися їх математичним апаратом, необхідно завдання прийняття рішень висловити термінах вероятностно-статистических моделей. Застосування конкретного імовірнісно-статистичного методу прийняття рішень складається з трьох етапів:

Перехід від економічної, управлінської, технологічної дійсності до абстрактної математико-статистичної схемою, тобто. побудова імовірнісної моделі системи управління, технологічного процесу, процедури прийняття рішень, зокрема за результатами статистичного контролю тощо.

Проведення розрахунків та отримання висновків суто математичними засобами в рамках імовірнісної моделі;

Інтерпретація математико-статистичних висновків стосовно реальної ситуації та прийняття відповідного рішення (наприклад, про відповідність або невідповідність якості продукції встановленим вимогам, необхідність налагодження технологічного процесу тощо), зокрема, висновки (про частку дефектних одиниць продукції в партії, про конкретному вигляді законів розподілу контрольованих параметрів технологічного процесу та ін.).

Математична статистика використовує поняття, методи та результати теорії ймовірностей. Розглянемо основні питання побудови ймовірнісних моделей прийняття рішень на економічних, управлінських, технологічних та інших ситуаціях. Для активного та правильного використання нормативно-технічних та інструктивно-методичних документів з імовірнісно-статистичних методів прийняття рішень потрібні попередні знання. Так, необхідно знати, за яких умов слід застосовувати той чи інший документ, яку вихідну інформацію необхідно мати для вибору та застосування, які рішення повинні бути прийняті за результатами обробки даних і т.д.

Приклади застосування теорії ймовірностей та математичної статистики.Розглянемо кілька прикладів, коли вероятностно-статистические моделі є добрим інструментом на вирішення управлінських, виробничих, економічних, народногосподарських завдань. Так, наприклад, у романі А.Н.Толстого «Ходіння по муках» (т.1) говориться: «майстерня дає двадцять три відсотки шлюбу, цієї цифри ви й тримаєтеся, - сказав Струков Івану Іллічу».

Постає питання, як розуміти ці слова у розмові заводських менеджерів, оскільки одна одиниця продукції може бути дефектна на 23%. Вона може бути або придатною або дефектною. Напевно, Струков мав на увазі, що у партії великого обсягу міститься приблизно 23% дефектних одиниць продукції. Тоді виникає запитання, а що означає «приблизно»? Нехай із 100 перевірених одиниць продукції 30 виявляться дефектними, чи з 1000 – 300, чи з 100000 – 30000 тощо., чи треба звинувачувати Струкова у брехні?

Або інший приклад. Монетка, яку використовують як жереб, має бути «симетричною», тобто. при її киданні в середньому в половині випадків повинен випадати герб, а в половині випадків – грати (решітка, цифра). Але що означає «у середньому»? Якщо провести багато серій по 10 кидань у кожній серії, то часто зустрічатимуться серії, в яких монета чотири рази випадає гербом. Для симетричної монети це відбуватиметься у 20,5% серій. А якщо на 100 000 кидань виявиться 40 000 гербів, то чи можна вважати монету симетричною? Процедура прийняття рішень будується з урахуванням теорії ймовірностей і математичної статистики.

Розглянутий приклад може бути недостатньо серйозним. Однак, це не так. Жеребкування широко використовується при організації промислових техніко-економічних експериментів, наприклад, при обробці результатів вимірювання показника якості (моменту тертя) підшипників залежно від різних технологічних факторів (впливу консерваційного середовища, методів підготовки підшипників перед вимірюванням, впливу навантаження підшипників у процесі вимірювання тощо). п.). Припустимо, необхідно порівняти якість підшипників залежно від результатів зберігання в різних консерваційних маслах, тобто. в оліях складу Аі У. При плануванні такого експерименту виникає питання, які підшипники слід помістити в олію складу А, а які – в олію складу Уале так, щоб уникнути суб'єктивізму і забезпечити об'єктивність прийнятого рішення.

Відповідь це питання може бути отримано з допомогою жереба. Аналогічний приклад можна навести і з контролем якості продукції. Щоб вирішити, чи відповідає чи не відповідає контрольована партія продукції встановленим вимогам, з неї відбирається вибірка. За результатами контролю вибірки робиться висновок про всю партію. У цьому випадку дуже важливо уникнути суб'єктивізму при формуванні вибірки, тобто необхідно, щоб кожна одиниця продукції контрольованої партії мала однакову можливість бути відібраною у вибірку. У виробничих умовах відбір одиниць продукції вибірку зазвичай здійснюють за допомогою жереба, а, по спеціальним таблицям випадкових чисел чи з допомогою комп'ютерних датчиків випадкових чисел.

Аналогічні проблеми забезпечення об'єктивності порівняння виникають при зіставленні різних схем організації виробництва, оплати праці, під час проведення тендерів та конкурсів, підбору кандидатів на вакантні посади тощо. Усюди потрібне жеребкування або подібні до неї процедури. Пояснимо на прикладі виявлення найбільш сильної та другої за силою команди при організації турніру з олімпійської системи (який програв вибуває). Нехай завжди сильніша команда перемагає слабшу. Зрозуміло, що найсильніша команда однозначно стане чемпіоном. Друга за силою команда вийде у фінал тоді і лише тоді, коли до фіналу вона не матиме ігор з майбутнім чемпіоном. Якщо таку гру буде заплановано, то друга за силою команда у фінал не потрапить. Той, хто планує турнір, може або достроково «вибити» другу за силою команду з турніру, звівши її в першій зустрічі з лідером, або забезпечити їй друге місце, забезпечивши зустрічі з більш слабкими командами аж до фіналу. Щоб уникнути суб'єктивізму, проводять жеребкування. Для турніру з 8 команд ймовірність того, що у фіналі зустрінуться дві найсильніші команди, дорівнює 4/7. Відповідно до ймовірності 3/7 друга за силою команда залишить турнір достроково.

За будь-якого виміру одиниць продукції (за допомогою штангенциркуля, мікрометра, амперметра тощо) є похибки. Щоб з'ясувати, чи є систематичні похибки, необхідно зробити багаторазові виміри одиниці виробленої продукції, характеристики якої відомі (наприклад, стандартного зразка). При цьому слід пам'ятати, що, крім систематичної похибки, присутня і випадкова похибка.

Тому постає питання, як за результатами вимірювань дізнатися, чи є систематична похибка. Якщо відзначати лише, чи є отримана при черговому вимірі похибка позитивною чи негативною, це завдання можна звести до попередньої. Справді, порівняємо вимір із киданням монети, позитивну похибку – з випаданням герба, негативну – решітки (нульова похибка за достатньої кількості поділів шкали майже будь-коли зустрічається). Тоді перевірка відсутності систематичної похибки еквівалентна перевірці симетричності монети.

Метою цих міркувань є зведення завдання перевірки відсутності систематичної похибки завдання перевірки симетричності монети. Проведені міркування призводять до так званого «критерію знаків» математичної статистики.

При статистичному регулюванні технологічних процесів на основі методів математичної статистики розробляються правила та плани статистичного контролю процесів, спрямовані на своєчасне виявлення розладки технологічних процесів та вжиття заходів до їх налагодження та запобігання випуску продукції, що не відповідає встановленим вимогам. Ці заходи спрямовані на скорочення витрат виробництва та втрат від постачання неякісних одиниць продукції. При статистичному приймальному контролі з урахуванням методів математичної статистики розробляються плани контролю якості шляхом аналізу вибірок із партій продукції. Складність у тому, щоб вміти правильно будувати вероятностно-статистические моделі прийняття рішень, основі яких можна відповісти на поставлені вище питання. У математичній статистиці для цього розроблені ймовірнісні моделі та методи перевірки гіпотез, зокрема гіпотез про те, що частка дефектних одиниць продукції дорівнює певному числу р 0 , наприклад, р 0 = 0,23 (згадайте слова Струкова з роману А.Н.Толстого).

Завдання оцінювання.У низці управлінських, виробничих, економічних, народногосподарських ситуацій виникають завдання іншого – завдання оцінки показників і параметрів розподілів ймовірностей.

Розглянемо приклад. Нехай на контроль надійшла партія з Nелектроламп. З цієї партії випадково відібрано вибірку обсягом nелектроламп. Виникає низка природних питань. Як за результатами випробувань елементів вибірки визначити середній термін служби електроламп та з якою точністю можна оцінити цю характеристику? Як зміниться точність, якщо взяти вибірку більшого обсягу? При якому числі годинника Тможна гарантувати, що не менше 90% електроламп прослужать Тта більше годин?

Припустимо, що під час випробування вибірки обсягом nелектроламп дефектними виявилися Хелектроламп. Тоді виникають такі питання. Які межі можна вказати для числа Dдефектних електроламп у партії, для рівня дефектності D/ Nі т.п.?

Або при статистичному аналізі точності та стабільності технологічних процесів слід оцінити такі показники якості, як середнє значення контрольованого параметра та ступінь його розкиду в аналізованому процесі. Відповідно до теорії ймовірностей як середнє значення випадкової величини доцільно використовувати її математичне очікування, а статистичної характеристики розкиду – дисперсію, середнє квадратичне відхилення чи коефіцієнт варіації. Звідси виникає питання: як оцінити ці статистичні характеристики за вибірковими даними та з якою точністю це вдається зробити? Аналогічних прикладів можна навести дуже багато. Тут важливо було показати, як теорія ймовірностей та математична статистика можуть бути використані у виробничому менеджменті при прийнятті рішень у галузі статистичного управління якістю продукції.

Що таке "математична статистика"?Під математичною статистикою розуміють розділ математики, присвячений математичним методам збору, систематизації, обробки та інтерпретації статистичних даних, а також використання їх для наукових або практичних висновків. Правила та процедури математичної статистики спираються на теорію ймовірностей, що дозволяє оцінити точність і надійність висновків, одержуваних у кожному завданні на підставі наявного статистичного матеріалу. При цьому статистичними даними називаються відомості про кількість об'єктів у будь-якій більш менш широкої сукупності, що володіють тими або іншими ознаками.

На кшталт розв'язуваних завдань математична статистика зазвичай ділиться на три розділи: опис даних, оцінювання та перевірка гіпотез.

За видом статистичних даних математична статистика ділиться на чотири напрями:

Одномірна статистика (статистика випадкових величин), у якій результат спостереження описується дійсним числом;

багатовимірний статистичний аналіз, де результат спостереження над об'єктом описується кількома числами (вектором);

Статистика випадкових процесів та часових рядів, де результат спостереження – функція;

Статистика об'єктів нечислової природи, в якій результат спостереження має нечислову природу, наприклад, є множиною (геометричною фігурою), впорядкуванням або отриманим результатом вимірювання за якісною ознакою.

Історично першою з'явилися деякі області статистики об'єктів нечислової природи (зокрема, завдання оцінювання частки шлюбу та перевірки гіпотез про неї) та одновимірна статистика. Математичний апарат їм простіше, тому з їхньої прикладі зазвичай демонструють основні ідеї математичної статистики.

Тільки методи обробки даних, тобто. Математична статистика є доказовими, які спираються на імовірнісні моделі відповідних реальних явищ і процесів. Йдеться про моделі поведінки споживачів, виникнення ризиків, функціонування технологічного обладнання, отримання результатів експерименту, перебігу захворювання тощо. Імовірнісну модель реального явища слід вважати побудованою, якщо аналізовані величини та зв'язки між ними виражені в термінах теорії ймовірностей. Відповідність імовірнісної моделі дійсності, тобто. її адекватність обґрунтовують, зокрема, за допомогою статистичних методів перевірки гіпотез.

Неймовірні методи обробки даних є пошуковими, їх можна використовувати лише при попередньому аналізі даних, оскільки вони не дають можливості оцінити точність та надійність висновків, отриманих на підставі обмеженого статистичного матеріалу.

Імовірнісні та статистичні методи застосовні усюди, де вдається побудувати та обґрунтувати ймовірнісну модель явища чи процесу. Їх застосування обов'язково, коли зроблені з урахуванням вибіркових даних висновки переносяться всю сукупність (наприклад, з вибірки протягом усього партію продукції).

У конкретних галузях застосування використовуються як імовірнісно-статистичні методи широкого застосування, так і специфічні. Наприклад, розділ виробничого менеджменту, присвяченого статистичним методам управління якістю продукції, використовують прикладну математичну статистику (включаючи планування експериментів). За допомогою її методів проводиться статистичний аналіз точності та стабільності технологічних процесів та статистична оцінка якості. До специфічних методів належать методи статистичного приймального контролю якості продукції, статистичного регулювання технологічних процесів, оцінки та контролю надійності та ін.

Широко застосовуються такі прикладні імовірнісно-статистичні дисципліни, як теорія надійності та теорія масового обслуговування. Зміст першої їх ясно з назви, друга займається вивченням систем типу телефонної станції, яку у випадкові моменти часу надходять виклики - вимоги абонентів, набираючих номери у своїх телефонних апаратах. Тривалість обслуговування цих вимог, тобто. тривалість розмов також моделюється випадковими величинами. Великий внесок у розвиток цих дисциплін зробили член-кореспондент АН СРСР А.Я. Хінчін (1894-1959), академік АН УРСР Б.В.Гнеденко (1912-1995) та інші вітчизняні вчені.

Коротко про історію математичної статистики.Математична статистика як наука починається з робіт знаменитого німецького математика Карла Фрідріха Гауса (1777-1855), який на основі теорії ймовірностей досліджував та обґрунтував метод найменших квадратів, створений ним у 1795 р. та застосований для обробки астрономічних даних (з метою уточнення орбіти малої Церера). Його ім'ям часто називають один із найбільш популярних розподілів ймовірностей – нормальний, а в теорії випадкових процесів основний об'єкт вивчення – гауссівські процеси.

Наприкінці ХІХ ст. – на початку ХХ ст. великий внесок у математичну статистику зробили англійські дослідники, передусім К.Пірсон (1857-1936) та Р.А.Фішер (1890-1962). Зокрема Пірсон розробив критерій «хі-квадрат» перевірки статистичних гіпотез, а Фішер – дисперсійний аналіз, теорію планування експерименту, метод максимальної правдоподібності оцінки параметрів.

У 30-ті роки ХХ ст. поляк Єжи Нейман (1894-1977) та англієць Е.Пірсон розвинули загальну теорію перевірки статистичних гіпотез, а радянські математики академік О.М. Колмогоров (1903-1987) та член-кореспондент АН СРСР Н.В.Смирнов (1900-1966) заклали основи непараметричної статистики. У сорокові роки ХХ ст. румун А. Вальд (1902-1950) побудував теорію послідовного статистичного аналізу.

Математична статистика бурхливо розвивається й у час. Так, за останні 40 років можна виділити чотири принципово нові напрями досліджень:

Розробка та впровадження математичних методів планування експериментів;

Розвиток статистики об'єктів нечислової природи як самостійного спрямування прикладної математичної статистики;

Розвиток статистичних методів, стійких до малих відхилень від використовуваної ймовірнісної моделі;

Широке розгортання робіт із створення комп'ютерних пакетів програм, призначених щодо статистичного аналізу даних.

Імовірнісно-статистичні методи та оптимізація.Ідея оптимізації пронизує сучасну прикладну математичну статистику та інші статистичні методи. А саме, методи планування експериментів, статистичного приймального контролю, статистичного регулювання технологічних процесів та ін. прикладної математичної статистики

У виробничому менеджменті, зокрема, при оптимізації якості продукції і на вимоги стандартів особливо важливо застосовувати статистичні методи на початковому етапі життєвого циклу продукції, тобто. на етапі науково-дослідної підготовки дослідно-конструкторських розробок (розробка перспективних вимог до продукції, аванпроекту, технічного завдання на дослідно-конструкторську розробку). Це пояснюється обмеженістю інформації, доступної на початковому етапі життєвого циклу продукції, та необхідністю прогнозування технічних можливостей та економічної ситуації на майбутнє. Статистичні методи повинні застосовуватися на всіх етапах розв'язання задачі оптимізації – при шкалюванні змінних, розробці математичних моделей функціонування виробів та систем, проведенні технічних та економічних експериментів тощо.

У завданнях оптимізації, у тому числі оптимізації якості продукції та вимог стандартів, використовують усі галузі статистики. А саме, статистику випадкових величин, багатовимірний статистичний аналіз, статистику випадкових процесів та часових рядів, статистику об'єктів нечислової природи. Вибір статистичного методу для аналізу конкретних даних доцільно проводити згідно з рекомендаціями.

Статистичні методи

Статистичні методи- Методи аналізу статистичних даних. Виділяють методи прикладної статистики, які можуть застосовуватися у всіх галузях наукових досліджень та будь-яких галузях народного господарства, та інші статистичні методи, застосовність яких обмежена тією чи іншою сферою. Маються на увазі такі методи, як статистичний приймальний контроль, статистичне регулювання технологічних процесів, надійність та випробування, планування експериментів.

Класифікація статистичних методів

Статистичні методи аналізу даних застосовуються практично у всіх сферах діяльності людини.Їх використовують завжди, коли необхідно отримати та обґрунтувати будь-які судження про групу (об'єктів чи суб'єктів) з деякою внутрішньою неоднорідністю.

Доцільно виділити три види наукової та прикладної діяльності в галузі статистичних методів аналізу даних (за ступенем специфічності методів, пов'язаної з зануреністю у конкретні проблеми):

а) розробка та дослідження методів загального призначення, без урахування специфіки галузі застосування;

б) розробка та дослідження статистичних моделей реальних явищ та процесів відповідно до потреб тієї чи іншої галузі діяльності;

в) застосування статистичних методів та моделей для статистичного аналізу конкретних даних.

Прикладна статистика

Опис виду даних та механізму їх породження – початок будь-якого статистичного дослідження. Для опису даних застосовують як детерміновані, і ймовірнісні методи. За допомогою детермінованих методів можна проаналізувати ті дані, які є у розпорядженні дослідника. Наприклад, з допомогою отримані таблиці, розраховані органами офіційної державної статистики з урахуванням представлених підприємствами і організаціями статистичних звітів. Перенести отримані результати більш широку сукупність, використовувати їх задля передбачення і управління можна лише з основі вероятностно-статистического моделювання. Тому математичну статистику часто включають лише методи, що спираються на теорію ймовірностей.

Ми не вважаємо за можливе протиставляти детерміновані та імовірнісно-статистичні методи. Ми розглядаємо їх як послідовні етапи статистичного аналізу. На першому етапі необхідно проаналізувати дані, що мають, представити їх у зручному для сприйняття вигляді за допомогою таблиць і діаграм. Потім статистичні дані доцільно проаналізувати з урахуванням тих чи інших вероятностно-статистических моделей. Зазначимо, можливість більш глибокого проникнення у суть реального явища чи процесу забезпечується розробкою адекватної математичної моделі.

У найпростішій ситуації статистичні дані - це значення деякої ознаки, властивої об'єктам, що вивчаються. Значення можуть бути кількісними або бути вказівкою на категорію, до якої можна віднести об'єкт. У другому випадку говорять про якісну ознаку.

При вимірі за кількісним чи якісним ознаками як статистичних даних про об'єкт отримуємо вектор. Його можна як новий вид даних. У такому разі вибірка складається із набору векторів. Є частина координат – числа, а частина – якісні (категоризовані) дані, то говоримо про вектор різнотипних даних.

Одним елементом вибірки, тобто одним виміром, може бути і функція загалом. Наприклад, що описує динаміку показника, тобто його зміна у часі, - електрокардіограма хворого або амплітуда биття валу двигуна. Або часовий ряд, що описує динаміку показників певної фірми. Тоді вибірка складається із набору функцій.

Елементами вибірки можуть бути інші математичні об'єкти. Наприклад, бінарні стосунки. Так, під час опитування експертів часто використовують упорядкування (ранжування) об'єктів експертизи - зразків продукції, інвестиційних проектів, варіантів управлінських рішень. Залежно від регламенту експертного дослідження елементами вибірки можуть бути різні види бінарних відносин (упорядкування, розбиття, толерантності), множини, нечіткі множини тощо.

Отже, математична природа елементів вибірки у різних завданнях прикладної статистики може бути різною. Однак можна виділити два класи статистичних даних - числові та нечислові. Відповідно прикладна статистика розбивається на дві частини - числову статистику та нечислову статистику.

Числові статистичні дані – це числа, вектори, функції. Їх можна складати, множити на коефіцієнти. Тож у числовій статистиці велике значення мають різноманітні суми. Математичний апарат аналізу сум випадкових елементів вибірки – це (класичні) закони великих чисел та центральні граничні теореми.

Нечислові статистичні дані - це категоризовані дані, вектори різнотипних ознак, бінарні відносини, множини, нечіткі множини та ін. Їх не можна складати та множити на коефіцієнти. Тому немає сенсу говорити про суми нечислових статистичних даних. Вони є елементами нечислових математичних просторів (множин). Математичний апарат аналізу нечислових статистичних даних ґрунтується на використанні відстаней між елементами (а також мір близькості, показників відмінності) у таких просторах. За допомогою відстаней визначаються емпіричні та теоретичні середні, доводяться закони великих чисел, будуються непараметричні оцінки густини розподілу ймовірностей, вирішуються завдання діагностики та кластерного аналізу, і т. д. (див. ).

У прикладних дослідженнях використовують статистичні дані різних видів. Це, зокрема, зі способами їх отримання. Наприклад, якщо випробування деяких технічних пристроїв продовжуються до певного моменту часу, отримуємо т. зв. цензуровані дані, що складаються з набору чисел - тривалості роботи низки пристроїв до відмови, та інформації про те, що інші пристрої продовжували працювати в момент закінчення випробування. Цензуровані дані часто використовуються при оцінці та контролі надійності технічних пристроїв.

Зазвичай, окремо розглядають статистичні методи аналізу даних перших трьох типів. Це обмеження викликано тим зазначеним вище обставиною, що математичний апарат аналізу даних нечисловой природи - значно інший, ніж даних як чисел, векторів і функций.

Імовірнісно-статистичне моделювання

При застосуванні статистичних методів у конкретних галузях знань та галузях народного господарства отримуємо науково-практичні дисципліни на кшталт «статистичні методи в промисловості», «статистичні методи в медицині» та ін. З цієї точки зору економетрика – це «статистичні методи в економіці». Ці дисципліни групи б) зазвичай спираються на імовірнісно-статистичні моделі, побудовані відповідно до особливостей галузі застосування. Дуже повчально зіставити імовірнісно-статистичні моделі, що застосовуються в різних галузях, виявити їхню близькість і водночас констатувати деякі відмінності. Так, видно близькість постановок завдань і застосовуваних для їх вирішення статистичних методів у таких галузях, як наукові медичні дослідження, конкретні соціологічні дослідження та маркетингові дослідження, або, коротше, в медицині, соціології та маркетингу. Вони часто поєднуються разом під назвою «вибіркові дослідження».

Відмінність вибіркових досліджень від експертних проявляється, передусім, серед обстежених об'єктів чи суб'єктів - у вибіркових дослідженнях йдеться зазвичай про сотні, а експертних - про десятки. Натомість технології експертних досліджень набагато витонченіші. Ще більш виражена специфіка в демографічних чи логістичних моделях, під час обробки наративної (текстової, літописної) інформації чи щодо взаємовпливу чинників.

Питання надійності та безпеки технічних пристроїв та технологій, теорії масового обслуговування докладно розглянуті у великій кількості наукових праць.

Статистичний аналіз конкретних даних

Застосування статистичних методів та моделей для статистичного аналізу конкретних даних тісно прив'язане до проблем відповідної галузі. Результати третього з виділених видів наукової та прикладної діяльності перебувають на стику дисциплін. Їх можна як приклади практичного застосування статистичних методів. Але не менше підстав відносити їх до відповідної сфери діяльності людини.

Наприклад, результати опитування споживачів розчинної кави природно віднести до маркетингу (що роблять, читаючи лекції з маркетингових досліджень). Дослідження динаміки зростання цін за допомогою індексів інфляції, розрахованих за незалежно зібраною інформацією, цікавить насамперед з погляду економіки та управління народним господарством (як на макрорівні, так і на рівні окремих організацій).

Перспективи розвитку

Теорія статистичних методів орієнтована рішення реальних завдань. Тому в ній постійно виникають нові постановки математичних завдань аналізу статистичних даних, розвиваються та обґрунтовуються нові методи. Обгрунтування часто проводиться математичними засобами, тобто доказом теорем. Велику роль грає методологічна складова – як саме ставити завдання, які припущення прийняти з метою подальшого математичного вивчення. Велика роль сучасних інформаційних технологій, зокрема комп'ютерного експерименту.

Актуальною є завдання аналізу історії статистичних методів з метою виявлення тенденцій розвитку та застосування їх для прогнозування.

Література

2. Нейлор Т. Машинні імітаційні експерименти із моделями економічних систем. - М: Мир, 1975. - 500 с.

3. Крамер Р. Математичні методи статистики. - М.: Мир, 1948 (1-е вид.), 1975 (2-ге вид.). – 648 с.

4. Більшов Л. Н., Смирнов Н. В. Таблиці математичної статистики. - М.: Наука, 1965 (1-е вид.), 1968 (2-ге вид.), 1983 (3-тє вид.).

5. Смирнов Н. В., Дунін-Барковський І. В. Курс теорії ймовірностей та математичної статистики для технічних додатків. Вид. 3-тє, стереотипне. - М: Наука, 1969. - 512 с.

6. Норман Дрейпер, Гаррі СмітПрикладний регресійний аналіз. Множинна регресія = Applied Regression Analysis. - 3-тє вид. – М.: «Діалектика», 2007. – С. 912. – ISBN 0-471-17082-8

Дивись також

Wikimedia Foundation. 2010 .

  • Yat-Kha
  • Амальгама (значення)

Дивитись що таке "Статистичні методи" в інших словниках:

    СТАТИСТИЧНІ МЕТОДИ- СТАТИСТИЧНІ МЕТОДИ наукові методи опису та вивчення масових явищ, що допускають кількісне (чисельне) вираження. Слово "статистика" (від гол. stato держава) має спільний корінь зі словом "держава". Спочатку воно… … Філософська енциклопедія

    СТАТИСТИЧНІ МЕТОДИ –- наукові методи опису та вивчення масових явищ, що допускають кількісне (чисельне) вираження. Слово "статистика" (від італ. stato - Держава) має спільний корінь зі словом "держава". Спочатку воно відносилося до науки управління та … Філософська енциклопедія

    Статистичні методи- (в екології та біоценології) методи варіаційної статистики, що дозволяють досліджувати ціле (напр., фітоценоз, популяцію, продуктивність) за його приватними сукупностями (напр., за даними, отриманими на облікових майданчиках) та оцінити ступінь точності. Екологічний словник

    статистичні методи- (У психології) (від лат. status стан) деякі методи прикладної математичної статистики, які використовуються в психології в основному для обробки експериментальних результатів. Основна мета застосування С. м. підвищення обґрунтованості висновків у ... Велика психологічна енциклопедія

    Статистичні методи– 20.2. Статистичні методи Конкретні статистичні методи, що використовуються для організації, регулювання та перевірки діяльності, включають, але не обмежуються такими: а) плануванням експериментів та факторний аналіз; b) аналіз дисперсії та … Словник-довідник термінів нормативно-технічної документації

    СТАТИСТИЧНІ МЕТОДИ- Методи дослідження кількостей. сторони масових товариств. явищ та процесів. С. м. дають можливість у цифровому вираженні характеризувати зміни, що відбуваються в суспільств. процесах, вивчати разл. форми соціально економіч. закономірностей, зміну… Сільсько-господарський енциклопедичний словник

    СТАТИСТИЧНІ МЕТОДИ- Деякі методи прикладної математичної статистики, що використовуються для обробки експериментальних результатів. Ряд статистичних методів було розроблено спеціально для перевірки якості психологічних тестів, для застосування у професійному… Професійну освіту. Словник

    СТАТИСТИЧНІ МЕТОДИ- (В інженерної психології) (від лат. status стан) деякі методи прикладної статистики, що використовуються в інженерній психології для обробки експериментальних результатів. Основна мета застосування С. м. підвищення обґрунтованості висновків у ... Енциклопедичний словник з психології та педагогіки

У багатьох випадках у гірничій науці необхідно досліджувати як детерміновані, а й випадкові процеси. Всі геомеханічні процеси протікають в умовах, що безперервно змінюються, коли ті чи інші події можуть відбутися, а можуть і не відбутися. При цьому виникає потреба аналізувати випадкові зв'язки.

Незважаючи на випадковий характер подій, вони підкоряються певним закономірностям, що розглядаються в теорії ймовірностей , Що вивчає теоретичні розподілу випадкових величин та їх характеристики. Способами обробки та аналізу випадкових емпіричних подій займається інша наука, так звана математична статистика. Ці дві споріднені науки становлять єдину математичну теорію масових випадкових процесів, що широко застосовується в наукових дослідженнях.

Елементи теорії ймовірностей та матстатистики.Під сукупністю розуміють безліч однорідних подій випадкової величини х, Що складає первинний статистичний матеріал. Сукупність може бути генеральною (велика вибірка N), що містить різні варіанти масового явища, і вибіркової (мала вибірка N 1), що є лише частиною генеральної сукупності.

Ймовірністю Р(х) події хназивають відношення числа випадків N(х), які призводять до настання події х, до загального числа можливих випадків N:

У математичній статистиці аналогом ймовірності є поняття частоти події , що є відношенням числа випадків , у яких мала місце подія, до загального числа подій:

При необмеженому зростанні числа подій часто прагне ймовірності Р(х).



Допустимо, є якісь статистичні дані, подані у вигляді ряду розподілу (гістограми) на рис. 4.11, тоді часто характеризує ймовірність появи випадкової величини в інтервалі і , а плавна крива зветься функції розподілу.

Імовірність випадкової величини – це кількісна оцінка можливості її появи. Достовірна подія має Р=1, неможлива подія – Р=0. Отже, для випадкової події, а сума ймовірностей всіх можливих значень.

У дослідженнях недостатньо мати криву розподілу, а необхідно знати та її характеристики:

а) середньоарифметичне -; (4.53)

б) розмах - R= x max – x min , який можна використовувати для орієнтовної оцінки варіації подій, де x max та x min – екстремальні значення виміряної величини;

в) математичне очікування – . (4.54)

Для безперервних випадкових величин математичне очікування записується як

, (4.55)

тобто. дорівнює дійсному значенню подій, що спостерігаються х, А відповідна мотакування абсцис називається центром розподілу.

г) дисперсія – , (4.56)

яка характеризує розсіювання випадкової величини стосовно математичного очікування. Дисперсію випадкової величини інакше називають центральним моментом другого порядку.

Для безперервної випадкової величини дисперсія дорівнює

; (4.57)

д) середньоквадратичне відхилення або стандарт -

е) коефіцієнт варіації (відносне розсіювання) -

, (4.59)

який характеризує інтенсивність розсіювання у різних сукупностях і застосовується їхнього порівняння.

Площа, розташована під кривою розподілу, відповідає одиниці, це означає, що крива охоплює всі значення випадкових величин. Проте таких кривих, які матимуть площу, рівну одиниці, можна побудувати велику кількість, тобто. вони можуть мати різне розсіювання. Мірою розсіювання є дисперсія або середньоквадратичне відхилення (рис. 4.12).


Вище ми розглянули основні характеристики кривої теоретичної розподілу, які аналізує теорія ймовірностей. У статистиці оперують емпіричними розподілами, а основним завданням статистики є підбір теоретичних кривих за наявним емпіричним законом розподілу.

Нехай у результаті n вимірів випадкової величини отримано варіаційний ряд х 1 , х 2 , х 3 , …х n. Обробка таких рядів зводиться до таких операцій:

– групують х ів інтервалі та встановлюють для кожного з них абсолютну та відносні частоти;

- За значеннями будують ступінчасту гістограму (рис. 4.11);

– обчислюють характеристики емпіричної кривої розподілу: середньоарифметичну дисперсію Д=; середньоквадратичне відхилення .

значенням , Ді sемпіричного розподілу відповідають величини , Д(х) та s(х) теоретичного розподілу.



Розглянемо основні теоретичні криві розподіли. Найчастіше в дослідженнях застосовують закон нормального розподілу (рис. 4.13), рівняння якого має вигляд:

(4.60)

Якщо поєднати вісь координат з точкою m, тобто. прийняти m(x)=0 і прийняти закон нормального розподілу буде описуватися більш простим рівнянням:

Для оцінки розсіювання зазвичай користуються величиною . Чим менше sтим менше розсіювання, тобто. спостереження мало відрізняється друг від друга. Зі збільшенням sрозсіювання зростає, ймовірність похибок збільшується, а максимум кривої (ординату), рівний, зменшується. Тому значення у=1/ при 1 називають мірою точності. Середньоквадратичні відхилення та відповідають точкам перегину (заштрихована область на рис. 4.12) кривої розподілу.

При аналізі багатьох випадкових дискретних процесів використовують розподіл Пуассона (короткострокові події, які у одиницю часу). Ймовірність появи чисел рідкісних подій х=1, 2, … за цей час виражається законом Пуассона (див. рис. 4.14):

, (4.62)

де х- Число подій за даний відрізок часу t;

λ - Щільність, тобто. середня кількість подій за одиницю часу;

– середня кількість подій за час t;

Для закону Пуассона дисперсія дорівнює математичному очікуванню числа настання подій за час t, тобто. .

Для дослідження кількісних характеристик деяких процесів (часу відмов машин тощо) застосовують показовий закон розподілу (рис. 4.15), густина розподілу якого виражається залежністю

де λ - Інтенсивність (середнє число) подій в одиницю часу.

У показовому розподілі інтенсивність λ є величиною, зворотною математичному очікуванню λ = 1/m(x). Крім того, справедливе співвідношення.

У різних галузях досліджень широко застосовується закон розподілу Вейбулла (рис. 4.16):

, (4.64)

де n, μ , - Параметри закону; х- Аргумент, найчастіше час.

Досліджуючи процеси, пов'язані з поступовим зниженням параметрів (зниженням міцності порід у часі тощо), застосовують закон гамма-розподілу (рис. 4.17):

, (4.65)

де λ , a- Параметри. Якщо a=1, гама функції перетворюється на показовий закон.

Крім наведених вище законів застосовують інші види розподілів: Пірсона, Релея, бета – розподіл тощо.

Дисперсійний аналіз.У дослідженнях часто виникає питання: Наскільки впливає той чи інший випадковий чинник на досліджуваний процес? Методи встановлення основних факторів та їх вплив на досліджуваний процес розглядаються у спеціальному розділі теорії ймовірностей та математичної статистики – дисперсійному аналізі. Розрізняють одне – та багатофакторний аналіз. Дисперсійний аналіз ґрунтується на використанні нормального закону розподілу та на гіпотезі, що центри нормальних розподілів випадкових величин рівні. Отже, всі виміри можна як вибірку з однієї й тієї нормальної сукупності.

Теорія надійності.Методи теорії ймовірностей та математичної статистики часто застосовують у теорії надійності, яка широко використовується в різних галузях науки та техніки. Під надійністю розуміють властивість об'єкта виконувати задані функції (зберігати встановлені експлуатаційні показники) протягом необхідного часу. Теоретично надійності відмови розглядаються як випадкові події. Для кількісного опису відмов застосовують математичні моделі – функції розподілу інтервалів часу (нормальний та експоненційний розподіл, Вейбулла, гамма-розподілу). Завдання полягає у знаходженні ймовірностей різних показників.

Метод Монте-Карло.Для дослідження складних процесів імовірнісного характеру застосовують метод Монте-Карло. За допомогою цього методу вирішують завдання щодо знаходження найкращого рішення з безлічі варіантів, що розглядаються.

Метод Монте-Карло інакше називають методом статистичного моделювання. Це чисельний метод, він заснований на використанні випадкових чисел, що моделюють імовірнісні процеси. Математичною основою методу є закон великих чисел, який формулюється так: при великій кількості статистичних випробувань ймовірність того, що середньоарифметичне значення випадкової величини прагне її математичного очікування, дорівнює 1:

, (4.64)

де ε – будь-яке мале позитивне число.

Послідовність розв'язання задач методом Монте-Карло:

- Збір, обробка та аналіз статистичних спостережень;

– відбір головних та відкидання другорядних факторів та складання математичної моделі;

- Складання алгоритмів і вирішення завдань на ЕОМ.

Для вирішення завдань методом Монте-Карло необхідно мати статистичний ряд, знати закон його розподілу, середнє значення, математичне очікування та середньоквадратичне відхилення. Рішення ефективне лише з використанням ЕОМ.

3. Суть імовірнісно-статистичних методів

Як підходи, ідеї та результати теорії ймовірностей та математичної статистики використовуються при обробці даних – результатів спостережень, вимірювань, випробувань, аналізів, дослідів з метою ухвалення практично важливих рішень?

Базою є імовірнісна модель реального явища чи процесу, тобто. математична модель, у якій об'єктивні співвідношення виражені термінах теорії ймовірностей. Імовірності використовуються передусім для опису невизначеностей, які необхідно враховувати під час прийняття рішень. Маються на увазі як небажані можливості (ризики), так і привабливі (щасливий випадок). Іноді випадковість вноситься в ситуацію свідомо, наприклад, під час жеребкування, випадкового відбору одиниць для контролю, проведення лотерей або опитувань споживачів.

Теорія ймовірностей дозволяє за одними ймовірностями розрахувати інші, які цікавлять дослідника. Наприклад, за ймовірністю випадання герба можна розрахувати ймовірність того, що при 10 кидання монет випаде не менше 3 гербів. Подібний розрахунок спирається на ймовірну модель, згідно з якою кидання монет описуються схемою незалежних випробувань, крім того, випадання герба і решітки рівноможливі, а тому ймовірність кожної з цих подій дорівнює ½. Більш складною є модель, де замість кидання монети розглядається перевірка якості одиниці виробленої продукції. Відповідна ймовірна модель спирається на припущення про те, що контроль якості різних одиниць продукції описується схемою незалежних випробувань. На відміну від моделі з киданням монет, необхідно ввести новий параметр – ймовірність рте, що одиниця продукції є дефектною. Модель буде повністю описана, якщо прийняти, що всі одиниці продукції мають однакову можливість виявитися дефектними. Якщо останнє припущення неправильне, число параметрів моделі зростає. Наприклад, можна прийняти, що кожна одиниця продукції має свою можливість виявитися дефектною.

Обговоримо модель контролю якості із загальною для всіх одиниць продукції ймовірністю дефектності р. Щоб під час аналізу моделі «дійти до числа», необхідно замінити рна деяке конкретне значення. Для цього необхідно вийти з рамок ймовірнісної моделі та звернутися до даних, отриманих під час контролю якості. Математична статистика вирішує зворотне завдання стосовно теорії ймовірностей. Її мета – на основі результатів спостережень (вимірювань, аналізів, випробувань, дослідів) отримати висновки про ймовірності, що лежать в основі ймовірнісної моделі. Наприклад, на основі частоти появи дефектних виробів під час контролю можна зробити висновки про ймовірність дефектності (див. обговорення вище з використанням теореми Бернуллі). На основі нерівності Чебишева робилися висновки про відповідність частоти появи дефектних виробів гіпотезі про те, що ймовірність дефектності набуває певного значення.

Таким чином, застосування математичної статистики спирається на ймовірну модель явища або процесу. Використовуються два паралельних ряду понять – які стосуються теорії (імовірнісної моделі) і які стосуються практики (вибірці результатів спостережень). Наприклад, теоретичній ймовірності відповідає частота, знайдена за вибіркою. Математичне очікування (теоретичний ряд) відповідає вибіркове середнє арифметичне (практичний ряд). Як правило, вибіркові показники є оцінками теоретичних. При цьому величини, що належать до теоретичного ряду, «перебувають у головах дослідників», відносяться до світу ідей (за давньогрецьким філософом Платоном), недоступні для безпосереднього виміру. Дослідники мають у своєму розпорядженні лише вибіркові дані, за допомогою яких вони намагаються встановити властивості теоретичної ймовірнісної моделі, що їх цікавлять.

Навіщо ж потрібна імовірнісна модель? Справа в тому, що тільки з її допомогою можна перенести властивості, встановлені за результатами аналізу конкретної вибірки, на інші вибірки, а також на так звану генеральну сукупність. Термін «генеральна сукупність» використовується, коли йдеться про велику, але кінцеву сукупність одиниць, що вивчаються. Наприклад, про сукупність всіх жителів Росії або сукупність всіх споживачів розчинної кави в Москві. Мета маркетингових чи соціологічних опитувань у тому, щоб твердження, отримані за вибіркою із сотень чи тисяч жителів, перенести на генеральні сукупності кілька мільйонів. Під час контролю якості у ролі генеральної сукупності виступає партія продукції.

Щоб перенести висновки з вибірки більш широку сукупність, необхідні ті чи інші припущення про зв'язок вибіркових характеристик з характеристиками цієї більшої сукупності. Ці припущення ґрунтуються на відповідній імовірнісній моделі.

Звичайно, можна обробляти вибіркові дані, не використовуючи ту чи іншу ймовірну модель. Наприклад, можна розраховувати вибіркове середнє арифметичне, підраховувати частоту виконання тих чи інших умов тощо. Проте результати розрахунків відноситимуться лише до конкретної вибірки, перенесення отриманих з їх допомогою висновків на будь-яку іншу сукупність некоректне. Іноді подібну діяльність називають "аналіз даних". Порівняно з імовірнісно-статистичними методами, аналіз даних має обмежену пізнавальну цінність.

Отже, використання імовірнісних моделей на основі оцінювання та перевірки гіпотез за допомогою вибіркових характеристик – ось суть імовірнісно-статистичних методів прийняття рішень.

Підкреслимо, що логіка використання вибіркових характеристик до ухвалення рішень з урахуванням теоретичних моделей передбачає одночасне використання двох паралельних рядів понять, одне із яких відповідає імовірнісним моделям, а другий – вибірковим даним. На жаль, у ряді літературних джерел, зазвичай застарілих чи написаних у рецептурному дусі, немає різниці між вибірковими і теоретичними характеристиками, що призводить читачів до подивів і помилок при практичному використанні статистичних методів.

Попередня


Останні матеріали розділу:

Священний Коран арабською мовою – рятівник душі і тіла людини Коран всі сури арабською
Священний Коран арабською мовою – рятівник душі і тіла людини Коран всі сури арабською

Все, що є у Всесвіті і все, що в ньому відбувається, пов'язане з Кораном і отримує своє відображення. Людство не мислимо без Корану, і...

Жіночий Султанат – Султанші мимоволі на екрані та у звичайному житті
Жіночий Султанат – Султанші мимоволі на екрані та у звичайному житті

У статті ми докладно охарактеризуємо Жіночий султанат Ми розповімо про його представниць та їх правління, про оцінки цього періоду в...

Правителі Османської імперії
Правителі Османської імперії

З моменту створення Османської імперії державою безперервно правили Османських нащадків по чоловічій лінії. Але незважаючи на плідність династії, були...