Статистичні гіпотези та критерії. Основні поняття, що використовуються під час перевірки гіпотез

В результаті вивчення цього розділу студент повинен:

знати

  • що таке статистична гіпотеза;
  • співвідношення теоретичних, експериментальних та статистичних гіпотез;
  • відмінності між нульовою та альтернативною гіпотезами;
  • логіку оцінки, прийняття та заперечення статистичних гіпотез;
  • поняття помилки першого та другого роду, статистичної значущості (надійності);
  • відмінності між параметричною та непараметричною статистикою, можливості та обмеження цих двох видів статистичних критеріїв;

вміти

  • перевіряти найпростіші гіпотези про середнє за допомогою t -тесту Стьюдента для парних (зв'язкових) та непарних (незалежних) вибірок;
  • оцінювати дві вибірки на однорідність за допомогою t -тесту Стьюдента та F -Теста Фішера;
  • будувати довірчі інтервали для параметрів, що оцінюються;

володіти

  • методичним апаратом та базовими навичками висування та перевірки статистичних гіпотез;
  • навичками оцінки статистичних гіпотез та побудови довірчих інтервалів.

Загальна стратегія

Ви вже знаєте, що у статистичному аналізі прийнято розрізняти поняття "параметр" та "статистика". Ці відмінності докладно обговорювалися у гол. 1; у табл. 2.1 резюмується обговорення, що відбулося.

Згадаймо, що будь-який розподіл може бути охарактеризовано тими чи іншими теоретичними параметрами. Математичне очікування, дисперсія, асиметрія, ексцес є прикладами таких параметрів розподілу випадкової величини в генеральній сукупності. Всі вони, відзначимо ще раз цей важливий факт, є теоретичними величинами, які майже ніколи не бувають відомі на практиці. У практичній діяльності дослідника їх можна лише оцінити з тим чи іншим ступенем точності шляхом обчислення різних статистичних величин, які не завжди виявляються рівними теоретичним величин параметрів, а також і один одному, в чому ми вже переконалися в параграфі 1.4, розглядаючи практичні приклади оцінки різних параметрів розподілу такої якості особистості, як фемінність - маскулінність.

Таблиця 2.1

Співвідношення параметрів та статистики

І це не дивно: адже статистика відображає поведінку випадкових величин лише у сформованій експериментатором вибірці, а не в самій генеральній сукупності. Тому в експериментатора може виникнути питання, як обчислені статистики співвідносяться з теоретичними параметрами розподілу. Іншими словами, експериментатор може зацікавитися тим, чи дійсно наявні у нього в розпорядженні вибіркові дані вилучені з генеральної сукупності, що характеризується передбачуваними в теорії параметрами розподілу. Щоб відповісти на це питання, експериментатор висуває та перевіряє статистичні гіпотези.

Статистичними гіпотезаминазивають припущення про можливі значення параметрів розподілу випадкової величини в генеральній сукупності. Перевірка та аналіз статистичних гіпотез здійснюються в результаті збирання та побудови статистики. Інструментом у такій роботі виступають статистичні тести, або критерії, кожен із яких є деякий набір стандартизованих правил. На основі цих правил приймається рішення про істинність чи хибність статистичної гіпотези.

Розглянемо ще раз приклад із підкиданням монети. Можна припускати, що ймовірність випадання "орла" при киданні нормальної, нефальшивої та непошкодженої монети дорівнює 50%. Це означає, що математичне очікування такої події при 100-кратному киданні монети виявиться рівним 50. Перевірка цієї гіпотези полягатиме в тому, щоб провести подібні випробування, оцінити в результаті цього параметр, що цікавить нас, шляхом обчислення відповідної статистики і за допомогою цієї статистики перевірити достовірність. висунутої гіпотези. Наприклад, провівши 100 випробувань монети, ми можемо переконатися, що кожна сторона дійсно випала по 50 разів. Однак ймовірно, що результат такого випробування все ж таки дещо відрізнятиметься від теоретично передбачуваного. Іншими словами, навіть якщо "орел" випаде трохи менше або трохи більше 50 разів, ми навряд будемо мати підстави вважати, що монета фальшива. Підозріла ситуація, коли таке відхилення від теоретично гаданих величин досягне більших значень, наприклад, коли "орел" при 100 випробуваннях монети не випаде жодного разу. Такий розклад, мабуть, є малоймовірним за умови, що з монетою все гаразд.

Отже, ясно, що якщо в ході 100-кратного кидання монети "орел" випав рівно 50 разів, з монетою все гаразд. Якщо "орел" не випав жодного разу, є підстави припускати, що з монетою щось не те. Але де та грань, яка відокремлює позитивні та негативні висновки? Це питання стосується вибираного критерію прийняття рішення. Саме такими критеріями виступають розроблені в математичній статистиці для перевірки статистичних гіпотез статистичні тести, які тому часто називають статистичними критеріями.

Таким чином, перевірка статистичних гіпотез здійснюється в результаті оцінки ймовірності випадкової події, якою розглядається величина статистики. Якщо ця ймовірність виявляється дуже незначною за умови істинності висунутої гіпотези, статистична гіпотеза, що перевіряється, відкидається, в іншому випадку гіпотеза приймається.

Проблема цієї процедури, однак, може полягати в тому, що ми можемо заздалегідь не знати конкретного значення параметра розподілу випадкової величини, що аналізується. Наприклад, у випадку з монетою можна припустити, що монета фальшива, і, отже, ймовірність випадання "орла" тією чи іншою мірою відрізняється від 50%. У цьому випадку, провівши серію випробувань, ми не зможемо оцінити ступінь відмінності отриманої статистики, що характеризує величину математичного очікування події, що аналізується, від дійсного його значення. І тоді перевірка статистичної гіпотези може бути неможливою. Вихід із цієї ситуації може, проте, полягати у тому, щоб оцінити ймовірність гіпотези, протилежної висунутої. Інакше кажучи, у разі можна, наприклад, висунути гіпотезу про рівність теоретичної ймовірності 50%. Якщо ця гіпотеза виявляється невірною, приймається альтернативна гіпотеза.

Дійсно, під час перевірки статистичних гіпотез дослідник завжди має справу не з однією, а з двома гіпотезами, які позначаються як Н 0 та Н 1. Один із цих гіпотез називається нульової, інша – альтернативної, тобто. спростовує нульову.

Нульова гіпотеза Н 0 завжди конкретна. Вона завжди стверджує якесь конкретне значення параметра розподілу. Наприклад, гіпотеза, що стосується математичного очікування, може формулюватися так: μ = А, де А – деяке конкретне значення μ, а гіпотеза, що стосується рівності двох велич дисперсії, – σ1 = σ2.

Альтернативна гіпотеза Н 1 завжди формулюється менш конкретно, наприклад: μ > А ; * σ2 і т.п. Але, як правило, виявляється так, що експериментатора цікавить не конкретна нульова гіпотеза Н 0, а саме менш конкретна альтернативна гіпотеза Н 1, оскільки саме вона більшою мірою відповідає випробуваній їм в експерименті науковій гіпотезі.

Проводячи емпіричну оцінку теоретичного параметра, експериментатор визначає статистичну значимість отриманого результату, беручи за основу припущення про істинність Н 0. Статистична значимість є ймовірність того, що в нескінченній кількості експериментів, що повністю відтворюють умови проведеного експерименту, ми отримаємо те ж чи ще більше значення побудованої статистики. Якщо можливість отримати таке і ще більше значення статистики в нескінченному числі експериментів з тими ж умовами при тому, що нульова гіпотеза істинна, виявляється невеликий, експериментатор відмовляється від нульової гіпотези на користь альтернативної.

Наочно описана логіка представлена ​​рис. 2.1. Як очевидно, тут висуваються дві альтернативні гіпотези. Одна з них конкретна і передбачає рівність математичного очікування на нуль. Ця гіпотеза позначена як Н 0. Відповідна їй крива описує розподіл випадкової величини Ζ, що передбачається цією гіпотезою. Друга гіпотеза, позначена як Н 1, менш конкретна. Вона лише стверджує, що величина математичного очікування має перевищувати нульове значення. У принципі існує безліч кривих, що описують розподіли, що відповідають цій гіпотезі. Наведена крива є однією з можливих. Величина Ζ експ характеризує значення статистики, що оцінює теоретичний параметр у експерименті. Це те, що експериментатор має у своєму розпорядженні те, що йому вдалося отримати, провівши збір емпіричних даних. Наприклад, це може бути величина середнього арифметичного за вибіркою. Тоді перевірка висунутих статистичних гіпотез повинна полягати в тому, щоб спробувати оцінити, наскільки можливо в іншому такому ж експерименті отримати ту ж величину Zексп або навіть більшу за умови істинності нульової гіпотези. Очевидно, що ця ймовірність дорівнює площі під кривою розподілу, що передбачається цією гіпотезою. Ця площа зліва обмежена обчисленою статистикою, праворуч – не обмежена. Така площа, як ми пам'ятаємо (див. параграф 1.2) називається квантилем розподілу. Вона може бути визначена таким чином:

Мал. 2.1.

Необхідна для прийняття або заперечення гіпотези величина квантилю р у цьому рівнянні є так званим рівень значущості обчисленої статистики Zексп. Чим більша ця величина, тим більшою ймовірністю отримані в експерименті дані описуються розподілом f Ho( Z ), тобто. розподілом, передбаченим гіпотезою Н 0. Навпаки, що менше значення р, тим менша ймовірність того, що емпіричні дані справді відповідають розподілу f H0(Z), і тим більша ймовірність того, що вони описуються розподілом, який передбачає більш високе значення μ. Таким чином, оцінюючи значення р, можна ухвалити рішення на користь однієї з двох висунутих гіпотез.

Гіпотеза Н 0 може бути прийнята, якщо величина квантилю, що визначає статистичну значимість емпіричного значення X, виявляється досить великою. Альтернативна гіпотеза Н 1 приймається, якщо величина квантилю, який задає статистичну значимість отриманого в експерименті результату, виявляється зневажливо малою. Проблема, проте, у тому, яку величину квантиля, задає статистичну значимість, вважати досить великий, яку – зневажливо малої. Щоб вирішити цю проблему, розглянемо докладніше, які можливості мають експериментатор, який оцінює статистичні гіпотези (табл. 2.2).

Зрозуміло, що висунуті статистичні гіпотези може бути або вірними, або неправильними. Оскільки гіпотези Н 0 та Н 1 є альтернативними, тобто. вони виключають один одного, мають місце лише два гіпотетичні випадки, що характеризують істинність або хибність аналізованих гіпотез: або Н 0 виявиться вірною, а Н 1 відповідно неправильної, чи навпаки. Оскільки експериментатор, що оцінює гіпотези, ніколи не знає, яка з гіпотез вірна, сто рішення прийняти чи відкинуто гіпотезу Н 0 ніяк не пов'язано з її істинністю чи хибністю – адже саме їх він і намагається встановити. Таким чином, у ході перевірки статистичних гіпотез можливо чотири результати, сприятливими з яких для експериментатора можуть вважатися лише два, незалежно від того, яку гіпотез насправді хоче довести дослідник.

Таблиця 2.2

Матриця наслідків в оцінці статистичних гіпотез

Якщо гіпотеза Н 0 вірна і вона приймається в результаті статистичного аналізу, експериментатор не робить помилки. І це сприятливий результат для дослідника, навіть якщо він хотів би прийняти альтернативну гіпотезу. Також експериментатор нс робить помилки, коли він відкидає гіпотезу Н 0, яка насправді є неправильною. Однак може статися так, що нульова гіпотеза насправді вірна, а експериментатор її все ж таки відкидає. У цьому випадку він робить помилку, яку прийнято називати помилкою першого роду або α( альфа )-помилкою. Помилка другого роду, або β( бета )-помилкою, називається результат, у якому експериментатор приймає нульову гіпотезу, яка насправді виявляється неправильною.

Зрозуміло, що чим більша ймовірність, що визначає статистичну значимість отриманого в експерименті результату, при якій експериментатор готовий відмовитися від нульової гіпотези на користь альтернативної, тим більша ймовірність першого помилки помилки і менше ймовірність другої помилки (рис. 2.2). Навпаки, зменшуючи значення ймовірності, коли експериментатор відмовляється від нульової гіпотези, він цим ризикує з більшою ймовірністю зробити помилку другого роду, але цим більшою мірою захищає себе від помилки першого роду. Таким чином, питання про те, за якого рівня значущості гіпотеза Н 0 може бути відкинута або прийнята, пов'язана насправді з тим, яка з двох можливих помилок менш важлива для експериментатора. Застосовуючи консервативнішу стратегію перевірки статистичної гіпотези, експериментатор нехтує небезпекою помилки другого роду. Застосовуючи радикальніший варіант дії, експериментатор як би забуває про помилку першого роду.

Мал. 2.2.

Якщо прийняття статистичної гіпотези передбачає якісь важливі соціальні наслідки, можна застосувати консервативнішу стратегію її оцінки. Якщо серйозні наслідки можуть виникнути внаслідок неприйняття статистичної гіпотези, можна діяти менш консервативно.

Наприклад, нехай розглядається питання визначення розумової відсталості конкретної дитини. У результаті психологічного обстеження встановлено, що його коефіцієнт інтелекту нижче середнього значення цієї популяції піддослідних. Таким чином, виникло припущення про недостатній інтелектуальний розвиток цієї дитини та необхідність у зв'язку з цим направлення її до спеціального інтернату для розумово відсталих. Для перевірки цієї гіпотези були сформульовані дві альтернативні статистичні гіпотези, одна з яких передбачає, що отримані при обстеженні дані характеризують звичайний популяційний розподіл з математичним очікуванням, що дорівнює межі, що визначає розумову відсталість, скажімо, 75 балів (гіпотеза Н 0), а друга передбачає нижчу значення математичного очікування, тобто. математичне очікування менше заданого кордону (гіпотеза Н 1). Далі припустимо, що в ході оцінки статистичної значущості емпіричного показника інтелектуального розвитку дитини з'ясувалося, що ймовірність отримати при іншому випадковому випробуванні той самий результат або навіть ще нижчий становить не більше одного шансу з 20. Виникає питання: чи можна на підставі даного результату судити про недостатню емпіричну обґрунтованість нульової гіпотези і, отже, відмовитися від неї на користь альтернативної гіпотези Н 1? Зрозуміло, що відповідь на це питання значною мірою залежатиме від того, які помилкові дії можна вважати більш прийнятними. Якщо ми переконані в тому, що перебування нормальної дитини хоч і з низькими розумовими здібностями в інтернаті для розумово відсталих краще, ніж навчання розумово відсталого в нормальній школі, ми можемо прийняти одне рішення щодо встановлення меж рівня значущості, якщо ми вважаємо по-іншому, необхідно ухвалити інше рішення.

На щастя, дослідник, як правило, позбавлений необхідності вирішувати проблему такого роду. Справа в тому, що статистично неможливо обґрунтувати оптимальний рівень значущості, який можна було б прийняти як еталонний при виборі статистичних гіпотез. Разом з тим, існують деякі квазістатистичні угоди, які приймаються за умовчанням (табл. 2.3). Емпіричний результат вважається статистично значимим для відмови від нульової гіпотези, якщо можливість отримати такий самий або більший (менший) результат при іншому випадковому випробуванні становить менше одного шансу з 20, тобто. тоді, коли значення р виявляється менше 0,05. Якщо значення р виявляється менше 0,01, то отриманий результат вважається високозначущою відмовитися від нульової гіпотези. У разі, коли значення р перевищує 0,10, вважається, що в експерименті не встановлені статистично значущі відмінності від теоретичного параметра, що передбачається нульовою гіпотезою. Якщо отримане значення р виявляється між величиною 0,10 та 0,05, результат вважається невизначеним. Говорять, що він знаходиться на межі рівнів значущості. Інакше такий результат називають маргінально значимим.

Таблиця 2.3

Стандартні величини квантилей, що визначає прийняття статистичного рішення

Описана стратегія перевірки та прийняття гіпотез є універсальною та найпоширенішою. Більш консервативна стратегія може полягати в тому, щоб як надійний і високонадійний рівні прийняти значення ймовірностей відповідно 0,01 і 0,001, а для ненадійного рівня значення ймовірності встановити в 0,05 (О. Ю. Єрмолаєв, ). Тоді маргінально значущим результатом виявиться той, що знаходиться в діапазоні від 0,01 до 0,05. Однак така стратегія в психологічних дослідженнях застосовується все ж таки рідко.

У будь-якому випадку необхідно мати на увазі, що результати аналізу статистичних гіпотез не можуть вважатися достатніми для оцінки експериментальних гіпотез, якщо вони беруться самі собі, поза зв'язком з усією експериментальною ситуацією.

Статистичні гіпотези не можна плутати з експериментальними та теоретичними гіпотезами. Теоретичні гіпотези відбивають характер зв'язків і закономірностей досліджуваних явищ. Експериментальні гіпотези висуваються на основі вивчення таких теоретичних знань у цій галузі та конкретизують таким чином самі теоретичні гіпотези. Так само як і статистичні гіпотези, вони передбачають одночасне формулювання конкуруючих гіпотез як заперечення існування передбачуваної каузальної залежності. Завдяки цьому факту досліджувана емпірична закономірність може допускати різні причинні інтерпретації, які називають конкуруючими гіпотезами.

На відміну від експериментальних, статистичні гіпотези є лише інструментом оцінки зібраних у ході експерименту даних і не передбачають спочатку будь-якої емпіричної закономірності. Результат їх перевірки носить лише статистичний характер і тому передбачає автоматичного прийняття чи заперечення як експериментальних, і більше теоретичних гіпотез.

Статистика - складна наука про вимірювання та аналіз різних даних. Як і багатьох інших дисциплінах, у цій галузі існує поняття гіпотези. Так, гіпотеза у статистиці - це якесь становище, яке потрібно прийняти або відкинути. Причому у цій галузі є кілька видів таких припущень, схожих між собою за визначенням, але відмінних практично. Нульова гіпотеза – сьогоднішній предмет вивчення.

Від загального до часткового: гіпотези у статистиці

Від основного визначення припущень відходить ще одне, не менш важливе, - статистична гіпотеза є вивчення генеральної сукупності важливих для науки об'єктів, щодо яких вчені роблять висновки. Її можна перевірити за допомогою вибірки (частини генеральної сукупності). Наведемо кілька прикладів статистичних гіпотез:

1. Успішність всього класу, можливо, залежить рівня освіти кожного учня.

2. Початковий курс математики однаково засвоюється як дітьми, що прийшли до школи у 6 років, так і дітьми, що прийшли у 7 років.

Простою гіпотезою у статистиці називають таке припущення, яке однозначно характеризує певний параметр величини, взятої вченим.

Складна складається з декількох або нескінченної множини простих. Вказується певна область чи немає точної відповіді.

Корисно розуміти кілька визначень гіпотез у статистиці, ніж плутати їх у практиці.

Концепція нульової гіпотези

Нульова гіпотеза - це теорія у тому, що є якісь дві сукупності, які різняться між собою. Однак на науковому рівні немає поняття «не різняться», але є «їхня схожість дорівнює нулю». Від цього визначення було утворено поняття. У статистиці нульова гіпотеза позначається як Н0. Причому крайнім значенням неможливого (малоймовірного) вважається від 0,01 до 0,05 або менше.

Краще розібрати, що таке нульова гіпотеза, приклад із життя допоможе. Педагог в університеті припустив, що різний рівень підготовки учнів двох груп до залікової роботи викликаний незначними параметрами, випадковими причинами, що не впливають на загальний рівень освіти (різниця у підготовці двох груп студентів дорівнює нулю).

Однак зустрічно варто навести приклад альтернативної гіпотези - припущення, що спростовує затвердження нульової теорії (Н1). Наприклад: директор університету припустив, що різний рівень у підготовці до залікової роботи в учнів двох груп викликаний застосуванням педагогами різних методик навчання (різниця у підготовці двох груп суттєва і на те є пояснення).

Тепер відразу видно різниця між поняттями «нульова гіпотеза» та «альтернативна гіпотеза». Приклади ілюструють ці поняття.

Перевірка нульової гіпотези

Створити припущення – це ще півбіди. Справжньою проблемою для новачків є перевірка нульової гіпотези. Саме тут на багатьох і чекають труднощі.

Використовуючи метод альтернативної гіпотези, що стверджує щось протилежне нульовій теорії, можна порівняти обидва варіанти та вибрати вірний. Так діє статистика.

Нехай нульова гіпотеза Н0, а альтернативна Н1 тоді:

Н0: c = c0;
Н1: c ≠ c0.

Тут c - це якесь середнє значення генеральної сукупності, яке належить визначити, а c0 - це спочатку значення, стосовно якого перевіряється гіпотеза. Також є кілька Х - середнє значення вибірки, яким визначається c0.

Отже, перевірка полягає в порівнянні Х і c0, якщо Х = c0 приймається нульова гіпотеза. Якщо ж Х≠c0, то за умовою вірною вважається альтернативна.

«Довірчий» спосіб перевірки

Існує найдієвіший спосіб, за допомогою якого нульова статистична гіпотеза легко перевіряється на практиці. Він полягає у побудові діапазону значень до 95% точності.

Для початку знадобиться знати формулу розрахунку довірчого інтервалу:
X - t*Sx ≤ c ≤ X + t*Sx,

де Х - це спочатку число на основі альтернативної гіпотези;
t – табличні величини (коефіцієнт Стьюдента);
Sx - стандартна середня помилка, яка розраховується як Sx = σ/√n, де в чисельнику стандартне відхилення, а знаменнику - обсяг вибірки.

Отже, припустимо ситуацію. До ремонту конвеєр на день випускав 32.1 кг кінцевої продукції, а після ремонту, як стверджує підприємець, коефіцієнт корисної дії зріс, і конвеєр, за тижневою перевіркою, почав випускати 39.6 кг у середньому.

Нульова гіпотеза стверджуватиме, що ремонт ніяк не вплинув на ККД конвеєра. Альтернативна гіпотеза скаже, що ремонт докорінно змінив ККД конвеєра, тому його продуктивність підвищилася.

За таблицею знаходимо n = 7, t = 2,447, звідки формула набуде наступного вигляду:

39,6 – 2,447*4,2 ≤ з ≤ 39,6 + 2,447*4,2;

29,3 ≤ з ≤ 49,9.

Виходить, що значення 32.1 входить у діапазон, отже, значення, запропоноване альтернативою - 39.6 - не приймається автоматично. Пам'ятайте, що спочатку перевіряється на правильність нульова гіпотеза, а потім – протилежна.

Різновиди заперечення

До цього розглядався такий варіант побудови гіпотези, де Н0 що-небудь стверджує, а Н1 це спростовує. Звідки можна було скласти таку систему:

Н0: с = с0;
Н1: з ≠ с0.

Але існує ще два споріднені способи спростування. Наприклад, нульова гіпотеза стверджує, що середня оцінка успішності класу більше 4.54, а альтернативна тоді скаже, що середня успішність того самого класу менше 4.54. І виглядати у вигляді системи це буде так:

Н0: з ⩾ 4.54;
Н1: з< 4.54.

Зверніть увагу, що нульова гіпотеза стверджує, що значення більше або рівне, а статистична - що строго менше. Суворість знаку нерівності має велике значення!

Статистична перевірка

Статистична перевірка нульових гіпотез полягає у використанні статистичного критерію. Такі критерії підпорядковуються різним законам розподілу.

Наприклад, існує F-критерій, який розраховується за розподілом Фішера. Є T-критерій, який найчастіше використовується на практиці, залежить від розподілу Стьюдента. Квадратний критерій згоди Пірсона тощо.

Область прийняття нульової гіпотези

В алгебрі є поняття "область допустимих значень". Це такий відрізок чи точка на осі Х, у якому перебуває безліч значень статистики, у яких нульова гіпотеза правильна. Крайні точки відрізка – критичні значення. Промені праворуч і ліворуч відрізка - критичні області. Якщо знайдене значення входить у них, то нульова теорія спростовується і приймається альтернативна.

Спростування нульової гіпотези

Нульова гіпотеза в статистиці часом дуже спритне поняття. Під час перевірки її можна припуститися помилок двох типів:

1. Відкидання правильної нульової гіпотези. Позначимо перший тип як а=1.
2. Ухвалення помилкової нульової гіпотези. Другий тип позначимо як а=2.

Варто розуміти, що це не однакові параметри, результати помилок можуть суттєво відрізнятися між собою та мати різні вибірки.

Приклад помилок двох типів

Зі складними поняттями легше розібратися на прикладі.

Під час виробництва якихось ліків від вчених потрібна надзвичайна обережність, оскільки перевищення дози одного з компонентів провокує високий рівень токсичності готового препарату, від якого пацієнти, які його приймають, можуть померти. Однак на хімічному рівні виявити передозування неможливо.
Через це перед тим як випустити ліки у продаж, невелику його дозу перевіряють на щурах чи кроликах, вводячи їм препарат. Якщо більшість піддослідних вмирає, то ліки у продаж не допускається, якщо піддослідні живі, то ліки дозволяють продавати в аптеках.

Перший випадок: насправді ліки були не токсичними, але під час експерименту було допущено помилку і препарат класифікували як токсичний і не допущений у продаж. А = 1.

Другий випадок: в ході іншого експерименту під час перевірки іншої партії ліки вирішено, що препарат не токсичний, і у продаж його допустили, хоча насправді препарат був отруйний. А = 2.

Перший варіант спричинить великі фінансові витрати постачальника-підприємця, тому що доведеться знищити всю партію ліки і починати з нуля.

Друга ситуація спровокує смерть пацієнтів, які купили та вживали ці ліки.

Теорія ймовірності

Не тільки нульові, але всі гіпотези у статистиці та економіці поділяють за рівнем значущості.

Рівень значимості - відсоток появи помилок першого роду (відхилення правильної нульової гіпотези).

Перший рівень - 5% чи 0.05, т. е. ймовірність помилитися 5 до 100 чи 1 до 20.
другий рівень - 1% чи 0.01, т. е. ймовірність 1 до 100.
третій рівень – 0.1% або 0.001, ймовірність 1 до 1000.

Критерії перевірки гіпотези

Якщо вченим вже було зроблено висновок про правильність нульової гіпотези, її необхідно піддати перевірці. Це необхідно, щоб унеможливити помилку. Існує основний критерій перевірки нульової гіпотези, що складається з кількох етапів:

1. Береться припустима хибна ймовірність P=0.05.
2. Підбирається статистика критерію 1.
3. За відомим методом знаходиться область допустимих значень.
4. Наразі обчислюється значення статистики Т.
5. Якщо Т (статистика) належить області прийняття нульової гіпотези (як і «довірчому» методі), то припущення вважаються вірними, отже, і сама нульова гіпотеза залишається правильною.

Саме так діє статистика. Нульова гіпотеза при грамотній перевірці буде прийнято або відкинуто.

Варто зауважити, що для звичайних підприємців та користувачів перші три етапи буває дуже складно виконати безпомилково, тому їх довіряють професійним математикам. Натомість 4 і 5 етапи може виконати будь-яка людина, яка достатньою мірою знає статистичні методи перевірки.

На різних стадіях статистичного дослідження та моделювання виникає необхідність у формулюванні та експериментальній перевірці деяких припущень (гіпотез) щодо природи та величини невідомих параметрів аналізованої генеральної сукупності (сукупностей). Наприклад, дослідник висловлює припущення: "вибірку вилучено з нормальної генеральної сукупності" або "генеральна середня аналізованої сукупності дорівнює п'яти". Такі припущення називаються статистичними гіпотезами.

Зіставлення висловленої гіпотези щодо генеральної сукупності з наявними вибірковими даними, що супроводжується кількісною оцінкою ступеня достовірності одержуваного висновку, здійснюється за допомогою того чи іншого статистичного критерію та називається перевіркою статистичних гіпотез .

Висунута гіпотеза називається нульовий (основний) . Її прийнято позначати Н 0.

Стосовно висловленої (основної) гіпотези можна сформулювати альтернативну (конкуруючу) , Що суперечить їй. Альтернативну (конкуруючу) гіпотезу прийнято позначати Н 1.

Мета статистичної перевірки гіпотезполягає в тому, щоб на підставі вибіркових даних ухвалити рішення про справедливість основної гіпотези Н 0.

Якщо гіпотеза, що висувається, зводиться до твердження про те, що значення деякого невідомого параметра генеральної сукупності точно точнозаданій величині, то ця гіпотеза називається простий, Наприклад: "Середньодушовий сукупний дохід населення Росії становить 650 рублів на місяць"; " Рівень безробіття (частка безробітних у чисельності економічно активного населення) у Росії дорівнює 9% " . В інших випадках гіпотеза називається складною.

Як нульова гіпотеза Н 0прийнято висувати просту гіпотезу, т.к. зазвичай буває зручніше перевіряти суворіше твердження.

гіпотези про вид закону розподілу досліджуваної випадкової величини;

Гіпотези про числові значення параметрів досліджуваної генеральної сукупності;

Гіпотези про однорідність двох або кількох вибірок чи деяких характеристик аналізованих сукупностей;

Гіпотези про загальний вигляд моделі, що описує статистичну залежність між ознаками та ін.

Оскільки перевірка статистичних гіпотез складає підставі вибіркових даних, тобто. обмеженого ряду спостережень, рішення щодо нульової гіпотези Н 0мають імовірнісний характер. Іншими словами, таке рішення неминуче супроводжується деякою, хоча можливо і дуже малою, ймовірністю помилкового висновку як у той, так і в інший бік.



Так, у якійсь невеликій частині випадків α нульова гіпотеза Н 0може виявитися знехтуваною, тоді як насправді в генеральній сукупності вона є справедливою. Таку помилку називають помилкою першого роду . А її ймовірність прийнято називати рівнем значимості та позначати α .

Навпаки, в якійсь невеликій частині випадків β нульова гіпотеза Н 0приймається, тоді як насправді в генеральній сукупності вона хибна, а справедлива альтернативна гіпотеза Н 1. Таку помилку називають помилкою другого роду . Імовірність помилки другого роду прийнято позначати β . Ймовірність 1 - βназивають потужністю критерію .

При фіксованому обсязі вибірки можна вибрати на власний розсуд величину ймовірності лише однієї помилки α або β . Збільшення ймовірності однієї з них призводить до зниження іншої. Прийнято ставити можливість помилки першого роду α - Рівень значимості. Як правило, користуються деякими стандартними значеннями рівня значимості α : 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Тоді, очевидно, з двох критеріїв, що характеризуються однією і тією самою ймовірністю α відхилити правильну насправді гіпотезу Н 0, слід прийняти той, який супроводжується меншою помилкою другого роду β , тобто. більшою потужністю. Зниження ймовірностей обох помилок α і β можна досягти шляхом збільшення обсягу вибірки.

Правильне рішення щодо нульової гіпотези Н 0також може бути двох видів:

Буде прийнято нульову гіпотезу Н 0, тоді як і насправді в генеральній сукупності вірна нульова гіпотеза Н 0; ймовірність такого рішення 1 - α;

Нульова гіпотеза Н 0буде відхилена на користь альтернативної Н 1,тоді як і насправді у генеральній сукупності нульова гіпотеза Н 0відхиляється на користь альтернативної Н 1; ймовірність такого рішення 1 - β - потужність критерію.

Результати рішення щодо нульової гіпотези можна проілюструвати таблицею 8.1.

Таблиця 8.1

Перевірка статистичних гіпотез здійснюється за допомогою статистичного критерію(назвемо його у загальному вигляді До), Що є функцією від результатів спостереження.

Статистичний критерій - це правило (формула), яким визначається міра розбіжності результатів вибіркового спостереження з висловленою гіпотезою Н 0 .

Статистичний критерій, як і будь-яка функція від результатів спостереження, є випадковою величиною і припущення справедливості нульової гіпотези Н 0 підпорядкована деякому добре вивченому (і затабульованому) теоретичному закону розподілу із щільністю розподілу f(k).

Вибір критерію перевірки статистичних гіпотез може бути здійснено виходячи з різних принципів. Найчастіше для цього користуються принципом відношення правдоподібностіщо дозволяє побудувати критерій найбільш потужний серед усіх можливих критеріїв. Суть його зводиться до вибору такого критерію Доз відомою функцією щільності f(k)за умови справедливості гіпотези Н 0 щоб при заданому рівнем значимості α можна було б знайти критичну точку До кр.розподілу f(k), Яка розділила б область значень критерію на дві частини: область допустимих значень, в якій результати вибіркового спостереження виглядають найбільш правдоподібними, і критичну область, в якій результати вибіркового спостереження виглядають менш правдоподібними щодо нульової гіпотези Н 0.

Якщо такий критерій Дообраний, і відома щільність його розподілу, то завдання перевірки статистичної гіпотези зводиться до того, щоб за заданого рівня значущості α розрахувати за вибірковими даними значення критерію, що спостерігається До набл.і визначити чи є воно найбільш менш правдоподібним щодо нульової гіпотези Н 0.

Перевірка кожного типу статистичних гіпотез здійснюється за допомогою відповідного критерію, що є найпотужнішим у кожному конкретному випадку. Наприклад, перевірка гіпотези про вид закону розподілу випадкової величини може бути здійснена за допомогою критерію згоди Пірсона χ 2; перевірка гіпотези про рівність невідомих значень дисперсій двох генеральних сукупностей – за допомогою критерію F- фішера; ряд гіпотез про невідомі значення параметрів генеральних сукупностей перевіряється за допомогою критерію Z- нормальної розподіленої випадкової величини та критерію T- Стьюдента і т.д.

Значення критерію, що розраховується за спеціальними правилами на підставі вибіркових даних, називається спостеріганим значенням критерію (До набл.).

Значення критерію, що поділяють сукупність значень критерію область допустимих значень(найбільш правдоподібних щодо нульової гіпотези Н 0) та критичну область(область значень, менш правдоподібних щодо таблиць розподілу випадкової величини До, обраної як критерій, називаються критичними точками(К кр.).

Області допустимих значень (областю прийняття нульової гіпотези Н 0) До Н 0 не відхиляється.

Критичною областюназивають сукупність значень критерію До , за яких нульова гіпотеза Н 0 відхиляється на користь конкуруючої Н 1 .

Розрізняють односторонню(правосторонню або лівосторонню) та двосторонню критичні області.

Якщо конкуруюча гіпотеза – правостороння, наприклад, Н 1: а > а 0, то й критична область - правостороння(Рис 1). При правосторонній конкуруючій гіпотезі критична точка (До кр. правостороння)набуває позитивних значень.

Якщо конкуруюча гіпотеза – лівостороння, наприклад, Н 1: а< а 0 , то й критична область - лівостороння(Рис 2). При лівосторонній конкуруючій гіпотезі критична точка набуває негативних значень (До кр. лівостороння).

Якщо конкуруюча гіпотеза – двостороння, наприклад, Н 1: а¹ а 0, то й критична область - двостороння(Рис 3). При двосторонній конкуруючій гіпотезі визначаються дві критичні точки (До кр. лівосторонняі До кр. правостороння).


Область допустимих Критична

значень область

Познайомимося з термінологією, що застосовується під час перевірки гіпотез.

· Але - нульова гіпотеза (гіпотеза скептика) це гіпотеза про відсутність відмінностейміж порівнюваними вибірками. Скептик вважає, що різницю між вибірковими оцінками, отриманими за результатами досліджень – випадкові

· Н 1 – альтернативна гіпотеза (гіпотеза оптиміста) це гіпотеза про наявність відмінностей між порівнюваними вибірками. Оптиміст вважає, що відмінності між вибірковими оцінками викликані об'єктивними причинами та відповідають відмінностям генеральних сукупностей

Перевірка статистичних гіпотез здійсненна лише тоді, коли з елементів порівнюваних вибірок можна скласти деяку величину(Критерій), закон розподілу якої у разі справедливості Н 0 відомий. Тоді для цієї величини можна вказати довірчий інтервал, який із заданою ймовірністю Р д потрапляє її значення. Цей інтервал називають критичною областю. Якщо значення критерію потрапляє в критичну область, приймається гіпотеза Н 0 . В іншому випадку приймається гіпотеза Н1.

У медичних дослідженнях використовують Р д = 0,95 або Р д = 0,99. Цим значенням відповідають рівні значущості a = 0,05 чи a = 0,01.

Під час перевірки статистичних гіпотез рівнем значимості(a) називається можливість відхилення нульової гіпотези, коли вона вірна.

Зверніть увагу на те, що за своєю суттю процедура перевірки гіпотез спрямована на виявлення відмінностей, а не на підтвердження їх відсутності. При виході значення критерію межі критичної області ми можемо з чистим серцем сказати «скептику» – ну що Ви ще хочете?! Якби відмінностей не було, то з ймовірністю 95% (або 99%) розрахункове значення було б у зазначених межах. Так ні!

Ну а якщо значення критерію потрапляє в критичну область, то немає підстав вважати, що гіпотеза Н 0 .вірна. Це, швидше за все, вказує на одну із двох можливих причин.



а) Обсяги вибірок недостатньо великі, щоб виявити існуючі відмінності. Цілком ймовірно, що продовження експериментів принесе успіх.

б) Відмінність є. Але вони настільки малі, що немає практичного значення. І тут продовження експериментів немає сенсу.

Перейдемо до розгляду деяких статистичних гіпотез, які у медичних дослідженнях.

§ 3.6. Перевірка гіпотез про рівність дисперсій,
F – критерій Фішера

У деяких клінічних дослідженнях про позитивний ефект свідчить не так величинадосліджуваного параметра, скільки його стабілізація, Зменшення його коливань. І тут виникає питання порівняння двох генеральних дисперсій за результатами вибіркового обстеження. Це завдання може бути вирішено за допомогою критерію Фішера.

Постановка задачі

нормальним закономрозподілу. Обсяги вибірок n 1 і n 2 а вибіркові дисперсіїрівні відповідно. Потрібно порівняти між собою генеральні дисперсії.

Перевірені гіпотези:

Н 0- Генеральні дисперсії однакові;

Н 1 –генеральні дисперсії різні.

Показано, якщо вибірки вилучені з генеральних сукупностей нормальним закономрозподілу, то за справедливості гіпотезиН 0 ставлення вибіркових дисперсій підпорядковується розподілу Фішера. Тому як критерій для перевірки справедливості Н 0 береться величина F, що обчислюється за формулою

де – вибіркові дисперсії.

Це відношення підпорядковується розподілу Фішера з числом ступенів свободи чисельника n 1 = n 1 -1, і числом ступенів свободи знаменника n 2 = n 2-1. Кордони критичної області перебувають у таблицях розподілу Фішера чи з допомогою комп'ютерної функції FРАСПОБР.

Наприклад, поданого у табл. 3.4, отримаємо: n 1 = n 2 = 20 - 1 = 19; F = 2,16/4,05 = 0,53. При a = 0,05 межі критичної області рівні відповідно: F лев = 0.40, F прав = 2.53.

Значення критерію потрапило в критичну область, тому приймається гіпотеза Н0: генеральні дисперсії вибірок однакові.

§ 3.7. Перевірка гіпотез щодо рівності середніх,
t- Критерій Стьюдента

Завдання порівняння середніхдвох генеральних сукупностей виникає, коли практичне значення має саме величинадосліджуваного ознаки. Наприклад, коли порівнюються терміни лікування двома різними методами або кількості ускладнень, що виникають при їх застосуванні. І тут можна використовувати t-критерій Стьюдента.

Постановка задачі.

Отримано дві вибірки (Х 1 ) і (X 2 ), вилучені з генеральних сукупностей нормальним закономрозподілу та однаковими дисперсіями. Обсяги вибірок n 1 і n 2 вибіркові середнірівні, а вибіркові дисперсії- , відповідно. Потрібно порівняти між собою генеральні середні.

Перевірені гіпотези:

Н 0– генеральні середні однакові;

Н 1 –генеральні середні різні.

Показано, що у разі справедливості гіпотези Н 0 величина t, що обчислюється за формулою

, (3.10)

розподілено згідно із законом Стьюдента з числом ступенів свободи n= n 1 + n 2 - 2.

Тут де n 1 = n 1 - 1 – число ступенів свободи першої вибірки; n 2 = n 2 - 1 - число ступенів свободи для другої вибірки.

Кордони критичної області знаходять за таблицями t-розподілу або за допомогою комп'ютерної функції СТЬЮДРАСПОБР. Розподіл Стендта симетрично щодо нуля, тому ліва та права межі критичної області однакові за модулем і протилежні за знаком: - tгр і tгр.

Наприклад, поданого у табл. 3.4, отримаємо: n 1 = n 2 = 20 - 1 = 19; t= -2.51, n = 38. При a = 0,05 t гр = 2.02.

Значення критерію виходить за ліву межу критичної області, тому приймаємо гіпотезу Н 1: генеральні середні. різні. При цьому середня генеральна сукупність першої вибіркименше.



Останні матеріали розділу:

Дирижабль царя соломона Трон у Візантії
Дирижабль царя соломона Трон у Візантії

У стародавніх міфах, легендах та священних текстах можна знайти безліч сюжетів про різні реальні історичні постаті, у розпорядженні яких були...

Віктор Корчний: Біографія гросмейстера, який втік від інтриг радянських шахів.
Віктор Корчний: Біографія гросмейстера, який втік від інтриг радянських шахів.

(1931-03-23 ​​) (81 рік) Місце народження: Звання: Максимальний рейтинг: Актуальний рейтинг: Віктор Левович Корчной (23 березня ,...

На орбіту за довголіттям: як політ у космос впливає організм людини Вплив космічного польоту організм людини
На орбіту за довголіттям: як політ у космос впливає організм людини Вплив космічного польоту організм людини

Під час космічного польоту на людину діють, крім комплексу факторів зовнішнього середовища, в якому протікає політ космічного...