Довірчий інтервал для оцінки середнього (дисперсія відома) у MS EXCEL. Довірчий інтервал

Побудуємо в MS EXCEL довірчий інтервал з метою оцінки середнього значення розподілу у разі відомого значення дисперсії.

Зрозуміло, вибір рівня довіриповністю залежить від розв'язуваного завдання. Так, ступінь довіри авіапасажира до надійності літака, безсумнівно, має бути вищим за ступінь довіри покупця до надійності електричної лампочки.

Формулювання завдання

Припустимо, що з генеральної сукупностімає взята вибіркарозміру n. Передбачається, що стандартне відхиленняцього розподілу відомо. Необхідно на підставі цієї вибіркиоцінити невідоме середнє значення розподілу(μ, ) та побудувати відповідний двосторонній довірчий інтервал.

Точкова оцінка

Як відомо з , статистика(позначимо її Х ср) є незміщеною оцінкою середньогоцією генеральної сукупностіта має розподіл N(μ;σ 2 /n).

Примітка: Що робити, якщо потрібно збудувати довірчий інтервалу разі розподілу, який не є нормальним?У цьому випадку на допомогу приходить , яка говорить, що за досить великого розміру вибірки n із розподілу що не є нормальним, вибірковий розподіл статистики Х порбуде приблизновідповідати нормальному розподілуіз параметрами N(μ;σ 2 /n).

Отже, точкова оцінка середнього значення розподілуу нас є – це середнє значення вибірки, тобто. Х ср. Тепер займемося довірчим інтервалом.

Побудова довірчого інтервалу

Зазвичай, знаючи розподіл та його параметри, ми можемо обчислити ймовірність того, що випадкова величина набуде значення заданого нами інтервалу. Зараз зробимо навпаки: знайдемо інтервал, у який випадкова величина потрапить із заданою ймовірністю. Наприклад, із властивостей нормального розподілувідомо, що з ймовірністю 95%, випадкова величина, розподілена по нормальному закону, потрапить в інтервал приблизно +/- 2 від середнього значення(Див. статтю про ). Цей інтервал, послужить нам прототипом для довірчого інтервалу.

Тепер розберемося, чи ми знаємо розподіл , щоб визначити цей інтервал? Для відповіді на запитання ми маємо вказати форму розподілу та його параметри.

Форму розподілу ми знаємо – це нормальний розподіл(нагадаємо, що йдеться про вибірковому розподілі статистики Х ср).

Параметр μ нам невідомий (його якраз потрібно оцінити за допомогою довірчого інтервалу), але у нас є його оцінка Х пор,обчислена на основі вибірки,яку можна використати.

Другий параметр – стандартне відхилення вибіркового середнього будемо вважати відомим, Він дорівнює σ/√n.

Т.к. ми не знаємо μ, то будуватимемо інтервал +/- 2 стандартних відхиленьне від середнього значення, а від відомої його оцінки Х ср. Тобто. при розрахунку довірчого інтервалуми не будемо вважати, що Х српотрапить в інтервал +/- 2 стандартних відхиленьвід μ з ймовірністю 95%, а вважатимемо, що інтервал +/- 2 стандартних відхиленьвід Х срз ймовірністю 95% накриє μ - Середня генеральна сукупність,з якого взято вибірка. Ці два твердження еквівалентні, але друге твердження нам дозволяє побудувати довірчий інтервал.

Крім того, уточнимо інтервал: випадкова величина, розподілена по нормальному закону, з ймовірністю 95% потрапляє в інтервал +/- 1,960 стандартних відхилень,а не+/- 2 стандартних відхилень. Це можна розрахувати за допомогою формули =НОРМ.СТ.ОБР((1+0,95)/2), Див. файл прикладу Лист Інтервал.

Тепер ми можемо сформулювати ймовірнісне твердження, яке послужить нам для формування довірчого інтервалу:
«Ймовірність того, що середня генеральна сукупністьзнаходиться від середньої вибіркив межах 1,960 « стандартних відхилень вибіркового середнього», дорівнює 95%».

Значення ймовірності, згадане у твердженні, має спеціальну назву , який пов'язаний зрівнем значимості α (альфа) простим виразом рівень довіри =1 . У нашому випадку рівень значущості α =1-0,95=0,05 .

Тепер на основі цього ймовірнісного твердження запишемо вираз для обчислення довірчого інтервалу:

де Z α/2 стандартного нормального розподілу(Таке значення випадкової величини z, що P(z>=Z α/2 )=α/2).

Примітка: Верхній α/2-квантильвизначає ширину довірчого інтервалув стандартних відхиленнях вибіркового середнього. Верхній α/2-квантиль стандартного нормального розподілузавжди більше 0, що дуже зручно.

У нашому випадку при α=0,05, верхній α/2-квантиль дорівнює 1,960. Для інших рівнів значення α (10%; 1%) верхній α/2-квантиль Z α/2 можна обчислити за допомогою формули =НОРМ.СТ.ОБР(1-α/2) або, якщо відомий рівень довіри, =НОРМ.СТ.ОБР((1+ур.довіри)/2).

Зазвичай при побудові довірчих інтервалів для оцінки середньоговикористовують тільки верхній α/2-квантильі не використовують нижній α/2-квантиль. Це можливо тому, що стандартне нормальний розподілсиметрично щодо осі х ( щільність його розподілусиметрична щодо середнього, тобто. 0). Тому немає потреби обчислювати нижній α/2-квантиль(його називають просто α /2-квантиль), т.к. він дорівнює верхньому α/2-квантилюзі знаком мінус.

Нагадаємо, що, незважаючи на форму розподілу величини х, відповідна випадкова величина Х сррозподілено приблизно нормально N(μ;σ 2 /n) (див. статтю про ). Отже, у загальному випадку, вищезгадане вираз для довірчого інтервалує лише наближеним. Якщо величина х розподілена по нормальному закону N(μ;σ 2 /n), то вираз для довірчого інтервалує точним.

Розрахунок довірчого інтервалу в MS EXCEL

Розв'яжемо завдання.
Час відгуку електронного компонента на вхідний сигнал є важливою характеристикою пристрою. Інженер хоче побудувати довірчий інтервал для середнього відгуку при рівні довіри 95%. З попереднього досвіду інженер знає, що стандартне відхилення часу відгуку складає 8 мсек. Відомо, що з оцінки часу відгуку інженер зробив 25 вимірів, середнє значення становило 78 мсек.

Рішення: Інженер хоче знати час відгуку електронного пристрою, але він розуміє, що час відгуку є не фіксованою, а випадковою величиною, яка має свій розподіл. Отже, найкраще, на що він може розраховувати, це визначити параметри та форму цього розподілу.

На жаль, з умови завдання форма розподілу часу відгуку нам не відома (вона не обов'язково має бути нормальним). , цього розподілу також невідомо. Відомо лише його стандартне відхиленняσ=8. Тому, поки ми не можемо порахувати ймовірності та побудувати довірчий інтервал.

Однак, незважаючи на те, що ми не знаємо розподілу часу окремого відгуку, ми знаємо, що згідно ЦПТ, вибірковий розподіл середнього часу відгукує приблизно нормальним(вважатимемо, що умови ЦПТвиконуються, т.к. розмір вибіркидосить великий (n=25)) .

Більш того, середняцього розподілу дорівнює середнього значеннярозподілу одиничного відгуку, тобто. μ. А стандартне відхиленняцього розподілу (σ/√n) можна обчислити за формулою =8/КОРІНЬ(25) .

Також відомо, що інженером було отримано точкова оцінкапараметра μ дорівнює 78 мсек (Х пор). Тому, ми можемо обчислювати ймовірності, т.к. нам відома форма розподілу ( нормальне) та його параметри (Х ср і σ/√n).

Інженер хоче знати математичне очікуванняμ розподілу часу відгуку. Як було сказано вище, це μ дорівнює математичному очікуванню вибіркового розподілу середнього часу відгуку. Якщо ми скористаємося нормальним розподілом N(Х ср; σ/√n), то шукане μ перебуватиме в інтервалі +/-2*σ/√n з ймовірністю приблизно 95%.

Рівень значущостідорівнює 1-0,95 = 0,05.

Нарешті, знайдемо лівий та правий кордон довірчого інтервалу.
Ліва межа: =78-НОРМ.СТ.ОБР(1-0,05/2)*8/КОРІНЬ(25) = 74,864
Права межа: =78+НОРМ.СТ.ОБР(1-0,05/2)*8/КОРІНЬ(25)=81,136

Ліва межа: =НОРМ.ОБР(0,05/2; 78; 8/КОРІНЬ(25))
Права межа: =НОРМ.ОБР(1-0,05/2; 78; 8/КОРІНЬ(25))

Відповідь: довірчий інтервалпри рівні довіри 95% та σ=8мсекдорівнює 78+/-3,136 мсек.

У файл прикладу на аркуші Сигмавідома створена форма для розрахунку та побудови двостороннього довірчого інтервалудля довільних вибірокіз заданим σ та рівнем значимості.

Функція ДОВЕРИТ.НОРМ()

Якщо значення вибіркизнаходяться в діапазоні B20: B79 , а рівень значущостідорівнює 0,05; то формула MS EXCEL:
=СРЗНАЧ(B20:B79)-ДОВЕРИТ.НОРМ(0,05;σ; РАХУНОК(B20:B79))
поверне лівий кордон довірчого інтервалу.

Цей же кордон можна обчислити за допомогою формули:
=СРЗНАЧ(B20:B79)-НОРМ.СТ.ОБР(1-0,05/2)*σ/КОРІНЬ(РАХУНОК(B20:B79))

Примітка: Функція ДОВЕРИТ.НОРМ() з'явилася в MS EXCEL 2010. У попередніх версіях MS EXCEL використовувалася функція ДОВЕРИТ() .

Довірчий інтервал– граничні значення статистичної величини, яка із заданою довірчою ймовірністю γ буде у цьому інтервалі при вибірці більшого обсягу. Позначається як P(θ - ε. На практиці вибирають довірчу ймовірність γ з досить близьких до одиниці значень γ = 0.9, γ = 0.95, γ = 0.99.

Призначення сервісу. За допомогою цього сервісу визначаються:

  • довірчий інтервал для генерального середнього; довірчий інтервал для дисперсії;
  • довірчий інтервал для середнього квадратичного відхилення; довірчий інтервал для генеральної частки;
Отримане рішення зберігається у файлі Word (див. приклад). Нижче наведено відеоінструкцію, як заповнювати вихідні дані.

Приклад №1. У колгоспі із загального стада у 1000 голів овець вибірковій контрольній стрижці зазнали 100 овець. В результаті було встановлено середній настриг вовни 4,2 кг на одну вівцю. Визначити з ймовірністю 0,99 середню квадратичну помилку вибірки щодо середнього настригу вовни однією вівцю і межі, у яких укладена величина настрига, якщо дисперсія дорівнює 2,5 . Вибірка неповторна.
Приклад №2. З партії імпортованої продукції посаді Московської Північної митниці було взято як випадкової повторної вибірки 20 проб продукту «А». В результаті перевірки встановлено середню вологість продукту «А» у вибірці, яка дорівнювала 6 % при середньому квадратичному відхиленні 1 %.
Визначте з ймовірністю 0,683 межі середньої вологості продукту в усій партії імпортованої продукції.
Приклад №3. Опитування 36 студентів показало, що середня кількість підручників, прочитаних ними за навчальний рік, дорівнювала 6. Вважаючи, що кількість підручників, прочитаних студентом за семестр, має нормальний закон розподілу із середнім квадратичним відхиленням, рівним 6, знайти: А) з надійністю 0 ,99 інтервальну оцінку для математичного очікування цієї випадкової величини; Б) з якою ймовірністю можна стверджувати, що середня кількість підручників, прочитаних студентом за семестр, обчислена за даною вибіркою, відхилиться від математичного очікування абсолютної величини не більше, ніж на 2.

Класифікація довірчих інтервалів

По виду оцінюваного параметра:

За типом вибірки:

  1. Довірчий інтервал для безкінечної вибірки;
  2. Довірчий інтервал для кінцевої вибірки;
Вибірка називається повторноюякщо відібраний об'єкт перед вибором наступного повертається в генеральну сукупність. Вибірка називається безповторноюякщо відібраний об'єкт у генеральну сукупність не повертається. Насправді зазвичай мають справу з безповторними вибірками.

Розрахунок середньої помилки вибірки при випадковому відборі

Розбіжність між значеннями показників, отриманих за вибіркою, та відповідними параметрами генеральної сукупності називається помилкою репрезентативності.
Позначення основних параметрів генеральної та вибіркової сукупності.
Формули середньої помилки вибірки
повторний відбірбезповторний відбір
для середньоїдля часткидля середньоїдля частки
Співвідношення між межею помилки вибірки (Δ), що гарантується з деякою ймовірністю Р(t),та середньою помилкою вибірки має вигляд: або Δ = t·μ, де t- Коефіцієнт довіри, що визначається залежно від рівня ймовірності Р(t) по таблиці інтегральної функції Лапласа.

Формули розрахунку чисельності вибірки при власне-випадковому способі відбору

У попередніх підрозділах ми розглянули питання щодо оцінки невідомого параметра аодним числом. Така оцінка називається "точковою". У ряді завдань потрібно не тільки знайти параметр авідповідне чисельне значення, але й оцінити його точність та надійність. Потрібно знати, до яких помилок може призвести заміна параметра айого точковою оцінкою аі з яким ступенем впевненості можна очікувати, що ці помилки не вийдуть за певні межі?

Такі завдання особливо актуальні при малій кількості спостережень, коли точкова оцінка а взначною мірою випадкова і наближена заміна а на а може призвести до серйозних помилок.

Щоб дати уявлення про точність та надійність оцінки а,

у математичній статистиці користуються так званими довірчими інтервалами та довірчими ймовірностями.

Нехай для параметра аотримана з досвіду незміщена оцінка а.Ми хочемо оцінити можливу при цьому помилку. Призначимо деяку досить велику ймовірність р (наприклад, р = 0,9, 0,95 або 0,99) таку, що подію з ймовірністю р можна вважати практично достовірною, і знайдемо таке значення s, для якого

Тоді діапазон практично можливих значень помилки, що виникає під час заміни ана а, буде ± s; великі по абсолютній величині помилки з'являтимуться лише з малою ймовірністю а = 1 - р. Перепишемо (14.3.1) у вигляді:

Рівність (14.3.2) означає, що з ймовірністю р невідоме значення параметра апотрапляє в інтервал

При цьому слід зазначити одну обставину. Раніше ми неодноразово розглядали можливість потрапляння випадкової величини в заданий невипадковий інтервал. Тут справа інакша: величина ане випадкова, зате випадковий інтервал/р. Випадково його становище на осі абсцис, що визначається його центром а; випадкова взагалі і довжина інтервалу 2s, оскільки величина s обчислюється, як правило, за дослідними даними. Тому в даному випадку краще буде тлумачити величину р не як ймовірність «попадання» точки ав інтервал/р, а як ймовірність того, що випадковий інтервал/р накриє точку а(Рис. 14.3.1).

Мал. 14.3.1

Імовірність р прийнято називати довірчою ймовірністю, а інтервал / р - довірчим інтервалом.Межі інтервалу If. а х = а- s та а 2 = а +а називаються довірчими межами.

Дамо ще одне тлумачення поняттю довірчого інтервалу: його можна як інтервал значень параметра а,сумісних з досвідченими даними і не суперечать їм. Справді, якщо домовитися вважати подію з ймовірністю а = 1-р практично неможливим, то значення параметра а, котрим а - а> s, слід визнати такими, що суперечать досвідченим даним, а ті, для яких |а - а a t na 2 .

Нехай для параметра ає незміщена оцінка а.Якби нам був відомий закон розподілу величини а, Завдання знаходження довірчого інтервалу була б дуже проста: достатньо було б знайти таке значення s, для якого

Труднощі полягає в тому, що закон розподілу оцінки азалежить від закону розподілу величини Xі, отже, від його невідомих параметрів (зокрема, і від параметра а).

Щоб обійти цю скруту, можна застосувати наступний грубо наближений прийом: замінити у виразі s невідомі параметри їх точковими оцінками. При порівняно великій кількості дослідів п(близько 20...30) цей прийом зазвичай дає задовільні за точністю результати.

Як приклад розглянемо завдання про довірчий інтервал для математичного очікування.

Нехай зроблено п X,характеристики якої - математичне очікування тта дисперсія D- Невідомі. Для цих параметрів отримано оцінки:

Потрібно побудувати довірчий інтервал/р, що відповідає довірчій ймовірності р, для математичного очікування твеличини X.

При вирішенні цього завдання скористаємося тим, що величина тявляє собою суму пнезалежних однаково розподілених випадкових величин X hі відповідно до центральної граничної теореми за досить великого пїї закон розподілу близький до нормального. Насправді навіть за відносно невеликій кількості доданків (близько 10...20) закон розподілу суми можна приблизно вважати нормальним. Виходитимемо з того, що величина трозподілено за нормальним законом. Характеристики цього закону – математичне очікування та дисперсія – рівні відповідно ті

(Див. розділ 13 підрозділ 13.3). Припустимо, що величина Dнам відома і знайдемо таку величину Єр, для якої

Застосовуючи формулу (6.3.5) глави 6, виразимо ймовірність у лівій частині (14.3.5) через нормальну функцію розподілу

де - середнє квадратичне відхилення оцінки т.

З рівняння

знаходимо значення Sp:

де arg Ф * (х) - функція, зворотна Ф * (х),тобто. таке значення аргументу, при якому нормальна функція розподілу дорівнює х.

Дисперсія D,через яку виражена величина а 1П, нам точно не відома; як її орієнтовне значення можна скористатися оцінкою D(14.3.4) та покласти приблизно:

Таким чином, наближено вирішено завдання побудови довірчого інтервалу, який дорівнює:

де gp визначається формулою (14.3.7).

Щоб уникнути при обчисленні s p зворотного інтерполювання у таблицях функції Ф*(л), зручно скласти спеціальну таблицю (табл. 14.3.1), де наводяться значення величини

залежно від нар. Величина (р визначає для нормального закону число середніх квадратичних відхилень, яке потрібно відкласти праворуч і ліворуч від центру розсіювання для того, щоб ймовірність попадання в отриману ділянку дорівнювала р.).

Через величину 7 р довірчий інтервал виражається у вигляді:

Таблиця 14.3.1

Приклад 1. Проведено 20 дослідів над величиною X;результати наведено у табл. 14.3.2.

Таблиця 14.3.2

Потрібно знайти оцінку для математичного очікування від величини Xта побудувати довірчий інтервал, що відповідає довірчій ймовірності р = 0,8.

Рішення.Маємо:

Вибравши за початок відліку л: = 10, за третьою формулою (14.2.14) знаходимо незміщену оцінку D :

За табл. 14.3,1 знаходимо

Довірчі кордони:

Довірчий інтервал:

Значення параметра т,що лежать у цьому інтервалі, є сумісними з досвідченими даними, наведеними в табл. 14.3.2.

Аналогічним способом може бути побудований довірчий інтервал для дисперсії.

Нехай зроблено пнезалежних дослідів над випадковою величиною Xз невідомими параметрами від Л і для дисперсії Dотримано незміщену оцінку:

Потрібно приблизно побудувати довірчий інтервал для дисперсії.

З формули (14.3.11) видно, що величина Dявляє собою

суму пвипадкових величин виду. Ці величини не є

незалежними, тому що до кожної з них входить величина т,залежить від решти. Однак, можна показати, що при збільшенні пзакон розподілу їхньої суми теж наближається до нормального. Практично при п= 20...30 він може вважатися нормальним.

Припустимо, що це так, і знайдемо характеристики цього закону: математичне очікування та дисперсію. Оскільки оцінка D- незміщена, то М [D] = D.

Обчислення дисперсії D Dпов'язано з порівняно складними викладками, тому наведемо її вираз без висновку:

де ц 4 - четвертий центральний момент величини X.

Щоб скористатися цим виразом, потрібно підставити значення ц 4 і D(хоча б наближені). Замість Dможна скористатися його оцінкою D.У принципі четвертий центральний момент також можна замінити його оцінкою, наприклад величиною виду:

але така заміна дасть вкрай невисоку точність, тому що взагалі при обмеженій кількості дослідів моменти високого порядку визначаються з більшими помилками. Однак практично часто буває, що вид закону розподілу величини Xвідомий наперед: невідомі лише його параметри. Тоді можна спробувати виразити ц 4 через D.

Візьмемо випадок, що найбільш часто зустрічається, коли величина Xрозподілено за нормальним законом. Тоді її четвертий центральний момент виражається через дисперсію (див. Розділ 6 підрозділ 6.2);

та формула (14.3.12) дає або

Заміняючи на (14.3.14) невідоме Dйого оцінкою D, отримаємо: звідки

Момент ц 4 можна виразити через Dтакож і в деяких інших випадках, коли розподіл величини Xперестав бути нормальним, але його відомий. Наприклад, для закону рівномірної щільності (див. розділ 5) маємо:

де (а, Р) - інтервал, у якому заданий закон.

Отже,

За формулою (14.3.12) отримаємо: звідки знаходимо приблизно

У випадках, коли вид закону розподілу величини 26 невідомий, при орієнтовній оцінці величини а/) рекомендується все ж таки користуватися формулою (14.3.16), якщо немає спеціальних підстав вважати, що цей закон сильно відрізняється від нормального (має помітний позитивний або негативний ексцес) .

Якщо орієнтовне значення а/) тим чи іншим способом отримано, можна побудувати довірчий інтервал для дисперсії аналогічно тому, як ми будували його для математичного очікування:

де величина в залежності від заданої ймовірності р знаходиться по таблиці. 14.3.1.

Приклад 2. Знайти приблизно 80% довірчий інтервал для дисперсії випадкової величини Xв умовах прикладу 1, якщо відомо, що величина Xрозподілено згідно із законом, близьким до нормального.

Рішення.Розмір залишається тієї ж, що у табл. 14.3.1:

За формулою (14.3.16)

За формулою (14.3.18) знаходимо довірчий інтервал:

Відповідний інтервал значень середнього відхилення квадратичного: (0,21; 0,29).

14.4. Точні методи побудови довірчих інтервалів для параметрів випадкової величини, розподіленої за нормальним законом

У попередньому підрозділі ми розглянули грубо наближені методи побудови довірчих інтервалів для математичного очікування та дисперсії. Тут ми дамо уявлення про точні методи вирішення того ж завдання. Підкреслимо, що для точного знаходження довірчих інтервалів необхідно знати заздалегідь вид закону розподілу величини X,тоді як застосування наближених методів це обов'язково.

Ідея точних методів побудови довірчих інтервалів зводиться до наступного. Будь-який довірчий інтервал знаходиться з умови, що виражає ймовірність виконання деяких нерівностей, в які входить оцінка, що нас цікавить а.Закон розподілу оцінки ау загальному випадку залежить від невідомих параметрів величини X.Однак іноді вдається перейти в нерівності від випадкової величини адо будь-якої іншої функції спостережених значень Х п Х 2 , ..., X п.закон розподілу якої не залежить від невідомих параметрів, а залежить тільки від кількості дослідів та від виду закону розподілу величини X.Такі випадкові величини грають велику роль математичної статистиці; вони найбільш докладно вивчені для нормального розподілу величини X.

Наприклад, доведено, що за нормального розподілу величини Xвипадкова величина

підкоряється так званому закону розподілу Ст'юдентаз п- 1 ступенями свободи; щільність цього закону має вигляд

де Г(х) - відома гамма-функція:

Доведено також, що випадкова величина

має «розподіл %2» з п- 1 ступенями свободи (див. розділ 7), щільність якого виражається формулою

Не зупиняючись на висновках розподілів (14.4.2) та (14.4.4), покажемо, як їх можна застосувати при побудові довірчих інтервалів для параметрів ти D .

Нехай зроблено пнезалежних дослідів над випадковою величиною X,розподіленої за нормальним законом із невідомими параметрами тіо.Для цих параметрів отримано оцінки

Потрібно побудувати довірчі інтервали для обох параметрів, що відповідають довірчій ймовірності р.

Побудуємо спочатку довірчий інтервал для математичного очікування. Природно, цей інтервал взяти симетричним відносно т; позначимо s p половину довжини інтервалу. Величину s p потрібно вибрати так, щоб виконувалася умова

Спробуємо перейти у лівій частині рівності (14.4.5) від випадкової величини тдо випадкової величини Т,розподіленої згідно із законом Стьюдента. І тому помножимо обидві частини нерівності |m-w?|

на позитивну величину: або, використовуючи позначення (14.4.1),

Знайдемо таке число/р, що Величина/р знайдеться з умови

З формули (14.4.2) видно, що (1) – парна функція, тому (14.4.8) дає

Рівність (14.4.9) визначає величину/р залежно від р. Якщо мати у своєму розпорядженні таблицю значень інтегралу

то величину/р можна знайти зворотним інтерполюванням у таблиці. Проте зручніше скласти заздалегідь таблицю значень/р. Така таблиця дається у додатку (табл. 5). У цій таблиці наведено значення залежно від довірчої ймовірності р та числа ступенів свободи п- 1. Визначивши/р за табл. 5 і вважаючи

ми знайдемо половину ширини довірчого інтервалу/р та сам інтервал

Приклад 1. Зроблено 5 незалежних дослідів над випадковою величиною X,розподіленої нормально з невідомими параметрами тта о. Результати дослідів наведено у табл. 14.4.1.

Таблиця 14.4.1

Знайти оцінку тдля математичного очікування і побудувати для нього 90%-й довірчий інтервал/р (тобто інтервал, що відповідає довірчій ймовірності р=0,9).

Рішення.Маємо:

За таблицею 5 додатки для п - 1 = 4 і р = 0,9 знаходимо звідки

Довірчий інтервал буде

Приклад 2 Для умов прикладу 1 підрозділу 14.3, припускаючи величину Xрозподілено нормально, знайти точний довірчий інтервал.

Рішення.За таблицею 5 додатка знаходимо при п - 1 = 19ір =

0,8/р = 1,328; звідси

Порівнюючи з рішенням прикладу 1 підрозділу 14.3 (е р = 0,072), переконуємося, що розбіжність дуже незначна. Якщо зберегти точність до другого знака після коми, то довірчі інтервали, знайдені точним та наближеним методами, збігаються:

Перейдемо до побудови довірчого інтервалу дисперсії. Розглянемо незміщену оцінку дисперсії

і висловимо випадкову величину Dчерез величину V(14.4.3), що має розподіл х 2 (14.4.4):

Знаючи закон розподілу величини V,можна знайти інтервал / (1, в який вона потрапляє із заданою ймовірністю р.).

Закон розподілу k n _ x (v)величини I 7 має вигляд, зображений на рис. 14.4.1.

Мал. 14.4.1

Виникає питання: як вибрати інтервал/р? Якби закон розподілу величини Vбув симетричним (як нормальний закон чи розподіл Стьюдента), природно було взяти інтервал /р симетричним щодо математичного очікування. В даному випадку закон до п х (v)несиметричний. Умовимося вибирати інтервал /р так, щоб ймовірність виходу величини Vза межі інтервалу вправо та вліво (заштриховані площі на рис. 14.4.1) були однакові та рівні

Щоб побудувати інтервал/р з такою властивістю, скористаємось табл. 4 додатки: у ній наведені числа у)такі, що

для величини V,що має х 2 -розподіл з г ступенями свободи. У нашому випадку г = п- 1. Зафіксуємо г = п- 1 і знайдемо у відповідному рядку табл. 4 два значення х 2 -одне, що відповідає ймовірності інше - ймовірності Позначимо ці

значення у 2і xl?Інтервал має у 2 ,своїм лівим, а у ~правим кінцем.

Тепер знайдемо по інтервалу /р шуканий довірчий інтервал /|, для дисперсії з межами D, та D 2 ,який накриває крапку Dз ймовірністю р:

Побудуємо такий інтервал /(, = (?> ь А), який накриває точку Dтоді і лише тоді, коли величина Vпотрапляє в інтервал/р. Покажемо, що інтервал

задовольняє цю умову. Справді, нерівності рівносильні нерівностям

а ці нерівності виконуються з ймовірністю р. Таким чином, довірчий інтервал дисперсії знайдено і виражається формулою (14.4.13).

Приклад 3. Знайти довірчий інтервал дисперсії в умовах прикладу 2 підрозділу 14.3, якщо відомо, що величина Xрозподілено нормально.

Рішення.Маємо . За таблицею 4 додатки

знаходимо при г = п - 1 = 19

За формулою (14.4.13) знаходимо довірчий інтервал для дисперсії

Відповідний інтервал для середнього відхилення квадратичного: (0,21; 0,32). Цей інтервал лише трохи перевищує отриманий у прикладі 2 підрозділу 14.3 наближеним методом інтервал (0,21; 0,29).

  • На малюнку 14.3.1 розглядається довірчий інтервал, симетричний щодо а. Загалом, як ми побачимо далі, це необов'язково.

Довірчі інтервали.

Обчислення довірчого інтервалу виходить з середньої помилці відповідного параметра. Довірчий інтервал показує, в яких межах із ймовірністю (1-a) знаходиться справжнє значення параметра, що оцінюється. Тут a – рівень значущості (1-a) називають також довірчою ймовірністю.

У першому розділі ми показали, що, наприклад, для середнього арифметичного, справжнє середнє за сукупністю приблизно 95% випадків лежить у межах 2 середніх помилок середнього. Отже, межі 95% довірчого інтервалу для середнього відстоятиме від вибіркового середнього на подвійну середню помилку середнього, тобто. ми множимо середню помилку середнього певний коефіцієнт, залежить від довірчої ймовірності. Для середнього та різниці середніх береться коефіцієнт Стьюдента (критичне значення критерію Стьюдента), для частки та різниці часток критичне значення критерію z. Добуток коефіцієнта на середню помилку можна назвати граничною помилкою цього параметра, тобто. максимальну, яку ми можемо отримати при оцінці.

Довірчий інтервал для середнього арифметичного : .

Тут – вибіркове середнє;

Середня помилка середньої арифметичної;

s –вибіркове середнє квадратичне відхилення;

n

f = n-1 (Коефіцієнт Стьюдента).

Довірчий інтервал для різниці середніх арифметичних :

Тут – різниця вибіркових середніх;

- середня помилка різниці середніх арифметичних;

s 1 ,s 2 –вибіркові середні квадратичні відхилення;

n 1 ,n 2

Критичне значення критерію Стьюдента при заданому рівні значимості a та числі ступенів свободи f=n 1 +n 2-2 (Коефіцієнт Стьюдента).

Довірчий інтервал для частки :

.

Тут d – вибіркова частка;

- Середня помилка частки;

n- Обсяг вибірки (чисельність групи);

Довірчий інтервал для різниці часток :

Тут - різниця вибіркових часток;

- Середня помилка різниці середніх арифметичних;

n 1 ,n 2- Обсяги вибірок (чисельності груп);

Критичне значення критерію z за заданого рівня значущості a ( , , ).

Обчислюючи довірчі інтервали для різниці показників, ми, по-перше, безпосередньо бачимо можливі значення ефекту, а чи не лише його точкову оцінку. По-друге, можемо зробити висновок про прийняття чи спростування нульової гіпотези і, по-третє, можемо зробити висновок про потужність критерію.

При перевірці гіпотез за допомогою довірчих інтервалів слід дотримуватись наступного правила:

Якщо 100(1-a)-відсотковий довірчий інтервал різниці середніх немає нуля, то відмінності статистично значимі лише на рівні значимості a; навпаки, якщо цей інтервал містить нуль, то відмінності статистично значущі.

Справді, якщо цей інтервал містить нуль, то, отже, порівнюваний показник може бути як і більше, і менше у одній із груп, проти інший, тобто. спостерігаються відмінності випадкові.

За місцем, де знаходиться нуль усередині довірчого інтервалу, можна судити про потужність критерію. Якщо нуль близький до нижньої чи верхній межі інтервалу, то можливо за більшої чисельності порівнюваних груп, відмінності досягли статистичної значимості. Якщо нуль близький до середини інтервалу, то, отже, рівноймовірне збільшення і зменшення показника в експериментальній групі, і, ймовірно, відмінностей дійсно немає.

Приклади:

Порівняти операційну летальність при застосуванні двох різних видів анестезії: із застосуванням першого виду анестезії оперувалося 61 особа, померло 8, із застосуванням другого – 67 осіб, померло 10.

d 1 = 8/61 = 0,131; d 2 = 10/67 = 0,149; d1-d2 = - 0,018.

Різниця летальностей порівнюваних методів перебуватиме в інтервалі (-0,018 - 0,122; -0,018 + 0,122) або (-0,14; 0,104) з ймовірністю 100(1-a) = 95%. Інтервал містить нуль, тобто. гіпотезу про однакову летальність при двох різних видах анестезії відкинути не можна.

Отже, летальність може зменшиться до 14% і збільшитися до 10,4% з ймовірністю 95%, тобто. нуль знаходиться приблизно посередині інтервалу, тому можна стверджувати, що, швидше за все, дійсно не відрізняються за летальністю ці два методи.

У розглянутому прикладі порівнювався середній час натискання при теппинг-тесті в чотирьох групах студентів, що відрізняються за екзаменаційною оцінкою. Обчислимо довірчі інтервали середнього часу натискання для студентів, які склали іспит на 2 та 5 і довірчий інтервал для різниці цих середніх.

Коефіцієнти Стьюдента знаходимо за таблицями розподілу Стьюдента (див. додаток): першої групи: = t(0,05;48) = 2,011; для другої групи: = t(0,05; 61) = 2,000. Таким чином, довірчі інтервали для першої групи: = (162,19-2,011*2,18 ; 162,19+2,011*2,18) = (157,8 ; 166,6) , для другої групи (156,55- 2,000 * 1,88; 156,55 +2,000 * 1,88) = (152,8; 160,3). Отже, для тих, хто склав іспит на 2, середній час натискання лежить в межах від 157,8 мс до 166,6 мс з ймовірністю 95%, для тих, хто склав іспит на 5 - від 152,8 мс до 160,3 мс з ймовірністю 95%.

Перевіряти нульову гіпотезу можна і за довірчими інтервалами для середніх, а не лише для різниці середніх. Наприклад, як і нашому разі, якщо довірчі інтервали для середніх перекриваються, то нульову гіпотезу відкинути не можна. Для того, щоб відкинути гіпотезу на вибраному рівні значущості, відповідні довірчі інтервали не повинні перекриватися.

Знайдемо довірчий інтервал для різниці середнього часу натискання у групах, які склали іспит на 2 і 5. Різниця середніх: 162,19 – 156,55 = 5,64. Коефіцієнт Стьюдента: = t(0,05; 49 +62-2) = t (0,05; 109) = 1,982. Групові середні квадратичні відхилення дорівнюватимуть: ; . Обчислюємо середню помилку різниці середніх: . Довірчий інтервал: = (5,64-1,982 * 2,87; 5,64 +1,982 * 2,87) = (-0,044; 11,33).

Отже, різниця середнього часу натискання в групах, які склали іспит на 2 і 5, буде в інтервалі від -0,044 мс до 11,33 мс. До цього інтервалу входить нуль, тобто. Середній час натискання у добре склали іспит, може збільшитися і зменшиться проти незадовільно склали, тобто. нульову гіпотезу відкинути не можна. Але нуль знаходиться дуже близько до нижньої межі, час натискання набагато швидше все-таки зменшується у добре здали. Таким чином, можна зробити висновок, що відмінності в середньому часу натискання між тими, хто здав на 2 і на 5 все-таки є, просто ми не змогли їх виявити при даній зміні середнього часу, розкид середнього часу та обсягах вибірок.



Потужність критерію – це можливість відкинути неправильну нульову гіпотезу, тобто. знайти відмінності там, де вони є.

Потужність критерію визначається з рівня значимості, величини відмінностей між групами, розкиду значень у групах та обсягу вибірок.

Для критерію Стьюдента та дисперсійного аналізу можна скористатися діаграмами чутливості.

Потужність критерію можна використовувати при попередньому визначенні необхідної кількості груп.

Довірчий інтервал показує, в яких межах із заданою ймовірністю знаходиться справжнє значення параметра, що оцінюється.

За допомогою довірчих інтервалів можна перевіряти статистичні гіпотези та робити висновки про чутливість критеріїв.

ЛІТЕРАТУРА.

Гланц С. - Розділ 6,7.

Реброва О.Ю. - С.112-114, с.171-173, с.234-238.

Сидоренко Є. В. – с.32-33.

Запитання для самоперевірки студентів.

1. Що таке потужність критерію?

2. У яких випадках слід оцінити потужність критеріїв?

3. Методи розрахунку потужності.

6. Як перевірити статистичну гіпотезу за допомогою довірчого інтервалу?

7. Що можна сказати про потужність критерію при розрахунку довірчого інтервалу?

Завдання.

Оцінка довірчих інтервалів

Цілі навчання

Статистика розглядає такі два основні завдання:

    У нас є деяка оцінка, побудована на вибіркових даних, і ми хочемо зробити деяке ймовірнісне твердження щодо того, де знаходиться справжнє значення параметра, що оцінюється.

    Ми маємо конкретну гіпотезу, яку необхідно перевірити на основі вибіркових даних.

У цій темі ми розглядаємо перше завдання. Введемо також визначення довірчого інтервалу.

Довірчий інтервал - це інтервал, який будується навколо оцінного значення параметра і показує, де знаходиться справжнє значення параметра з апріорі заданою ймовірністю.

Вивчивши матеріал цієї теми, Ви:

    дізнаєтесь, що таке довірчий інтервал оцінки;

    навчіться класифікувати статистичні завдання;

    освоїте техніку побудови довірчих інтервалів як за статистичними формулами, так і за допомогою програмного інструментарію;

    навчитеся визначати необхідні розміри вибірок для досягнення певних параметрів точності статистичних оцінок.

Розподіл вибіркових характеристик

Т-розподіл

Як обговорювали вище розподіл випадкової величини, близький до стандартизованого нормального розподілу з параметрами 0 і 1. Оскільки нам не відома величина σ, ми замінюємо її на деяку оцінку s . Величина вже має інший розподіл, а саме чи Розподіл Стьюдента, Яке визначається параметром n -1 (кількість ступенів свободи). Цей розподіл близький до нормального розподілу (що більше n, тим розподіл ближче).

На рис. 95
представлено розподіл Стьюдента з 30 ступенями свободи. Як видно, воно дуже близьке до нормального розподілу.

Аналогічно до функцій для роботи з нормальним розподілом НОРМРАСП і НОРМОБР є функції для роботи з t-розподілом - СТЬЮДРАСП (TDIST) і Стьюдрозбір (TINV). Приклад використання цих функцій можна переглянути у файлі СТЬЮДРАСП.XLS (шаблон і рішення) та на рис. 96
.

Розподіл інших характеристик

Як ми вже знаємо, для визначення точності оцінювання математичного очікування нам необхідний t-розподіл. Для оцінювання інших параметрів, наприклад дисперсії, потрібні інші розподіли. Два з них - це F-розподіл та x 2 -розподіл.

Довірчий інтервал для середнього значення

Довірчий інтервал- це інтервал, який будується навколо оцінного значення параметра і показує, де знаходиться справжнє значення параметра, що оцінюється, з апріорі заданою ймовірністю.

Побудова довірчого інтервалу для середнього значення відбувається наступним чином:

приклад

У ресторані швидкого обслуговування планується розширити асортимент нового вигляду сендвіча. Для того щоб оцінити попит на нього, менеджер випадково планує вибрати 40 відвідувачів з тих, хто вже спробував його і запропонувати їм оцінити їхнє ставлення до нового продукту в балах від 1 до 10. Менеджер хоче оцінити очікувану кількість балів, яку отримає новий продукт і побудувати 95% довірчий інтервал цієї оцінки. Як це здійснити? (Див. файл СЕНДВІЧ1.XLS (шаблон і рішення).

Рішення

Для вирішення цього завдання можна скористатися. Результати подано на рис. 97
.

Довірчий інтервал для сумарного значення

Іноді, за вибірковими даними, потрібно оцінити не математичне очікування, а загальну суму значень. Наприклад, у ситуації з аудитором інтерес може становити оцінка середньої величини рахунку, а суми всіх рахунків.

Нехай N – загальна кількість елементів, n – розмір вибірки, T 3 – сума значень у вибірці, T” – оцінка для суми по всій сукупності, тоді а довірчий інтервал обчислюється за формулою , де s - оцінка стандартного відхилення для вибірки, - оцінка середнього для вибірки.

приклад

Припустимо, деяка податкова служба хоче оцінити розмір сумарних податкових повернень для 10 000 платників податків. Платник податків отримує повернення, або доплачує податки. Знайдіть 95%-й довірчий інтервал для суми повернення за умови, що розмір вибірки становить 500 осіб (див. файл СУМА ПОВЕРНЕНЬ.XLS (шаблон і рішення ).

Рішення

У StatPro немає спеціальної процедури для цього випадку, однак можна помітити, що кордони можна отримати з кордонів для середнього виходячи з наведених вище формул (рис. 98).
).

Довірчий інтервал для пропорції

Нехай p - математичне очікування частки клієнтів, а р - оцінка цієї частки, отримана за вибіркою розміру n. Можна показати, що для чималих розподіл оцінки буде близьким до нормального з математичним очікуванням p і стандартним відхиленням . Стандартна помилка оцінки в даному випадку виражається як , а довірчий інтервал як .

приклад

У ресторані швидкого обслуговування планується розширити асортимент нового вигляду сендвіча. Для того щоб оцінити попит на нього, менеджер випадково вибрав 40 відвідувачів з тих, хто вже спробував його і запропонував їм оцінити їхнє ставлення до нового продукту в балах від 1 до 10. Менеджер хоче оцінити очікувану частку клієнтів, які оцінюють новий продукт не менше ніж у 6 балів (він очікує, що саме ці клієнти будуть споживачами нового продукту).

Рішення

Спочатку створюємо новий стовпець за ознакою 1, якщо оцінка клієнта була більше 6 балів і 0 інакше (див. файл СЕНДВІЧ2.XLS (шаблон та рішення)).

Спосіб 1

Підраховуючи кількість 1 оцінюємо частку, а далі використовуємо формули.

Значення z кр береться зі спеціальних таблиць нормального розподілу (наприклад, 1,96 для 95% довірчого інтервалу).

Використовуючи даний підхід і конкретні дані для побудови 95% інтервалу, отримаємо наступні результати (рис. 99
). Критичне значення параметра z кр дорівнює 1,96. Стандартна помилка оцінки – 0,077. Нижня межа довірчого інтервалу – 0,475. Верхня межа довірчого інтервалу – 0,775. Таким чином, менеджер вправі вважати з 95% впевненістю, що відсоток клієнтів, які оцінили новий продукт на 6 балів і вище, буде між 47,5 і 77,5.

Спосіб 2

Це завдання допускає рішення стандартними засобами StatPro. Для цього досить помітити, що частка в даному випадку збігається із середнім значенням стовпця Тип . Далі застосуємо StatPro/Statistical Inference/One-Sample Analysisдля побудови довірчого інтервалу середнього значення (оцінки математичного очікування) стовпця Тип . Отримані у разі результат, будуть дуже близький до результату 1-го способу (рис. 99).

Довірчий інтервал для стандартного відхилення

Як оцінка стандартного відхилення використовується s (формула наведена у розділі 1). Функцією щільності розподілу оцінки s є функція хі-квадрат, яка, як і t-розподіл, має n-1 ступінь свободи. Є спеціальні функції для роботи з цим розподілом ХІ2РАСП (CHIDIST) та ХІ2ОБР (CHIINV).

Довірчий інтервал у разі вже буде не симетричним. Умовна схема меж представлена ​​на рис. 100 .

приклад

Верстат повинен робити деталі діаметром 10 см. Однак через різні обставини відбуваються помилки. Контролера за якістю хвилюють дві обставини: по-перше, середнє значення має дорівнювати 10 см; по-друге, навіть у разі, якщо відхилення будуть великі, багато деталі будуть забраковані. Щодня він робить вибірку з 50 деталей (див. файл КОНТРОЛЬ ЯКОСТІ.XLS (шаблон та рішення)) Які висновки може дати така вибірка?

Рішення

Побудуємо 95% довірчі інтервали для середнього і для стандартного відхилення за допомогою StatPro/Statistical Inference/ One-Sample Analysis(Рис. 101
).

Далі, використовуючи припущення про розподіл діаметрів, розрахуємо частку бракованих виробів, задавшись граничним відхиленням 0,065. Використовуючи можливості таблиці підстановки (випадок двох параметрів), побудуємо залежність частки шлюбу від середнього значення та стандартного відхилення (рис. 102)
).

Довірчий інтервал для різниці двох середніх значень

Це одне з найважливіших застосувань статистичних методів. Приклади ситуацій.

    Менеджер магазину одягу хотів би знати, на скільки більше чи менше витрачає у магазині середня жінка-покупець, ніж чоловік.

    Дві авіакомпанії літають аналогічними маршрутами. Організація-споживач хотіла б порівняти різницю між середньоочікуваними часом затримок рейсів по обох авіакомпаніях.

    Компанія розсилає купони на окремі види товарів в одному місті та не розсилає в іншому. Менеджери хочуть порівняти середні обсяги купівлі цих товарів у найближчі два місяці.

    Автомобільний дилер часто має справу на презентаціях із заміжніми парами. Щоб зрозуміти їхню персональну реакцію на презентацію, пари часто опитують окремо. Менеджер хоче оцінити різницю в рейтингах, які вказують чоловіки і жінки.

Випадок незалежних вибірок

Різниця середніх значень матиме t-розподіл із n 1 + n 2 - 2 ступенями свободи. Довірчий інтервал для μ 1 - μ 2 виражається співвідношенням:

Дане завдання допускає рішення не тільки за наведеними вище формулами, але і стандартними засобами StatPro. Для цього достатньо застосувати

Довірчий інтервал для різниці між пропорціями

Нехай - математичне очікування часток. Нехай їх вибіркові оцінки, побудовані за вибірками розміру n 1 і n 2 відповідно. Тоді є оцінкою для різниці. Отже, довірчий інтервал цієї різниці виражається як:

Тут z кр є значенням, отриманим з нормального розподілу за спеціальними таблицями (наприклад, 1,96 для 95% довірчого інтервалу).

Стандартна помилка оцінки виражається у разі співвідношенням:

.

приклад

Магазин, готуючись до великого розпродажу, зробив наступні маркетингові дослідження. Було обрано 300 найкращих покупців, які у свою чергу були випадково поділені на дві групи по 150 членів у кожній. Усім з відібраних покупців було розіслано запрошення для участі у розпродажі, але тільки для членів першої групи було додано купон, що дає право на знижку 5%. Під час розпродажу купівлі всіх 300 відібраних покупців фіксувалися. Як менеджер може інтерпретувати отримані результати і зробити висновок про ефективність надання купонів? (див. файл КУПОНИ.XLS (шаблон і рішення)).

Рішення

Для нашого конкретного випадку зі 150 покупців, які отримали купон на знижку, 55 зробили купівлю на розпродажі, а серед 150 купон, які не отримали купівлю, зробили тільки 35 (рис. 103).
). Тоді значення вибіркових пропорцій відповідно 0,3667 та 0,2333. А вибіркова різниця між ними дорівнює відповідно 0,1333. Вважаючи довірчий інтервал 95%, знаходимо по таблиці нормального розподілу z кр = 1,96. Обчислення стандартної помилки вибіркової різниці дорівнює 0,0524. Остаточно отримуємо, що нижня межа 95% довірчого інтервалу дорівнює 0,0307, ​​а верхня межа 0,2359 відповідно. Отримані результати можна інтерпретувати таким чином, що на кожних 100 покупців, які отримали купон зі знижкою, очікується від 3 до 23 нових покупців. Однак треба мати на увазі, що цей висновок сам по собі ще не означає ефективності застосування купонів (оскільки надаючи знижку ми втрачаємо в прибутку!). Продемонструємо це на конкретних даних. Припустимо, що середній обсяг купівлі дорівнює 400 крб., у тому числі 50 крб. є прибуток магазину. Тоді очікуваний прибуток на 100 покупцях, які не отримали купон, дорівнює:

50 0,2333 100 = 1166,50 руб.

Аналогічні обчислення для 100 покупців, які отримали купон, дають:

30 0,3667 100 = 1100,10 руб.

Зменшення середнього прибутку до 30 пояснюється тим, що, використовуючи знижку, покупці, які отримали купон, у середньому робитимуть покупку на 380 руб.

Таким чином, підсумковий висновок говорить про неефективність використання таких купонів у цій конкретній ситуації.

Зауваження. Це завдання допускає рішення стандартними засобами StatPro. Для цього достатньо звести це завдання до завдання оцінки різниці двох середніх способом, а далі застосувати StatPro/Statistical Inference/Two-Sample Analysisдля побудови довірчого інтервалу різниці двох середніх значень.

Управління довжиною довірчого інтервалу

Довжина довірчого інтервалу залежить від наступних умов:

    безпосередньо даних (стандартне відхилення);

    рівня значимості;

    розміру вибірки.

Розмір вибірки для оцінки середнього значення

Спочатку розглянемо завдання у випадку. Позначимо дане нам значення половини довжини довірчого інтервалу за (рис. 104
). Нам відомо, що довірчий інтервал для середнього значення деякої випадкової величини X виражається як , де . Вважаючи:

і висловлюючи n, отримаємо.

На жаль, точного значення дисперсії випадкової величини X нам не відомо. Крім цього, нам невідомо і значення t кр, оскільки воно залежить від n через кількість ступенів свободи. У цій ситуації ми можемо вчинити так. Замість дисперсії s використовуємо будь-яку оцінку дисперсії, за якими є реалізація досліджуваної випадкової величини. Замість значення t кр використовуємо значення z кр нормального розподілу. Це цілком припустимо, оскільки функції щільності розподілів для нормального та t-розподілу дуже близькі (за винятком випадку малих n). Таким чином, шукана формула набуває вигляду:

.

Оскільки формула дає, взагалі кажучи, нецілочисленний результат, як шуканий розмір вибірки береться округлення з надлишком результату.

приклад

У ресторані швидкого обслуговування планується розширити асортимент нового вигляду сендвіча. Для того щоб оцінити попит на нього, менеджер випадково планує вибрати деяку кількість відвідувачів з тих, хто вже спробував його, і запропонувати їм оцінити їхнє ставлення до нового продукту в балах від 1 до 10. Менеджер хоче оцінити очікувану кількість балів, яку отримає новий продукт і побудувати 95% довірчий інтервал цієї оцінки. При цьому він хоче, щоб половина ширини довірчого інтервалу не перевищувала 0,3. Яку кількість відвідувачів йому потрібно опитати?

виглядає наступним чином:

Тут р оц- оцінка частки p , а є задана половина довжини довірчого інтервалу. Завищене значення для n можна отримати, використовуючи значення р оц= 0,5. У цьому випадку довжина довірчого інтервалу не перевищуватиме заданого значення при будь-якому істинному значенні p .

приклад

Нехай менеджер із попереднього прикладу планує оцінити частку клієнтів, які віддали перевагу новому виду продукції. Він хоче побудувати 90% довірчий інтервал, половина довжини якого не перевищувала б 0,05. Скільки клієнтів має увійти до випадкової вибірки?

Рішення

У разі значення z кр = 1,645. Тому шукана кількість обчислюється як .

Якби менеджер мав підстави вважати, що шукане значення p становить, наприклад, приблизно 0,3, то, підставляючи це значення у наведену вище формулу, ми отримали б менше значення величини випадкової вибірки, а саме 228.

Формула для визначення розмірів випадкової вибірки у разі різниці між двома середніми значеннямизаписується як:

.

приклад

Деяка комп'ютерна компанія має сервісний центр обслуговування клієнтів. Останнім часом побільшало скарг клієнтів на погану якість обслуговування. У сервісному центрі в основному працюють співробітники двох типів: які не мають великого досвіду, але закінчили спеціальні підготовчі курси і мають великий практичний досвід, але не закінчили спеціальних курсів. Компанія хоче проаналізувати нарікання клієнтів за останні півроку та порівняти їх середні кількості, що припадають на кожну з двох груп співробітників. Передбачається, що кількості у вибірках з обох груп будуть однакові. Яку кількість співробітників необхідно включити у вибірку, щоб отримати 95% інтервал з половиною довжини не більше 2?

Рішення

Тут σ оц є оцінка стандартного відхилення обох випадкових змінних у припущенні, що вони близькі. Таким чином, у нашому завданні нам необхідно якимось чином одержати цю оцінку. Це можна зробити, наприклад, в такий спосіб. Переглянувши дані щодо нарікань клієнтів за останні півроку, менеджер може помітити, що на кожного співробітника в основному припадає від 6 до 36 нарікань. Знаючи, що для нормального розподілу практично всі значення віддалені від середнього значення не більше ніж на три стандартні відхилення, він може з певною підставою вважати, що:

, Звідки σ оц = 5.

Підставляючи це значення у формулу, отримуємо .

Формула для визначення розміру випадкової вибірки у разі оцінки різниці між часткамимає вигляд:

приклад

Деяка компанія має дві заводи з виробництва аналогічної продукції. Менеджер компанії хоче порівняти частки бракованої продукції обох фабриках. За наявною інформацією відсоток шлюбу обох фабриках становить від 3 до 5%. Передбачається побудувати 99% довірчий інтервал з половиною довжини не більше 0,005 (або 0,5%). Яку кількість виробів необхідно вибрати з кожної фабрики?

Рішення

Тут р 1оц і р 2оц є оцінками двох невідомих часток шлюбу на 1-й та 2-й фабриці. Якщо покласти р 1оц = р 2оц = 0,5, ми отримаємо підвищене значення для n . Але оскільки в нашому випадку ми маємо деяку апріорну інформацію про ці частки, то беремо верхню оцінку цих часток, а саме 0,05. Отримуємо

Коли робиться оцінка деяких параметрів сукупності за вибірковими даними, корисно дати як точкову оцінку параметра, а й вказати довірчий інтервал, який показує, де може бути точне значення параметра.

У цьому розділі ми також познайомилися з кількісними співвідношеннями, що дозволяють будувати такі інтервали для різних параметрів; дізналися методи управління довжиною довірчого інтервалу.

Зазначимо також, що завдання оцінки розмірів вибірки (завдання планування експерименту) можна вирішити, використовуючи стандартні засоби StatPro, а саме StatPro/Statistical Inference/Sample Size Selection.



Останні матеріали розділу:

Чому неприйнятні уроки статевого «освіти» у школах?
Чому неприйнятні уроки статевого «освіти» у школах?

Статеве виховання в російській школі: чи потрібний нам досвід Америки? Р.Н.Федотова, Н.А.Самарец Малюки ростуть на очах, і, не встигнувши озирнутися, ми...

Що таке психологія як наука визначення
Що таке психологія як наука визначення

наука про закономірності розвитку та функціонування психіки як особливої ​​форми життєдіяльності, заснована на явленості у самоспостереженні особливих...

Визначення психології як науки
Визначення психології як науки

Останнім часом вивчення психології людини стало дуже популярним. На заході консультаційна практика фахівців цієї галузі існує...