Що означає різні рівні достовірності. Основні терміни та поняття медичної статистики

Сьогодні це дійсно занадто просто: ви можете підійти до комп'ютера і практично без знання того, що ви робите, створювати розумне і нісенітницю з воістину дивовижною швидкістю. (Дж. Бокс)

Основні терміни та поняття медичної статистики

У цій статті ми наведемо деякі ключові поняття статистики, які є актуальними при проведенні медичних досліджень. Докладніше терміни розбираються у відповідних статтях.

Варіація

Визначення.Ступінь розсіювання даних (значень ознаки) по області значень

Ймовірність

Визначення. Імовірність (probability) - ступінь можливості прояву будь-якої певної події в тих чи інших умовах.

приклад. Пояснимо визначення терміна на пропозиції «Вірогідність одужання при застосуванні лікарського препарату Арімідекс дорівнює 70%». Подією є «видужання хворого», умовою «хворий приймає Арімідекс», ступенем можливості - 70% (грубо кажучи, зі 100 осіб, які приймають Арімідекс, одужують 70).

Кумулятивна ймовірність

Визначення.Кумулятивна ймовірність виживання (Cumulative Probability of surviving) в момент часу t - це те саме, що частка пацієнтів, що вижили, до цього моменту часу.

приклад. Якщо говориться, що кумулятивна ймовірність виживання після проведення п'ятирічного курсу лікування дорівнює 0.7, то це означає, що з групи пацієнтів, що розглядається, в живих залишилося 70% від початкової кількості, а 30% померло. Іншими словами, з кожної сотні людей 30 померли протягом перших 5 років.

Час до події

Визначення.Час до події - це час, виражений у деяких одиницях, що минув з початкового моменту часу до настання деякої події.

Пояснення. Як одиниці часу в медичних дослідженнях виступають дні, місяці та роки.

Типові приклади початкових моментів часу:

початок спостереження за пацієнтом

проведення хірургічного лікування

Типові приклади подій, що розглядаються:

прогресування хвороби

виникнення рецидиву

смерть пацієнта

Вибірка

Визначення.Частина популяції, одержана шляхом відбору.

За результатами аналізу вибірки роблять висновки про всю популяцію, що правомірно лише у разі, якщо відбір був випадковим. Оскільки випадковий відбір із популяції здійснити практично неможливо, слід прагнути до того, щоб вибірка була, принаймні, репрезентативна стосовно популяції.

Залежні та незалежні вибірки

Визначення.Вибірки, у яких об'єкти дослідження набиралися незалежно друг від друга. Альтернатива незалежним вибіркам – залежні (зв'язкові, парні) вибірки.

Гіпотеза

Двостороння та одностороння гіпотези

Спочатку пояснимо застосування терміна гіпотезу у статистиці.

Мета більшості досліджень – перевірка істинності деякого твердження. Метою тестування лікарських препараторів найчастіше є перевірка гіпотези, що одні ліки ефективніші за інші (наприклад, Арімідекс ефективніший за Тамоксифен).

Для переказу строгості дослідження, твердження, що перевіряється, виражають математично. Наприклад, якщо А - це кількість років, що проживе пацієнт, який приймає Арімідекс, а Т - це кількість років, що проживе пацієнт, який приймає Тамоксифен, то гіпотезу, що перевіряється, можна записати як А>Т.

Визначення.Гіпотеза називається двосторонньою (2-sided), якщо вона полягає у рівності двох величин.

Приклад двосторонньої гіпотези: A=T.

Визначення. Гіпотеза називається односторонньою (1-sided), якщо вона полягає у нерівності двох величин.

Приклади односторонніх гіпотез:

Дихотомічні (бінарні) дані

Визначення.Дані, що виражаються лише двома допустимими альтернативними значеннями

Приклад: Пацієнт «здоровий» - «хворий». Набряк "є" - "ні".

Довірчий інтервал

Визначення.Довірчий інтервал (confidence interval) для деякої величини - це діапазон навколо значення величини, в якому знаходиться дійсне значення цієї величини (з певним рівнем довіри).

приклад. Нехай досліджуваною величиною є кількість пацієнтів на рік. У середньому їх кількість дорівнює 500, а 95%-довірчий інтервал – (350, 900). Це означає, що, швидше за все (з ймовірністю 95%), протягом року в клініку звернуться щонайменше 350 і більше 900 людина.

Позначення. Найчастіше використовуються скорочення: ДІ 95% (CI 95%) – це довірчий інтервал із рівнем довіри 95%.

Достовірність, статистична значимість (P – рівень)

Визначення.Статистична значимість результату - це міра впевненості у його "істинності".

Будь-яке дослідження проходить з урахуванням лише частини об'єктів. Дослідження ефективності лікарського препарату проводиться на основі не взагалі всіх хворих на планеті, а лише певної групи пацієнтів (провести аналіз на основі всіх хворих просто неможливо).

Припустимо, що в результаті аналізу було зроблено деякий висновок (наприклад, використання як адекватну терапію препарату Арімідекс в 2 рази ефективніше, ніж препарат Тамоксифен).

Питання, яке необхідно при цьому ставити: "Наскільки можна довіряти цьому результату?"

Уявіть, що ми проводили дослідження на основі двох пацієнтів. Звичайно ж, у цьому випадку до результатів потрібно ставитись з побоюванням. Якщо ж було обстежено велику кількість хворих (чисельне значення «великої кількості» залежить від ситуації), то зробленим висновкам можна довіряти.

Так ось, ступінь довіри визначається значенням p-рівня (p-value).

p align="justify"> Більш високий p-рівень відповідає більш низькому рівню довіри до результатів, отриманих при аналізі вибірки. Наприклад, p-рівень, що дорівнює 0.05 (5%) показує, що зроблений при аналізі деякої групи висновок є лише випадковою особливістю цих об'єктів з ймовірністю лише 5%.

Інакше кажучи, дуже ймовірно (95%) висновок можна поширити попри всі об'єкти.

У багатьох дослідженнях 5% сприймається як прийнятне значення p-уровня. Це означає, що й, наприклад, p= 0.01, то результатам довіряти можна, і якщо p=0.06, то нельзя.

Дослідження

Проспективне дослідження- це дослідження, у якому вибірки виділяються з урахуванням вихідного чинника, а вибірках аналізується деякий результуючий чинник.

Ретроспективне дослідження- це дослідження, у якому вибірки виділяються з урахуванням результуючого чинника, а вибірках аналізується деякий вихідний чинник.

приклад. Вихідний фактор - вагітна жінка молодша/старша 20 років. Результуючий фактор - дитина легша/важча 2,5 кг. Аналізуємо, чи залежить вага дитини від віку матері.

Якщо ми набираємо 2 вибірки, в одній - матері віком до 20 років, в іншій - старше, а потім аналізуємо масу дітей у кожній групі, то це проспективне дослідження.

Якщо ми набираємо 2 вибірки, в одній – матері, що народили дітей легше 2,5 кг, в іншій – важче, а потім аналізуємо вік матерів у кожній групі, то це ретроспективне дослідження (природно, таке дослідження можна провести, тільки коли досвід закінчено, тобто всі діти народилися).

Вихід

Визначення.Клінічно значуще явище, лабораторний показник чи ознака, що є об'єктом інтересу дослідника. При проведенні клінічних випробувань результати є критеріями оцінки ефективності лікувального або профілактичного впливу.

Клінічна епідеміологія

Визначення.Наука, що дозволяє здійснювати прогнозування того чи іншого результату для кожного конкретного хворого на підставі вивчення клінічного перебігу хвороби в аналогічних випадках з використанням суворих методів вивчення хворих для забезпечення точності прогнозів.

Когорта

Визначення.Група учасників дослідження, об'єднаних якоюсь загальною ознакою в момент її формування та досліджуваних протягом тривалого часу.

Контроль

Контроль історичний

Визначення.Контрольна група, сформована та обстежена в період, що передує дослідженню.

Контроль паралельний

Визначення.Контрольна група, що формується одночасно з формуванням основної групи.

Кореляція

Визначення.Статистичний зв'язок двох ознак (кількісних або порядкових), що показує, що більшому значенню однієї ознаки у певній частині випадків відповідає більше – у разі позитивної (прямої) кореляції – значення іншої ознаки або менше значення – у разі негативної (зворотної) кореляції.

приклад. Між рівнем тромбоцитів та лейкоцитів у крові пацієнта виявлено значну кореляцію. Коефіцієнт кореляції дорівнює 0,76.

Коефіцієнт ризику (КР)

Визначення. p align="justify"> Коефіцієнт ризику (hazard ratio) - це відношення ймовірності настання деякої («нехорошої») події для першої групи об'єктів до ймовірності настання цієї ж події для другої групи об'єктів.

приклад. Якщо ймовірність появи раку легень у некурців дорівнює 20%, а у курців - 100%, то КР дорівнюватиме одній п'ятій. У цьому прикладі першою групою об'єктів є люди, що не палять, другою групою - курці, а в якості «нехорошої» події розглядається виникнення раку легенів.

Очевидно, що:

1) якщо КР=1, то ймовірність настання події у групах однакова

2) якщо КР>1, то подія частіше відбувається з об'єктами з першої групи, ніж із другої

3) якщо КР<1, то событие чаще происходит с объектами из второй группы, чем из первой

Мета-аналіз

Визначення. Зтатистичний аналіз, що узагальнює результати кількох досліджень, що досліджують одну й ту саму проблему (зазвичай ефективність методів лікування, профілактики, діагностики). Об'єднання досліджень забезпечує велику вибірку для аналізу та більшу статистичну потужність об'єднаних досліджень. Використовується підвищення доказовості чи впевненості у висновку про ефективність досліджуваного методу.

Метод Каплана - Мейєра (Множинні оцінки Каплана - Мейєра)

Цей метод придумали статистиками Е.Л.Капланом і Полем Мейером.

Метод використовується для обчислення різних величин, пов'язаних із часом спостереження за пацієнтом. Приклади таких величин:

ймовірність одужання протягом одного року при застосуванні лікарського препарату

шанс виникнення рецидиву після операції на протязі трьох років після операції

кумулятивна ймовірність виживання протягом п'яти років серед пацієнтів із раком простати при ампутації органу

Пояснимо переваги використання методу Каплана – Мейєра.

Значення величин при «звичайному» аналізі (що не використовує метод Каплана-Мейєра) розраховуються на основі розбиття тимчасового інтервалу, що розглядається, на проміжки.

Наприклад, якщо ми досліджуємо ймовірність смерті пацієнта протягом 5 років, то часовий інтервал може бути поділений як на 5 частин (менше 1 року, 1-2 роки, 2-3 роки, 3-4 роки, 4-5 років), так та на 10 (по півроку кожен), або на іншу кількість інтервалів. Результати ж за різних розбиття вийдуть різні.

Вибір найбільш відповідного розбиття - складне завдання.

Оцінки значень величин, отриманих методом Каплана- Мейера не залежить від розбиття часу спостереження на інтервали, а залежить тільки від часу життя кожного окремого пацієнта.

Тому досліднику простіше проводити аналіз, та й результати нерідко виявляються якіснішими за результати «звичайного» аналізу.

Крива Каплана-Мейєра (Kaplan - Meier curve)-це графік кривої виживання, отриманої за методом Каплана-Мейєра.

Модель Коксу

Ця модель була придумана сером Девідом Роксбі Коксом (р.1924), відомим англійським статистиком, автором понад 300 статей та книг.

Модель Кокса використовується у ситуаціях, коли досліджувані під час аналізу виживання величини залежить від функцій часу. Наприклад, ймовірність виникнення рецидиву через t років (t=1,2,…) може залежати від логарифму часу log(t).

Важливою перевагою методу, запропонованого Коксом, є застосування цього методу у великій кількості ситуацій (модель не накладає жорстких обмежень на природу або форму розподілу ймовірностей).

На основі моделі Коксу можна проводити аналіз (званий аналізом Коксу (Cox analysis)), результатом проведення якого є значення коефіцієнта ризику та довірчого інтервалу для коефіцієнта ризику.

Непараметричні методи статистики

Визначення.Клас статистичних методів, що використовуються головним чином для аналізу кількісних даних, що не утворюють нормальний розподіл, а також для аналізу якісних даних.

приклад. Для виявлення значущості відмінностей тиску систоли пацієнтів залежно від типу лікування скористаємося непараметричним критерієм Манна-Уітні.

Ознака (змінна)

Визначення. Характеристика об'єкта дослідження (спостереження) Розрізняють якісні та кількісні ознаки.

Рандомізація

Визначення.Спосіб випадкового розподілу об'єктів дослідження в основну та контрольну групи з використанням спеціальних засобів (таблиць або лічильника випадкових чисел, підкидання монети та інших способів випадкового призначення номера групи, що включається спостереженню). За допомогою рандомізації зводяться до мінімуму відмінності між групами за відомими і невідомими ознаками, що потенційно впливають на результат, що вивчається.

Ризик

Атрибутивний- додатковий ризик виникнення несприятливого результату (наприклад, захворювання) у зв'язку з наявністю певної характеристики (фактору ризику) об'єкта дослідження. Це частина ризику розвитку хвороби, яка пов'язана з цим фактором ризику, пояснюється ним і може бути усунена, якщо цей фактор ризику усунути.

Відносний ризик- Відношення ризику виникнення несприятливого стану в одній групі до ризику цього стану в іншій групі. Використовується у проспективних та спостережних дослідженнях, коли групи формуються заздалегідь, а виникнення досліджуваного стану ще не відбулося.

Ковзаючий іспит

Визначення.Метод перевірки стійкості, надійності, працездатності (валідності) статистичної моделі шляхом почергового видалення спостережень та перерахунку моделі. Чим подібніші отримані моделі, тим стійкіша, надійніша модель.

Подія

Визначення.Клінічний результат, що спостерігається у дослідженні, наприклад виникнення ускладнення, рецидиву, настання одужання, смерті.

Стратифікація

Визначення. Метод формування вибірки, у якому сукупність всіх учасників, відповідних критеріям включення до дослідження, спочатку поділяється на групи (страти) з урахуванням однієї чи кількох характеристик (зазвичай статі, віку), потенційно які впливають досліджуваний результат, та був із кожної із цих груп ( страт) незалежно проводиться набір учасників до експериментальної та контрольної групи. Це дозволяє досліднику дотримуватися балансу важливих характеристик між експериментальною та контрольною групами.

Таблиця сполученості

Визначення.Таблиця абсолютних частот (кількості) спостережень, стовпці якої відповідають значенням однієї ознаки, а рядки - значенням іншої ознаки (у разі двовимірної таблиці сполученості). Значення абсолютних частот розташовуються у клітинах на перетині рядів та колонок.

Наведемо приклад таблиці спряженості. Операцію на аневризмі було зроблено 194 пацієнтам. Відомий показник виразності набряку у пацієнтів перед операцією.

Набряк\ Вихід
немає набряку	20	6	26
помірний набряк	27	15	42
виражений набряк	8	21	29
m j	55	42	194

Таким чином, із 26 пацієнтів, які не мають набряку, після операції вижило 20 пацієнтів, померло – 6 пацієнтів. З 42 пацієнтів, які мають помірний набряк, вижило 27 пацієнтів, померло - 15 і т.д.

Критерій хі-квадрат для таблиць сполученості

Для визначення значущості (достовірності) відмінностей однієї ознаки в залежності від іншої (наприклад, результату операції в залежності від вираженості набряку) застосовується критерій хі-квадрат для таблиць сполученості:

Шанс

Нехай ймовірність деякої події дорівнює p. Тоді ймовірність того, що подія не відбудеться, дорівнює 1-p.

Наприклад, якщо ймовірність того, що хворий залишиться живим через п'ять років дорівнює 0.8 (80%), то ймовірність того, що він за цей часовий проміжок помре дорівнює 0.2 (20%).

Визначення.Шанс – це відношення ймовірності того, що події відбудеться до ймовірності того, що подія не станеться.

приклад. У прикладі (про хворого) шанс дорівнює 4, оскільки 0.8/0.2=4

Таким чином, ймовірність одужання в 4 рази більша за ймовірність смерті.

Інтерпретація значення величини.

1) Якщо Шанс = 1, то ймовірність настання події дорівнює ймовірності того, що подія не відбудеться;

2) якщо Шанс >1, то ймовірність настання події більша за ймовірність того, що подія не відбудеться;

3) якщо Шанс<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

Відношення шансів

Визначення.Відношення шансів (odds ratio) - це відношення шансів першої групи об'єктів до відношення шансів другої групи об'єктів.

приклад. Допустимо, що деяке лікування проходять і чоловіки, і жінки.

Імовірність того, що хворий чоловічої статі залишиться живим через п'ять років дорівнює 0.6 (60%); ймовірність того, що він за цей часовий проміжок помре дорівнює 0.4 (40%).

Аналогічні ймовірності для жінок дорівнюють 0.8 та 0.2.

Відношення шансів у цьому прикладі рівне

Інтерпретація значення величини.

1) Якщо відношення шансів = 1, то шанс для першої групи дорівнює шансу для другої групи

2) Якщо відношення шансів >1, то шанс для першої групи більший за шанс для другої групи

3) Якщо ставлення шансів<1, то шанс для первой группы меньше шанса для второй группы

Завданням статистичного дослідження є виявлення закономірностей, що у природі досліджуваних явищ. Показники та середні величини мають бути відображенням дійсності, для чого необхідно визначати ступінь їх достовірності. Правильне відображення вибірковою сукупністю генеральної сукупності називається репрезентативністю . Мірою точності та достовірності вибіркових статистичних величин є середні помилки представницькості (репрезентативності), які залежать від чисельності вибірки та ступеня різноманітності вибіркової сукупності за досліджуваною ознакою.

Тому для визначення ступеня достовірності результатів статистичного дослідження необхідно для кожної відносної та середньої величини обчислити відповідну середню помилку. Середня помилка показника m p обчислюється за такою формулою:

При числі спостережень менше 30, де

P - величина показника у відсотках, проміле тощо.

q - доповнення цього показника до 100, якщо він у відсотках, до 1000, якщо % 0 і т.д. (тобто q = 100-P, 1000-P і т.д.)

Наприклад, відомо, що в районі протягом року захворіло на дизентерію 224 особи. Чисельність населення ― 33000. Показник захворюваності на дизентерію на

Середня помилка цього показника

Для вирішення питання про ступінь достовірності показника визначають довірчий коефіцієнт (t), що дорівнює відношенню показника для його середньої помилки, тобто.

У нашому прикладі

Що вище t, то більше вписувалося ступінь достовірності. При t = 1, ймовірність достовірності показника дорівнює 68,3%, при t = 2 - 95,5%, при t = 3 - 99,7%. У медико-статистичних дослідженнях зазвичай використовують довірчу ймовірність (надійність), рівну 95,5%-99,0%, а найбільш відповідальних випадках - 99,7%. Таким чином, у нашому прикладі показник захворюваності достовірний.

При числі спостережень менше 30 значення критерію визначається за таблицею Стьюдента. Якщо отримана величина буде вищою або дорівнює табличній – показник достовірний. Якщо нижче – не достовірний.

При необхідності порівняння двох однорідних показників достовірність їх відмінностей визначається за такою формулою:

(від більшого числа забирають менше),

де P 1 -P 2 ― різниця двох порівнюваних показників,

― середня помилка різниці двох показників.

Наприклад, у районі Б протягом року захворіло на дизентерію 270 осіб. Населення району ― 45000. Звідси захворюваність на дизентерію:

тобто. показник захворюваності достовірний.

Як видно, захворюваність у районі Б нижче, ніж у районі А. Визначаємо за формулою достовірність різниці двох показників:

За наявності великої кількості спостережень (понад 30) різниця показників є статистично достовірною, якщо t = 2 чи більше. Отже, у прикладі захворюваність у районі А достовірно вище, т.к. довірчий коефіцієнт (t) більший за 2.

Знаючи величину середньої помилки показника, можна визначити довірчі межі цього в залежності від впливу причин випадкового характеру. Довірчі межі визначаються за такою формулою:

P - показник;

m ― його середня помилка;

t ― довірчий коефіцієнт вибирається залежно від необхідної величини надійності: t=1 відповідає надійності результату у 68,3% випадків, t=2 – 95,5%, t=2,6 – 99%, t=3 – 99,7 %, t = 3,3 - 99,9 Величина називається граничною помилкою.

Наприклад, в районі Б показник захворюваності на дизентерію з точністю до 99,7 9 % може коливатися у зв'язку з випадковими факторами в межах тобто. від 49,1 до 70,9.

При обґрунтуванні статистичного висновку слід вирішити питання, де проходить лінія між прийняттям і запереченням нульової гіпотези? У силу наявності в експерименті випадкових впливів цей кордон не може бути проведений абсолютно точно. Вона базується на понятті рівня значимості. рівнем значимості називається ймовірність помилкового відхилення нульової гіпотези. Або, іншими словами, рівень значущості - це ймовірність помилки першого роду після ухвалення рішення. Для позначення цієї ймовірності, як правило, вживають або грецьку букву α, або латинську букву нар.Надалі ми вживатимемо літеру нар.

Історично склалося так, що у прикладних науках, що використовують статистику, і зокрема у психології, вважається, що нижчим рівнем статистичної значущості є рівень р = 0,05; достатнім - рівень р= 0,01 та вищим рівень р = 0,001. Тому в статистичних таблицях, які наводяться у додатку до підручників зі статистики, зазвичай даються табличні значення для рівнів р = 0,05, р = 0,01 та р= 0,001. Іноді даються табличні значення для рівнів р - 0,025 та р = 0,005.

Величини 0,05, 0,01 та 0,001 – це так звані стандартні рівні статистичної значущості. При статистичному аналізі експериментальних даних психолог залежно від завдань та гіпотез дослідження має вибрати необхідний рівень значущості. Як бачимо, тут найбільша величина, або нижня межа рівня статистичної значущості, дорівнює 0,05 - це означає, що допускається п'ять помилок у вибірці зі ста елементів (випадків, випробуваних) або одна помилка із двадцяти елементів (випадків, випробуваних). Вважається, що ні шість, ні сім, ні більше разів зі ста ми помилитися не можемо. Ціна таких помилок буде надто великою.

Зауважимо, що у сучасних статистичних пакетах на ЕОМ використовуються не стандартні рівні значимості, а рівні, що підраховуються безпосередньо у процесі роботи з відповідним статистичним методом. Ці рівні, що позначаються буквою р,можуть мати різний числовий вираз в інтервалі від 0 до 1, наприклад, р = 0,7, р= 0,23 або р= 0,012. Зрозуміло, що у перших двох випадках отримані рівні значущості занадто великі і говорити, що результат значимий не можна. У той самий час у разі результати значимі лише на рівні 12 тисячних. Це достовірний рівень.

Правило прийняття статистичного висновку таке: на підставі отриманих експериментальних даних психолог підраховує за вибраним ним статистичним методом так звану емпіричну статистику, або емпіричне значення. Цю величину зручно позначити як Ч емп . Потім емпірична статистика Ч емп порівнюється з двома критичними величинами, які відповідають рівням значимості 5% і 1% для обраного статистичного методу і які позначаються як Ч кр . Величини Ч кр знаходяться для даного статистичного методу за відповідними таблицями, наведеними у додатку до будь-якого підручника зі статистики. Ці величини, як правило, завжди різні і їх надалі для зручності можна назвати як Ч кр1і Ч кр2 . Знайдені за таблицями величини критичних значень Ч кр1і Ч кр2зручно представляти у наступній стандартній формі записи:

Підкреслимо, однак, що ми використовували позначення Ч емп і Ч кр як скорочення слова "число". У всіх статистичних методах прийнято свої символічні позначення всіх цих величин: як підрахованої за відповідним статистичним методом емпіричної величини, так і знайдених за відповідними таблицями критичних величин. Наприклад, при підрахунку рангового коефіцієнта кореляції Спірмена за таблицею критичних значень цього коефіцієнта знайшли наступні величини критичних значень, які цього методу позначаються грецької буквою ρ («ро»). Так для р = 0,05 за таблицею знайдено величину ρ кр 1 = 0,61 і для р = 0,01 величина ρ кр 2 = 0,76.

У прийнятій у подальшому викладі стандартної формі запису це виглядає так:

Тепер нам необхідно порівняти наше емпіричне значення із двома знайденими за таблицями критичними значеннями. Найкраще це зробити, розташувавши всі три числа на так званій осі значущості. «Вісь значущості» являє собою пряму, на лівому кінці якої розташовується 0, хоча він, як правило, не відзначається на цій прямій, і зліва направо йде збільшення числового ряду. По суті, це звична шкільна вісь абсцис ОХдекартової системи координат. Однак особливість цієї осі в тому, що на ній виділено три ділянки, зони. Одна крайня зона називається зоною незначущості, друга крайня зона – зоною значимості, а проміжна – зоною невизначеності. Кордонами всіх трьох зон є Ч кр1для р = 0,05 та Ч кр2 для р = 0,01, як показано малюнку.

Залежно від правила ухвалення рішення (правила висновку), запропонованого в даному статистичному методі, можливо два варіанти.

Перший варіант: альтернативна гіпотеза приймається, якщо Ч емп ≥Ч кр .

Або другий варіант: альтернативна гіпотеза приймається, якщо Ч емп ≤Ч кр .

Підраховане Ч емп за будь-яким статистичним методом має обов'язково потрапити до однієї з трьох зон.

Якщо емпіричне значення потрапляє до зони незначущості, приймається гіпотеза Н 0 про відсутність відмінностей.

Якщо Ч емп потрапило до зони значимості, приймається альтернативна гіпотеза Н 1 о наявності відмінностей, а гіпотеза Н0 відхиляється.

Якщо Ч емп потрапляє у зону невизначеності, перед дослідником стоїть дилема. Так, в залежності від важливості розв'язуваної задачі він може вважати отриману статистичну оцінку достовірною на рівні 5%, і прийняти, тим самим гіпотезу Н1, відхиливши гіпотезу Н0 , або - недостовірною лише на рівні 1%, прийнявши цим, гіпотезу Н 0 . Підкреслимо, однак, що це саме той випадок, коли психолог може припуститися помилок першого чи другого роду. Як уже говорилося вище, за цих обставин найкраще збільшити обсяг вибірки.

Підкреслимо також, що величина Ч емп може точно збігтися або з Ч кр1або Ч кр2 . У першому випадку вважатимуться, що оцінка достовірна точно лише на рівні 5% і прийняти гіпотезу Н 1 , чи, навпаки, прийняти гіпотезу Н 0 . У другий випадок, зазвичай, приймається альтернативна гіпотеза Н 1 про наявність відмінностей, а гіпотеза Н 0 відхиляється.

Статистика давно вже стала невід'ємною частиною життя. З нею люди стикаються усюди. На основі статистики робляться висновки про те, де і які захворювання поширені, що більш затребуване у конкретному регіоні чи серед певного прошарку населення. На ґрунтуються навіть побудови політичних програм кандидатів до органів влади. Ними ж користуються і торговельні мережі при закупівлі товарів, а виробники керуються цими даними у пропозиціях.

Статистика відіграє важливу роль у житті суспільства та впливає на кожного його окремого члена навіть у дрібницях. Наприклад, якщо більшість людей воліють темні кольори в одязі в конкретному місті або регіоні, то знайти яскравий жовтий плащ з квітковим принтом в місцевих торгових точках буде вкрай важко. Але з яких величин складаються ці дані, які так впливають? Наприклад, що є «статистична значимість»? Що саме розуміється під цим визначенням?

Що це?

Статистика як наука складається з поєднання різних величин та понять. Одним із них і є поняття «статистична значимість». Так називається значення змінних величин, ймовірність появи інших показників у яких дуже мала.

Приміром, 9 із 10 осіб одягають на ноги гумове взуття під час ранкової прогулянки грибами в осінній ліс після дощової ночі. Імовірність того, що в якийсь момент 8 з них взуються в парусинові мокасини - мізерно мала. Таким чином, у даному конкретному прикладі число 9 є величиною, яка називається «статистична значимість».

Відповідно, якщо розвивати далі наведений практичний приклад, взуттєві магазини закуповують до кінця літнього сезону гумові чобітки у великій кількості, ніж у інший час року. Так, величина статистичного значення впливає на звичайне життя.

Зрозуміло, у складних підрахунках, припустимо, за прогнозом поширення вірусів, враховується велика кількість змінних. Але сама суть визначення значущого показника статистичних даних – аналогічна, незалежно від складності підрахунків та кількості непостійних величин.

Як вираховують?

Використовуються для обчислення значення показника «статистична значимість» рівняння. Тобто, можна стверджувати, що в цьому випадку все вирішує математика. Найпростішим варіантом обчислення є ланцюг математичних дій, у якому беруть участь такі параметри:

два типи результатів, отриманих при опитуваннях або вивченні об'єктивних даних, наприклад, сум на які здійснюються покупки, що позначаються а та b;
показник для обох груп – n;
значення частки об'єднаної вибірки – p;
поняття "стандартна помилка" - SE.

Наступним етапом визначається загальний тестовий показник - t його значення порівнюється з числом 1,96. 1,96 - це усереднене значення, що передає діапазон 95%, відповідно до функції t-розподілу Стьюдента.

Часто виникає питання, у чому відмінність значень n і p. Цей аспект просто прояснити за допомогою прикладу. Допустимо, обчислюється статистична значущість лояльності до будь-якого товару чи бренду чоловіків та жінок.

У цьому випадку за літерними позначеннями стоятиме таке:

n – число опитаних;
p – число задоволених продуктом.

Чисельність опитаних жінок у разі буде позначено, як n1. Відповідно, чоловіків – n2. Те саме значення матимуть цифри «1» та «2» у символу p.

Порівняння тестового показника з усередненими значеннями розрахункових таблиць Стьюдента стає тим, що називається «статистична значимість».

Що розуміється під перевіркою?

Результати будь-якого математичного обчислення можна перевірити, цьому навчають дітей ще у початкових класах. Логічно припустити, що коли статистичні показники визначаються за допомогою ланцюга обчислень, то й перевіряються.

Проте перевірка статистичної значущості – не лише математика. Статистика має справу з великою кількістю змінних величин і різних ймовірностей, які далеко не завжди піддаються розрахунку. Тобто якщо повернуться до наведеного на початку статті прикладу з гумовим взуттям, то логічна побудова статистичних даних, на які спиратимуться закупівлі товарів для магазинів, може бути порушена сухою та спекотною погодою, яка не є типовою для осені. Внаслідок цього явища кількість людей, які купують гумові чоботи, знизиться, а торгові точки зазнають збитків. Передбачити погодну аномалію математична формула, зрозуміло, неспроможна. Цей момент називається – «помилка».

Ось ймовірність таких помилок і враховує перевірка рівня обчисленої значущості. У ньому враховуються як обчислені показники, і прийняті рівні значимості, і навіть величини, умовно звані гіпотезами.

Що таке рівень значущості?

Поняття «рівень» входить до основних критеріїв статистичної значимості. Використовується воно у прикладній та практичній статистиці. Це свого роду величина, яка враховує можливість можливих відхилень чи помилок.

Рівень ґрунтується на виявленні відмінностей у готових вибірках, дозволяє встановити їх суттєвість або ж, навпаки, випадковість. Це поняття не лише цифрові значення, а й їх своєрідні розшифровки. Вони пояснюють те, як треба розуміти значення, а сам рівень визначається порівнянням результату із усередненим індексом, це й виявляє ступінь достовірності відмінностей.

Таким чином, можна уявити поняття рівня просто - це показник допустимої, ймовірної похибки або помилки у зроблених з отриманих статистичних даних висновках.

Які рівні значення використовуються?

Статистична значимість коефіцієнтів ймовірності допущеної помилки практично відштовхується від трьох базових рівнів.

Першим рівнем вважається поріг, у якому значення дорівнює 5 %. Тобто ймовірність похибки вбирається у рівня значимості 5 %. Це означає, що впевненість у бездоганності та безпомилковості висновків, зроблених на основі даних статистичних досліджень, становить 95%.

Другим рівнем є поріг 1%. Відповідно, ця цифра означає, що керуватися отриманими за статистичних розрахунків даними можна з упевненістю в 99 %.

Третій рівень – 0,1 %. За такого значення ймовірність наявності помилки дорівнює частці відсотка, тобто похибки практично виключаються.

Що таке гіпотеза у статистиці?

Помилки як поняття поділяються за двома напрямками, що стосуються прийняття або відхилення нульової гіпотези. Гіпотеза - це поняття, за яким ховається, згідно з визначенням, набір інших даних або тверджень. Тобто опис ймовірнісного розподілу чогось, що відноситься до предмета статистичного обліку.

Гіпотез при простих розрахунках буває дві – нульова та альтернативна. Різниця між ними в тому, що нульова гіпотеза бере за основу уявлення про відсутність принципових відмінностей між вибірками, що беруть участь у визначенні статистичної значущості, а альтернативна їй повністю протилежна. Тобто альтернативна гіпотеза заснована на наявності вагомої різниці у цих вибірках.

Якими є помилки?

Помилки як поняття у статистиці перебувають у прямій залежності від прийняття за істинну ту чи іншу гіпотезу. Їх можна розділити на два напрямки або типу:

перший тип обумовлений прийняттям нульової гіпотези, що виявилася неправильною;
другий - викликаний дотриманням альтернативної.

Перший тип помилок називається хибнопозитивним і зустрічається досить часто у всіх сферах, де використовуються статистичні дані. Відповідно, помилка другого типу називається хибнонегативною.

Навіщо потрібна регресія у статистиці?

Статистична значимість регресії у цьому, що з її допомогою можна встановити, наскільки відповідає реальності обчислена з урахуванням даних модель різних залежностей; дозволяє виявити достатність або брак чинників для обліку та висновків.

Визначається регресивне значення за допомогою порівняння результатів з наведеними в таблицях Фішера даними. Або за допомогою дисперсійного аналізу. Важливе значення показники регресії мають за складних статистичних дослідженнях і розрахунках, у яких бере участь багато змінних величин, випадкових даних, і можливих змін.

Статистична значимість або рівень значимості - основний результат перевірки

статистичної гіпотези. Говорячи технічною мовою, це ймовірність отримання цього

результату вибіркового дослідження за умови, що насправді для генеральної

Спільно вірна нульова статистична гіпотеза - тобто зв'язку немає. Інакше кажучи, це

ймовірність того, що виявлений зв'язок носить випадковий характер, а не є властивістю

сукупності. Саме статистична значимість, р-рівень значимості є

кількісною оцінкою надійності зв'язку: що менше ця ймовірність, то надійніший зв'язок.

Припустимо, при порівнянні двох вибіркових середніх було отримано значення рівня

статистичної значимості р = 0,05. Це означає, що перевірка статистичної гіпотези про

рівність середніх у генеральній сукупності показала, що якщо вона вірна, то ймовірність

випадкової появи виявлених відмінностей становить трохи більше 5%. Інакше кажучи, якби

дві вибірки багаторазово витягувалися з однієї і тієї ж генеральної сукупності, то в 1

20 випадків виявлялося б таку ж чи більшу різницю між середніми цих вибірок.

Тобто існує 5% ймовірність того, що виявлені відмінності носять випадковий

характер, а чи не є властивістю сукупності.

Щодо наукової гіпотези рівень статистичної значущості – це кількісний

показник ступеня недовіри до висновку про наявність зв'язку, обчислений за результатами

вибіркової, емпіричної перевірки цієї гіпотези. Чим менше значення р-рівня, тим вище

статистична значущість результату дослідження, що підтверджує наукову гіпотезу.

Корисно знати, що впливає рівень значимості. Рівень значущості за інших рівних

умовах вище (значення р-рівню менше), якщо:

Розмір зв'язку (відмінності) більше;

Мінливість ознаки (ознак) менша;

Об'єм вибірки (вибірок) більший.

Односторонніеpі двосторонні критерії перевірки значущості

Якщо мета дослідження тому, щоб виявити відмінність параметрів двох генеральних

сукупностей, які відповідають різним її природним умовам (умови життя,

вік піддослідних тощо), то часто невідомо, який з цих параметрів буде більшим, а

який менше.

Наприклад, якщо цікавляться варіативністю результатів у контрольній та

експериментальної групи, то, як правило, немає впевненості в знаку відмінності дисперсій або

стандартних відхилень результатів, якими оцінюється варіативність. В цьому випадку

нульова гіпотеза полягає в тому, що дисперсії рівні між собою, а мета дослідження -

довести протилежне, тобто. наявність різницю між дисперсіями. При цьому допускається, що

Відмінність може бути будь-якого знака. Такі гіпотези називають двосторонніми.

Але іноді завдання полягає у тому, щоб довести збільшення чи зменшення параметра;

наприклад, середній результат експериментальної групі вище, ніж контрольної. При цьому

не допускається, що різницю може бути іншого знака. Такі гіпотези називаються

Односторонніми.

Критерії значимості, що служать для перевірки двосторонніх гіпотез, називаються

Двосторонніми, а для односторонніх – односторонніми.

Виникає питання про те, який із критеріїв слід обирати в тому чи іншому випадку. Відповідь

На це питання знаходиться за межами формальних статистичних методів та повністю

Залежить від цілей дослідження. У жодному разі не можна вибирати той чи інший критерій після

Проведення експерименту на основі аналізу експериментальних даних, оскільки це може

Привести до неправильних висновків. Якщо до проведення експерименту допускається, що різниця

Порівнюваних параметрів може бути як позитивним, так і негативним.