Визначення статистичної значимості. Достовірність та статистична значимість

ДОСТАВНІСТЬ СТАТИСТИЧНА

- англ. credibility /validity, statistical; ньому. Validitat, statistische. Послідовність, об'єктивність та відсутність неясності у статистичному тесті або в к.-л. наборі вимірів. Д. с. може бути перевірена повторенням того ж тесту (або запитальника) по відношенню до того самого суб'єкта, щоб переконатися, чи будуть отримані такі ж результати; або порівнянням різних частинтесту, якими припускають виміряти той самий об'єкт.

Антіназі. Енциклопедія соціології, 2009

Дивитися що таке "ДОСТАВНІСТЬ СТАТИСТИЧНА" в інших словниках:

ДОСТАВНІСТЬ СТАТИСТИЧНА- англ. credibility /validity, statistical; ньому. Validitat, statistische. Послідовність, об'єктивність та відсутність неясності у статистичному тесті або в к. л. наборі вимірів. Д. с. може бути перевірена повторенням того ж тесту (або… … Тлумачний словникз соціології

У статистиці величину називають статистично значущою, якщо мала ймовірність її випадкового виникнення чи ще крайніх величин. Тут під крайністю розуміється рівень відхилення тестової статистики від нуль гіпотези. Різниця називається… … Вікіпедія

Фізичне явище статистичної стійкості у тому, що зі збільшенням величини вибірки частота випадкової подіїабо середнє значення фізичної величинипрагне деякого фіксованого числа. Феномен статистичної… … Вікіпедія

ДОСТАВНІСТЬ ВІДМІННОСТІ (подібності)- аналітико статистична процедура встановлення рівня значущості відмінностей або подібностей між вибірками за показниками, що вивчаються (змінними). Сучасний освітній процес: основні поняття та терміни

ЗВІТНІСТЬ, СТАТИСТИЧНА Великий бухгалтерський словник

ЗВІТНІСТЬ, СТАТИСТИЧНА- форма державного статистичного спостереження, при якій відповідні органи одержують від підприємств (організацій та установ) необхідні їм відомості у вигляді статутних у законному порядку звітних документів (статистичних звітів) за … Великий економічний словник

Наука, що займається вивченням прийомів систематичного спостереженнянад масовими явищами соціального життялюдини, складання чисельних їх описів та наукової обробкицих описів. Таким чином, теоретична статистика є наука. Енциклопедичний словникФ.А. Брокгауза та І.А. Єфрона

Коефіцієнт кореляції- (Correlation coefficient) Коефіцієнт кореляції це статистичний показникзалежності двох випадкових величинВизначення коефіцієнта кореляції, види коефіцієнтів кореляції, властивості коефіцієнта кореляції, обчислення та застосування. Енциклопедія інвестора

Статистика- (Statistics) Статистика це загальнотеоретична наука, що вивчає кількісні зміниу явищах та процесах. Державна статистика, служби статистики, Росстат (Держкомстат), статистичні дані, статистика запитів, статистика продажів, … Енциклопедія інвестора

Кореляція- (Correlation) Кореляція це статистичний взаємозв'язокдвох або кількох випадкових величин Поняття кореляції, види кореляції, коефіцієнт кореляції, кореляційний аналіз, кореляція цін, кореляція валютних пар на Форекс | Енциклопедія інвестора

Книги

Дослідження в математиці та математика в дослідженні: Методичний збірник з дослідницької діяльності учнів, Борзенко В.І. методичні розробки, застосовні у створенні дослідницької діяльностіучнів. Перша частина збірки присвячена застосуванню дослідницького підходув…

Рівень значимості у статистиці є важливим показником, Що відбиває ступінь впевненості в точності, істинності отриманих (прогнозованих) даних. Поняття широко застосовується в різних сферах: від проведення соціологічних досліджень, до статистичного тестування наукових гіпотез

Визначення

Рівень статистичної значущості (або статистично значущий результат) показує, якою є ймовірність випадкового виникнення досліджуваних показників. Загальна статистична значущість явища виражається коефіцієнтом р-value (p-рівень). У будь-якому експерименті чи спостереженні існує ймовірність, що отримані дані виникли через помилки вибірки. Особливо це актуально для соціології.

Тобто статистично значимої є величина, чия ймовірність випадкового виникнення вкрай мала чи прагне крайності. Крайністю у цьому контексті вважають ступінь відхилення статистики від нуль-гіпотези (гіпотези, яку перевіряють на узгодженість із отриманими вибірковими даними). У науковій практицірівень значущості вибирається перед збиранням даних і, як правило, його коефіцієнт становить 0,05 (5%). Для систем, де дуже важливі точні значення, цей показник може становити 0,01 (1%) та менше.

Історія питання

Поняття рівня значущості було введено британським статистиком та генетиком Рональдом Фішером у 1925 році, коли він розробляв методику перевірки статистичних гіпотез. При аналізі будь-якого процесу існує певна можливість тих чи інших явищ. Проблеми з'являються під час роботи з невеликими (чи очевидними) відсотками ймовірностей, які під поняття «похибка вимірів».

Працюючи зі статистичними даними, недостатньо конкретними, щоб їх перевірити, вчені стикалися з проблемою нульової гіпотези, яка «заважає» оперувати малими величинами. Фішер запропонував для таких систем визначити ймовірність подій у 5% (0,05) як зручний вибірковий зріз, що дозволяє відхилити нуль-гіпотезу при розрахунках.

Введення фіксованого коефіцієнта

У 1933 році вчені ЄжиНейман та Егон Пірсон у своїх роботах рекомендували заздалегідь (до збору даних) встановлювати певний рівень значущості. Приклади використання цих правил добре помітні під час проведення виборів. Припустимо, є два кандидати, один із яких дуже популярний, а другий – маловідомий. Очевидно, що перший кандидат вибори виграє, а шанси другого прагнуть нуля. Прагнуть - але не рівні: завжди є ймовірність форс-мажорних обставин, сенсаційної інформації, несподіваних рішень, які можуть змінити прогнозовані результати виборів.

Нейман і Пірсон погодилися, що запропонований Фішером рівень значущості 0,05 (який позначається символом α) найбільш зручний. Проте сам Фішер у 1956 році виступив проти фіксації цього значення. Він вважав, що рівень α має встановлюватись відповідно до конкретних обставин. Наприклад, у фізиці частинок він становить 0,01.

Значення p-рівня

Термін р-value вперше використаний у роботах Браунлі у 1960 році. P-рівень (p-значення) є показником, що знаходиться в зворотної залежностівід істинності результатів. Найвищий коефіцієнт р-value відповідає найменшому рівню довіри до проведеної вибірки залежності між змінними.

Це значення відображає ймовірність помилок, пов'язаних з інтерпретацією результатів. Припустимо, p-рівень = 0,05 (1/20). Він показує п'ятивідсоткову ймовірність того, що знайдений у вибірці зв'язок між змінними – лише випадкова особливість проведеної вибірки. Тобто, якщо ця залежність відсутня, то при багаторазових подібних експериментах в середньому в кожному двадцятому дослідженні можна очікувати таку ж або більшу залежністьміж змінними. Часто p-рівень розглядається як «допустима межа» рівня помилок.

До речі, р-value може не відображати реальну залежністьміж змінними, лише показує якесь середнє значення не більше припущень. Зокрема, остаточний аналіз даних також залежатиме від обраних значень даного коефіцієнта. При p-рівні = 0,05 будуть одні результати, а при коефіцієнті, що дорівнює 0,01, інші.

Перевірка статистичних гіпотез

Рівень статистичної значущості особливо важливий при перевірці гіпотез, що висуваються. Наприклад, при розрахунках двостороннього тесту область відторгнення поділяють порівну на обох кінцях вибіркового розподілу(щодо нульової координати) та вираховують істинність отриманих даних.

Припустимо, при моніторингу якогось процесу (яви) з'ясувалося, що нова статистична інформаціясвідчить про невеликі змінищодо попередніх значень. У цьому розбіжності у результатах малі, не очевидні, але важливі дослідження. Перед фахівцем постає дилема: зміни реально відбуваються, чи це помилки вибірки (неточність вимірів)?

У цьому випадку застосовують або відкидають нульову гіпотезу (списують все на похибку, або визнають зміну системи як факт, що відбувся). Процес розв'язання задачі базується на співвідношенні загальної статистичної значущості (р-value) та рівня значущості (α). Якщо р-рівень< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Використовувані значення

Рівень значущості залежить від аналізованого матеріалу. На практиці використовують такі фіксовані значення:

α = 0,1 (або 10%);
α = 0,05 (або 5%);
α = 0,01 (або 1%);
α = 0,001 (або 0,1%).

Чим більш точними потрібні розрахунки, тим менший коефіцієнт використовується. Природно, що статистичні прогнози у фізиці, хімії, фармацевтиці, генетиці потребують більшої точності, ніж у політології, соціології.

Пороги значимості у конкретних областях

У високоточних областях, таких як фізика частинок та виробнича діяльність, статистична значимість часто виражається як співвідношення середньоквадратичного відхилення (позначається коефіцієнтом сигма – σ) щодо нормального розподілуймовірностей (розподіл Гауса). σ – це статистичний показник, що визначає розсіювання значень певної величини щодо математичних очікувань. Використовується для складання графіків ймовірності подій.

Залежно від галузі знань, коефіцієнт σ сильно відрізняється. Наприклад, при прогнозуванні існування бозона Хіггса параметр дорівнює п'яти (σ=5), що відповідає значенню р-value=1/3,5 млн. При дослідженнях геномів рівень значущості може становити 5×10 -8 , що не є рідкістю для цієї області.

Ефективність

Необхідно враховувати, що коефіцієнти і р-value не є точними характеристиками. Яким би не був рівень значущості у статистиці досліджуваного явища, він не є безумовною основою для прийняття гіпотези. Наприклад, чим менше значенняα, тим більший шанс, що встановлювана гіпотеза є значущою. Проте існує ризик помилитися, що зменшує статистичну потужність (значущість) дослідження.

Дослідники, які зациклюються виключно на статистично значних результатівможуть отримати помилкові висновки. При цьому перевіряти ще раз їх роботу важко, тому що ними застосовуються припущення (якими фактично і є значення α і р-value). Тому рекомендується завжди, поряд із обчисленням статистичної значущості, визначати інший показник – величину статистичного ефекту. Величина ефекту – це кількісна міра сили ефекту.

ПЛАТНА ФУНКЦІЯ.Функція статистичної значимості доступна лише деяких тарифних планах. Перевірте, чи є вона в .

Можна дізнатися, чи є статистично значущі відмінності у відповідях, отриманих від різних групреспондентів на запитання в опитуванні. Для роботи з функцією статистичної значущості в SurveyMonkey необхідно:

Включити функцію статистичної значущості під час додавання правила порівняння до питання у Вашому опитуванні. Вибрати групи респондентів для порівняння, щоб відсортувати результати опитування груп для наочного порівняння.
Вивчити таблиці з даними щодо Вашого опитування, щоб виявити наявність статистично значних відмінностейу відповідях, одержаних від різних груп респондентів.

Перегляд статистичної значущості

Виконавши наведені нижче дії, Ви зможете створити опитування, що відображає статистичну значимість.

1. Додайте запитання закритого типу

Щоб відобразити статистичну значущість під час аналізу результатів, Вам знадобиться застосувати правило порівняння до будь-якого питання з Вашого опитування.

Застосувати правило порівняння та обчислити статистичну значимість у відповідях можна у тому випадку, якщо у схемі опитування Ви використовуєте одну з наступних типівпитань:

Необхідно переконатися, що запропоновані варіанти відповіді можна розділити на повноцінні групи. Варіанти відповіді, які Ви обираємо для порівняння при створенні правила порівняння, будуть використані для організації даних у перехресні таблиці в рамках всього опитування.

2. Зберіть відповіді

Після завершення складання опитування створіть колектор для розсилки. Існує кілька способів.

Вам необхідно отримати щонайменше 30 відповідей за кожним варіантом відповіді, який Ви плануєте використовувати у своєму правилі порівняння, щоб активувати та переглянути статистичну значущість.

Приклад опитування

Ви хочете дізнатися, чи задоволені чоловіки Вашою продукцією значно більше ніж жінки.

Додайте до опитування два питання з множинними варіантами відповіді:
Яка Ваша підлога? (Чоловіча Жіноча)
Чи задоволені Ви чи незадоволені нашим продуктом? (задоволений (-льону), незадоволений (-льону))
Переконайтеся, що не менше 30 респондентів вибрали варіант відповіді «чоловічий» на питання про поле, А ТАКОЖ не менше 30 респондентів як свою стать вибрали варіант «жіночий».
Додайте правило порівняння до питання "Яка Ваша підлога?" та виберіть обидва варіанти відповіді як Ваші групи.
Використовуйте таблицю даних нижче діаграми питання "Чи задоволені Ви чи незадоволені нашим продуктом?" , щоб дізнатися, чи показують якісь варіанти відповіді статистично значущу відмінність

Що таке статистично значуща відмінність?

Статистично значуща відмінність означає, що за допомогою статистичного аналізувстановлено наявність суттєвих відмінностей між відповідями однієї групи респондентів та відповідями іншої групи. Статистична значимість означає, що одержані цифри достовірно відрізняються. Такі знання значно допоможуть Вам при аналізі даних. Проте важливість одержаних результатів визначаєте Ви. Саме Ви вирішуєте, як тлумачити результати опитувань та які заходи слід вжити на їх основі.

Наприклад, ви отримуєте більше претензій від покупців жіночої статі, ніж від покупців-чоловіків. Як визначити, чи є така відмінність реальною і чи потрібно у зв'язку з цим вжити заходів? Одним із відмінних способів перевірити Ваші спостереження є проведення опитування, яке покаже Вам, чи справді Вашим товаром значно більшою мірою задоволені покупці-чоловіки. За допомогою статистичної формулиПропонована нами функція статистичної значущості надасть Вам можливість визначити, чи Ваш товар набагато більше подобається чоловікам, ніж жінкам. Це дозволить Вам вжити заходів, ґрунтуючись на фактах, а не на припущеннях.

Статистично значуща відмінність

Якщо отримані результати виділені в таблиці даних, це означає, що дві групи респондентів значно відрізняються один від одного. Термін «значно» означає, що отримані цифри мають якусь особливу важливість чи значення, лише те, що з-поміж них є статистична різниця.

Відсутність статистично значущої відмінності

Якщо отримані результати не виділені у відповідній таблиці даних, це означає, що, незважаючи на можливу різницю в двох порівнюваних цифрах, між ними немає статистичної різниці.

Відповіді без статистично значимих відмінностей демонструють, що між двома порівнюваними елементами немає значної різниці при об'ємі вибірки, що використовується Вами, проте це не обов'язково означає, що вони не мають значення. Можливо, збільшивши обсяг вибірки, Ви зможете виявити статистично значущу відмінність.

Обсяг вибірки

Якщо у Вас дуже малий обсяг вибірки, значними будуть лише дуже великі відмінностіміж двома групами Якщо у вас дуже великий обсяг вибірки, як невеликі, так і великі відмінності будуть враховані як значні.

Проте, якщо дві цифри є статистично різними, це не означає, що різниця між результатами має для Вас будь-яке практичне значення. Вам доведеться самим вирішити, які саме відмінності є важливими для Вашого опитування.

Обчислення статистичної значущості

Ми обчислюємо статистичну значущість, використовуючи стандартний рівень довіри 95%. Якщо варіант відповіді відображається як статистично значущий, це означає, що тільки завдяки випадковості або через помилку вибірки різниця між двома групами має місце з ймовірністю менше 5% (часто відображається у вигляді: p<0,05).

Для обчислення статистично значимих відмінностей між групами ми використовуємо такі формулы:

Параметр	Опис
a1	Частка учасників із першої групи, які відповіли на питання певним чином, помножена на обсяг вибірки цієї групи.
b1	Частка учасників із другої групи, які відповіли на питання певним чином, помножена на обсяг вибірки цієї групи.
Частка об'єднаної вибірки (p)	Сукупність двох часток з обох груп.
Стандартна помилка (SE)	Показник того, наскільки ваша частка відрізняється від дійсної частки. Найменше значення означає, що частка близька до дійсної частки, більше значення означає, що частка суттєво відрізняється від дійсної частки.
Тестовий статистичний показник (t)	Тестовий статистичний показник. Кількість значень стандартного відхилення, яке дане значення відрізняється від середнього значення.
Статистична значимість	Якщо абсолютна величина тестового статистичного показника перевищує 1,96 стандартних відхилень від середнього значення, це вважається статистично значущою відмінністю.

*1,96 є значенням, що застосовується для рівня довіри 95%, оскільки 95% діапазону, що обробляється функцією t-розподілу Стьюдента, лежить в межах 1,96 стандартного відхилення від середнього значення.

Приклад обчислень

Продовжуючи приклад, що використовується вище, давайте з'ясуємо, чи дійсно відсоток чоловіків, які заявляють про те, що вони задоволені Вашим товаром, значно вищий від відсотка жінок.

Допустимо, у Вашому опитуванні взяло участь 1000 чоловіків та 1000 жінок, і в результаті опитування виявилося, що 70% чоловіків та 65% жінок стверджують, що вони задоволені Вашим товаром. Чи є показник на рівні 70 % значно вищим за показник на рівні 65 %?

Підставте такі дані з опитування в запропоновані формули:

p1 (% чоловіків, задоволених продуктом) = 0,7
p2 (% жінок, задоволених продуктом) = 0,65
n1 (кількість опитаних чоловіків) = 1000
n2 (кількість опитаних жінок) = 1000

Оскільки абсолютна величина тестового статистичного показника більша ніж 1,96, це означає, що різниця між чоловіками та жінками є значною. У порівнянні з жінками чоловіки з більшою ймовірністю будуть задоволені Вашим продуктом.

Приховування статистичної значущості

Як приховати статистичну значущість для всіх питань

Натисніть стрілку вниз праворуч від правила порівняння на лівій бічній панелі.
Виберіть пункт Редагувати правило.
Вимкніть функцію Показати статистичну значимістьза допомогою перемикача.
Натисніть кнопку Застосувати.

Щоб приховати статистичну значимість одного питання, необходимо:

Натисніть кнопку Налаштуватинад діаграмою цього питання.
Відкрийте вкладку Параметри відображення.
Зніміть прапорець навпроти пункту Статистична значимість.
Натисніть кнопку Зберегти.

Параметр відображення автоматично активується, коли відображається статистична значимість. Якщо зняти прапорець цього параметра відображення, відображення статистичної значущості також буде вимкнено.

Увімкніть функцію статистичної значущості, додавши правила порівняння до питання у Вашому опитуванні. Вивчіть таблиці з даними щодо Вашого опитування, щоб виявити наявність статистично значимих відмінностей у відповідях, отриманих від різних груп респондентів.

Завдання 3.П'яти дошкільнятам пред'являють тест. Фіксується час вирішення кожного завдання. Чи знайдено статистично значущі відмінності між часом вирішення перших трьох завдань тесту?

№ випробуваних

Довідковий матеріал

Це завдання засноване на теорії дисперсійного аналізу. У загальному випадку, завданням дисперсійного аналізу є виявлення тих факторів, які істотно впливають на результат експерименту. Дисперсійний аналіз може застосовуватися для порівняння середніх кількох вибірок, якщо число вибірок більше двох. Для цієї мети є однофакторний дисперсійний аналіз.

З метою вирішення поставлених завдань приймається таке. Якщо дисперсії отриманих значень параметра оптимізації у разі впливу факторів відрізняються від дисперсій результатів у разі відсутності впливу факторів, такий фактор визнається значущим.

Як видно з формулювання завдання, тут використовуються методи перевірки статистичних гіпотез, а саме завдання перевірки двох емпіричних дисперсій. Отже, дисперсійний аналіз виходить з перевірки дисперсій за критерієм Фішера. У цьому завданні необхідно перевірити, чи є статистично значущими відмінності між часом вирішення перших трьох завдань тесту кожним із шести дошкільнят.

Нульовий (основний) називають висунуту гіпотезу H о. Сутність е зводиться до припущення, що різниця між порівнюваними параметрами дорівнює нулю (звідси і назва гіпотези - нульова) і що відмінності, що спостерігаються, мають випадковий характер.

Конкуруючою (альтернативною) називають гіпотезу H 1 яка суперечить нульовій.

Рішення:

Методом дисперсійного аналізу при рівні значущості α = 0,05 перевіримо нульову гіпотезу (H про) про існування статистично значущих відмінностей між часом вирішення перших трьох завдань тесту у шести дошкільнят.

Розглянемо таблицю умови завдання, у якій знайдемо середній час вирішення кожного із трьох завдань тесту

№ випробуваних	Рівні фактора
№ випробуваних	Час вирішення першого завдання тесту (сек.).	Час вирішення другого завдання тесту (сек.).	Час вирішення третього завдання тесту (сек.).






Групова середня

Знаходимо загальну середню:

Для того, щоб врахувати значущість тимчасових відмінностей кожного тесту, загальна вибіркова дисперсія розбивається на дві частини, перша з яких називається факторною, а друга залишковою.

Розрахуємо загальну суму квадратів відхилень варіант від загальної середньої за формулою

або , де р - Число вимірювань часу рішень завдань тесту, q - кількість піддослідних. Для цього складемо таблицю квадратів варіант

№ випробуваних	Рівні фактора
№ випробуваних	Час вирішення першого завдання тесту (сек.).	Час вирішення другого завдання тесту (сек.).	Час вирішення третього завдання тесту (сек.).

Статистична значимість результату (p-значення) є оціненою мірою впевненості у його «істинності» (у сенсі «репрезентативності вибірки»). Висловлюючись технічніше, p-значення - це показник, що знаходиться в спадній залежності від надійності результату. p align="justify"> Більш високе p-значення відповідає більш низькому рівню довіри до знайденої у вибірці залежності між змінними. Саме p-значення є ймовірністю помилки, пов'язаної з поширенням спостережуваного результату на всю популяцію. Наприклад, p-значення = 0.05 (тобто 1/20) показує, що є 5% ймовірність, що знайдена у вибірці зв'язок між змінними є лише випадковою особливістю даної вибірки. Іншими словами, якщо ця залежність у популяції відсутня, а ви багато разів проводили б подібні експерименти, то приблизно в одному з двадцяти повторень експерименту можна було б очікувати такої ж чи сильнішої залежності між змінними.

Багато дослідженнях p-значение=0.05 сприймається як «прийнятна межа» рівня помилки.

Не існує ніякого способу уникнути свавілля при ухваленні рішення про те, який рівень значущості слід вважати «значним». Вибір певного рівня значимості, вище якого результати відкидаються як хибні, досить довільним. Насправді остаточне рішення зазвичай залежить від цього, був результат передбачений апріорі (тобто. до проведення досвіду) чи виявлено апостеріорно внаслідок багатьох аналізів і порівнянь, виконаних з безліччю даних, і навіть на традиції, що у цій галузі досліджень. Зазвичай у багатьох областях результат p 0.05 є прийнятною межею статистичної значущості, проте слід пам'ятати, що цей рівень все ще включає ймовірність помилки (5%). Результати, значущі рівні p 0.01 зазвичай розглядаються як статистично значущі, а результати з рівнем p 0.005 чи p 0.001 як високо значущі. Однак слід розуміти, що дана класифікація рівнів значущості досить довільна і є лише неформальною угодою, прийнятою на основі практичного досвіду в тій чи іншій галузі дослідження.

Як було вже сказано, величина залежності та надійність становлять дві різні характеристики залежностей між змінними. Проте не можна сказати, що вони абсолютно незалежні. Говорячи загальною мовою, що більше величина залежності (зв'язку) між змінними у вибірці звичайного обсягу, то більше вона надійна.

Якщо припускати відсутність залежності між відповідними змінними в популяції, то найбільш ймовірно очікувати, що в досліджуваній вибірці зв'язок між цими змінними також не буде. Таким чином, чим сильніша залежність виявлена у вибірці, тим менш ймовірно, що цієї залежності немає в популяції, з якої вона вилучена.

Обсяг вибірки впливає значення залежності. Якщо спостережень мало, то є мало можливих комбінацій значень цих змінних і таким чином, ймовірність випадкового виявлення комбінації значень, що показують сильну залежність, відносно велика.

Як обчислюється рівень статистичної значимості. Припустимо, ви вже вирахували міру залежності між двома змінними (як пояснювалося вище). Наступне питання, яке стоїть перед вами: «наскільки важлива ця залежність?» Наприклад, чи є 40% поясненою дисперсією між двома змінними достатнім, щоб вважати залежність значущою? Відповідь: "залежно від обставин". Саме значимість залежить в основному від обсягу вибірки. Як уже пояснювалося, у дуже великих вибірках навіть дуже слабкі залежності між змінними будуть значущими, тоді як у малих вибірках навіть дуже сильні залежності не є надійними. Таким чином, щоб визначити рівень статистичної значущості, вам потрібна функція, яка представляла б залежність між «величиною» і «значимістю» залежності між змінними для кожного обсягу вибірки. Ця функція вказала б вам точно «наскільки можливо отримати залежність цієї величини (чи більше) у вибірці цього обсягу, у припущенні, що у популяції такої залежності немає». Іншими словами, ця функція давала б рівень значущості (p-значення), і, отже, можливість помилково відхилити припущення про відсутність цієї залежності у популяції. Ця «альтернативна» гіпотеза (що полягає в тому, що немає залежності в популяції) зазвичай називається нульовою гіпотезою. Було б ідеально, якби функція, яка обчислює ймовірність помилки, була лінійною і мала лише різні нахили для різних обсягів вибірки. На жаль, ця функція значно складніша і не завжди точно одна і та ж. Проте, здебільшого її форма відома, і її можна використовувати визначення рівнів значимості щодо вибірок заданого розміру. Більшість цих функцій пов'язані з дуже важливим класом розподілів, званим нормальним.