Середнє квадратичне чи квадратичне відхилення. Середнє лінійне відхилення

При статистичній перевірці гіпотез, при вимірі лінійного взаємозв'язку між випадковими величинами.

Середньоквадратичне відхилення:

Стандартне відхилення(Оцінка середньоквадратичного відхилення випадкової величини Підлога, стіни навколо нас і стеля, xщодо її математичного очікування на основі незміщеної оцінки її дисперсії):

де - дисперсія; - Підлога, стіни навколо нас і стеля, i-й елемент вибірки; - Обсяг вибірки; - середнє арифметичне вибірки:

Слід зазначити, що обидві оцінки є зміщеними. Загалом незміщену оцінку побудувати неможливо. Однак оцінка на основі оцінки незміщеної дисперсії є заможною.

Правило трьох сигм

Правило трьох сигм() - Практично всі значення нормально розподіленої випадкової величини лежать в інтервалі. Більш строго - не менше ніж з 99,7% достовірністю значення нормально розподіленої випадкової величини лежить у зазначеному інтервалі (за умови, що величина істинна, а не отримана в результаті обробки вибірки).

Якщо ж справжня величина невідома, слід користуватися не , а Підлога, стіни навколо нас і стеля, s. Таким чином, правило трьох сигм перетворюється в правило трьох Підлога, стіни навколо нас і стеля, s .

Інтерпретація величини середньоквадратичного відхилення

Велике значення середньоквадратичного відхилення показує великий розкид значень у представленій множині із середньою величиною множини; Маленьке значення, відповідно, показує, що значення у множині згруповані навколо середнього значення.

Наприклад, у нас є три числові множини: (0, 0, 14, 14), (0, 6, 8, 14) і (6, 6, 8, 8). У всіх трьох множин середні значення дорівнюють 7, а середньоквадратичні відхилення, відповідно, дорівнюють 7, 5 і 1. У останньої множини середньоквадратичне відхилення маленьке, тому що значення у множині згруповані навколо середнього значення; у першої множини найбільше значення середньоквадратичного відхилення - значення всередині множини сильно розходяться із середнім значенням.

Загалом середньоквадратичне відхилення вважатимуться мірою невизначеності. Наприклад, у фізиці середньоквадратичне відхилення використовується визначення похибки серії послідовних вимірів будь-якої величини. Це значення дуже важливо для визначення правдоподібності досліджуваного явища в порівнянні з передбаченим теорією значенням: якщо середнє значення вимірювань сильно відрізняється від передбачених теорією значень (велике значення середньоквадратичного відхилення), то отримані значення або метод їх отримання слід перевіряти ще раз.

Практичне застосування

На практиці середньоквадратичне відхилення дозволяє визначити, наскільки значення у множині можуть відрізнятися від середнього значення.

Клімат

Припустимо, існують два міста з однаковою максимальною середньою денною температурою, але одне розташоване на узбережжі, а інше всередині континенту. Відомо, що в містах, розташованих на узбережжі, безліч різних максимальних денних температур менше, ніж у міст, розташованих усередині континенту. Тому середньоквадратичне відхилення максимальних денних температур у прибережного міста буде менше, ніж у другого міста, незважаючи на те, що середнє значення цієї величини у них однакове, що на практиці означає, що ймовірність того, що максимальна температура повітря кожного конкретного дня в році буде сильнішою. відрізнятиметься від середнього значення, вище у міста, розташованого всередині континенту.

Спорт

Припустимо, що є кілька футбольних команд, які оцінюються за деяким набором параметрів, наприклад, кількістю забитих і пропущених голів, гольових моментів і т.п. Чим менше у команди середньоквадратичне відхилення по кожному з представлених параметрів, тим більш передбачуваним є результат команди, такі команди є збалансованими. З іншого боку, у команди з великим значенням середньоквадратичного відхилення складно передбачити результат, що пояснюється дисбалансом, наприклад, сильним захистом, але слабким нападом.

Використання середньоквадратичного відхилення параметрів команди дозволяє в тій чи іншій мірі передбачити результат матчу двох команд, оцінюючи сильні та слабкі сторони команд, а отже, і способів боротьби, що вибираються.

Технічний аналіз

Див. також

Література

* Боровиків, Ст. STATISTICA. Мистецтво аналізу даних на комп'ютері: Для професіоналів/В. Боровиков. - СПб. : Пітер, 2003. – 688 с. - ISBN 5-272-00078-1.

У цій статті я розповім про те, як знайти середньоквадратичне відхилення. Цей матеріал вкрай важливий для повноцінного розуміння математики, тому репетитор з математики повинен присвятити його вивченню окремого уроку або навіть кількох. У цій статті ви знайдете посилання на докладний і зрозумілий відеоурок, в якому розказано про те, що таке відхилення середньоквадратичне і як його знайти.

Середньоквадратичне відхиленнядає можливість оцінити розкид значень, отриманих у результаті виміру якогось параметра. Позначається символом (грецька буква "сигма").

Формула до розрахунку досить проста. Щоб знайти середньоквадратичне відхилення, потрібно взяти квадратне коріння з дисперсії. Тож тепер ви повинні запитати: "А що ж таке дисперсія?"

Що таке дисперсія

Визначення дисперсії звучить так. Дисперсія це середнє арифметичне від квадратів відхилень значень від середнього.

Щоб знайти дисперсію, послідовно проведіть такі обчислення:

  • Визначте середнє (просте середнє арифметичне ряду значень).
  • Потім від кожного зі значень відніміть середнє і зведіть отриману різницю в квадрат (отримали квадрат різниці).
  • Наступним кроком буде обчислення середнього арифметичного отриманих квадратів різниць (чому саме квадратів ви зможете дізнатися нижче).

Розглянемо з прикладу. Допустимо, ви з друзями вирішили виміряти зростання ваших собак (у міліметрах). В результаті вимірів ви отримали такі дані вимірювань росту (в загривку): 600 мм, 470 мм, 170 мм, 430 мм і 300 мм.

Обчислимо середнє значення, дисперсію та середньоквадратичне відхилення.

Спочатку знайдемо середнє значення. Як ви вже знаєте, для цього потрібно скласти всі виміряні значення та поділити на кількість вимірів. Хід обчислень:

Середня мм.

Отже, середня (середньоарифметична) становить 394 мм.

Тепер потрібно визначити відхилення зростання кожного з собак від середнього:

Зрештою, щоб обчислити дисперсію, кожну з отриманих різниць зводимо в квадрат, а потім знаходимо середнє арифметичне від отриманих результатів:

Дисперсія мм 2 .

Таким чином, дисперсія становить 21 704 мм 2 .

Як знайти середньоквадратичне відхилення

То як же тепер вирахувати середньоквадратичне відхилення, знаючи дисперсію? Як ми пам'ятаємо, взяти із неї квадратний корінь. Тобто середньоквадратичне відхилення одно:

Мм (округлено до найближчого цілого значення мм).

Застосувавши цей метод, ми з'ясували, деякі собаки (наприклад, ротвейлери) – дуже великі собаки. Але є й дуже маленькі собаки (наприклад, такси, тільки казати їм цього не варто).

Найцікавіше, що середньоквадратичне відхилення несе корисну інформацію. Тепер ми можемо показати, які з отриманих результатів вимірювання зростання знаходяться в межах інтервалу, який ми отримаємо, якщо відкладемо від середнього (в обидва боки від нього) середньоквадратичне відхилення.

Тобто за допомогою середньоквадратичного відхилення ми отримуємо "стандартний" метод, який дозволяє дізнатися, яке із значень є нормальним (середньостатистичним), а яке екстраординарно більшим або, навпаки, малим.

Що таке стандартне відхилення

Але… все буде трохи інакше, якщо ми аналізуватимемо вибіркуданих. У нашому прикладі ми розглядали генеральну сукупність.Тобто наші 5 собак були єдиними у світі собаками, які нас цікавили.

Але якщо дані є вибіркою (значеннями, які обрали із великої генеральної сукупності), тоді обчислення потрібно вести інакше.

Якщо є значень, то:

Решта розрахунків проводяться аналогічно, зокрема і визначення середнього.

Наприклад, якщо наших п'ять собак – лише вибірка з генеральної сукупності собак (всіх собак на планеті), ми маємо ділити на 4, а не на 5,а саме:

Дисперсія вибірки = мм 2 .

При цьому стандартне відхилення щодо вибірки дорівнює мм (округлено до найближчого цілого значення).

Можна сказати, що ми зробили деяку “корекцію” у випадку, коли наші значення є лише невеликою вибіркою.

Примітка. Чому саме квадрати різниць?

Але чому при обчисленні дисперсії ми беремо квадрати різниць? Допустимо при вимірі якогось параметра, ви отримали наступний набір значень: 4; 4; -4; -4. Якщо ми просто складемо абсолютні відхилення від середнього (різниці) між собою... негативні значення взаємно знищаться із позитивними:

.

Виходить, цей варіант марний. Тоді, можливо, варто спробувати абсолютні значення відхилень (тобто модулі цих значень)?

На перший погляд виходить непогано (отримана величина, до речі, називається середнім абсолютним відхиленням), але не у всіх випадках. Спробуємо інший приклад. Нехай у результаті виміру вийшов наступний набір значень: 7; 1; -6; -2. Тоді середнє абсолютне відхилення одно:

Ось це так! Знов отримали результат 4, хоча різниці мають набагато більший розкид.

А тепер подивимося, що вийде, якщо звести різниці у квадрат (і взяти потім квадратний корінь із їхньої суми).

Для першого прикладу вийде:

.

Для другого прикладу вийде:

Тепер – зовсім інша річ! Середньоквадратичне відхилення виходить тим більшим, чим більший розкид мають різниці ... чого ми і прагнули.

Фактично в цьому методі використана та сама ідея, що і при обчисленні відстані між точками, тільки застосована іншим способом.

І з математичної точки зору використання квадратів і квадратних коренів дає більше користі, ніж ми могли б отримати на підставі абсолютних значень відхилень, завдяки чому середньоквадратичне відхилення застосовується і для інших математичних завдань.

Про те, як знайти середньоквадратичне відхилення, вам розповів , Сергій Валерійович

Дисперсія. Середнє квадратичне відхилення

Дисперсія- це середня арифметична квадратів відхилень кожного значення ознаки від загальної середньої. Залежно від вихідних даних дисперсія може бути незваженою (простою) або зваженою.

Дисперсія розраховується за такими формулами:

· Для несгрупованих даних

· Для згрупованих даних

Порядок розрахунку дисперсії зважену:

1. визначають середню арифметичну зважену

2. визначаються відхилення варіант від середньої

3. зводять у квадрат відхилення кожної варіанти від середньої

4. множать квадрати відхилень на ваги (частоти)

5. підсумовують отримані твори

6. отриману суму ділять на суму ваг

Формула для визначення дисперсії може бути перетворена на таку формулу:

- проста

Порядок розрахунку дисперсії простий:

1. визначають середню арифметичну

2. зводять у квадрат середню арифметичну

3. зводять у квадрат кожну варіанту ряду

4. знаходимо суму квадратів варіант

5. ділять суму квадратів варіант з їхньої число, тобто. визначають середній квадрат

6. визначають різницю між середнім квадратом ознаки та квадратом середньої

Також формула для визначення зваженої дисперсії може бути перетворена в наступну формулу:

тобто. дисперсія дорівнює різниці середньої з квадратів значень ознаки та квадрата середньої арифметичної. При користуванні перетвореною формулою виключається додаткова процедура з розрахунку відхилень індивідуальних значень ознаки від х та виключається помилка у розрахунку, пов'язана із округленням відхилень

Дисперсія має ряд властивостей, деякі з них дозволяють спростити її обчислення:

1) дисперсія постійної величини дорівнює нулю;

2) якщо всі варіанти значень ознаки зменшити на те саме число, то дисперсія не зменшиться;

3) якщо всі варіанти значень ознаки зменшити в те саме число раз (раз), то дисперсія зменшиться в раз

Середнє квадратичне відхилення S- являє собою квадратний корінь з дисперсії:

· Для несгрупованих даних:

;

· Для варіаційного ряду:

Розмах варіації, середнє лінійне та середнє квадратичне відхилення є іменованими величинами. Вони мають самі одиниці виміру, як і індивідуальні значення ознаки.

Дисперсія та середнє квадратичне відхилення найбільш широко застосовуваних показників варіації. Пояснюється це тим, що вони входять до більшості теорем теорії ймовірності, яка є фундаментом математичної статистики. Крім того, дисперсія може бути розкладена на складові елементи, що дозволяють оцінити вплив різних факторів, що зумовлюють варіацію ознаки.

Розрахунок показників варіації для банків, згрупованих за розміром прибутку, показано у таблиці.

Розмір прибутку, млн. руб. Число банків розрахункові показники
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Разом: 121,70 17,640 23,126

Середнє лінійне та середнє квадратичне відхилення показують на скільки в середньому коливається величина ознаки у одиниць та досліджуваної сукупності. Так, у разі середня величина коливання розміру прибутку становить: по середньому лінійному відхилення 0,882 млн. крб.; за середнім квадратичним відхиленням - 1,075 млн. руб. Середнє квадратичне відхилення завжди більше середнього лінійного відхилення. Якщо розподіл ознаки, близький до нормального, між S і d існує взаємозв'язок: S=1,25d, або d=0,8S. Середнє квадратичне відхилення показує, як розташована основна маса одиниць сукупності щодо середньої арифметичної. Незалежно від форми розподілу 75 значень ознаки потрапляють в інтервал х 2S, а принаймні 89 всіх значень потрапляють в інтервал х 3S (теорема П.Л.Чебишева).

Х i -випадкові (поточні) величини;

середнє значення випадкових величин за вибіркою, розраховується за такою формулою:

Отже, дисперсія – це середній квадрат відхилень . Тобто спочатку розраховується середнє значення, потім береться різниця між кожним вихідним та середнім значенням, зводиться у квадрат , Складається і потім ділиться на кількість значень в даній сукупності.

Різниця між окремим значенням та середньою відображає міру відхилення. У квадрат зводиться для того, щоб усі відхилення стали виключно позитивними числами і щоб уникнути взаємознищення позитивних та негативних відхилень при їхньому сумуванні. Потім, маючи квадрати відхилень, ми просто розраховуємо середню арифметичну.

Розгадка магічного слова «дисперсія» полягає у цих трьох словах: середній – квадрат – відхилень.

Середнє квадратичне відхилення (СКО)

Витягуючи з дисперсії квадратний корінь, отримуємо так зване « середньоквадратичне відхилення".Зустрічаються назви "стандартне відхилення" або "сигма" (від назви грецької літери σ .). Формула середнього квадратичного відхилення має вигляд:

Отже, дисперсія – це сигма у квадраті, або – середнє квадратичне відхилення у квадраті.

Середньоквадратичне відхилення, очевидно, також характеризує міру розсіювання даних, але тепер (на відміну дисперсії) його можна порівнювати з вихідними даними, так як одиниці виміру у них однакові (це випливає з формули розрахунку). Розмах варіації – це різниця між крайніми значеннями. Середньоквадратичне відхилення як міра невизначеності також бере участь у багатьох статистичних розрахунках. З її допомогою встановлюють ступінь точності різних оцінок та прогнозів. Якщо варіація дуже велика, то стандартне відхилення теж вийде великим, отже, і прогноз буде неточним, що висловиться, наприклад, у дуже широких інтервалах довірчих.

Тому в методах статистичної обробки даних в оцінках об'єктів нерухомості залежно від необхідної точності поставленого завдання використовують правило двох або трьох сигм.

Для порівняння правила двох сигм та правила трьох сигм використовуємо формулу Лапласа:

Ф - Ф ,

де Ф(x) – функція Лапласа;



Мінімальне значення

β = максимальне значення

s = значення сигми (середнє квадратичне відхилення)

a = середнє значення

У цьому випадку використовується приватний вид формули Лапласа, коли межі α і β значень випадкової величини X одно відстоять від центру розподілу a = M(X) на деяку величину d: a = a-d, b = a+d. Або (1) Формула (1) визначає можливість заданого відхилення d випадкової величини X з нормальним законом розподілу від її математичного очікування М(X) = a. Якщо у формулі (1) прийняти послідовно d = 2s та d = 3s, то отримаємо: (2), (3).

Правило двох сигм

Майже достовірно (з довірчою ймовірністю 0,954) можна стверджувати, що всі значення випадкової величини X з нормальним законом розподілу відхиляються від її математичного очікування M(X) = a на величину невелику 2s (двох середніх квадратичних відхилень). Довірчою ймовірністю (Pд) називають ймовірність подій, що умовно приймаються за достовірні (їх ймовірність близька до 1).

Проілюструємо правило двох сигм геометрично. На рис. 6 зображена крива Гауса з центром розподілу а. Площа, обмежена всією кривою та віссю Оx, дорівнює 1 (100%), а площа криволінійної трапеції між абсцисами а–2s та а+2s, згідно з правилом двох сигм, дорівнює 0,954 (95,4% від усієї площі). Площа заштрихованих ділянок дорівнює 1-0,954 = 0,046 (5% від всієї площі). Ці ділянки називають критичною областю значень випадкової величини. Значення випадкової величини, які у критичну область, малоймовірні і практично умовно приймаються за неможливі.

Імовірність умовно неможливих значень називають рівнем важливості випадкової величини. Рівень значущості пов'язаний із довірчою ймовірністю формулою:

де q – рівень значимості, виражений у відсотках.

Правило трьох сигм

При вирішенні питань, що вимагають більшої надійності, коли довірчу ймовірність (Pд) приймають рівною 0,997 (точніше - 0,9973), замість правила двох сигм, згідно з формулою (3), використовують правило трьох сигм.



Згідно правилу трьох сигмпри довірчій ймовірності 0,9973 критичною областю буде область значень ознаки поза інтервалом (а-3s, а+3s). Рівень значущості складає 0,27%.

Інакше кажучи, ймовірність те, що абсолютна величина відхилення перевищить потрійне середнє квадратичне відхилення, дуже мала, саме дорівнює 0,0027=1-0,9973. Це означає, що лише 0,27% випадків може статися. Такі події, з принципу неможливості малоймовірних подій, вважатимуться практично неможливими. Тобто. Вибірка високоточна.

У цьому полягає сутність правила трьох сигм:

Якщо випадкова величина розподілена нормально, то абсолютна величина її відхилення від математичного очікування вбирається у потрійного середнього квадратичного відхилення (СКО).

На практиці правило трьох сигм застосовують так: якщо розподіл досліджуваної випадкової величини невідомий, але умова, зазначена в наведеному правилі, виконується, тобто підстава припускати, що досліджувана величина розподілена нормально; в іншому випадку вона не розподілена нормально.

Рівень значимості приймають залежно від дозволеного ступеня ризику та поставленого завдання. Для оцінки нерухомості зазвичай приймається менш точна вибірка, дотримуючись правила двох сигм.

Заняття №4

Тема: «Описова статистика. Показники різноманітності ознаки у сукупності»

Основними критеріями різноманітності ознаки у статистичній сукупності є: ліміт, амплітуда, середнє квадратичне відхилення, коефіцієнт осциляції та коефіцієнт варіації. На попередньому занятті обговорювалося, що середні величини дають лише узагальнюючу характеристику ознаки, що вивчається, в сукупності і не враховують значення окремих його варіант: мінімальне і максимальне значення, вище середнього, нижче середнього і т.д.

приклад. Середні величини двох різних числових послідовностей: -100; -20; 100; 20 та 0,1; -0,2; 0,1 абсолютно однакові та рівніО.Однак діапазони розкиду даних цих послідовностей відносного середнього значення дуже різні.

Визначення перелічених критеріїв розмаїття ознаки передусім здійснюється з урахуванням його значення окремих елементів статистичної сукупності.

Показники виміру варіації ознаки бувають абсолютніі відносні. До абсолютних показників варіації відносять: розмах варіації, ліміт, середнє відхилення, дисперсію. Коефіцієнт варіації та коефіцієнт осциляції відносяться до відносних показників варіації.

Ліміт (lim) -це критерій, який визначається крайніми значеннями варіант у варіаційному ряду. Іншими словами, даний критерій обмежується мінімальною та максимальною величинами ознаки:

Амплітуда (Am)або розмах варіації –це різниця крайніх варіантів. Розрахунок даного критерію здійснюється шляхом віднімання з максимального значення ознаки його мінімального значення, що дозволяє оцінити ступінь розкиду варіант:

Недоліком ліміту та амплітуди як критеріїв варіабельності є те, що вони повністю залежать від крайніх значень ознаки варіаційного ряду. У цьому не враховуються коливання значень ознаки всередині ряду.

Найбільш повну характеристику різноманітності ознаки у статистичній сукупності дає середнє квадратичне відхилення(сигма), яке є загальним заходом відхилення варіант від своєї середньої величини. Середнє квадратичне відхилення часто називають також стандартним відхиленням.

У основі середнього квадратичного відхилення лежить зіставлення кожної варіанти із середньої арифметичної цієї сукупності. Оскільки в сукупності завжди будуть варіанти як менше, і більше, ніж вона, то сума відхилень , мають знак " " , погашатиметься сумою відхилень, мають знак " " , тобто. сума всіх відхилень дорівнює нулю. А, щоб уникнути впливу символів різниць беруть відхилення варіант від середнього арифметичного у квадраті, тобто. . Сума квадратів відхилень не дорівнює нулю. Щоб отримати коефіцієнт, здатний виміряти мінливість, беруть середнє від суми квадратів – це величина називається дисперсії:

За змістом дисперсія – це середній квадрат відхилень індивідуальних значень ознаки від його середньої величини. Дисперсія квадрат середнього квадратичного відхилення.

Дисперсія є розмірною величиною (іменованою). Так, якщо варіанти числового ряду виражені в метрах, дисперсія дає квадратні метри; якщо варіанти виражені у кілограмах, то дисперсія дає квадрат цього заходу (кг 2), і т.д.

Середнє квадратичне відхилення- Квадратний корінь з дисперсії:

, то при розрахунку дисперсії та середнього квадратичного відхилення у знаменнику дробу замістьнеобхідно ставити.

Розрахунок середнього квадратичного відхилення можна розбити на шість етапів, які необхідно здійснити у певній послідовності:

Застосування середньоквадратичного відхилення:

а) для судження про коливання варіаційних рядів та порівняльної оцінки типовості (представницькості) середніх арифметичних величин. Це необхідно в диференціальній діагностиці щодо стійкості ознак.

б) на реконструкцію варіаційного ряду, тобто. відновлення його частотної характеристики на основі правила «трьох сигм». В інтервалі (М±3σ) знаходиться 99,7% всіх варіантів ряду, в інтервалі (М±2σ) - 95,5% та в інтервалі (М±1σ) - 68,3% варіант ряду(Рис.1).

в) для виявлення «вискакуючих» варіант

г) для визначення параметрів норми та патології за допомогою сигмальних оцінок

д) для розрахунку коефіцієнта варіації

е) до розрахунку середньої помилки середньої арифметичної величини.

Для характеристики будь-якої генеральної сукупності, що маєнормальний тип розподілу , достатньо знати два параметри: середню арифметичну та середнє квадратичне відхилення.

Малюнок 1. Правило «трьох сигм»

приклад.

У педіатрії середньоквадратичне відхилення використовують для оцінки фізичного розвитку дітей шляхом порівняння даних конкретної дитини з відповідними стандартними показниками. За стандарт беруться середні арифметичні показники фізичного розвитку здорових дітей. Порівняння показників зі стандартами проводять за спеціальними таблицями, в яких стандарти наводяться разом із відповідними їм сигмальними шкалами. Вважається, що якщо показник фізичного розвитку дитини знаходиться в межах стандарту (середнє арифметичне) ±σ, то фізичний розвиток дитини (за цим показником) відповідає нормі. Якщо показник знаходиться в межах стандарту ±2σ, то є незначне відхилення від норми. Якщо показник виходить за ці межі, то фізичний розвиток дитини різко відрізняється від норми (можлива патологія).

Крім показників варіації, що у абсолютних величинах, у статистичному дослідженні використовуються показники варіації, виражені у відносних величинах. Коефіцієнт осциляції -це відношення розмаху варіації до середньої величини ознаки. Коефіцієнт варіації -це відношення середнього квадратичного відхилення до середньої величини ознаки. Як правило, ці величини виражаються у відсотках.

Формули розрахунку відносних показників варіації:

З наведених формул видно, що чим більший коефіцієнт V наближений до нуля, тим менша варіація значень ознаки. Чим більше V, тим паче мінливий ознака.

У статистичній практиці найчастіше застосовується коефіцієнт варіації. Він використовується як для порівняльної оцінки варіації, але й характеристики однорідності сукупності. Сукупність вважається однорідною, якщо коефіцієнт варіації вбирається у 33% (для розподілів, близьких до нормального). Арифметично ставлення і середньої арифметичної нівелює вплив абсолютної величини цих характеристик, а відсоткове співвідношення робить коефіцієнт варіації величиною безрозмірною (неіменованою).

Отримане значення коефіцієнта варіації оцінюється відповідно до орієнтовних градацій ступеня різноманітності ознаки:

Слабке - до 10%

Середнє - 10 - 20%

Сильне – понад 20 %

Використання коефіцієнта варіації є доцільним у випадках, коли доводиться порівнювати ознаки різні за своєю величиною та розмірністю.

Відмінність коефіцієнта варіації з інших критеріїв розкиду наочно демонструє приклад.

Таблиця 1

Склад працівників промислового підприємства

З наведених у прикладі статистичних показників можна дійти невтішного висновку щодо відносної однорідності вікового складу та освітнього рівня працівників підприємства за низької професійної стійкості обстеженого контингенту. Неважко помітити, що спроба судити про ці соціальні тенденції за середнім квадратичним відхиленням призвела б до помилкового висновку, а спроба порівняння облікових ознак «стаж роботи» та «вік» з обліковою ознакою «освіта» взагалі була б некоректною через різнорідність цих ознак.

Медіана та перцентілі

Для порядкових (рангових) розподілів, де критерієм середини ряду є медіана, середньоквадратичне відхилення та дисперсія не можуть бути характеристиками розсіювання варіант.

Те саме властиво і для відкритих варіаційних рядів. Зазначена обставина пов'язана з тим, що відхилення, за якими обчислюються дисперсія та σ, відраховуються від середнього арифметичного, яке не обчислюється у відкритих варіаційних рядах та у рядах розподілів якісних ознак. Тому для стисненого опису розподілів використовується інший параметр розкиду – квантиль(синонім - «nерцентиль»), придатний для опису якісних та кількісних ознак за будь-якої форми їх розподілу. Цей параметр може використовуватися і для переведення кількісних ознак у якісні. І тут такі оцінки присвоюються залежно від цього, якому порядку квантилю відповідає та чи інша конкретна варіанта.

У практиці медико-біологічних досліджень найчастіше використовуються такі кванти:

- Медіана;

, – квартили (чверті), де – нижній квартиль, верхній квартиль.

Квантилі ділять область можливих змін варіантів у варіаційному ряду на певні інтервали. Медіана (квантиль) - це варіанта, яка знаходиться в середині варіаційного ряду і ділить цей ряд навпіл, на дві рівні частини ( 0,5 і 0,5 ). Квартиль ділить ряд на чотири частини: перша частина (нижній квартиль) - це варіанти, що відокремлює варіанти, числові значення яких не перевищують 25% максимально можливого в даному ряду, квартиль відокремлює варіанти з числовим значенням до 50% максимально можливого. Верхній квартиль () відокремлює варіанти завбільшки до 75% від максимально можливих значень.

У разі асиметричності розподілу змінної щодо середнього арифметичного для його характеристики використовуються медіана та квартилі.І тут використовується наступна форма відображення середньої величини – Ме (;). Наприклад, Досліджуваний ознака – «термін, у якому дитина почав самостійно ходити» - у досліджуваній групі має асиметричний розподіл. При цьому нижньому квартилю () відповідає термін початку ходьби – 9,5 місяців, медіані – 11 місяців, верхньому квартилю () – 12 місяців. Відповідно, характеристика середньої тенденції зазначеної ознаки буде представлена ​​як 11 (9,5; 12) місяців.

Оцінка статистичної значущості результатів дослідження

Під статистичної значимістю даних розуміють ступінь відповідності відображуваної дійсності, тобто. статистично значимими даними вважаються ті, які спотворюють і правильно відбивають об'єктивну реальність.

Оцінити статистичну значимість результатів дослідження – означає визначити, з якою ймовірністю можна перенести результати, отримані на вибірковій сукупності, всю генеральну сукупність. Оцінка статистичної значущості необхідна розуміння того, наскільки щодо явища можна будувати висновки про явище загалом і його закономірностях.

Оцінка статистичної значущості результатів дослідження складається з:

1. помилок репрезентативності (помилок середніх та відносних величин) - m;

2. довірчих меж середніх чи відносних величин;

3. достовірності різниці середніх чи відносних величин за критерієм t.

Стандартна помилка середньої арифметичноїабо помилка репрезентативностіхарактеризує коливання середньої. При цьому необхідно відзначити, що чим більший обсяг вибірки, тим менше розкид середніх величин. Стандартна помилка середнього обчислюється за такою формулою:

У сучасній науковій літературі середня арифметична записується разом із помилкою репрезентативності:

або разом із середньоквадратичним відхиленням:

Як приклад розглянемо дані щодо 1500 міських поліклінік країни (генеральна сукупність). Середня кількість пацієнтів, які обслуговуються в поліклініці, дорівнює 18150 осіб. Випадковий відбір 10% об'єктів (150 поліклінік) дає середню кількість пацієнтів, що дорівнює 20051 чоловік. Помилка вибірки, очевидно пов'язана з тим, що не всі 1500 поліклінік потрапили у вибірку, дорівнює різниці між цими середніми – генеральним середнім ( Mген) та вибірковим середнім ( Мвиб). Якщо сформувати іншу вибірку того самого обсягу з нашої генеральної сукупності, то вона дасть іншу величину помилки. Всі ці вибіркові середні за досить великих вибірках розподілені нормально навколо генеральної середньої за досить великої кількості повторень вибірки однієї й тієї кількості об'єктів з генеральної сукупності. Стандартна помилка середнього m- це неминучий розкид вибіркових середніх довкола генеральної середньої.

У разі коли результати дослідження представлені відносними величинами (наприклад, відсотковими частками) – розраховується стандартна помилка частки:

де P – показник %, n – кількість спостережень.

Результат відображається у вигляді (P±m)%. Наприклад,відсоток одужання серед хворих становив (95,2±2,5)%.

У тому випадку, якщо кількість елементів сукупності, то при розрахунку стандартних помилок середнього та частки у знаменнику дробу замістьнеобхідно ставити.

Для нормального розподілу (розподіл вибіркових середніх є нормальним) відомо, яка частина сукупності потрапляє у будь-який інтервал навколо середнього значення. Зокрема:

Насправді проблема полягає в тому, що характеристики генеральної сукупності нам невідомі, а вибірка робиться саме з метою їх оцінки. Це означає, що якщо ми робитимемо вибірки одного і того ж обсягу nіз генеральної сукупності, то в 68,3% випадків на інтервалі буде знаходитись значення M(воно ж у 95,5% випадків перебуватиме на інтервалі та у 99,7% випадків – на інтервалі).

Оскільки реально робиться лише одна вибірка, то формулюється це твердження у термінах ймовірності: з ймовірністю 68,3% середнє значення ознаки у генеральній сукупності укладено в інтервалі, з ймовірністю 95,5% - в інтервалі та ін.

На практиці навколо вибіркового значення будується такий інтервал, який із заданою (досить високою) ймовірністю – довірчою ймовірністю –«накривав» справжнє значення цього параметра в генеральній сукупності. Цей інтервал називається довірчим інтервалом.

Довірча ймовірністьP це ступінь упевненості в тому, що довірчий інтервал справді міститиме справжнє (невідоме) значення параметра в генеральній сукупності.

Наприклад, якщо довірча ймовірність Рдорівнює 90%, це означає, що 90 вибірок зі 100 дадуть правильну оцінку параметра в генеральній сукупності. Відповідно, можливість помилки, тобто. неправильної оцінки генерального середнього за вибіркою, що дорівнює у відсотках: . Для цього це означає, що 10 вибірок зі 100 дадуть неправильну оцінку.

Очевидно, що ступінь впевненості (довірча ймовірність) залежить від величини інтервалу: чим ширший інтервал, тим вища впевненість, що до нього потрапить невідоме значення для генеральної сукупності. Насправді для побудови довірчого інтервалу береться, як мінімум, подвоєна помилка вибірки, щоб забезпечити впевненість щонайменше 95,5%.

Визначення довірчих меж середніх і відносних величин дозволяє знайти два їх крайніх значення - мінімально можливе і максимально можливе, в межах яких показник може зустрічатися у всій генеральній сукупності. Виходячи з цього, довірчі межі (або довірчий інтервал)- це межі середніх чи відносних величин, вихід межі яких унаслідок випадкових коливань має незначну ймовірність.

Довірчий інтервал може бути переписаний у вигляді: , де t- Довірчий критерій.

Довірчі межі середньої арифметичної величини в генеральній сукупності визначають за такою формулою:

М ген = М виб + t m M

для відносної величини:

Р ген = Р виб + t m Р

де М гені Р ген- значення середньої та відносної величини для генеральної сукупності; М вибі Р виб- значення середньої та відносної величини, отримані на вибірковій сукупності; m Mі m P- помилки середньої та відносної величин; t- довірчий критерій (критерій точності, який встановлюється при плануванні дослідження і може дорівнювати 2 або 3); t m- це довірчий інтервал або Δ – гранична помилка показника, отриманого під час вибіркового дослідження.

Слід зазначити, що величина критерію tПевною мірою пов'язана з ймовірністю безпомилкового прогнозу (р), вираженої в %. Її обирає сам дослідник, керуючись необхідністю отримати результат із потрібним ступенем точності. Так, для ймовірності безпомилкового прогнозу 95,5% величина критерію tстановить 2, для 99,7% – 3.

Наведені оцінки довірчого інтервалу прийнятні лише статистичних сукупностей із кількістю спостережень понад 30. При меншому обсязі сукупності (малих вибірках) визначення критерію t користуються спеціальними таблицями. У даних таблицях шукане значення перебуває на перетині рядка, відповідної чисельності сукупності (n-1), та стовпця, що відповідає рівню ймовірності безпомилкового прогнозу (95,5%; 99,7%), обраному дослідником. У медичних дослідженнях при встановленні довірчих кордонів будь-якого показника прийнято можливість безпомилкового прогнозу 95,5% і більше. Це означає, що величина показника, отримана на вибірковій сукупності, повинна зустрічатися в генеральній сукупності як мінімум у 95,5% випадків.

    Запитання по темі заняття:

    Актуальність показників різноманітності ознаки у статистичній сукупності.

    Загальна характеристика абсолютних показників варіації.

    Середнє квадратичне відхилення, розрахунок, застосування.

    Відносні показники варіації.

    Медіана, квартильна оцінка.

    Оцінка статистичної значущості результатів дослідження.

    Стандартна помилка середньої арифметичної, формула розрахунку, приклад використання.

    Розрахунок частки та її стандартної помилки.

    Концепція довірчої ймовірності, приклад використання.

10. Поняття довірчого інтервалу, його застосування.

    Тестові завдання на тему з зразками відповідей:

1. ДО АБСОЛЮТНИХ ПОКАЗНИКІВ ВАРІАЦІЇ ВІДНОСИТЬСЯ

1) коефіцієнт варіації

2) коефіцієнт осциляції

4) медіана

2. ДО ВІДНОСНИХ ПОКАЗНИКІВ ВАРІАЦІЇ ВІДНОСИТЬСЯ

1) дисперсія

4) коефіцієнт варіації

3. КРИТЕРІЙ, ЯКИЙ ВИЗНАЧАЄТЬСЯ КРАЙНІМИ ЗНАЧЕННЯМИ ВАРІАНТ У ВАРІАЦІЙНОМУ РЯДУ

2) амплітуда

3) дисперсія

4) коефіцієнт варіації

4. РІЗНІСТЬ КРАЙНІХ ВАРІАНТ - ЦЕ

2) амплітуда

3) середнє квадратичне відхилення

4) коефіцієнт варіації

5. СЕРЕДНІЙ КВАДРАТ ВІДКЛОНЕНЬ ІНДИВІДУАЛЬНИХ ЗНАЧЕНЬ ОЗНАКУ ВІД ЙОГО СЕРЕДНЬОЇ ВЕЛИЧИНИ – ЦЕ

1) коефіцієнт осциляції

2) медіана

3) дисперсія

6. ВІДНОСИННЯ РОЗМАХУ ВАРІАЦІЇ ДО СЕРЕДНЬОЇ ВЕЛИЧИНИ ПРИЗНАКУ – ЦЕ

1) коефіцієнт варіації

2) середнє квадратичне відхилення

4) коефіцієнт осциляції

7. ВІДНОСІННЯ СЕРЕДНЬОГО КВАДРАТИЧНОГО ВІДКЛОНЕННЯ ДО СЕРЕДНЬОЇ ВЕЛИЧИНИ ОЗНАКУ – ЦЕ

1) дисперсія

2) коефіцієнт варіації

3) коефіцієнт осциляції

4) амплітуда

8. ВАРІАНТА, ЯКА ЗНАХОДИТЬСЯ В СЕРЕДИНІ ВАРІАЦІЙНОГО РЯДУ І ДІЛИТЬ ЙОГО НА ДВІ РІВНІ ЧАСТИНИ – ЦЕ

1) медіана

3) амплітуда

9. У МЕДИЧНИХ ДОСЛІДЖЕННЯХ ПРИ ВСТАНОВЛЕННІ ДОВЕРЧИХ КОРДОНІВ БУДЬ-ЯКОГО ПОКАЗНИКА ПРИЙНЯТА ІМОВІТНІСТЬ БЕЗПРИМИЛНОГО ПРОГНОЗУ

10. ЯКЩО 90 ВИБІРОК ЗІ 100 ДАЮТЬ ПРАВИЛЬНУ ОЦІНКУ ПАРАМЕТРА В ГЕНЕРАЛЬНІЙ СУКУПНОСТІ, ТО ЦЕ ОЗНАЧАЄ, ЩО ДОВЕРЧА ІМОВІРНІСТЬ PРІВНА

11. У РАЗІ, ЯКЩО 10 ВИБІРОК З 100 ДАЮТЬ НЕВЕРНУ ОЦІНКУ, ІМОВІТНІСТЬ ПОМИЛКИ РІВНА

12. КОРДОНИ СЕРЕДНІХ АБО ВІДНОСНИХ ВЕЛИЧИН, ВИХІД ЗА МЕЖИ ЯКИХ ВСЛІДСТВО ВИПАДКОВИХ КОЛИВАНЬ МАЄ НЕЗНАЧНУ ІМОВІРНІСТЬ – ЦЕ

1) довірчий інтервал

2) амплітуда

4) коефіцієнт варіації

13. МАЛИЙ ВИБІРКОЮ ВВАЖАЄТЬСЯ ТА СУКУПНІСТЬ, У ЯКІЙ

1) n менше або дорівнює 100

2) n менше або дорівнює 30

3) n менше або дорівнює 40

4) n близько до 0

14. ДЛЯ ймовірності безпомилкового прогнозу 95% ВЕЛИЧИНА КРИТЕРІЯ tСкладає

15. ДЛЯ ймовірності безпомилкового прогнозу 99% ВЕЛИЧИНА КРИТЕРІЯ tСкладає

16. ДЛЯ РОЗПОДІЛ, БЛИЗЬКИХ ДО НОРМАЛЬНОГО, СУКУПНІСТЬ ВВАЖАЄТЬСЯ ОДНОРІДНОЮ, ЯКЩО КОЕФІЦІЄНТ ВАРІАЦІЇ НЕ ПЕРЕВИЩУЄ

17. ВАРІАНТА, ЩО ВІДДІЛЮЄ ВАРІАНТИ, ЧИСЛОВІ ЗНАЧЕННЯ ЯКИХ НЕ ПЕРЕВИЩУЮТЬ 25% МАКСИМАЛЬНО МОЖЛИВОГО У ДАНОМУ РЯДУ – ЦЕ

2) нижній квартиль

3) верхній квартиль

4) квартиль

18. ДАНІ, ЯКІ НЕ СПОКАЖУЮТЬ І ПРАВИЛЬНО ВІДБИЛЯЮТЬ ОБ'ЄКТИВНУ РЕАЛЬНІСТЬ, НАЗИВАЮТЬСЯ

1) неможливі

2) рівноможливі

3) достовірні

4) випадкові

19. ЗГОДНО ПРАВИЛУ "ТРОХ СИГМ", ПРИ НОРМАЛЬНОМУ РОЗПОДІЛІ ОЗНАКУ У МЕЖАХ
БУДЕ ЗНАХОДИТИСЯ

1) 68,3% варіант



Останні матеріали розділу:

Федір Ємельяненко розкритикував турнір у грізному за бої дітей Омеляненко висловився про бої в чечні
Федір Ємельяненко розкритикував турнір у грізному за бої дітей Омеляненко висловився про бої в чечні

Заява уславленого спортсмена та президента Союзу ММА Росії Федора Омеляненка про неприпустимість дитячих боїв після бою дітей Рамзана Кадирова...

Саша пивоварова - біографія, інформація, особисте життя
Саша пивоварова - біографія, інформація, особисте життя

Ті часи, коли моделлю обов'язково мала бути дівчина з ляльковим личком, суворо відповідна параметрам 90-60-90, давно минули.

Міфологічні картини.  Головні герої та символи.  Картини на сюжет з історії стародавньої греції.
Міфологічні картини. Головні герої та символи. Картини на сюжет з історії стародавньої греції.

Вік вищого розквіту скульптури в період класики був і віком розквіту грецького живопису. Саме до цього часу відноситься чудове...