Формула середньоквадратичного відхилення у статистиці. Середнє квадратичне відхилення

Мудрі математики та статистики вигадали більш надійний показник, хоча й дещо іншого призначення – середнє лінійне відхилення. Цей показник характеризує міру розкиду значень сукупності даних навколо їхнього середнього значення.

Для того, щоб показати міру розкиду даних потрібно спочатку визначитися, щодо чого цей самий розкид буде вважатися - зазвичай це середня величина. Далі потрібно порахувати, наскільки значення аналізованої сукупності даних далеко від середньої. Зрозуміло, що кожному значенню відповідає деяка величина відхилення, але нас цікавить загальна оцінка, що охоплює всю сукупність. Тому розраховують середнє відхилення за формулою звичайної середньої арифметичної. Але! Але для того, щоб розрахувати середнє відхилення, їх потрібно спочатку скласти. І якщо ми складемо позитивні та негативні числа, то вони взаємознищаться і їхня сума буде прагнути до нуля. Щоб цього уникнути, всі відхилення беруться за модулем, тобто всі негативні числа стають позитивними. Ось тепер середнє відхилення показуватиме узагальнену міру розкиду значень. У результаті середньо лінійне відхилення буде розраховуватися за формулою:

a- Середнє лінійне відхилення,

x– аналізований показник, з рисою зверху – середнє значення показника,

n– кількість значень у аналізованій сукупності даних,

оператор підсумовування, сподіваюся, нікого не лякає.

Розраховане за зазначеною формулою середнє лінійне відхилення відбиває середнє абсолютне відхилення від середньої величини за цією сукупністю.

На малюнку червона лінія – це середнє значення. Відхилення кожного спостереження середнього вказані маленькими стрілочками. Саме вони беруться за модулем і підсумовуються. Потім усе поділяється на кількість значень.

Для повноти картини слід навести ще й приклад. Припустимо, є фірма з виробництва живців для лопат. Кожен черешок має бути 1,5 метра завдовжки, але, що ще важливіше, усі мають бути однаковими або, принаймні, плюс-мінус 5 см. Проте недбайливі працівники то 1,2 м відпилять, то 1,8 м. Дачники незадоволені . Вирішив директор фірми провести статистичний аналіз довжини живців. Відібрав 10 штук і заміряв їх довжину, знайшов середню та розрахував середнє лінійне відхилення. Середня вийшла якраз, що треба - 1,5 м. А ось середнє лінійне відхилення вийшло 0,16 м. Ось і виходить, що кожен живець довший або коротший, ніж потрібно в середньому на 16 см. Є, про що поговорити з працівниками . Насправді я не зустрічав реального використання цього показника, тому приклад вигадав сам. Проте у статистиці є такий показник.

Дисперсія

Як і середнє лінійне відхилення, дисперсія також відбиває міру розкиду даних навколо середньої величини.

Формула для розрахунку дисперсії виглядає так:

(Для варіаційних рядів (зважена дисперсія))

(Для несгрупованих даних (проста дисперсія))

Де: σ 2 – дисперсія, Xi- аналізований показник (значення ознаки), - середнє значення показника, fi - кількість значень в аналізованій сукупності даних.

Дисперсія – це середній квадрат відхилень.

Спочатку розраховується середнє значення, потім береться різниця між кожним вихідним та середнім значенням, зводиться у квадрат, множиться на частоту відповідного значення ознаки, складається і потім ділиться на кількість значень у даній сукупності.

Однак у чистому вигляді, як, наприклад, середня арифметична, або індекс, дисперсія не використовується. Це скоріше допоміжний та проміжний показник, який використовується для інших видів статистичного аналізу.

Спрощений спосіб розрахунку дисперсії

Середньоквадратичне відхилення

Щоб використовувати дисперсію для аналізу даних з неї витягують квадратний корінь. Виходить так зване середньоквадратичне відхилення.

До речі, стандартне відхилення ще називають сигмою – від грецької літери, якою його означають.

Середньоквадратичне відхилення, очевидно, також характеризує міру розсіювання даних, але тепер (на відміну дисперсії) його можна порівнювати з вихідними даними. Як правило, середньоквадратичні показники у статистиці дають точніші результати, ніж лінійні. Отже, середньоквадратичне відхилення є точнішим показником міри розсіювання даних, ніж середнє лінійне відхилення.

Математичне очікування та дисперсія

Нехай ми вимірюємо випадкову величину Nразів, наприклад, десять разів вимірюємо швидкість вітру та хочемо знайти середнє значення. Як пов'язане середнє значення із функцією розподілу?

Кидатимемо гральний кубик велику кількість разів. Кількість очок, що випаде на кубику при кожному кидку, є випадковою величиною і може набувати будь-яких натуральних значень від 1 до 6. Середнє арифметичне випалих очок, підрахованих за всі кидки кубика, теж є випадковою величиною, проте при великих Nвоно прагне цілком конкретного числа – математичного очікування M x. В даному випадку M x = 3,5.

Як вийшла ця величина? Нехай у Nвипробуваннях разів випало 1 очко, разів – 2 очки і так далі. Тоді При N→ ∞ кількість наслідків, в яких випало одне очко, Аналогічно, Звідси

Модель 4.5. Гральні кубики

Припустимо тепер, що ми знаємо закон розподілу випадкової величини xтобто знаємо, що випадкова величина xможе приймати значення x 1 , x 2 , ..., x kз ймовірностями p 1 , p 2 , ..., p k.

Математичне очікування M xвипадкової величини xодно:

Відповідь. 2,8.

Математичне очікування який завжди є розумною оцінкою якоїсь випадкової величини. Так, для оцінки середньої заробітної плати розумніше використовувати поняття медіани, тобто такої величини, що кількість людей, які отримують меншу, ніж медіана, зарплату та більшу, збігаються.

Медіаноювипадкової величини називають число x 1/2 таке, що p (x < x 1/2) = 1/2.

Іншими словами, ймовірність p 1 того, що випадкова величина xвиявиться меншою x 1/2 , і ймовірність p 2 того, що випадкова величина xвиявиться більшою x 1/2, однакові та рівні 1/2. Медіана визначається однозначно задля всіх розподілів.

Повернемося до випадкової величини xяка може приймати значення x 1 , x 2 , ..., x kз ймовірностями p 1 , p 2 , ..., p k.

Дисперсієювипадкової величини xназивається середнє значення квадрата відхилення випадкової величини від її математичного очікування:

Приклад 2

В умовах попереднього прикладу обчислити дисперсію та середньоквадратичне відхилення випадкової величини x.

Відповідь. 0,16, 0,4.

Модель 4.6. Стрілянина в ціль

Приклад 3

Знайти розподіл ймовірності числа очок, що випали на кубику з першого кидка, медіану, математичне очікування, дисперсію та середньоквадратичне відхилення.

Випадання будь-якої грані рівноймовірне, так що розподіл виглядатиме так:

Середньоквадратичне відхилення Видно, що відхилення від середнього значення величини дуже велике.

Властивості математичного очікування:

  • Математичне очікування суми незалежних випадкових величин дорівнює сумі їх математичних очікувань:

Приклад 4

Знайти математичне очікування суми та твори очок, що випала на двох кубиках.

У прикладі 3 ми виявили, що для одного кубика M (x) = 3,5. Значить, для двох кубиків

Властивості дисперсії:

  • Дисперсія суми незалежних випадкових величин дорівнює сумі дисперсій:

D x + y = D x + D y.

Нехай за Nкидків на кубику випало yокулярів. Тоді

Цей результат є вірним не тільки для кидків кубика. Він у багатьох випадках визначає точність виміру математичного очікування досвідченим шляхом. Видно, що при збільшенні кількості вимірів Nрозкид значень навколо середнього, тобто середньоквадратичне відхилення, зменшується пропорційно

Дисперсія випадкової величини пов'язана з математичним очікуванням квадрата цієї випадкової величини наступним співвідношенням:

Знайдемо математичні очікування обох частин цієї рівності. За визначенням,

Математичне ж очікування правої частини рівності за якістю математичних очікувань дорівнює

Середнє квадратичне відхилення

Середньоквадратичне відхиленнядорівнює квадратному кореню з дисперсії:
При визначенні середнього квадратичного відхилення при досить великому обсязі сукупності, що вивчається (n > 30) застосовуються формули:

Подібна інформація.


Програма Excel цінується як професіоналами, так і любителями, адже працювати з нею може користувач будь-якого рівня підготовки. Наприклад, кожен бажаючий з мінімальними навичками спілкування з Екселем може намалювати простенький графік, зробити пристойну табличку і т.д.

Разом з тим, ця програма навіть дозволяє виконувати різноманітні розрахунки, наприклад, розрахунок, але для цього вже необхідний дещо інший рівень підготовки. Втім, якщо ви тільки почали тісне знайомство з цією прогою і цікавитеся всім, що допоможе вам стати більш просунутим користувачем, ця стаття для вас. Сьогодні я розповім, що є середньоквадратичним відхиленням формула в excel, навіщо вона взагалі потрібна і, власне кажучи, коли застосовується. Поїхали!

Що це таке

Почнемо з теорії. Середнім квадратичним відхиленням прийнято називати квадратний корінь, отриманий із середнього арифметичного всіх квадратів різниць між наявними величинами, а також їх середнім арифметичним. До слова, цю величину прийнято називати грецькою літерою "сигма". Стандартне відхилення розраховується за формулою СТАНДОТКЛОН, відповідно програма робить це за користувача сама.

Суть цього поняття у тому, щоб виявити ступінь мінливості інструмента, тобто, це, свого роду, індикатор родом з описової статистики. Він виявляє зміни волатильності інструменту у будь-якому часовому проміжку. За допомогою формул СТАНДОТКЛОН можна оцінити стандартне відхилення під час вибірки, при цьому логічні та текстові значення ігноруються.

Формула

Допомагає розрахувати середнє квадратичне відхилення Excel формула, яка автоматично передбачена в програмі Excel. Щоб її знайти, необхідно знайти в Екселі розділ формули, а вже там вибрати ту, що має назву СТАНДОТКЛОН, тому дуже просто.

Після цього перед вами з'явиться віконце, в якому потрібно буде ввести дані для обчислення. Зокрема, у спеціальні поля слід вписати два числа, після чого програма сама вирахує стандартне відхилення щодо вибірки.

Безперечно, математичні формули та розрахунки – питання досить складне, і не всі користувачі з ходу можуть впоратися з ним. Тим не менш, якщо копнути трохи глибше і трохи детальніше розібратися в питанні, виявляється, що не все так і сумно. Сподіваюся, на прикладі обчислення середньоквадратичного відхилення ви переконалися в цьому.

Відео на допомогу

Стандартне відхилення є одним із тих статистичних термінів у корпоративному світі, яке дозволяє підняти авторитет людей, які зуміли вдало ввернути його в ході бесіди чи презентації, і залишає невиразне непорозуміння тих, хто не знає, що це таке, але соромиться запитати. Насправді більшість менеджерів не розуміють концепцію стандартного відхилення і, якщо ви один із них, вам час перестати жити в брехні. У сьогоднішній статті я розповім вам, як цей недооцінений статистичний захід дозволить краще зрозуміти дані, з якими ви працюєте.

Що вимірює стандартне відхилення?

Уявіть, що ви є власником двох магазинів. І щоб уникнути втрат, важливо щоб був чіткий контроль залишків на складі. У спробі з'ясувати, хто з менеджерів краще управляє запасами, ви вирішили проаналізувати стоки останніх шести тижнів. Середня тижнева вартість стоку обох магазинів приблизно однакова і становить близько 32 умовних одиниць. На перший погляд, середнє значення стоку показує, що обидва менеджери працюють однаково.

Але якщо уважніше вивчити діяльність другого магазину, можна переконатись, що хоча середнє значення коректне, варіабельність стоку дуже висока (від 10 до 58 у.о.). Отже, можна дійти невтішного висновку, що середнє значення який завжди правильно оцінює дані. Ось де на допомогу приходить стандартне відхилення.

Стандартне відхилення показує, як розподілені значення щодо середнього у нашій . Іншими словами, можна зрозуміти наскільки великий розкид величини стоку від тижня до тижня.

У нашому прикладі ми скористалися функцією Excel СТАНДОТКЛОН, щоб розрахувати показник стандартного відхилення разом із середнім.

У випадку з першим менеджером стандартне відхилення склало 2. Це говорить нам про те, що кожне значення у вибірці в середньому відкланяється на 2 від середнього значення. Чи це добре? Давайте розглянемо питання під іншим кутом - стандартне відхилення рівне 0, говорить нам про те, що кожне значення у вибірці дорівнює його середньому значенню (у нашому випадку, 32,2). Так, стандартне відхилення 2 трохи відрізняється від 0, і вказує на те, що більшість значень знаходяться поруч із середнім значенням. Чим ближче стандартне відхилення до 0, тим надійніше середнє. Більше того, стандартне відхилення близьке до 0 говорить про маленьку варіабельність даних. Тобто, величина стоку зі стандартним відхиленням 2 вказує на неймовірну послідовність першого менеджера.

У випадку з другим магазином стандартне відхилення склало 18,9. Тобто вартість стоку в середньому відхиляється на величину 18,9 від середнього від тижня до тижня. Божевільний розкид! Що далі стандартне відхилення від 0, то менш точно середнє значення. У нашому випадку цифра 18,9 вказує на те, що середньому значенню (32,8 у.о. на тиждень) просто не можна довіряти. Воно також говорить нам про те, що щотижнева величина стоку має велику варіабельність.

Така концепція стандартного відхилення двома словами. Хоча воно не дає уявлення про інші важливі статистичні виміри (Мода, Медіана…), фактично стандартне відхилення відіграє вирішальну роль більшості статистичних розрахунків. Розуміння принципів стандартного відхилення проллє світло на суть багатьох процесів вашої діяльності.

Як розрахувати стандартне відхилення?

Отже, тепер ми знаємо, про що свідчить цифра стандартного відхилення. Давайте розберемося, як вона вважається.

Розглянемо набір даних від 10 до 70 з кроком 10. Як бачите, я вже розрахував для них значення стандартного відхилення за допомогою функції СТАНДОТКЛОН у осередку H2 (помаранчевим).

Нижче описано кроки, які робить Excel, щоб прийти до цифри 21,6.

Зверніть увагу, що всі розрахунки візуалізовані для кращого розуміння. Насправді в Excel розрахунок відбувається миттєво, залишаючи всі кроки за лаштунками.

Спочатку Excel знаходить середнє значення вибірки. У нашому випадку середнє вийшло рівним 40, яке на наступному кроці віднімають від кожного значення вибірки. Кожну отриману різницю зводять у квадрат і підсумовують. У нас вийшла сума, що дорівнює 2800, яку необхідно розділити на кількість елементів вибірки мінус 1. Так як у нас 7 елементів, виходить необхідно 2800 розділити на 6. З отриманого результату знаходимо квадратний корінь, ця цифра буде стандартним відхиленням.

Для тих, кому не зрозумілий принцип розрахунку стандартного відхилення за допомогою візуалізації, наводжу математичну інтерпретацію знаходження даного значення.

Функції розрахунку стандартного відхилення в Excel

В Excel є кілька різновидів формул стандартного відхилення. Вам достатньо набрати = СТАНДОТКЛОН і ви самі в цьому переконаєтесь.

Варто зазначити, що функції СТАНДОТКЛОН.В та СТАНДОТКЛОН.Г (перша та друга функція у списку) дублюють функції СТАНДОТКЛОН та СТАНДОТКЛОНП (п'ята та шоста функція у списку), відповідно, які були залишені для сумісності з попередніми версіями.

Взагалі різниця в окончаниях.В и.Г функцій свідчить про принцип розрахунку стандартного відхилення вибірки чи генеральної сукупності. Різницю між двома цими масивами я вже пояснював у попередній.

Особливістю функцій СТАНДОТКЛОНУ та СТАНДОТКЛОНПУ (третя та четверта функція у списку), є те, що при розрахунку стандартного відхилення масиву в розрахунок приймаються логічні та текстові значення. Текстові та справжні логічні значення дорівнюють 1, а помилкові логічні значення дорівнюють 0. Мені важко уявити ситуацію, коли б мені могли знадобитися ці дві функції, тому, думаю, що їх можна ігнорувати.

Інструкція

Нехай є кілька чисел, що характеризують однорідні величини. Наприклад, результати вимірювань, зважувань, статистичних спостережень тощо. Усі представлені величини повинні вимірюватися однієї й тієї ж виміру. Щоб знайти квадратичне відхилення, виконайте такі дії.

Визначте середнє арифметичне всіх чисел: складіть усі числа та поділіть суму на загальну кількість чисел.

Визначте дисперсію (розкид) чисел: складіть квадрати знайдених раніше відхилень і поділіть отриману суму на кількість чисел.

У палаті лежать семеро хворих з температурою 34, 35, 36, 37, 38, 39 і 40 градусів Цельсія.

Потрібно визначити середнє відхилення від середньої.
Рішення:
"По палаті": (34 +35 +36 +37 +38 +39 +40) / 7 = 37 ºС;

Відхилення температур від середнього (в даному випадку нормального значення): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, виходить: -3, -2, -1 0, 1, 2, 3 (ºС);

Розділіть отриману ранню суму чисел їх кількість. Для точності обчислення краще скористатися калькулятором. Підсумок поділу є середнім арифметичним значенням доданків.

Уважно поставтеся до всіх етапів розрахунку, оскільки помилка хоч в одному з обчислень призведе до неправильного підсумкового показника. Перевіряйте отримані розрахунки кожному етапі. Середнє арифметичне число має той же вимірник, що й доданки, тобто якщо ви визначаєте середню відвідуваність, то всі показники у вас будуть «людина».

Даний спосіб обчислення застосовується лише в математичних та статистичних розрахунках. Так, наприклад, середнього арифметичного значення інформатики має інший алгоритм обчислення. Середнє арифметичне значення дуже умовним показником. Воно показує можливість тієї чи іншої події за умови, що він лише один чинник чи показник. Для глибокого аналізу необхідно враховувати безліч чинників. І тому застосовується обчислення більш загальних величин.

Середнє арифметичне - один із заходів центральної тенденції, що широко використовується в математиці та статистичних розрахунках. Знайти середнє арифметичне число для кількох значень дуже просто, але у кожного завдання є свої нюанси, знати які для виконання вірних розрахунків просто необхідно.

Кількісні результати проведених подібних дослідів.

Як знайти середнє арифметичне число

Пошук середнього арифметичного числа для масиву чисел слід починати з визначення суми алгебри цих значень. Наприклад, якщо у масиві присутні числа 23, 43, 10, 74 і 34, їх алгебраїчна сума дорівнюватиме 184. При запису середнє арифметичне позначається буквою μ (мю) чи x (ікс з характеристикою). Далі суму алгебри слід розділити на кількість чисел в масиві. У аналізованому прикладі чисел було п'ять, тому середнє арифметичне дорівнюватиме 184/5 і становитиме 36,8.

Особливості роботи з негативними числами

Якщо масиві присутні негативні числа, то перебування середнього арифметичного значення відбувається за аналогічним алгоритмом. Різниця є тільки при розрахунках у середовищі програмування, або якщо завдання має додаткові умови. У цих випадках знаходження середнього арифметичного чисел з різними знаками зводиться до трьох дій:

1. Знаходження загальної середньої арифметичної кількості стандартним методом;
2. Знаходження середнього арифметичного негативного числа.
3. Обчислення середнього арифметичного позитивного числа.

Відповіді кожної з дій записуються через кому.

Натуральні та десяткові дроби

Якщо масив чисел представлений десятковими дробами, рішення відбувається методом обчислення середнього арифметичного цілих чисел, але скорочення результату проводиться у разі вимогам завдання до точності відповіді.

При роботі з натуральними дробами їх слід привести до спільного знаменника, який множиться на кількість чисел у масиві. У чисельнику відповіді буде сума наведених чисельників вихідних дробових елементів.



Останні матеріали розділу:

Основний план дій та способи виживання Вночі тихо, вдень вітер посилюється, а надвечір затихає
Основний план дій та способи виживання Вночі тихо, вдень вітер посилюється, а надвечір затихає

5.1. Поняття про місце існування людини. Нормальні та екстремальні умови життєпроживання. Виживання 5.1.1. Поняття про довкілля людини...

Англійські звуки для дітей: читаємо транскрипцію правильно
Англійські звуки для дітей: читаємо транскрипцію правильно

А ви знали, що англійський алфавіт складається з 26 літер та 46 різних звуків? Одна й та сама буква може передавати кілька звуків одночасно.

Контрольний тест з історії на тему Раннє Середньовіччя (6 клас)
Контрольний тест з історії на тему Раннє Середньовіччя (6 клас)

М.: 2019. – 128 с. М.: 2013. – 160 с. Посібник включає тести з історії Середніх віків для поточного та підсумкового контролю та відповідає змісту...