Середній квадратичний розподіл. Стандартне відхилення

Середньоквадратичне відхилення(синоніми: середнє квадратичне відхилення, середньоквадратичне відхилення, квадратичне відхилення; близькі терміни: стандартне відхилення, стандартний розкид) - в теорії ймовірностей і статистиці найбільш поширений показник розсіювання значень випадкової величини щодо її математичного очікування. При обмежених масивах вибірок значень замість математичного очікування використовується середня арифметична сукупність вибірок.

Енциклопедичний YouTube

  • 1 / 5

    Середньоквадратичне відхилення вимірюється в одиницях вимірювання самої випадкової величини і використовується при розрахунку стандартної помилки середнього арифметичного, при побудові довірчих інтервалів, при статистичній перевірці гіпотез, при вимірюванні лінійної зв'язки. Визначається як квадратний корінь з дисперсії випадкової величини .

    Середньоквадратичне відхилення:

    s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ; (\displaystyle s=(\sqrt ((\frac(n)(n-1))\sigma ^(2)))=(\sqrt ((\frac(1)(n-1))\sum _( i=1)^(n)\left(x_(i)-(\bar (x))\right)^(2)));)
    • Примітка: Дуже часто зустрічаються різночитання в назвах СКО (Середньоквадратичного відхилення) та СТО (Стандартного відхилення) за їх формулами. Наприклад, у модулі numPy мови програмування Python функція std() описується як "standart deviation", тоді як формула відображає СКО (розподіл на корінь з вибірки). У Excel функція СТАНДОТКЛОН() інша (розподіл на корінь з n-1).

    Стандартне відхилення(Оцінка середньоквадратичного відхилення випадкової величини xщодо її математичного очікування на основі незміщеної оцінки її дисперсії) s (\displaystyle s):

    σ = 1 n ∑ i = 1 n (x i − x ¯) 2 . (\displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\left(x_(i)-(\bar(x))\right) ^(2))).)

    де σ 2 (\displaystyle \sigma ^(2))- Дисперсія; x i (\displaystyle x_(i)) - i-й елемент вибірки; n (\displaystyle n)- Обсяг вибірки; - середня арифметична вибірки:

    x = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).)

    Слід зазначити, що обидві оцінки є зміщеними. У загальному випадку незміщену оцінку побудувати неможливо. Однак оцінка на основі оцінки незміщеної дисперсії є заможною.

    Відповідно до ГОСТ Р 8.736-2011 середньоквадратичне відхилення вважається за другою формулою цього розділу. Будь ласка, звірте результати.

    Правило трьох сигм

    Правило трьох сигм (3 σ (\displaystyle 3\sigma )) - практично всі значення нормально розподіленої випадкової величини лежать в інтервалі (x − 3 σ ; x ¯ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma ;(\bar (x))+3\sigma \right)). Суворіше - приблизно з ймовірністю 0,9973 значення нормально розподіленої випадкової величини лежить у зазначеному інтервалі (за умови, що величина x ¯ (\displaystyle (\bar(x)))справжня, а чи не отримана внаслідок обробки вибірки).

    Якщо ж справжня величина x ¯ (\displaystyle (\bar(x)))невідома, то слід користуватися не σ (\displaystyle \sigma ), а s. Таким чином, правило трьох сигм перетворюється на правило трьох s .

    Інтерпретація величини середньоквадратичного відхилення

    Більше значення середньоквадратичного відхилення показує більший розкид значень у представленій множині із середньою величиною множини; менше значення, відповідно, показує, що значення у множині згруповані навколо середнього значення.

    Наприклад, у нас є три числові множини: (0, 0, 14, 14), (0, 6, 8, 14) і (6, 6, 8, 8). У всіх трьох множин середні значення дорівнюють 7, а середньоквадратичні відхилення, відповідно, дорівнюють 7, 5 і 1. У останньої множини середньоквадратичне відхилення маленьке, тому що значення у множині згруповані навколо середнього значення; у першої множини найбільше значення середньоквадратичного відхилення - значення всередині множини сильно розходяться із середнім значенням.

    У загальному сенсі середньоквадратичне відхилення вважатимуться мірою невизначеності. Наприклад, у фізиці середньоквадратичне відхилення використовується визначення похибки серії послідовних вимірів будь-якої величини. Це значення дуже важливо для визначення правдоподібності досліджуваного явища в порівнянні з передбаченим теорією значенням: якщо середнє значення вимірювань сильно відрізняється від передбачених теорією значень (велике значення середньоквадратичного відхилення), то отримані значення або метод їх отримання слід перевіряти ще раз. ототожнюється із ризиком портфеля.

    Клімат

    Припустимо, існують два міста з однаковою максимальною середньої денною температурою, але одне розташоване на узбережжі, а інше на рівнині. Відомо, що в містах, розташованих на узбережжі, безліч різних максимальних денних температур менше, ніж у міст, розташованих усередині континенту. Тому середньоквадратичне відхилення максимальних денних температур у прибережного міста буде менше, ніж у другого міста, незважаючи на те, що середнє значення цієї величини у них однакове, що на практиці означає, що ймовірність того, що максимальна температура повітря кожного конкретного дня в році буде сильнішою. відрізнятиметься від середнього значення, вище у міста, розташованого всередині континенту.

    Спорт

    Припустимо, що є кілька футбольних команд, які оцінюються за деяким набором параметрів, наприклад, кількістю забитих і пропущених голів, гольових моментів і т.п. Чим менше у команди середньоквадратичне відхилення по кожному з представлених параметрів, тим більш передбачуваним є результат команди, такі команди є збалансованими. З іншого боку, у команди з великим значенням середньоквадратичного відхилення складно передбачити результат, що пояснюється дисбалансом, наприклад, сильним захистом, але слабким нападом.

    Використання середньоквадратичного відхилення параметрів команди дозволяє в тій чи іншій мірі передбачити результат матчу двох команд, оцінюючи сильні та слабкі сторони команд, а отже, і способів боротьби, що вибираються.

    Матеріал з Вікіпедії – вільної енциклопедії

    Середньоквадратичне відхилення(синоніми: середнє квадратичне відхилення, середньоквадратичне відхилення, квадратичне відхилення; близькі терміни: стандартне відхилення, стандартний розкид) - в теорії ймовірностей та статистики найбільш поширений показник розсіювання значень випадкової величини щодо її математичного очікування. При обмежених масивах вибірок значень замість математичного очікування використовують середнє арифметичне сукупності вибірок.

    Основні відомості

    Середньоквадратичне відхилення вимірюється в одиницях виміру самої випадкової величини і використовується при розрахунку стандартної помилки середнього арифметичного при побудові довірчих інтервалів при статистичній перевірці гіпотез при вимірюванні лінійного взаємозв'язку між випадковими величинами. Визначається як квадратний корінь із дисперсії випадкової величини.

    Середньоквадратичне відхилення:

    \sigma=\sqrt(\frac(1)(n)\sum_(i=1)^n\left(x_i-\bar(x)\right)^2).

    Стандартне відхилення(Оцінка середньоквадратичного відхилення випадкової величини xщодо її математичного очікування на основі незміщеної оцінки її дисперсії) s:

    s=\sqrt(\frac(n)(n-1)\sigma^2)=\sqrt(\frac(1)(n-1)\sum_(i=1)^n\left(x_i-\bar (x) \right)^2);

    Правило трьох сигм

    Правило трьох сигм (3\sigma) - практично всі значення нормально розподіленої випадкової величини лежать в інтервалі \left(\bar(x)-3\sigma;\bar(x)+3\sigma\right). Суворіше - приблизно з ймовірністю 0,9973 значення нормально розподіленої випадкової величини лежить у зазначеному інтервалі (за умови, що величина \bar(x)справжня, а чи не отримана внаслідок обробки вибірки).

    Якщо ж справжня величина \bar(x)невідома, то слід користуватися не \sigma, а s. Таким чином, правило трьох сигм перетворюється на правило трьох s .

    Інтерпретація величини середньоквадратичного відхилення

    Більше значення середньоквадратичного відхилення показує більший розкид значень у представленій множині із середньою величиною множини; менше значення, відповідно, показує, що значення у множині згруповані навколо середнього значення.

    Наприклад, у нас є три числові множини: (0, 0, 14, 14), (0, 6, 8, 14) і (6, 6, 8, 8). У всіх трьох множин середні значення дорівнюють 7, а середньоквадратичні відхилення, відповідно, дорівнюють 7, 5 і 1. У останньої множини середньоквадратичне відхилення маленьке, тому що значення у множині згруповані навколо середнього значення; у першої множини найбільше значення середньоквадратичного відхилення - значення всередині множини сильно розходяться із середнім значенням.

    У загальному сенсі середньоквадратичне відхилення вважатимуться мірою невизначеності. Наприклад, у фізиці середньоквадратичне відхилення використовується визначення похибки серії послідовних вимірів будь-якої величини. Це значення дуже важливо для визначення правдоподібності досліджуваного явища в порівнянні з передбаченим теорією значенням: якщо середнє значення вимірювань сильно відрізняється від передбачених теорією значень (велике значення середньоквадратичного відхилення), то отримані значення або метод їх отримання слід перевіряти ще раз.

    Практичне застосування

    На практиці середньоквадратичне відхилення дозволяє оцінити, наскільки значення з множини можуть відрізнятися від середнього значення.

    Економіка та фінанси

    Середнє квадратичне відхилення прибутковості портфеля \sigma =\sqrt(D[X])ототожнюється із ризиком портфеля.

    Клімат

    Припустимо, існують два міста з однаковою максимальною середньої денною температурою, але одне розташоване на узбережжі, а інше на рівнині. Відомо, що в містах, розташованих на узбережжі, безліч різних максимальних денних температур менше, ніж у міст, розташованих усередині континенту. Тому середньоквадратичне відхилення максимальних денних температур у прибережного міста буде менше, ніж у другого міста, незважаючи на те, що середнє значення цієї величини у них однакове, що на практиці означає, що ймовірність того, що максимальна температура повітря кожного конкретного дня в році буде сильнішою. відрізнятиметься від середнього значення, вище у міста, розташованого всередині континенту.

    Спорт

    Припустимо, що є кілька футбольних команд, які оцінюються за деяким набором параметрів, наприклад, кількістю забитих і пропущених голів, гольових моментів і т.п. Чим менше у команди середньоквадратичне відхилення по кожному з представлених параметрів, тим більш передбачуваним є результат команди, такі команди є збалансованими. З іншого боку, у команди з великим значенням середньоквадратичного відхилення складно передбачити результат, що пояснюється дисбалансом, наприклад, сильним захистом, але слабким нападом.

    Використання середньоквадратичного відхилення параметрів команди дозволяє в тій чи іншій мірі передбачити результат матчу двох команд, оцінюючи сильні та слабкі сторони команд, а отже, і способів боротьби, що вибираються.

    Див. також

    Напишіть відгук про статтю "Середньоквадратичне відхилення"

    Література

    • Боровиков Ст. STATISTICA. Мистецтво аналізу даних на комп'ютері: Для професіоналів/В. Боровиков. - СПб. : Пітер, 2003. – 688 с. - ISBN 5-272-00078-1..

    Уривок, що характеризує Середньоквадратичне відхилення

    І, швидко відчинивши двері, він вийшов рішучими кроками на балкон. Гомін раптом замовк, шапки і картузи знялися, і всі очі піднялися до графа, що вийшов.
    – Здрастуйте, хлопці! - Сказав граф швидко і голосно. - Дякую що прийшли. Я зараз вийду до вас, але перш за все нам треба впоратися з лиходієм. Нам треба покарати лиходія, від якого загинула Москва. Зачекайте на мене! - І граф так само швидко повернувся до покоїв, міцно грюкнувши дверима.
    По натовпу пробіг схвальне ремствування задоволення. «Він, значить, лиходіїв управить усіх! А ти кажеш француз… він тобі всю дистанцію розв'яже! – говорили люди, ніби дорікаючи один одному за своє маловір'я.
    За кілька хвилин із парадних дверей поспішно вийшов офіцер, наказав щось, і драгуни витяглися. Натовп від балкона жадібно посунувся до ґанку. Вийшовши гнівно швидкими кроками на ганок, Растопчин поспішно озирнувся довкола себе, ніби шукаючи когось.
    - Де він? - сказав граф, і в ту ж хвилину, як він сказав це, він побачив з-за рогу будинку молодого чоловіка, що виходив між двома драгунами, з довгою тонкою шиєю, з до половини поголеною і заросла головою. Молодий чоловік цей був одягнений у колись чепурного, критий синім сукном, потертий лисий кожух і в брудні покінні арештантські шаровари, засунуті в нечищені, стоптані тонкі чоботи. На тонких, слабких ногах важко висіли кайдани, що ускладнювали нерішучу ходу хлопця.
    – А! - сказав Растопчин, поспішно відвертаючи свій погляд від молодого чоловіка в лисячому кожушку і вказуючи на нижню сходинку ганку. - Поставте його сюди! - Молодий чоловік, брязкаючи кайданами, важко переступив на вказану сходинку, притримавши пальцем комір кожуха, повернув двічі довгою шиєю і, зітхнувши, покірним жестом склав перед животом тонкі, неробочі руки.
    Декілька секунд, поки молодик встановлювався на сходинці, тривала мовчанка. Тільки в задніх рядах людей, що стискалися до одного місця, чулися кректання, стогін, поштовхи і тупіт ніг, що переставлялися.
    Розтопчин, чекаючи на те, щоб він зупинився на вказаному місці, хмурно потирав рукою обличчя.
    - Хлопці! – сказав Растопчин металево дзвінким голосом, – ця людина, Верещагін – той самий мерзотник, від якого загинула Москва.
    Молодий чоловік у лисячому кожусі стояв у покірній позі, склавши кисті рук разом перед животом і трохи зігнувшись. Схудле, з безнадійним виразом, понівечене голеною головою молоде обличчя його було опущене вниз. При перших словах графа він повільно підняв голову і подивився знизу на графа, ніби бажаючи щось сказати йому чи хоч зустріти його погляд. Але Растопчин не дивився на нього. На довгій тонкій шиї юнака, як мотузка, напружилася і посиніла жила за вухом, і раптом почервоніло обличчя.
    Всі очі були спрямовані на нього. Він глянув на натовп, і, ніби обнаділений тим виразом, який він прочитав на обличчях людей, він сумно й несміливо посміхнувся і, знову опустивши голову, одужав ногами на сходинці.
    - Він зрадив своєму цареві та вітчизні, він передався Бонапарту, він один із усіх росіян осоромив ім'я російського, і від нього гине Москва, - говорив Растопчин рівним, різким голосом; але раптом швидко глянув униз на Верещагіна, який продовжував стояти в тій самій покірній позі. Наче цей погляд підірвав його, він, піднявши руку, закричав майже, звертаючись до народу: - Своїм судом розправляйтеся з ним! віддаю його вам!
    Народ мовчав і тільки все тісніше й тісніше натискав один на одного. Тримати один одного, дихати в цій зараженій задусі, не мати сили поворухнутися і чекати чогось невідомого, незрозумілого і страшного ставало нестерпно. Люди, що стояли в передніх рядах, бачили і чули все те, що відбувалося перед ними, всі з перелякано широко розплющеними очима і роззявленими ротами, напружуючи всі свої сили, утримували на своїх спинах натиск задніх.
    - Бий його!.. Нехай загине зрадник і не соромить ім'я російської! - Закричав Растопчин. – Рубі! Я наказую! - Почувши не слова, але гнівні звуки голосу Растопчина, натовп застогнав і насунувся, але знову зупинився.
    — Граф!.. — промовив серед тиші, що знову настала, боязкий і разом театральний голос Верещагіна. – Граф, один бог над нами… – сказав Верещагін, піднявши голову, і знову налилася кров'ю товста жила на його тонкій шиї, і фарба швидко виступила та втекла з його обличчя. Він не домовив того, що хотів сказати.
    - Руби його! Я наказую!.. – прокричав Растопчин, раптом зблідаючи так само, як Верещагін.
    - Шаблі геть! – крикнув офіцер драгунам, сам виймаючи шаблю.
    Інша ще сильна хвиля злетіла по народу, і, добігши до передніх рядів, ця хвиля зрушила передні, хитаючи, піднесла до самих сходів ганку. Високий малий, з скам'янілим виразом обличчя і з піднятою рукою, що зупинилася, стояв поруч з Верещагіним.
    – Рубі! - прошепотів майже офіцер драгунам, і один із солдатів раптом з кривлявою злобою обличчям ударив Верещагіна тупим палашем по голові.
    "А!" – коротко і здивовано скрикнув Верещагін, злякано озираючись і не розуміючи, навіщо це було з ним зроблено. Такий же стогін здивування та жаху пробіг по натовпу.
    "О Боже!" – почувся чиєсь сумний вигук.
    Але за вигуком подиву, що вирвався У Верещагіна, він жалібно скрикнув від болю, і цей крик погубив його. Та натягнута до вищого ступеня перешкода людського почуття, яка ще тримала натовп, прорвалося миттєво. Злочин був започаткований, необхідно було довершити його. Жалобний стогін докору був заглушений грізним і гнівним ревом натовпу. Як останній сьомий вал, що розбиває кораблі, злетіла з задніх рядів ця остання нестримна хвиля, долинула до передніх, збила їх і поглинула все. Драгун, що вдарив, хотів повторити свій удар. Верещагін із криком жаху, затуляючись руками, кинувся до народу. Високий хлопець, на якого він натрапив, вчепився руками в тонку шию Верещагіна і з диким криком, з ним разом, упав під ноги народу, що навалився.
    Одні били та рвали Верещагіна, інші високого малого. І крики задавлених людей і тих, хто намагався врятувати високого малого, тільки збуджували лють натовпу. Довго драгуни було неможливо звільнити закривавленого, до смерті побитого фабричного. І довго, незважаючи на всю спекотну поспішність, з якою натовп намагався довершити раз розпочату справу, ті люди, які били, душили і рвали Верещагіна, не могли вбити його; але натовп тиснув їх з усіх боків, з ними в середині, як одна маса, колихався з боку в бік і не давав їм можливості ні добити, ні кинути його.

    Отримані з досвіду величини неминуче містять похибки, зумовлені найрізноманітнішими причинами. Серед них слід розрізняти похибки систематичні та випадкові. Систематичні помилки зумовлюються причинами, що діють цілком певним чином, і можуть бути завжди усунуті або досить точно враховані. Випадкові помилки викликаються дуже великою кількістю окремих причин, які не піддаються точному обліку і діють у кожному окремому вимірі по-різному. Ці помилки неможливо виключити; врахувати їх можна лише у середньому, навіщо необхідно знати закони, яким підпорядковуються випадкові помилки.

    Означатимемо вимірювану величину через А, а випадкову помилку при вимірюванні х. Так як помилка х може набувати будь-яких значень, то вона є безперервною випадковою величиною, яка цілком характеризується своїм законом розподілу.

    Найбільш простим і досить точно відображає дійсність (у переважній більшості випадків) є так званий нормальний закон розподілу помилок:

    Цей закон розподілу може бути отриманий з різних теоретичних передумов, зокрема, з вимоги, щоб найбільш ймовірним значенням невідомої величини, для якої безпосереднім виміром отримано ряд значень з однаковим ступенем точності, було середнє арифметичне цих значень. Величина 2 називається дисперсієюцього нормального закону.

    Середнє арифметичне

    Визначення дисперсії за дослідними даними. Якщо для будь-якої величини А безпосереднім виміром отримано n значень a i з однаковим ступенем точності і якщо помилки величини А підпорядковані нормальному закону розподілу, то найімовірнішим значенням буде А середнє арифметичне:

    a - середнє арифметичне,

    a i - виміряне значення на i-му кроці.

    Відхилення значення (для кожного спостереження) a i величини А від середнього арифметичного: a i - a.

    Для визначення дисперсії нормального закону розподілу помилок у цьому випадку користуються формулою:

    2 - дисперсія,
    a - середнє арифметичне,
    n - кількість вимірювань параметра,

    Середньоквадратичне відхилення

    Середньоквадратичне відхиленняпоказує абсолютне відхилення виміряних значень від середньоарифметичного. Відповідно до формули для міри точності лінійної комбінації середня квадратична помилкасереднього арифметичного визначається за такою формулою:

    , де


    a - середнє арифметичне,
    n - кількість вимірювань параметра,
    a i - виміряне значення на i-му кроці.

    Коефіцієнт варіації

    Коефіцієнт варіаціїхарактеризує відносну міру відхилення виміряних значень від середньоарифметичного:

    , де

    V - коефіцієнт варіації,
    - середньоквадратичне відхилення,
    a – середнє арифметичне.

    Чим більше значення коефіцієнта варіаціїтим більший розкид і менша вирівняність досліджуваних значень. Якщо коефіцієнт варіаціїменше 10%, то мінливість варіаційного ряду прийнято вважати незначною, від 10% до 20% відноситься до середньої, більше 20% і менше 33% до значної і якщо коефіцієнт варіаціїперевищує 33%, то це говорить про неоднорідність інформації та необхідність виключення найбільших і найменших значень.

    Середнє лінійне відхилення

    Один із показників розмаху та інтенсивності варіації - середнє лінійне відхилення(Середній модуль відхилення) від середнього арифметичного. Середнє лінійне відхиленнярозраховується за формулою:

    , де

    _
    a - середнє лінійне відхилення,
    a - середнє арифметичне,
    n - кількість вимірювань параметра,
    a i - виміряне значення на i-му кроці.

    Для перевірки відповідності досліджуваних значень закону нормального розподілу застосовують відношення показника асиметріїдо його помилки та ставлення показника ексцесудля його помилки.

    Показник асиметрії

    Показник асиметрії(A) та його помилка (m a) розраховується за такими формулами:

    , де

    А – показник асиметрії,
    - середньоквадратичне відхилення,
    a - середнє арифметичне,
    n - кількість вимірювань параметра,
    a i - виміряне значення на i-му кроці.

    Показник ексцесу

    Показник ексцесу(E) та його помилка (m e) розраховується за такими формулами:

    , де

    Стандартне відхилення – класичний індикатор мінливості з описової статистики.

    Стандартне відхиленнясередньоквадратичне відхилення, СКО, вибіркове стандартне відхилення (англ. standard deviation, STD, STDev) - дуже поширений показник розсіювання в описовій статистиці. Проте, т.к. технічний аналіз схожий на статистику, даний показник можна (і потрібно) використовувати в технічному аналізі для виявлення ступеня розсіювання ціни аналізованого інструменту в часі. Позначається грецьким символом Сігма "σ".

    Дякую Карлам Гаусс і Пірсон за те, що ми маємо можливість користуватися стандартним відхиленням.

    Використовуючи стандартне відхилення у технічному аналізі, ми перетворюємо цей «показник розсіювання» в «індикатор волатильності«, Зберігаючи сенс, але змінюючи терміни.

    Що являє собою стандартне відхилення

    Але крім проміжних допоміжних обчислень, стандартне відхилення цілком прийнятне для самостійного обчисленнята застосування у технічному аналізі. Як зазначив активний читач нашого журналу burdock, « досі не зрозумію, чому СКО не входить до набору стандартних індикаторів вітчизняних дилінгових центрів«.

    Справді, стандартне відхилення може класичним та «чистим» способом виміряти мінливість інструменту. Але на жаль, цей індикатор негаразд поширений у аналізі цінних паперів .

    Застосування стандартного відхилення

    Вручну обчислити стандартне відхилення не дуже цікавоале корисно для досвіду. Стандартне відхилення можна виразитиформулою STD=√[(∑(x-x ) 2)/n] , що звучить як корінь із суми квадратів різниць між елементами вибірки та середнім, поділеної на кількість елементів у вибірці.

    Якщо кількість елементів у вибірці перевищує 30, то знаменник дробу під коренем набуває значення n-1. Інакше використовується n.

    Покроково обчислення стандартного відхилення:

    1. обчислюємо середнє арифметичне вибірки даних
    2. забираємо це середнє від кожного елемента вибірки
    3. всі отримані різниці зводимо у квадрат
    4. сумуємо всі отримані квадрати
    5. ділимо отриману суму на кількість елементів у вибірці (або на n-1, якщо n>30)
    6. обчислюємо квадратний корінь з отриманого приватного (названого дисперсією)

    Варто зазначити, що такий розрахунку дисперсії є недолік – вона виходить зміщеною, тобто. її математичне очікування не дорівнює справжньому значенню дисперсії. Докладніше про це. У той же час не все так погано. При збільшенні обсягу вибірки вона наближається до свого теоретичного аналогу, тобто. є асимптотично не зміщеною. Тому під час роботи з великими розмірами вибірок можна використати формулу вище.

    Мова знаків корисно перекласти мовою слів. Вийде, що дисперсія – це середній квадрат відхилень. Тобто спочатку розраховується середнє значення, потім береться різниця між кожним вихідним та середнім значенням, зводиться у квадрат, складається і потім ділиться на кількість значень у цій сукупності. Різниця між окремим значенням та середньою відображає міру відхилення. У квадрат зводиться для того, щоб усі відхилення стали виключно позитивними числами і щоб уникнути взаємознищення позитивних та негативних відхилень при їхньому сумуванні. Потім, маючи квадрати відхилень, ми просто розраховуємо середню арифметичну. Середній – квадрат – відхилень. Відхилення зводяться у квадрат, і вважається середня. Розгадка полягає лише у трьох словах.

    Однак у чистому вигляді, як, наприклад, середня арифметична, або індекс, дисперсія не використовується. Це скоріше допоміжний і проміжний показник, необхідний інших видів статистичного аналізу. У неї навіть одиниці вимірювання нормальної немає. Судячи з формули, це квадрат одиниці виміру вихідних даних. Без пляшки, як кажуть, не розберешся.

    (Module 111)

    Щоб повернути дисперсію в реальність, тобто використовувати з більш приземлених цілей, з неї витягують квадратний корінь. Виходить так зване середньоквадратичне відхилення (СКО). Зустрічаються назви "стандартне відхилення" або "сигма" (від назви грецької літери). Формула стандартного відхилення має вигляд:

    Для отримання цього показника за вибіркою використовують формулу:

    Як і з дисперсією, є й трохи інший варіант розрахунку. Але зі зростанням вибірки різниця зникає.

    Середньоквадратичне відхилення, очевидно, також характеризує міру розсіювання даних, але тепер (на відміну дисперсії) його можна порівнювати з вихідними даними, так як одиниці виміру у них однакові (це випливає з формули розрахунку). Але і цей показник у чистому вигляді не дуже інформативний, тому що в ньому закладено занадто багато проміжних розрахунків, які збивають з пантелику (відхилення, квадрат, сума, середнє, корінь). Тим не менш, із середньоквадратичним відхиленням вже можна працювати безпосередньо, тому що властивості даного показника добре вивчені та відомі. Наприклад, є таке правило трьох сигм, Що свідчить, що у даних 997 значень з 1000 знаходяться в межах ±3 сигми від середньої арифметичної. Середньоквадратичне відхилення як міра невизначеності також бере участь у багатьох статистичних розрахунках. З її допомогою встановлюють ступінь точності різних оцінок та прогнозів. Якщо варіація дуже велика, то стандартне відхилення теж вийде великим, отже, і прогноз буде неточним, що висловиться, наприклад, у дуже широких інтервалах довірчих.

    Коефіцієнт варіації

    Середнє квадратичне відхилення дає абсолютну оцінку міри розкиду. Тому щоб зрозуміти, наскільки розкид великий щодо самих значень (тобто незалежно від їх масштабу), потрібен відносний показник. Такий показник називається коефіцієнтом варіаціїі розраховується за такою формулою:

    Коефіцієнт варіації вимірюється у відсотках (якщо помножити на 100%). За цим показником можна порівнювати найрізноманітніших явищ незалежно від їх масштабу та одиниць виміру. Цей факт і робить коефіцієнт варіації настільки популярним.

    У статистиці прийнято, що, якщо значення коефіцієнта варіації менше 33%, то сукупність вважається однорідною, якщо більше 33%, то неоднорідною. Мені тут важко щось прокоментувати. Не знаю хто і чому так визначив, але це вважається аксіомою.

    Відчуваю, що я захопився сухою теорією і треба навести щось наочне та образне. З іншого боку, всі показники варіації описують приблизно те саме, тільки розраховуються по-різному. Тому різноманітністю прикладів блиснути важко, Відрізнятися можуть лише значення показників, але не їхня суть. Ось і порівняємо, як відрізняються значення різних показників варіації для однієї й тієї сукупності даних. Візьмемо приклад із розрахунком середнього лінійного відхилення (з ). Ось вихідні дані:

    І графік нагадування.

    За цими даними розрахуємо різні показники варіації.

    Середнє значення – це середня середня арифметична.

    Розмах варіації – різниця між максимумом та мінімумом:

    Середнє лінійне відхилення вважається за формулою:

    Стандартне відхилення:

    Розрахунок зведемо до таблички.

    Як видно, середнє лінійне та середньоквадратичне відхилення дають схожі значення ступеня варіації даних. Дисперсія – це сигма у квадраті, тому вона завжди буде відносно великою кількістю, що, власне, ні про що не говорить. Розмах варіації – це різниця між крайніми значеннями і може багато про що говорити.

    Підіб'ємо деякі підсумки.

    Варіація показника відбиває мінливість процесу чи явища. Її ступінь може вимірюватися за допомогою кількох показників.

    1. Розмах варіації – різниця між максимумом та мінімумом. Відображає діапазон можливих значень.
    2. Середнє лінійне відхилення – відбиває середнє з абсолютних (за модулем) відхилень всіх значень аналізованої сукупності їх середньої величини.
    3. Дисперсія – середній квадрат відхилень.
    4. Середньоквадратичне відхилення – корінь із дисперсії (середнього квадрата відхилень).
    5. Коефіцієнт варіації – найбільш універсальний показник, відбиває ступінь розкиду значень незалежно від своїх масштабу та одиниць виміру. Коефіцієнт варіації вимірюється у відсотках і може бути використаний для порівняння варіації різних процесів та явищ.

    Таким чином, у статистичному аналізі існує система показників, що відображають однорідність явищ та стійкість процесів. Часто показники варіації не мають самостійного сенсу та використовуються для подальшого аналізу даних (розрахунок довірчих інтервалів



Останні матеріали розділу:

Малі сторожові кораблі пр
Малі сторожові кораблі пр

Хоча радянське надводне кораблебудування почалося з будівництва сторожів (СКР) типу «Ураган», кораблям цього класу мало уваги приділялося...

Найбільші російські богатирі (16 фото) Чурила Пленкович - Богатир заїжджий
Найбільші російські богатирі (16 фото) Чурила Пленкович - Богатир заїжджий

Київ-град стояв на трьох горах і височів над усіма російськими містами. Словом, столиця. Великим та мудрим був київський князь Володимир. Його...

Новини модернізації крейсерів «Орлан
Новини модернізації крейсерів «Орлан

Тяжкий атомний ракетний крейсер (ТАРКР). У 1964 р. в СРСР розпочато дослідження можливості будівництва великого військового надводного...