Дисперсія низки. Як розрахувати дисперсію в excel за допомогою функції дисп.

Дисперсіявипадкової величини- міра розкиду цієї випадкової величини, тобто її відхиленнявід математичного очікування. У статистиці для позначення дисперсії найчастіше використовується позначення (сигма у квадраті). Квадратний корінь з дисперсії, рівний, називається стандартним відхиленнямабо стандартним розкидом. Стандартне відхилення вимірюється у тих самих одиницях, як і сама випадкова величина, а дисперсія вимірюється у квадратах цієї одиниці виміру.

Хоча для оцінки всієї вибірки дуже зручно використовувати лише одне значення (таке як середнє або моду і медіану), цей підхід легко може призвести до неправильних висновків. Причина такого положення лежить не в самій величині, а в тому, що одна величина не відбиває розкид значень даних.

Наприклад, у вибірці:

середнє значення дорівнює 5.

Однак, у самій вибірці немає жодного елемента зі значенням 5. Можливо, Вам знадобиться ступінь близькості кожного елемента вибірки до її середнього значення. Або, іншими словами, вам потрібно знати дисперсію значень. Знаючи ступінь зміни даних, Ви можете краще інтерпретувати середнє значення, медіануі моду. Ступінь зміни значень вибірки визначається шляхом обчислення їхньої дисперсії та стандартного відхилення.



Дисперсія і квадратний корінь дисперсії, званий стандартним відхиленням, характеризують середнє відхилення від середнього значення вибірки. Серед цих двох величин найбільше значення має стандартне відхилення. Це значення можна представити як середню відстань, де знаходяться елементи від середнього елемента вибірки.

Дисперсію важко інтерпретувати змістовно. Однак квадратний корінь з цього значення є стандартним відхиленням і добре піддається інтерпретації.

Стандартне відхилення обчислюється шляхом визначення спочатку дисперсії і потім обчислення квадратного кореня дисперсії.

Наприклад, для масиву даних, наведених на малюнку, будуть отримані такі значення:

Малюнок 1

Тут середнє значення квадратів різниць дорівнює 717,43. Для отримання стандартного відхилення залишилося лише взяти квадратний корінь із цього числа.

Результат становитиме приблизно 26,78.

Слід пам'ятати, що стандартне відхилення інтерпретується як середня відстань, де знаходяться елементи від середнього значення вибірки.

Стандартне відхилення показує, як добре середнє значення описує всю вибірку.

Допустимо, Ви є керівником виробничого відділу зі збирання ПК. У квартальному звіті йдеться, що випуск за останній квартал становив 2500 ПК. Погано це чи добре? Ви попросили (або вже у звіті є ця графа) у звіті відобразити стандартне відхилення за цими даними. Цифра стандартного відхилення, наприклад, дорівнює 2000. Стає зрозумілим для Вас, як керівника відділу, що виробнича лінія вимагає кращого управління (занадто великі відхилення за кількістю ПК, що збираються).

Згадаймо: за великої величини стандартного відхилення дані широко розкидані щодо середнього значення, а за маленької – вони групуються близько до середнього значення.

Чотири статистичні функції ДИСП(), ДИСПР(), СТАНДОТКЛОН() та СТАНДОТКЛОНП() – призначені для обчислення дисперсії та стандартного відхилення чисел в інтервалі осередків. Перед тим як обчислювати дисперсію та стандартне відхилення набору даних, потрібно визначити, чи ці дані є генеральною сукупністю або вибіркою з генеральної сукупності. У разі вибірки з генеральної сукупності слід використовувати функції ДИСП() та СТАНДОТКЛОН(), а у разі генеральної сукупності – функції ДИСПР() та СТАНДОТЛОНП():

Генеральна сукупність Функція

ДИСПР()

СТАНДОТЛОНП()
Вибірка

ДИСП()

СТАНДОТКЛОН()

Дисперсія (а також стандартне відхилення), як ми зазначали, свідчать про те, якою мірою входять до набору даних величини розкидані навколо середнього арифметичного.

Мале значення дисперсії чи стандартного відхилення свідчить, що це дані зосереджені навколо середнього арифметичного, а велике значення цих величин – у тому, що дані розкидані у широкому діапазоні значень.

Дисперсію досить важко інтерпретувати змістовно (що означає мале значення, велике значення?). Виконання Завдання 3дозволить візуально, на графіку, показати сенс дисперсії для набору даних.

Завдання

· Завдання 1.

· 2.1. Дати поняття: дисперсія та стандартне відхилення; їх символьне позначення під час статистичної обробки даних.

· 2.2. Оформити робочий лист відповідно до рисунка 1 і зробити необхідні розрахунки.

· 2.3. Навести основні формули, які використовуються при розрахунках

· 2.4. Пояснити всі позначення ( , , )

· 2.5. Пояснити практичне значення поняття дисперсія та стандартне відхилення.

Завдання 2.

1.1. Дати поняття: генеральна сукупність та вибірка; математичне очікування та середнє арифметичне їхнє символьне позначення при статистичній обробці даних.

1.2. Відповідно до рисунка 2 оформити робочий лист і зробити розрахунки.

1.3. Навести основні формули, що використовуються при розрахунках (для генеральної сукупності та вибірки).

Малюнок 2

1.4. Поясніть, чому можливі отримання таких значень середніх арифметичних у вибірках як 46,43 та 48,78 (див. файл Додаток). Зробити висновки.

Завдання 3.

Є дві вибірки з різним набором даних, але середнє їм однаковим:

Малюнок 3

3.1. Оформити робочий лист відповідно до рисунка 3 і зробити необхідні розрахунки.

3.2. Наведіть основні формули розрахунку.

3.3. Побудуйте графіки відповідно до рисунків 4, 5.

3.4. Поясніть отримані залежності.

3.5. Аналогічні обчислення проведіть для цих двох вибірок.

Вихідна вибірка 11119999

Значення другої вибірки підбираєте так, щоб середнє арифметичне для другої вибірки було таким же, наприклад,:

Підберіть значення для другої вибірки самостійно. Оформіть обчислення та побудови графіків подібно до малюнків 3, 4, 5. Покажіть основні формули, які використовували при обчисленнях.

Зробіть відповідні висновки.

Усі завдання оформити у вигляді звіту з усіма необхідними малюнками, графіками, формулами та короткими поясненнями.

Примітка: побудову графіків обов'язково пояснити з малюнками та короткими поясненнями.

У разі, якщо сукупність розбита на групи за ознакою, що вивчається, то для даної сукупності можуть бути обчислені такі види дисперсії: загальна, групові (внутрішньогрупові), середня з групових (середня з внутрішньогрупових), міжгрупова.

Спочатку розраховує коефіцієнт детермінації, який показує яку частину загальної варіації досліджуваного ознаки становить міжгрупова варіація, тобто. обумовлена ​​групувальною ознакою:

Емпіричне кореляційне відношення характеризує тісноту зв'язку між ознаками групувальним (факторним) та результативним.

Емпіричне кореляційне відношення може набувати значення від 0 до 1.

Для оцінки тісноти зв'язку на основі показника емпіричного кореляційного відношення можна скористатися співвідношеннями Чеддока:

приклад 4.Є такі дані про виконання робіт проектно-вишукувальними організаціями різної форми власності:

Визначити:

1) загальну дисперсію;

2) групові дисперсії;

3) середню із групових дисперсій;

4) міжгрупову дисперсію;

5) загальну дисперсію з урахуванням правила складання дисперсій;


6) коефіцієнт детермінації та емпіричне кореляційне відношення.

Зробіть висновки.

Рішення:

1. Визначимо середній обсяг виконання робіт підприємств двох форм власності:

Розрахуємо загальну дисперсію:

2. Визначимо групові середні:

млн. руб.;

млн. руб.

Групові дисперсії:

;

3. Розрахуємо середню із групових дисперсій:

4. Визначимо міжгрупову дисперсію:

5. Розрахуємо загальну дисперсію з урахуванням правила складання дисперсій:

6. Визначимо коефіцієнт детермінації:

.

Таким чином, обсяг робіт, виконаних проектно-розвідувальними організаціями на 22% залежить від форми власності підприємств.

Емпіричне кореляційне відношення розраховуємо за формулою

.

Розмір розрахованого показника свідчить у тому, що залежність обсягу робіт від форми власності підприємства невелика.

Приклад 5.В результаті обстеження технологічної дисципліни виробничих ділянок отримано такі дані:

Визначте коефіцієнт детермінації

Дисперсія у статистицізнаходиться як індивідуальних значень ознаки у квадраті від . Залежно від вихідних даних вона визначається за формулами простої та зваженої дисперсій:

1. (Для несгрупованих даних) обчислюється за формулою:

2. Зважена дисперсія (для варіаційного ряду):

де n - Частота (повторюваність фактора Х)

Приклад знаходження дисперсії

На цій сторінці описано стандартний приклад знаходження дисперсії, також Ви можете переглянути інші завдання на її знаходження

Приклад 1. Є такі дані щодо групи з 20 студентів заочного відділення. Потрібно побудувати інтервальний ряд розподілу ознаки, розрахувати середнє значення ознаки та вивчити його дисперсію

Побудуємо інтервальне угруповання. Визначимо розмах інтервалу за формулою:

де X max - максимальне значення групувального ознаки;
X min-мінімальне значення групувальної ознаки;
n – кількість інтервалів:

Приймаємо n=5. Крок дорівнює: h = (192 - 159) / 5 = 6,6

Складемо інтервальне угруповання

Для подальших розрахунків збудуємо допоміжну таблицю:

X'i - середина інтервалу. (наприклад, середина інтервалу 159 – 165,6 = 162,3)

Середню величину зростання студентів визначимо за формулою середньої арифметичної зваженої:

Визначимо дисперсію за такою формулою:

Формулу дисперсії можна перетворити так:

З цієї формули випливає, що дисперсія дорівнює різниці середньої з квадратів варіантів і квадрата та середньої.

Дисперсія у варіаційних рядахз рівними інтервалами за способом моментів може бути розрахована наступним способом при використанні другої властивості дисперсії (розділивши всі варіанти на величину інтервалу). Визначення дисперсії, обчисленої за способом моментів, за такою формулою менш трудомісткий:

де i – величина інтервалу;
А - умовний нуль, як який зручно використовувати середину інтервалу, що володіє найбільшою частотою;
m1 - квадрат моменту першого порядку;
m2 - момент другого порядку

(якщо в статистичній сукупності ознака змінюється так, що є тільки два варіанти, що взаємно виключають один одного, то така мінливість називається альтернативною) може бути обчислена за формулою:

Підставляючи до цієї формули дисперсії q =1- р, отримуємо:

Види дисперсії

Загальна дисперсіявимірює варіацію ознаки у всій сукупності загалом під впливом всіх чинників, що зумовлюють цю варіацію. Вона дорівнює середньому квадрату відхилень окремих значень ознаки х від загального середнього значення х може бути визначена як проста дисперсія або зважена дисперсія.

характеризує випадкову варіацію, тобто. частина варіації, яка обумовлена ​​впливом неврахованих факторів і не залежить від ознаки-фактора, покладеної в основу угруповання. Така дисперсія дорівнює середньому квадрату відхилень окремих значень ознаки всередині групи X від середньої арифметичної групи і може бути обчислена як проста дисперсія або зважена дисперсія.

Таким чином, внутрішньогрупова дисперсія вимірюєваріацію ознаки всередині групи та визначається за формулою:

де хі - групова середня;
ni – число одиниць у групі.

Наприклад, внутрішньогрупові дисперсії, які треба визначити в задачі вивчення впливу кваліфікації робітників на рівень продуктивності праці в цеху показують варіації виробітку в кожній групі, викликані всіма можливими факторами (технічний стан обладнання, забезпеченість інструментами та матеріалами, вік робітників, інтенсивність праці тощо) .), крім відмінностей у кваліфікаційному розряді (всередині групи всі робітники мають одну й ту саму кваліфікацію).

Середня з внутрішньо групових дисперсій відображає випадкову , тобто ту частину варіації, яка відбувалася під впливом всіх інших факторів, за винятком фактора угруповання. Вона розраховується за такою формулою:

Характеризує систематичну варіацію результативної ознаки, яка обумовлена ​​впливом ознаки-фактора, покладеного в основу угруповання. Вона дорівнює середньому квадрату відхилень групових середніх від загальної середньої. Міжгрупова дисперсія розраховується за такою формулою:

Правило складання дисперсії у статистиці

Згідно правилу складання дисперсійзагальна дисперсія дорівнює сумі середньої із внутрішньогрупових та міжгрупових дисперсій:

Сенс цього правилаполягає в тому, що загальна дисперсія, яка виникає під впливом всіх факторів, дорівнює сумі дисперсій, що виникають під впливом всіх інших факторів, та дисперсії, що виникає за рахунок угруповання.

Користуючись формулою складання дисперсій, можна визначити за двома відомими дисперсіями третю невідому, а також судити про силу впливу групувальної ознаки.

Властивості дисперсії

1. Якщо всі значення ознаки зменшити (збільшити) на ту саму постійну величину, то дисперсія від цього не зміниться.
2. Якщо всі значення ознаки зменшити (збільшити) в те саме число разів n, то дисперсія відповідно зменшиться (збільшити) в n^2 разів.

Дисперсія у статистиці визначається як середнє квадратичне відхилення індивідуальних значень ознаки у квадраті від середньої арифметичної. Поширений спосіб розрахунку квадратів відхилень варіантів від середньої зі своїми подальшим усередненням.

В економічно-статистичному аналізі варіацію ознаки прийнято оцінювати найчастіше за допомогою середнього квадратичного відхилення, воно є коренем квадратним з дисперсії.

(3)

Характеризує абсолютну коливання значень варіюючого ознаки виявляється у тих самих одиницях виміру, як і варіанти. У статистиці часто виникає необхідність порівняння варіації різних ознак. Для таких порівнянь використовують відносний показник варіації, коефіцієнт варіації.

Властивості дисперсії:

1)якщо з усіх варіант відняти якесь число, то дисперсія від цього не зміниться;

2) якщо всі значення варіант розділити на якесь число b, то дисперсія зменшиться в b^2 разів, тобто.

3) якщо обчислити середній квадрат відхилень від будь-якого числа з нерівного середнього арифметичного, то він буде більше дисперсії . При цьому цілком певну величину на квадрат різниці між середньою величиною поc.

Дисперсію можна визначити як різницю між середнім квадратом та середньою у квадраті.

17. Групова та міжгрупова варіації. Правило складання дисперсії

Якщо статистична сукупність розбита на групи або частини за ознакою, що вивчається, то для такої сукупності можуть бути обчислені такі види дисперсії: групові (приватні), середньо групові (приватних), і міжгрупова.

Загальна дисперсія- Відображає варіацію ознаки за рахунок всіх умов і причин, що діють у даній статистичній сукупності.

Групова дисперсія- Дорівнює середньому квадрату відхилень окремих значень ознаки всередині групи від середньої арифметичної цієї групи, званої групової середньої. При цьому групова середня не збігається із загальною середньою для всієї сукупності.

Групова дисперсія відображає варіацію ознаки лише за рахунок умов та причин, що діють усередині групи.

Середня групова дисперсія- визначається як середнє зважене арифметичне з групових дисперсій, причому вагами є обсяги груп.

Міжгрупова дисперсія- дорівнює середньому квадрату відхилень групових середніх від загальної середньої.

Міжгрупова дисперсія характеризує варіацію результативної ознаки за рахунок групувальної ознаки.

Між розглянутими видами дисперсій існує певне співвідношення: загальна дисперсія дорівнює сумі середньої групової та міжгрупової дисперсії.

Це співвідношення називається правилом складання дисперсії.

18. Динамічний ряд та його складові елементи. Види динамічних рядів.

Ряд у статистиці- це цифрові дані, що показують, зміна явища у часі чи просторі і дають можливість виробляти статистичне порівняння явищ як у процесі їх розвитку у часі, і за різними форм і видів процесів. Завдяки цьому можна виявити взаємну залежність явищ.

Процес розвитку руху соціальних явищ у часі у статистиці прийнято називати динамікою. Для відображення динаміки будують ряди динаміки (хронологічні, тимчасові), які є рядами значень статистичного показника, що змінюються в часі (наприклад, кількість засуджених за 10 років), розташованих у хронологічному порядку. Їх складовими елементами є цифрові значення даного показника та періоди чи моменти часу, до яких вони відносяться.

Найважливіша характеристика рядів динаміки- їх розмір (обсяг, величина) того чи іншого явища, досягнутих у певний період або до певного моменту. Відповідно, величина членів низки динаміки - його рівень. Розрізняютьпочатковий, середній та кінцевий рівні динамічного ряду. Початковий рівеньпоказує величину першого, кінцевий – величину останнього члена ряду. Середній рівеньявляє собою середню хронологічну варіаційну раду і обчислюється в залежності від того, чи динамічний ряд є інтервальним або моментним.

Ще одна важлива характеристика динамічного ряду- час, що минув від початкового до кінцевого спостереження, чи кількість таких спостережень.

Існують різні види рядів динаміки, їх можна класифікувати за такими ознаками.

1) Залежно від способу вираження рівнів ряди динаміки поділяються на ряди абсолютних та похідних показників (відносних та середніх величин).

2) Залежно від того, як виражають рівні ряду стан явища на певні моменти часу (на початок місяця, кварталу, року тощо) або його величину за певні інтервали часу (наприклад, за добу, місяць, рік тощо). п.), розрізняють відповідно моментні та інтервальні ряди динаміки. Моментні лави в аналітичній роботі правоохоронних органів використовуються порівняно рідко.

Теоретично статистики виділяють раді динаміки і з інших класифікаційних ознак: залежно від відстані між рівнями - з рівнозначними рівнями і нерівними рівнями у часі; залежно від наявності основної тенденції досліджуваного процесу – стаціонарні та не стаціонарні. При аналізі динамічних рядів виходять з наступного рівні ряду у вигляді складових:

Y t = TP + Е(t)

де ТР – детермінована складова, що визначає загальну тенденцію зміни в часі або тренд.

Е (t) - випадкова компонента, що викликає коливання рівнів.



Останні матеріали розділу:

Вираз цілі у німецькій мові Um zu damit у німецькій мові
Вираз цілі у німецькій мові Um zu damit у німецькій мові

Після союзів aber - але , und - і, а , sondern - але, а , denn - тому що , oder - або, або в придаткових реченнях використовується...

Характеристики головних героїв твору Білий пудель, Купрін
Характеристики головних героїв твору Білий пудель, Купрін

Бариня – другорядний персонаж у оповіданні; багата поміщиця, яка проводить літо на своїй дачі у Криму; мати примхливого та норовливого хлопчика.

У списках не значився, Васильєв Борис львович
У списках не значився, Васильєв Борис львович

Василь Володимирович Биков «У списках не значився» Частина перша Миколі Петровичу Плужнікову надали військове звання, видали форму лейтенанта...