Сенс дисперсії випадкової величини. Дисперсія та стандартне відхилення

Для згрупованих даних залишкова дисперсія- середня із внутрішньогрупових дисперсій:

Де σ 2 j - внутрішньогрупова дисперсія j-ї групи.

Для не згрупованих даних залишкова дисперсія– міра точності апроксимації, тобто. наближення лінії регресії до вихідних даних:
де y(t) – прогноз рівняння тренда; yt – вихідний ряд динаміки; n - кількість точок; p – число коефіцієнтів рівняння регресії (кількість змінних, що пояснюють).
У цьому прикладі вона називається незміщена оцінка дисперсії.

Приклад №1. Розподіл робітників трьох підприємств одного об'єднання за тарифними розрядами характеризується такими даними:

Тарифний розряд робітникаЧисельність робітників на підприємстві
підприємство 1підприємство 2підприємство 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

Визначити:
1. дисперсію по кожному підприємству (внутрішньогрупові дисперсії);
2. середню із внутрішньогрупових дисперсій;
3. міжгрупову дисперсію;
4. загальну дисперсію.

Рішення.
Перш ніж приступити до вирішення завдання необхідно з'ясувати, яка ознака є результативною, а якою є факторною. У прикладі результативною ознакою є «Тарифний розряд», а факторною ознакою – «Номер (назва) підприємства».
Тоді маємо три групи (підприємства), для яких необхідно розрахувати групову середню та внутрішньогрупові дисперсії:


ПідприємствоГрупова середня,Внутрішньогрупова дисперсія,
1 4 1,8

Середня з внутрішньогрупових дисперсій ( залишкова дисперсія) розрахуємо за формулою:


де можна розрахувати:
або:


тоді:
Загальна дисперсія дорівнюватиме: s 2 = 1,6 + 0 = 1,6.
Загальну дисперсію також можна розрахувати і за однією з наступних двох формул:

При вирішенні практичних завдань часто доводиться мати справу з ознакою, яка приймає лише два альтернативні значення. У цьому випадку говорять не про вагу того чи іншого значення ознаки, а про його частку в сукупності. Якщо частку одиниць сукупності, які мають досліджувану ознаку, позначити через « р», а не володіють – через « q», то дисперсію можна розрахувати за такою формулою:
s 2 = p×q

Приклад №2. За даними про вироблення шести робочих бригади визначити міжгрупову дисперсію та оцінити вплив робочої зміни на їх продуктивність праці, якщо загальна дисперсія дорівнює 12,2.

№ робітника бригадиВироблення робітника, шт.
в I змінуу II зміну
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

Рішення. Початкові дані

Xf 1f 2f 3f 4f 5f 6Разом
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
Разом 31 33 37 37 40 38

Тоді маємо 6 групи, для яких необхідно розрахувати групову середню та внутрішньогрупові дисперсії.
1. Знаходимо середні значення кожної групи.







2. Знаходимо середнє квадратичне кожної групи.







Результати розрахунку зведемо до таблиці:
Номер групиГрупова середняВнутрішньогрупова дисперсія
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. Внутрішньогрупова дисперсіяхарактеризує зміну (варіацію) досліджуваної (результативної) ознаки в межах групи під впливом на нього всіх факторів, крім фактора, покладеного в основу угруповання:
Середню із внутрішньогрупових дисперсій розрахуємо за формулою:


4. Міжгрупова дисперсіяхарактеризує зміну (варіацію) досліджуваного (результативного) ознаки під впливом нього чинника (факторного ознаки), покладеного в основу угруповання.
Міжгрупову дисперсію визначимо як:

де


Тоді

Загальна дисперсіяхарактеризує зміна (варіацію) досліджуваного (результативного) ознаки під впливом нею всіх без винятку чинників (факторних ознак). За умовою завдання вона дорівнює 12.2.
Емпіричне кореляційне ставленнявимірює, яку частину загальної коливання результативної ознаки викликає фактор, що вивчається. Це відношення факторної дисперсії до загальної дисперсії:

Визначаємо емпіричне кореляційне відношення:

Зв'язки між ознаками можуть бути слабкими та сильними (тісними). Їхні критерії оцінюються за шкалою Чеддока:
0.1 0.3 0.5 0.7 0.9 У нашому прикладі зв'язок між ознакою Y фактором X слабкий
Коефіцієнт детермінації.

Визначимо коефіцієнт детермінації:

Таким чином, на 0.67% варіація обумовлена ​​відмінностями між ознаками, а на 99.37% іншими факторами.
Висновок: у разі вироблення робочих залежить від роботи у конкретну зміну, тобто. вплив робочої зміни з їхньої продуктивність праці не значний і зумовлено іншими чинниками.

Приклад №3. На основі даних про середню заробітну плату та квадрати відхилень від її величини за двома групами робітників знайти загальну дисперсію, застосувавши правило складання дисперсій:

Рішення:
Середня із внутрішньогрупових дисперсій

Міжгрупову дисперсію визначимо як:


Загальна дисперсія дорівнюватиме: 480 + 13824 = 14304

Поряд із вивченням варіації ознаки по всій по всій сукупності в цілому часто буває необхідно простежити кількісні зміни ознаки по групах, на які поділяється сукупність, а також між групами. Таке вивчення варіації досягається за допомогою обчислення та аналізу різних видів дисперсії.
Виділяють дисперсію загальну, міжгрупову та внутрішньогрупову.
Загальна дисперсія σ 2вимірює варіацію ознаки у всій сукупності під впливом всіх чинників, що зумовили цю варіацію, .

Міжгрупова дисперсія (δ) характеризує систематичну варіацію, тобто. відмінності у величині досліджуваної ознаки, що виникають під впливом ознаки-фактора, покладеного в основу угруповання. Вона розраховується за такою формулою:
.

Внутрішньогрупова дисперсія (σ)відбиває випадкову варіацію, тобто. частина варіації, що відбувається під впливом неврахованих факторів і не залежить від ознаки-фактора, покладеного в основу угруповання. Вона обчислюється за такою формулою:
.

Середня із внутрішньогрупових дисперсій: .

Існує закон, що пов'язує 3 види дисперсії. Загальна дисперсія дорівнює сумі середньої з внутрішньогрупової та міжгрупової дисперсії: .
Дане співвідношення називають правилом складання дисперсій.

В аналізі широко використовується показник, що є частиною міжгрупової дисперсії в загальній дисперсії. Він має назву емпіричного коефіцієнта детермінації (? 2): .
Корінь квадратний з емпіричного коефіцієнта детермінації зветься емпіричного кореляційного відношення (η):
.
Воно характеризує вплив ознаки, покладеної в основу угруповання, на варіацію результативної ознаки. Емпіричне кореляційне відношення змінюється не більше від 0 до 1.
Покажемо його практичне використання на прикладі (табл. 1).

Приклад №1. Таблиця 1 – Продуктивність праці двох груп робітників одного з цехів НВО «Циклон»

Розрахуємо загальну та групові середні та дисперсії:




Вихідні дані для обчислення середньої внутрішньогрупової та міжгрупової дисперсії представлені в табл. 2.
Таблиця 2
Розрахунок і 2 по двох групах робочих.


Групи робітників
Чисельність робітників, чол. Середня, дет./змін. Дисперсія

Пройшли технічне навчання

5 95 42,0

Не пройшли технічне навчання

5 81 231,2

Усі робітники

10 88 185,6
Розрахуємо показники. Середня із внутрішньогрупових дисперсій:
.
Міжгрупова дисперсія

Загальна дисперсія:
Отже, емпіричне кореляційне співвідношення: .

Поряд із варіацією кількісних ознак може спостерігатися і варіація якісних ознак. Таке вивчення варіації досягається у вигляді обчислення наступних видів дисперсій:

Внутрішньогрупова дисперсія частки визначається за формулою

де n i- Чисельність одиниць в окремих групах.
Частка ознаки, що вивчається, у всій сукупності, яка визначається за формулою:
Три види дисперсії пов'язані між собою так:
.

Це співвідношення дисперсій називається теоремою складання дисперсій частки ознаки.

Обчислимо вMSEXCELдисперсію та стандартне відхилення вибірки. Також обчислимо дисперсію випадкової величини, якщо відомий її розподіл.

Спочатку розглянемо дисперсію, потім стандартне відхилення.

Дисперсія вибірки

Дисперсія вибірки (вибіркова дисперсія,samplevariance) характеризує розкид значень у масиві щодо .

Усі 3 формули математично еквівалентні.

З першої формули видно, що дисперсія вибіркице сума квадратів відхилень кожного значення в масиві від середнього, Поділена на розмір вибірки мінус 1.

дисперсії вибіркивикористовується функція ДИСП(), англ. назва VAR, тобто. VARiance. З версії MS EXCEL 2010 рекомендується використовувати аналог ДИСП.В() , англ. назва VARS, тобто. Sample VARiance. Крім того, починаючи з версії MS EXCEL 2010 є функція ДИСП.Г(), англ. назва VARP, тобто. Population VARiance, яка обчислює дисперсіюдля генеральної сукупності. Вся відмінність зводиться до знаменника: замість n-1 як у ДИСП.В(), у ДИСП.Г() у знаменнику просто n. До MS EXCEL 2010 для обчислення дисперсії генеральної сукупності використовувалась функція ДИСПР().

Дисперсію вибірки
=КВАДРОТКЛ(Вибірка)/(РАХУНОК(Вибірка)-1)
=(СУММКВ(Вибірка)-РАХУНОК(Вибірка)*СРЗНАЧ(Вибірка)^2)/ (РАХУНОК(Вибірка)-1)- Звичайна формула
= СУМ((Вибірка-СРЗНАЧ(Вибірка))^2)/ (РАХУНОК(Вибірка)-1) –

Дисперсія вибіркидорівнює 0, тільки в тому випадку, якщо всі значення рівні між собою і відповідно рівні середнього значення. Зазвичай, чим більша величина дисперсіїтим більше розкид значень у масиві.

Дисперсія вибіркиє точковою оцінкою дисперсіїрозподілу випадкової величини, з якої було зроблено вибірка. Про побудову довірчих інтервалівпри оцінці дисперсіїможна прочитати у статті.

Дисперсія випадкової величини

Щоб обчислити дисперсіювипадкової величини необхідно знати її .

Для дисперсіївипадкової величини Х часто використовують позначення Var(Х). Дисперсіядорівнює квадрату відхилення від середнього E(X): Var(Х)=E[(X-E(X)) 2 ]

дисперсіяобчислюється за такою формулою:

де x i – значення, яке може набувати випадкова величина, а μ – середнє значення (), р(x) – ймовірність, що випадкова величина прийме значення х.

Якщо випадкова величина має, то дисперсіяобчислюється за такою формулою:

Розмірність дисперсіївідповідає квадрату одиниці виміру вихідних значень. Наприклад, якщо значення у вибірці є вимірювання ваги деталі (в кг), то розмірність дисперсії буде кг 2 . Це буває складно інтерпретувати, тому для характеристики розкиду значень частіше використовують величину рівну квадратному кореню. дисперсіїстандартне відхилення.

Деякі властивості дисперсії:

Var(Х + a) = Var (Х), де Х - випадкова величина, а - константа.

Var(aХ)=a 2 Var(X)

Var(Х)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Ця властивість дисперсії використовується в статті про лінійну регресію.

Var(Х+Y)=Var(Х) + Var(Y) + 2*Cov(Х;Y), де Х та Y - випадкові величини, Cov(Х;Y) - коваріація цих випадкових величин.

Якщо випадкові величини незалежні (independent), їх коваріаціядорівнює 0, отже, Var(Х+Y)=Var(Х)+Var(Y). Ця властивість дисперсії використовується при виведенні.

Покажемо, що з незалежних величин Var(Х-Y)=Var(Х+Y). Справді, Var(Х-Y)=Var(Х-Y)=Var(Х+(-Y))=Var(Х)+Var(-Y)=Var(Х)+Var(-Y)=Var( Х)+(-1) 2 Var(Y)=Var(Х)+Var(Y)=Var(Х+Y). Ця властивість дисперсії використовується для побудови.

Стандартне відхилення вибірки

Стандартне відхилення вибірки- це міра того, наскільки широко розкидані значення у вибірці щодо них.

За визначенням, стандартне відхиленняодно квадратному кореню з дисперсії:

Стандартне відхиленняне враховує величину значень у вибірці, а тільки ступінь розсіювання значень навколо них середнього. Щоб проілюструвати це наведемо приклад.

Обчислимо стандартне відхилення для 2-х вибірок: (1; 5; 9) та (1001; 1005; 1009). В обох випадках s=4. Очевидно, що відношення величини стандартного відхилення до значень масиву вибірок істотно відрізняється. Для таких випадків використовується Коефіцієнт варіації(Coefficient of Variation, CV) - ставлення Стандартне відхиленнядо середнього арифметичному, Вираженого у відсотках.

У MS EXCEL 2007 та більш ранніх версіях для обчислення Стандартне відхилення вибіркивикористовується функція = СТАНДОТКЛОН (), англ. назва STDEV, тобто. STandard DEViation. З версії MS EXCEL 2010 рекомендується використовувати її аналог = СТАНДОТКЛОН.В(), англ. назва STDEV.S, тобто. Sample STandard DEViation.

Крім того, починаючи з версії MS EXCEL 2010 є функція СТАНДОТКЛОН.Г() , англ. назва STDEV.P, тобто. Population STandard DEViation, яка обчислює стандартне відхиленнядля генеральної сукупності. Вся відмінність зводиться до знаменника: замість n-1 як у СТАНДОТКЛОН.В() , у СТАНДОТКЛОН.Г() у знаменнику просто n.

Стандартне відхиленняможна також обчислити безпосередньо за нижченаведеними формулами (див. файл прикладу)
=КОРІНЬ(КВАДРОТКЛ(Вибірка)/(РАХУНОК(Вибірка)-1))
=КОРІНЬ((СУММКВ(Вибірка)-РАХУНОК(Вибірка)*СРЗНАЧ(Вибірка)^2)/(РАХУНОК(Вибірка)-1))

Інші заходи розкиду

Функція КВАДРОТКЛ() обчислює з умму квадратів відхилень значень від них середнього. Ця функція поверне той самий результат, як і формула =ДИСП.Г( Вибірка)*РАХУНОК( Вибірка), де Вибірка- Посилання на діапазон, що містить масив значень вибірки (). Обчислення функції КВАДРОТКЛ() проводяться за формулою:

Функція СРОТКЛ() є мірою розкиду безлічі даних. Функція СРОТКЛ() обчислює середнє абсолютних значень відхилень значень від середнього. Ця функція поверне той самий результат, що й формула =СУМПРОВИЗВ(ABS(Вибірка-СРЗНАЧ(Вибірка)))/РАХУНОК(Вибірка), де Вибірка- Посилання на діапазон, що містить масив значень вибірки.

Обчислення функції СРОТКЛ () проводяться за формулою:

Серед безлічі показників, що застосовуються у статистиці, потрібно виділити розрахунок дисперсії. Слід зазначити, що виконання вручну цього обчислення – досить стомлююче заняття. На щастя, в Excel є функції, що дозволяють автоматизувати процедуру розрахунку. З'ясуємо алгоритм роботи із цими інструментами.

Дисперсія – це показник варіації, що є середній квадрат відхилень від математичного очікування. Отже, він висловлює розкид чисел щодо середнього значення. Обчислення дисперсії може проводитися як за генеральною сукупністю, так і вибірковою.

Спосіб 1: розрахунок за генеральною сукупністю

Для розрахунку цього показника в Excel за генеральною сукупністю застосовується функція ДИСП.Г. Синтаксис цього виразу має такий вигляд:

ДИСП.Г(Число1; Число2; ...)

Усього може бути застосовано від 1 до 255 аргументів. Як аргументи можуть виступати, як числові значення, так і посилання на комірки, в яких вони містяться.

Подивимося, як визначити це значення для діапазону з числовими даними.


Спосіб 2: розрахунок за вибіркою

На відміну від обчислення значення по генеральній сукупності, у розрахунку за вибіркою у знаменнику вказується не загальна кількість чисел, а на одне менше. Це робиться з метою корекції похибки. Ексель враховує даний нюанс у спеціальній функції, яка призначена для цього виду обчислення – ДИСП.В. Її синтаксис представлений такою формулою:

ДИСП.В(Число1; Число2; ...)

Кількість аргументів, як і попередньої функції, теж може коливатися від 1 до 255.


Як бачимо, програма Ексель здатна значною мірою полегшити розрахунок дисперсії. Ця статистична величина може бути розрахована додатком як за генеральною сукупністю, так і за вибіркою. При цьому всі дії користувача фактично зводяться тільки до вказівки діапазону чисел, що обробляються, а основну роботу Excel робить сам. Безумовно, це заощадить значну кількість часу користувачів.

Варіаційний розмах (або розмах варіації)це різниця між максимальним та мінімальним значеннями ознаки:

У прикладі розмах варіації змінної вироблення робочих становить: у першій бригаді R=105-95=10 дет., у другій бригаді R=125-75=50 дет. (У 5 разів більше). Це свідчить, що вироблення 1-ї бригади більш «стійка», але резервів зростання вироблення більше в другій бригади, т.к. у разі досягнення всіма робітниками максимальної для цієї бригади виробітку, нею може бути виготовлено 3*125=375 деталей, а в 1-й бригаді лише 105*3=315 деталей.
Якщо крайні значення ознаки не типові для сукупності, використовують квартильний або децильний розмахи. Квартильний розмах RQ = Q3-Q1 охоплює 50% обсягу сукупності, децильний розмах перший RD1 = D9-D1охоплює 80% даних, другий децильний розмах RD2 = D8-D2 - 60%.
Недоліком показника варіаційного розмаху є, але його величина не відображає всі коливання ознаки.
Найпростішим узагальнюючим показником, що відображає всі коливання ознаки, є середнє лінійне відхилення, що являє собою середню арифметичну абсолютних відхилень окремих варіантів від їх середньої величини:

,
для згрупованих даних
,
де хi - значення ознаки в дискретному ряду або середина інтервалу в інтервальному розподілі.
У вищенаведених формулах різниці в чисельнику взяті за модулем, інакше, згідно з властивістю середньої арифметичної, чисельник завжди дорівнюватиме нулю. Тому середнє лінійне відхилення у статистичній практиці застосовують рідко, лише у випадках, коли підсумовування показників без урахування знака має економічний сенс. З його допомогою, наприклад, аналізується склад працюючих, рентабельність виробництва, оборот зовнішньої торгівлі.
Дисперсія ознаки- Це середній квадрат відхилень варіант від їх середньої величини:
проста дисперсія
,
зважена дисперсія
.
Формулу для розрахунку дисперсії можна спростити:

Таким чином, дисперсія дорівнює різниці середньої з квадратів варіант і квадрата середньої з варіант сукупності:
.
Однак, внаслідок підсумовування квадратів відхилень дисперсія дає спотворене уявлення про відхилення, тому її на основі розраховують середнє квадратичне відхиленнящо показує, наскільки в середньому відхиляються конкретні варіанти ознаки від їхнього середнього значення. Обчислюється шляхом вилучення квадратного кореня з дисперсії:
для несгрупованих даних
,
для варіаційного ряду

Чим менше значення дисперсії та середнього квадратичного відхилення, тим однорідніша сукупність, тим більш надійною (типовою) буде середня величина.
Середнє лінійне та середнє квадратичне відхилення - іменовані числа, тобто виражаються в одиницях виміру ознаки, ідентичні за змістом та близькі за значенням.
Розраховувати абсолютні показники варіації рекомендується з допомогою таблиць.
Таблиця 3 - Розрахунок показників варіації (на прикладі терміну даних про змінну вироблення робочих бригади)


Число робітників,

Середина інтервалу,

Розрахункові значення

Разом:

Середнє зміна вироблення робітників:

Середнє лінійне відхилення:

Дисперсія виробітку:

Середнє квадратичне відхилення виробітку окремих робітників від середнього виробітку:
.

1 Розрахунок дисперсії способом моментів

Обчислення дисперсій пов'язані з громіздкими розрахунками (особливо якщо середня величина виражена великим числом із кількома десятковими знаками). Розрахунки можна спростити, якщо використовувати спрощену формулу та властивості дисперсії.
Дисперсія має такі властивості:

  1. якщо всі значення ознаки зменшити або збільшити на ту саму величину А, то дисперсія від цього не зменшиться:

,

, то чи
Використовуючи властивості дисперсії і спочатку зменшивши всі варіанти сукупності на величину А, а потім розділивши величину інтервалу h, отримаємо формулу обчислення дисперсії в варіаційних рядах з рівними інтервалами способом моментів:
,
де - Дисперсія, обчислена за способом моментів;
h – величина інтервалу варіаційного ряду;
- Нові (перетворені) значення варіант;
А - постійна величина, в якості якої використовують середину інтервалу, що має найбільшу частоту; або варіант, що має максимальну частоту;
- Квадрат моменту першого порядку;
- Момент другого порядку.
Виконаємо розрахунок дисперсії способом моментів на основі даних про змінне вироблення робітників бригади.
Таблиця 4 - Розрахунок дисперсії за способом моментів


Групи робітників з вироблення, шт.

Число робітників,

Середина інтервалу,

Розрахункові значення

Порядок розрахунку:


  1. розраховуємо дисперсію:

2 Розрахунок дисперсії альтернативної ознаки

Серед ознак, що вивчаються статистикою, є такі, яким властиві лише два взаємно виключають значення. Це альтернативні ознаки. Їм надається відповідно два кількісні значення: варіанти 1 і 0. Частиною варіанти 1, яка позначається p, є частка одиниць, що мають дану ознаку. Різниця 1-р=q є частотою варіанти 0. Таким чином,


хі

Середня арифметична альтернативна ознака
, Оскільки p+q=1.

Дисперсія альтернативної ознаки
, т.к. 1-р = q
Таким чином, дисперсія альтернативної ознаки дорівнює добутку частки одиниць, що володіють даною ознакою, і частки одиниць, що не мають цієї ознаки.
Якщо значення 1 і 0 зустрічаються однаково часто, тобто p = q, дисперсія досягає свого максимуму pq = 0,25.
Дисперсія альтернативної ознаки використовується у вибіркових обстеженнях, наприклад, якості продукції.

3 Міжгрупова дисперсія. Правило складання дисперсій

Дисперсія, на відміну інших характеристик варіації, є адитивної величиною. Тобто в сукупності, яка поділена на групи за факторною ознакою х , дисперсія результативної ознаки yможе бути розкладена на дисперсію у кожній групі (внутрішньогрупову) та дисперсію між групами (міжгрупову). Тоді, поряд із вивченням варіації ознаки по всій сукупності загалом, стає можливим вивчення варіації у кожній групі, а також між цими групами.

Загальна дисперсіявимірює варіацію ознаки упо всій сукупності під впливом всіх факторів, що спричинили цю варіацію (відхилення). Вона дорівнює середньому квадрату відхилень окремих значень ознаки увід загальної середньої та може бути обчислена як проста або зважена дисперсія.
Міжгрупова дисперсіяхарактеризує варіацію результативної ознаки у, спричинену впливом ознаки-фактора х, покладеного в основу угруповання. Вона характеризує варіацію групових середніх і дорівнює середньому квадрату відхилень групових середніх від загальної середньої.
,
де – середня арифметична i-та група;
– чисельність одиниць у i-тій групі (частота i-тої групи);
- Загальна середня сукупності.
Внутрішньогрупова дисперсіявідбиває випадкову варіацію, т. е. ту частину варіації, що викликана впливом неврахованих чинників і залежить від ознаки-фактора, покладеного основою угруповання. Вона характеризує варіацію індивідуальних значень щодо групових середніх, дорівнює середньому квадрату відхилень окремих значень ознаки увсередині групи від середньої арифметичної цієї групи (групової середньої) та обчислюється як проста або зважена дисперсія для кожної групи:
або ,
де – число одиниць групи.
На підставі внутрішньогрупових дисперсій з кожної групи можна визначити загальну середню із внутрішньогрупових дисперсій:
.
Взаємозв'язок між трьома дисперсіями отримав назву правила складання дисперсій, згідно з яким загальна дисперсія дорівнює сумі міжгрупової дисперсії та середньої з внутрішньогрупових дисперсій:

приклад. При вивченні впливу тарифного розряду (кваліфікації) робітників на рівень продуктивності їхньої праці отримані такі дані.
Таблиця 5 - Розподіл робітників по середньогодинному виробітку.



п/п

Робочі 4-го розряду

Робочі 5-го розряду

Вироблення
робітника, шт.,

Вироблення
робітника, шт.,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

У цьому прикладі робітники розділені на дві групи за факторною ознакою х- кваліфікації, що характеризується їх розрядом. Результативна ознака – вироблення – варіюється як під його впливом (міжгрупова варіація), так і за рахунок інших випадкових факторів (внутрішньогрупова варіація). Завдання полягає у вимірі цих варіацій за допомогою трьох дисперсій: загальної, міжгрупової та внутрішньогрупової. Емпіричний коефіцієнт детермінації показує частку варіації результативної ознаки упід впливом факторної ознаки х. Решта загальної варіації увикликана зміною інших чинників.
У прикладі емпіричний коефіцієнт детермінації дорівнює:
або 66,7%,
Це означає, що у 66,7% варіація продуктивність праці робочих зумовлена ​​відмінностями у кваліфікації, але в 33,3% – впливом інших чинників.
Емпіричне кореляційне ставленняпоказує тісноту зв'язку між групувальною та результативними ознаками. Розраховується як квадратний корінь з емпіричного коефіцієнта детермінації:

Емпіричне кореляційне відношення, як і може приймати значення від 0 до 1.
Якщо зв'язок немає, то =0. І тут =0, тобто групові середні рівні між собою міжгрупової варіації немає. Значить групувальний ознака – чинник впливає освіту загальної варіації.
Якщо зв'язок функціональний, то =1. І тут дисперсія групових середніх дорівнює загальної дисперсії (), тобто внутригрупповой варіації немає. Це означає, що групувальна ознака повністю визначає варіацію результативної ознаки, що вивчається.
Чим ближче значення кореляційного ставлення до одиниці, тим більше, ближче до функціональної залежності зв'язок між ознаками.
Для якісної оцінки тісноти зв'язок між ознаками користуються співвідношеннями Чеддока.

У прикладі , що свідчить про тісний зв'язок між продуктивністю праці робітників та його кваліфікацією.



Останні матеріали розділу:

Дати та події великої вітчизняної війни
Дати та події великої вітчизняної війни

О 4-й годині ранку 22 червня 1941 року війська фашистської Німеччини (5,5 млн осіб) перейшли кордони Радянського Союзу, німецькі літаки (5 тис) почали...

Все, що ви повинні знати про радіацію Джерела радіації та одиниці її виміру
Все, що ви повинні знати про радіацію Джерела радіації та одиниці її виміру

5. Дози випромінювання та одиниці виміру Дія іонізуючих випромінювань є складним процесом. Ефект опромінення залежить від величини...

Мізантропія, або Що робити, якщо я ненавиджу людей?
Мізантропія, або Що робити, якщо я ненавиджу людей?

Шкідливі поради: Як стати мізантропом і всіх радісно ненавидіти Ті, хто запевняє, що людей треба любити незалежно від обставин або...