За якою ознакою збудовано варіаційний ряд. Ряди розподілу

Практичне заняття 1

ВАРІАЦІЙНІ РЯДИ РОЗПОДІЛУ

Варіаційним рядомабо поряд розподілуназивають упорядкований розподіл одиниць сукупності за зростаючим (частіше) або за спадаючим (рідше) значенням ознаки та підрахунок числа одиниць з тим чи іншим значенням ознаки.

Існує 3 видуряду розподілу:

1) ранжований ряд– це перелік окремих одиниць сукупності у порядку зростання досліджуваної ознаки; якщо чисельність одиниць сукупності досить велика ранжований ряд стає громіздким, й у випадках ряд розподілу будується з допомогою угруповання одиниць сукупності за значеннями досліджуваного ознаки (якщо ознака приймає невелике число значень, то будується дискретний ряд, а інакше – інтервальний ряд);

2) дискретний ряд- Це таблиця, що складається з двох стовпців (рядків) - конкретних значень варіює ознаки X iта числа одиниць сукупності з даним значенням ознаки f i- Частот; число груп у дискретному ряду визначається числом реально існуючих значень ознаки, що варіює;

3) інтервальний ряд- Це таблиця, що складається з двох стовпців (рядків) - інтервалів варіює ознаки X iі числа одиниць сукупності, які у цей інтервал (частот), чи часткою цього числа у кількості сукупностей (частин).

Числа, що показують, скільки разів окремі варіанти зустрічаються в даній сукупності, називаються частотамиабо вагамиваріант і позначаються малою літерою латинського алфавіту f. Загальна сума частот варіаційного ряду дорівнює обсягу цієї сукупності, тобто.

де k- Число груп, n– загальна кількість спостережень, чи обсяг сукупності.

Частоти (ваги) виражають як абсолютними, а й відносними числами – у частках одиниці чи відсотках від загальної чисельності варіант, складових цю сукупність. У таких випадках ваги називають відносними частотамиабо Частотами.Загальна сума частково дорівнює одиниці

або
,

якщо частоти виражені у відсотках від загальної кількості спостережень п.Заміна частот частостями не є обов'язковою, але іноді виявляється корисною і навіть необхідною в тих випадках, коли доводиться зіставляти один з одним варіаційні ряди, що сильно відрізняються за їх обсягами.

Залежно від того, як варіює ознака – дискретно чи безперервно, у широкому чи вузькому діапазоні, – статистична сукупність розподіляється в безінтервальнийабо інтервальнийваріаційні ряди. У першому випадку частоти відносяться безпосередньо до ранжованих значень ознаки, які набувають положення окремих груп або класів варіаційного ряду, у другому – підраховують частоти, що відносяться до окремих проміжків або інтервалів (від – до), на які розбивається загальна варіація ознаки в межах від мінімальної до максимальної варіанти цієї сукупності. Ці проміжки або класові інтервали можуть бути рівними і не рівними по ширині. Звідси розрізняють рівно-і нерівноінтервальні варіаційні ряди.У нерівноінтервальних рядах характер розподілу частот змінюється в міру зміни ширини класових інтервалів. Нерівноінтервальне угруповання в біології застосовують порівняно рідко. Як правило, біометричні дані розподіляються в рівноінтервальні ряди, що дозволяє не тільки виявляти закономірність варіювання, а й полегшує обчислення зведених числових характеристик варіаційного ряду, зіставлення рядів розподілу один з одним.

Починаючи побудову рівноінтервального варіаційного ряду, важливо правильно намітити ширину класового інтервалу. Справа в тому, що грубе угруповання (коли встановлюють дуже широкі класові інтервали) спотворює типові риси варіювання та веде до зниження точності числових характеристик ряду. При виборі надмірно вузьких інтервалів точність узагальнюючих числових характеристик підвищується, але ряд виходить занадто розтягнутим і не дає чіткої картини варіювання.

Для отримання добре осяжного варіаційного ряду та забезпечення достатньої точності числових характеристик, що обчислюються по ньому, слід розбити варіацію ознаки (у межах від мінімальної до максимальної варіанти) на таке число груп або класів, яке задовольняло б обом вимогам. Це завдання вирішують розподілом розмаху варіювання ознаки на число груп або класів, що намічаються при побудові варіаційного ряду:

,

де h- Величина інтервалу; Xм a x і X min – максимальне та мінімальне значення в сукупності; k- Число груп.

При побудові інтервального ряду розподілу необхідно вибирати оптимальну кількість груп (інтервалів ознаки) і встановлювати довжину (розмах) інтервалу. Оскільки при аналізі ряду розподілу порівнюють частоти різних інтервалах, необхідно, щоб довжина інтервалів була постійною. Якщо доводиться мати справу з інтервальним рядом розподілу з нерівними інтервалами, то для сумісності потрібно частоти або частоти привести до одиниці інтервалу, отримане значення називається щільністю ρ , тобто
.

Оптимальне число груп вибирається так, щоб достатньою мірою відбилося розмаїття значень ознаки в сукупності і в той же час закономірність розподілу, його форма не спотворювалася випадковими коливаннями частот. Якщо груп буде замало, не виявиться закономірність варіації; якщо груп буде надмірно багато, випадкові стрибки частот спотворять форму розподілу.

Найчастіше число груп серед розподілу визначають за формулою Стерждесса:

де n- Чисельність сукупності.

Істотну допомогу в аналізі низки розподілу та її властивостей надає графічне зображення. Інтервальний ряд зображується стовпчиковою діаграмою, в якій основи стовпчиків, розташовані по осі абсцис, - це інтервали значень ознаки, що варіює, а висоти стовпчиків - частоти, що відповідають масштабу по осі ординат. Діаграма такого типу називається гістограмою.

Якщо є дискретний ряд розподілу або використовуються середини інтервалів, то графічне зображення такого ряду називається полігоном, яке виходить з'єднанням прямими точок з координатами X iі f i .

Якщо по осі абсцис відкладати значення класів, а по осі ординат – накопичені частоти з наступним з'єднанням точок прямими лініями, виходить графік, що називається кумулята.Накопичені частоти знаходять послідовним підсумовуванням, або кумуляцієючастот у бік від першого класу до кінця варіаційного ряду.

приклад. Є дані про несучість 50 курей-несучок за 1 рік, що містяться на птахофермі (табл. 1.1).

Таблиця 1.1

Несучість курей-несучок

№ курки-несучки

Несучість, шт.

№ курки-несучки

Несучість, шт.

№ курки-несучки

Несучість, шт.

№ курки-несучки

Несучість, шт.

№ курки-несучки

Несучість, шт.

Потрібно побудувати інтервальний ряд розподілу та відобразити його графічно у вигляді гістограми, полігону та кумуляти.

Видно, що ознака варіює від 212 до 245 яєць, одержаних від несушки за 1 рік.

У нашому прикладі за формулою Стерждеса визначимо кількість груп:

k = 1 + 3,322lg 50 = 6,643 ≈ 7.

Розрахуємо довжину (розмах) інтервалу за формулою:

.

Побудуємо інтервальний ряд із 7 групами та інтервалом 5 шт. яєць (табл. 1.2). Для побудови графіків у таблиці розрахуємо середину інтервалів та накопичену частоту.

Таблиця 1.2

Інтервальний ряд розподілу несучості

Група курей-несучок за величиною несучості

X i

Число курей-несучок

f i

Середина інтервалу

Х i ’

Накопичена частота

f i

Побудуємо гістограму розподілу несучості (рис. 1.1).

Рис. 1.1. Гістограма розподілу несучості

Дані гістограми показують характерну для багатьох ознак форму розподілу: частіше зустрічаються значення середніх інтервалів ознаки, рідше крайні (малі та великі) значення ознаки. Форма цього розподілу близька до нормального закону розподілу, який утворюється, якщо на змінну, що варіює, впливає велика кількість факторів, жоден з яких не має переважаючого значення.

Полігон і кумулята розподілу несучості мають вигляд (рис. 1.2 та 1.3).

Рис. 1.2. Полігон розподілу несучості

Рис. 1.3. Кумулята розподілу несучості

Технологія вирішення задачі табличному процесорі Microsoft Excel наступна.

1. Введіть вихідні дані відповідно до рис. 1.4.

2. Ранжуйте ряд.

2.1. Виділіть осередки А2: А51.

2.2. Клацніть лівою кнопкою миші на панелі інструментів на кнопці<Сортировка по возрастанию > .

3. Визначте величину інтервалу для побудови інтервального ряду розподілу.

3.1. Скопіюйте комірку А2 в комірку Е53.

3.2. Скопіюйте комірку А51 в комірку Е54.

3.3. Розрахуйте розмах варіації. Для цього введіть в комірку Е55 формулу =E54-E53.

3.4. Розрахуйте кількість груп варіації. Для цього введіть у комірку Е56 формулу =1 +3,322 * LOG10 (50).

3.5. Введіть у комірку Е57 округлену кількість груп.

3.6. Розрахуйте довжину інтервалу. Для цього введіть у комірку Е58 формулу =E55/E57.

3.7. Введіть у комірку Е59 округлену довжину інтервалу.

4. Побудуйте інтервальний ряд.

4.1. Скопіюйте комірку Е53 в комірку В64.

4.2. Введіть у комірку В65 формулу =B64+$E$59.

4.3. Скопіюйте комірку В65 у комірки В66: В70.

4.4. Введіть у комірку С64 формулу =B65.

4.5. Введіть у комірку С65 формулу =C64+$E$59.

4.6. Скопіюйте комірку С65 у комірки С66:С70.

Результати рішення виводяться на екран дисплея у такому вигляді (рис. 1.5).

5. Розрахуйте частоту інтервалів.

5.1. Виконайте команду Сервіс,Аналіз даних, клацнувши по черзі лівою кнопкою миші.

5.2. У діалоговому вікні Аналіз данихза допомогою лівої кнопки миші встановіть: Інструменти аналізу <Гистограмма>(Рис. 1.6).

5.3. Клацніть лівою кнопкою миші на кнопці<ОК>.

5.4. На вкладці Гістограмавстановіть параметри відповідно до рис. 1.7.

5.5. Клацніть лівою кнопкою миші на кнопці<ОК>.

Результати рішення виводяться на екран дисплея у такому вигляді (рис. 1.8).

6. Заповніть таблицю "Інтервальний ряд розподілу".

6.1. Скопіюйте комірки В74: В80 у комірки D64: D70.

6.2. Розрахуйте суму частот. Для цього виділіть комірки D64:D70 та клацніть лівою кнопкою миші на панелі інструментів на кнопці<Автосумма > .

6.3. Розрахуйте середину інтервалів. Для цього введете в комірку Е64 формулу =(B64+C64)/2і скопіюйте в комірки Е65: Е70.

6.4. Розрахуйте накопичені частоти. Для цього скопіюйте комірку D64 у комірку F64. У комірку F65 введіть формулу =F64+D65 і скопіюйте у комірки F66:F70.

Результати рішення виводяться на екран дисплея у такому вигляді (рис. 1.9).

7. Відредагуйте гістограму.

7.1. Клацніть правою кнопкою миші на діаграмі на назві «кишеня» і на вкладці, що з'явилася, натисніть кнопку<Очистить>.

7.2. Клацніть правою кнопкою миші на діаграмі і на вкладці, що з'явилася, натисніть кнопку<Исходные данные>.

7.3. У діалоговому вікні Початкові данізмініть підписи осі Х. Для цього виділіть комірки В64: С70 (рис. 1.10).

7.5. Натисніть клавішу .

Результати виводяться на екран дисплея у такому вигляді (рис. 1.11).

8. Побудуйте полігон розподілу несучості.

8.1. Клацніть лівою кнопкою миші на панелі інструментів на кнопці<Мастер диаграмм > .

8.2. У діалоговому вікні Майстер діаграм (крок 1 із 4)за допомогою лівої кнопки миші встановіть: Стандартні <График>(Рис. 1.12).

8.3. Клацніть лівою кнопкою миші на кнопці<Далее>.

8.4. У діалоговому вікні Майстер діаграм (крок 2 із 4)встановіть параметри відповідно до рис. 1.13.

8.5. Клацніть лівою кнопкою миші на кнопці<Далее>.

8.6. У діалоговому вікні Майстер діаграм (крок 3 із 4)введіть назви діаграми та ос Y (рис. 1.14).

8.7. Клацніть лівою кнопкою миші на кнопці<Далее>.

8.8. У діалоговому вікні Майстер діаграм (крок 4 із 4)встановіть параметри відповідно до рис. 1.15.

8.9. Клацніть лівою кнопкою миші на кнопці<Готово>.

Результати виводяться на екран дисплея у такому вигляді (рис. 1.16).

9. Вставте на графіку підпис даних.

9.1. Клацніть правою кнопкою миші на діаграмі і на вкладці, що з'явилася, натисніть кнопку<Исходные данные>.

9.2. У діалоговому вікні Початкові данізмініть підписи осі Х. Для цього виділіть комірки Е64: Е70 (рис. 1.17).

9.3. Натисніть клавішу .

Результати виводяться на екран дисплея у такому вигляді (рис. 1.18).

Кумулята розподілу будується аналогічно до полігону розподілу на основі накопичених частот.

Варіаційні лави, їх елементи.

Дослідник, що цікавиться тарифним розрядом робочих механічних
ського цеху, провів опитування 100 робітників. Розташуємо значення, що спостерігалися
приз-нака у порядку зростання. Ця операція називається ранжуванням ста-
тистичних даних. В результаті отримаємо наступний ряд, який називає-
ся ранжованим:

1,1,..1, 2,2..2, 3,3,..3, 4,4,..4, 5,5,..5, 6,6,..6.

З ранжованого ряду випливає, що досліджувана ознака (тарифний
розряд) прийняв шість різних значень: 1, 2, 3, 4, 5 та 6.

Надалі різні значення приз-нака будемо називати варіанти-
ми,
а під варіюванням -розуміти зміну значень ознаки.

Залежно від значень, що приймаються ознакою, ознаки діляться
на дискретно варіюють і безперервно варіюють.

Тарифний розряд - це дискретно варіює ознака. Число, покази-
ваю-че, скільки разів зустрічається варіант х у ряді спостережень, називається годину-
той
варіанти m x.

Замість частоти варіанта х можна розглядати її ставлення до загального
числу спостережень n,яке називається часто-стюваріанти та її відношення обоз-начается w x.

w x = m x / n = m x / åm x

Таблиця, що дозволяє судити про розподіл частот (або частостей) між варіантами, називається дискретним варіаційним рядом.

Поряд з поняттям частоти використовують поняття накопиченої частоти,
кото-рую позначають т x нак.Накопичена частина показує, у скільки на-
блюде-ях ознака прийняв значення, менші за даного значення х. Відносно-
ня накопиченої частоти до загального числа спостережень n, називають накопичений-
ної часто-стю
і позначають w x нак. Очевидно, що



w x нак = m x нак / n = m x нак / åm x .

Накопичені частоти (частини для дискретного варіаційного ряду, вираховані в наступній таблиці:

Х m x m x нак w x нак
0+4=4 0,04
4+6=10 0,10
10+12=22 0,22
22+16=38 0,38
38+44=82 0,82
82+18=100 1,00
Вище 6

Нехай необхідно дослідити вироблення на одного робітника - верстатника механічного цеху у звітному році у відсотках до попереднього року. Тут досліджуваною ознакою х є вироблення у звітному році у відсотках до попереднього. Це безперервно варіює ознака. Для виявлення характерних рис варіювання значень ознаки об'єднаємо в групи робітників, у яких величина виробітку коливається в межах 10%. Згруповані дані подаємо у таблиці:

Досл. Ознака х Кількість робочих m Частка робітників w Накопичено. частота m x нак w x нак
80-90 8/117 8/117
90-100 15/117 8+15=23 23/117
100-110 46/117 23+46=69 69/117
110-120 29/117 69+29=98 98/117
120-130 13/117 98+13=111 111/117
130-140 3/117 111+3=114 114/117
140-150 3/117 114+3=117 117/117
å

У таблиці частоти m показують, у скільки спостереженнях ознака прийняв значення, що належать тому чи іншому інтервалу. Таку частоту називають інтервальної,а ставлення її до загального числа спостережень – інтервальної частотою w.Таблицю, що дозволяє судити про розподіл частот між інтервалами варіювання значень ознаки, називають інтервальний варіаційним рядом.

Інтервальний варіаційний ряд будують за даними спостережень за не-
перервно варіює ознакою, а також за дис-кретно варіює, якщо
велика кількість варіантів, що спостерігали. Дискретний варіаційний ряд будують
тільки для дис-кретно варіює ознаки

Іноді інтервальний варіаційний ряд умовно замінюють дискретним.
Тоді середнє значення інтервалу приймають за варіант х, а відпо-
вуючу інтервальну частоту - за т х.

Для визначення оптимального постійного інтевалу h часто використовують формулу Стерджесу:

h=(x max – x min)/(1+3.322*lg n).

Побудова інт.вар.рядів

Частоти m показують, у скількох спостереженнях ознака прийняла значення, що належать тому чи іншому інтервалу. Таку частоту називають інтервальної, а відношення її до загального числа спостережень - інтервальної частотою w. Таблицю, що дозволяє будувати висновки про розподіл частот (чи частостей) між інтервалами варіювання значень ознаки, називають інтервальним варіаційним рядом.

Інтервальний варіаційний ряд будують за даними спостережень за безперервно варіюючим ознакою, а також за дискретно варіюючим, якщо велика кількість варіантів, що спостерігали. Дискретний варіаційний ряд будують тільки для дискретно варіює ознаки.

Іноді інтервальний варіаційний ряд умовно замінюють дискретним. Тоді серединне значення інтервалу приймають за варіант х, а відповідну інтервальну частоту за mx

Для побудови інтервального варіаційного ряду необхідно визначити величину інтервалу, встановити повну шкалу інтервалів та відповідно до неї згрупувати результати спостережень.

Для визначення оптимального постійного інтервалу часто використовують формулу Стерджесса:

h = (xmax - xmin) / (1 + 3,322 lg n).

де xmax xmin - відповідно максимальний та мінімальний варіанти. Якщо результаті розрахунків h виявиться дробовим числом, то величину інтервалу слід узяти або найближче ціле число, або найближчу нескладну дріб.

За початок першого інтервалу рекомендується прийняти величину a1 = xmin-h/2; початок другого інтервалу збігається з кінцем першого і а2=а1 +h; початок третього інтервалу збігається з кінцем другого і дорівнює a3 = a2 + h. Побудова інтервалів триває до тих пір, поки початок наступного по порядку інтервалу не буде більше хmах. Після встановлення шкали інтервалів слід згрупувати результати спостережень.

5) Поняття, форми вираження та види статитстичних показників.

Статистичний показникє кількісною характеристикою соціально-економічних явищ і процесів в умовах якісної визначеності. Якісна визначеність показника полягає в тому, що він безпосередньо пов'язаний з внутрішнім змістом досліджуваного явища або процесу, його сутністю.

Система статистичних показників– це сукупність взаємозалежних показників, має однорівневу чи багаторівневу структуру і націлена рішення конкретної статистичної завдання.

На відміну від ознаки статистичний показник виходить розрахунковим шляхом. Це може бути простий підрахунок одиниць сукупності, підсумовування їх значень ознаки, порівняння 2 чи кількох величин чи складніші розрахунки.

Розрізняють конкретний статистичний показник та показник-категорію.

Конкретний статистичний показникхарактеризує розмір, величину досліджуваного явища чи процесу у даному місці й у час. Однак у теоретичних роботах і на етапі проектування статистичного спостереження також оперують і абсолютними показниками або показниками-категоріями.

Показники-категоріївідображають сутність, загальні відмінні властивості конкретних статистичних показників одного й того ж виду без вказівки місця, часу та числового значення. Усі статистичні показники діляться за охопленням одиниць сукупності на індивідуальні і вільні, а формою – на абсолютні, відносні і середні.

Індивідуальні показникиХарактеризують окремий об'єкт або окрему одиницю сукупності - підприємство, фірму, банк і т. п. Прикладом може служити чисельність промислово-виробничого персоналу підприємства. На сонові співвідношення двох індивідуальних абсолютних показників, що характеризують один і той же об'єкт або одиницю, отримують індивідуальний відносний показник.

Зведені показникина відміну від індивідуальних характеризують групу одиниць, що є частиною статистичної сукупності чи всю сукупність загалом. Ці показники поділяються на об'ємні та розрахункові.

Об'ємні показникиодержують шляхом складання значень ознаки окремих одиниць сукупності. Отримана величина, звана об'ємом ознаки, може виступати як об'ємний абсолютний показник, а може порівнюватися з іншою об'ємною абсолютною величиною або об'ємом сукупності. В останніх 2 випадках одержують об'ємний відносний та об'ємний середній показники.

Розрахункові показники, що обчислюються за різними формулами, служать для вирішення окремих статистичних завдань аналізу - вимірювання варіації, характеристики структурних зрушень, оцінки взаємозв'язку і т. д. Вони також діляться на абсолютні, відносні або середні.

До цієї групи входять індекси, коефіцієнти тісноти зв'язку, помилки вибірки та інші показники.

Охоплення одиниць сукупності та форма вираження є основними, але не єдиними класифікаційними ознаками статистичних показників. Важливою класифікаційною ознакою є тимчасовий фактор. Соціально-економічні процеси та явища знаходять своє відображення у статистичних показниках або станом на певний момент часу, як правило, на певну дату, початок або кінець місяця, року, або за певний період – день, тиждень, місяць, квартал, рік. У першому випадку показники є моментними,у другому - інтервальними.

Залежно від приналежності до одного чи двох об'єктів вивчення розрізняють однооб'єктніі міжоб'єктні показники. Якщо перші характеризують лише один об'єкт, то другі отримують у результаті зіставлення двох величин, що належать до різних об'єктів.

З погляду просторової визначеності статистичні показники поділяються на загальнотериторіальні, Що характеризують досліджуваний об'єкт або явище в цілому по країні, регіональні та місцеві, що належать до будь-якої частини території або окремого об'єкта.

6) Види та взаємозв'язок відносних показників.

Відносний показникє результатом поділу одного абсолютного показника на інший і виражає співвідношення між кількісними характеристиками соцекономічних процесів і явищ. Тому по відношенню до абсолютних показників відносні показники або показники у формі відносних величин є похідними.

При розрахунку відносного показника абсолютний показник, що знаходиться в чисельнику одержуваного відношення, називається поточнимабо порівнюваним. А показник, з яким проводиться порівняння і який знаходиться в знаменнику, називається основою або базою порівняння. Відносні показники можуть виражатися у відсотках, проміле, коефіцієнтах або можуть бути іменованими числами.

Усі використовувані практично відносні показники поділяються на:

В· динаміки; · Плану; В· реалізації плану; В· структури; В· координації; В·інтенсив-ності та рівня ек-го розвитку; В· порівняння.

Відносний показник данамікиявляє собою відношення рівня досліджуваного процесу або явища за даний період часу до рівня цього процесу або явища в минулому.

ОПД=поточний показник/поперед. Або базовий показник.

Розрахована таким чином величина показує, у скільки разів поточний рівень перевищує попередній або яку частку від останнього становить. Якщо цей показник виражений кратним співвідношенням, він називається коефіцієнтом зростання, при домноженні цього коефіцієнта на 100% отримують темп зростання.

Відносний показник структуриє співвідношення структурних елементів досліджуваного об'єкта та його цілого. Відносний показник структури виявляється у частках одиниці чи відсотках. Розраховані величини (d i), відповідно звані частками або питомими вагами, показують, якою часткою має або яка питома вага має i-а частина в загальному результаті.

Відносні показники координаціїхарактеризують співвідношення окремих частин цілого між собою. При цьому як база порівняння вибирається та частина, яка має найбільшу питому вагу або є пріоритетною з економічної, соціальної або будь-якої іншої точки зору. Через війну отримують, скільки одиниць кожної структурної частини посідає 1 одиницю базисної структурної частини.

Відносний показник інтенсивностіхарактеризує ступінь поширення досліджуваного процесу або явища в властивому йому середовищі. Цей показник обчислюється, коли абсолютна величина виявляється недостатньою для формулювання обґрунтованих висновків про масштаби явища, його розміри, насиченість, щільність поширення. Він може виражатися у відсотках, проміле або бути іменованою величиною. Різновидом відносних показників інтенсивності є відносні показники рівня еко-го розвитку,що характеризують виробництво продукції розрахунку на душу населення і відіграють важливу роль оцінці розвитку держави. За формою вираження ці показники близькі до середніх показників, що нерідко призводить до їх змішування або ототожнення. Різниця між ними полягає лише в тому, що при розрахунку середнього показника ми маємо справу з сукупністю одиниць, кожна з яких є носієм середньої ознаки.

Відносний показник порівнянняє співвідношення однойменних абсолютних показників, що характеризують різні об'єкти (підприємства, фірми, області, райони і т. д.)

Показники варіації

Вивчення варіації (зміна значень ознаки не більше сукупності) має значення у статистиці та соціально-економічних дослідженнях взагалі. Абсолютні та відносні показники варіації, що характеризують коливання значень варіюючого ознаки, дозволяють, зокрема, виміряти ступінь зв'язку та взаємозв'язку, оцінити ступінь однорідності сукупності, типовості та стійкості середньої, визначити величину можливої ​​похибки вибіркового спостереження.

До абсолютних показників варіації відносять розмах варіації, середнє лінійне відхилення, дисперсію, середнє квадратичне відхилення та квартальне відхилення.

Розмах варіації показує, на яку величину змінюється значення кількісно варіює ознаки

R = xmax-xmin, де xmax (xmin) - максимальне (мінімальне) значення ознаки в сукупності (у ряді розподілу).

Середнє лінійне відхилення d визначається як середня величина з відхилень варіантів ознаки від середньої в першому ступені, взятих за модулем:

Середнє лінійне відхилення порівняно рідко застосовується з метою оцінки варіації ознаки. Зазвичай обчислюються дисперсія та середнє квадратичне відхилення.

Якщо необхідно порівняти коливання декількох ознак в одній сукупності або однієї і тієї ж ознаки в декількох сукупностях з різними показниками центру розподілу, то користуються відносними показниками варіації.

До них належать такі показники:

1. Коефіцієнт осциляції:

2. Відносне лінійне відхилення:

3. Коефіцієнт варіації:

4. Відносний показник квартильної варіації:

Найчастіше застосовуваний показник відносної варіації - це коефіцієнт варіації. Цей показник використовують як порівняльної оцінки варіації, а й як характеристику однорідності сукупності. Сукупність вважається однорідною, якщо<0,33.

Форми.

1. Стат. звітність-це така орг-я форма коли він одиниці набл-я предост-т інформацію про своєї деят-ти як формулярів, регламентир-го апарату.

Особливість звітності полягає в тому, що вона обов'язково обгрунтована, зобов'язана у виконанні і юрки підтверджена підписом керівника або відповідальної особи.

2. Спеціально організоване спостереження-найбільш яскравий і простий приклад цієї форми набл-я явл. перепис. Перепис зазвичай проводиться через рівні проміжки часу, одночасно по всій дослід-й території одночасно.

Росс-ми органами статистики проводяться перепису населення окремих видів п/п і орг-ций, матер-их ресурсів, багаторічних насаджень, об'єктів НЗ будівництва та т.д.

4. Реєстрова форма спостереження- заснована на веденні стат-го регістру. У регістрі каж. одиниця набл-я хар-ся поруч показників. У вітчизняній статистичній практиці найбільше поширення набули регістри нас-я і регістри п/п.

Реєстрація населення – ведеться органами РАГСу

Реєстрація п/п - ЄДРПО вед.орг. статистики.

Види.

можна розбити на групи слідом. ознаками:

а) за часом реєстрації

б) з охоплення одиниць сов-ти

За часом реєстр. вони бувають:

Поточні (непрер-е)

Перервне (періодичні та одноразові)

При тек. набл. зміна явищ і процесів фіксується у міру їх надходження (реєстрація народження, смерті, шлюбу, розлучення тощо)

Періодич. набл. проводиться через опр. проміжки часу (N перепис населення кожні 10 років)

Єдиноврем. набл. проводиться або не регулярно, або лише один раз (референдум)

За охопленням од. сов-ти стат-е набл. бувають:

Суцільними

Несуцільними

Суцільне набл. представляє собою обстеження-е всіх одиниць сов-ти

Несуцільне набл. передбачає ч. обсл-ю підлягає лише частина дослід-ий сов-ти.

Сущ-ет кілька видів несплошного набл-я:

Метод осн. масиву

Вибіркове (самостійно)

Монографічне

Цей метод х-ся тим, що відбираються зазвичай найбільш істот-е, зазвичай найбільші од. сов-ти в кіт. сосред-на означає. частина всіх наблх ознак.

При монографічному набл-ии ретельно ан. піддаються отд. од. вивч-ий сов-ти чи м.б. чи типові цієї сов-ти од. або предст-е собою будь-які нові різновиди явищ.

Многогр-е набл. проводиться з виявлення чи намічаються тенденції у розвитку даного явища.

Способи

Безпосереднє набл-е

Документарне набл.

Безпосереднім зв. таке набл. при кіт. самі реєстратори шляхом непоср-го виміру, підрахунку, стримування уст-т факт підлягає рег-ии і підставі роблять запис у формулярі.

Документарний метод набл. заснований на исп-ии як джерела інф-ції разл-х док-ов зазвичай облікового х-ра (тобто. стат. звітність)

Опитування-це спосіб переконання при кіт. необхідні відомості получ-т зі слів респондента (тобто опитуваного) (усний, кореспондентський, анкетний, явочний і т.д.)

Визначення помилок вибірки.

У процесі проведення вибіркового спостереження виділяють два види помилок: реєстрації та репрезентативності.

Помилки реєстрації - Відхилення між значенням показника, отриманого при проведенні статистичного спостереження, і дійсним його значенням. Ці помилки можуть виникати і при суцільному, і при несуцільному спостереженні. Помилки реєстрації виникають через неправильні або неточні відомості. Джерелами цього виду помилок можуть бути нерозуміння сутності питання, неуважність реєстратора, перепустка або повторний рахунок окремих одиниць спостереження. Помилки реєстрації поділяються на систематичні, обумовлені причинами, що діють в якомусь одному напрямку і згладжують результати обстеження (округлення цифр), і випадкові, що є результатом дії різних випадкових факторів (перестановка місцями сусідніх цифр). Випадкові помилки мають різну спрямованість і за досить великому обсязі обстежуваної сукупності взаємно погашаються.

Помилки репрезентативності - Усунення значень показника обстеженої сукупності від його значення у вихідній сукупності. Ці помилки також поділяються на систематичні, що з'являються внаслідок порушення принципів відбору одиниць, що підлягають спостереженню, з вихідної сукупності, і випадкові, які виникають, якщо відібрана сукупність неповно відтворює всю сукупність загалом. Величина випадкової помилки можна оцінити.

Помилка вибіркового спостереження- Різниця між значенням ознаки в генеральній сукупності і його значенням, розрахованим за результатами вибіркового спостереження. У практиці вибіркових обстежень найчастіше визначається середня і гранична помилки вибірки.

Середня помилка вибірки різних способів відбору обчислюється по-різному. Якщо випадковий чи хутровий відбір, то

Для середньої: m = s 2 /(n) 1/2

Для частки: m = (w(1-w)/n) 1/2 де

m - середня помилка вибірки

s 2 – генеральна дисперсія

n – обсяг вибіркової сукупності

Якщо вибіркова сукупність формується на основі типової вибірки та відбір одиниць здійснюється пропорційно до обсягу типових груп, то середня помилка дорівнює:

Для середньої: m = (s i 2 / n) 1/2

Для частки: m = (w i (1-w i) / n) 1/2 , де

s i 2 – середня із внутрішньогруп-х дисперсій

w i – частка одиниць у цій групі, які мають досліджуваним ознакою.

s i 2 = ås 2 n i / å i

Середня помилка серійної вибірки дорівнює:

Для середньої: m = (d х 2/r) 1/2

Для частки: m = (d 2 w/r) 1/2

d 2 w -міжгрупова дисперсія частки

d х 2 -міжгрупова дисперсія кількісної ознаки.

r– число відібраних серій/

d 2 x = (x i -x) 2 / r

d 2 w = å(w i - w) 2 / r

Якщо відбір одиниць з генеральної сукупності проводиться безповторним способом, то формули середньої помилки вноситься поправка: (1-n/N) 1/2

Гранична помилка вибірки D розраховується як добуток коефіцієнта довіри t і середньої помилки виборки: D = t*m. D пов'язані з її рівнем довіри ймовірності. Цей рівень визначає коефіцієнт довіри t і навпаки. Значення t наводяться у спеціальних математичних таблицях.

Визначення обсягу вибірки.

Обсяг вибірки розраховується, як правило, на стадії проектування вибіркового обстеження. Формули визначення чисельності вибірки випливають з формул граничних помилок вибірки.

Обсяг власне випадкової та механічної повторних вибірок визначається за формулами:

Для середньої n = t 2 s 2 / D 2

Для частки n = t 2 w(1-w) / D 2

У разі неповторної вибірки:

Для середньої n = t 2 s 2 N/ND 2 +t 2 s 2

Для частки n = t 2 w(1-w)N / ND 2 +t 2 w(1-w).

Величини s 2 та wдо проведення виборочного спостереження невідомі. Приблизно їх знаходять так:

1. беруть із попередніх обстежень;

2. якщо відомі максимально та мінімальне значення ознаки, то середньоквадратичне відхилення визначають за правилом «трьох сигм»:

s = x max – x min / 6

3. щодо альтернативного призна-ка, якщо немає жодних відомостей про його частку в генеральній сукупності, береться максимально можлива величина w=0,5

При типовому відборі, пропорційному об'єму типових груп, обсяг вибірки по кожній групі визначається формулою : n i = n * N i / N, де

n i –обсяг вибірки з i-ї групи

N i- Обсяг i-тої групи в ген-ой сов-ти.

При вибірці, пропорційної варіації ознаки, чисельність вибірки з кожної групи знаходять так: n i = nN is i / åN is i .

При типовій повторній вибірці, пропорційній до обсягу груп, загальну чисельність вибірки знаходять так:

Для середньої n = t 2 s 2 i/D 2

Для частки n = t 2 w(1-w) / D 2

У разі неповторної типової вибірки:

Для середньої n = t 2 s 2 i N / D 2 N+t 2 s 2 i

Для частки n = t 2 w(1-w)N / D 2 N+t 2 w(1-w)

Основні поняття та передумови застосування кореляційно-регресійного аналізу.

Кореляція- Це статистична залежність між випадковими величинами, що не мають строго функціонального характеру, при якій зміна однієї з випадкових величин призводить до зміни математичного очікування інший.

Кореляційний аналіз- має своєю задачею кількісне визначення тіс-ноти зв'язку між двома ознаками і між результативними і безліччю факторних ознак. Тіснота зв'язку кількісно виражається величиною коефіцієнтів кореляції.

Кореляційно-регресійнийаналіз як загальне поняття включає в себе вимірювання тісноти, напрями зв'язку та встановлення аналітичного виразу (форми) зв'язку (регресійний аналіз).

Регресійний аналізполягає у визначенні аналітичного виразу зв'язку, в якому зміна однієї величини (названої залежною або результативною ознакою) обумовлено впливом однієї або декількох незалежних величин (факторів), а безліч всіх інших факторів, що також впливають на залежну величину, -мається за постійні та середні значення. Регресія може бути однофакторної (парної) і багатофакторної (множинної).

Метою регресійного аналізує оцінка функціональної залежності умовного середнього значення результативного ознаки (У) від факторних (х 1, х 2, ... х до) ознаками.

Основною передумовою регресійного аналізуі те, що тільки резу-льтативний ознака (У) підпорядковується нормальному закону розподілу, а факторні ознаки х 1 , х 2 ,…,х можуть мати довільний закон розподілу. В аналізі динамічних рядів як факторна ознака виступає час t. При цьому в регресійному аналізі заздалегідь мається на увазі наявність причинно-наслідкових зв'язків між результативними (У) факторними (х 1, х 2, ..., Х к) ознаками. Рівняння регресії, або статистична модель зв'язку соціально-економічних явищ, що виражається функцією У х = f (х 1, х 2, ..., х к), є достатньо адекватним реальному моделюваному явищу або процесу у разі дотримання наступних вимог їх побудови.

1. Сукупність досліджуваних вихідних даних д/б однорідної та математично описується безперервними функціями.

2. Можливість опису модельованого явища одним або декількома рівняннями причинно-наслідкових зв'язків.

3. Усі факторні ознаки повинні мати кількісне (цифрове) вираження.

4. Наявність досить великого обсягу досліджуваної вибіркової сукупності.

5. Причинно-наслідкові зв'язки між явищами і процесами слід описувати лінійною або приведеною до лінійної формами залежності.

6. Відсутність кількісних обмежень на параметри моделі зв'язку.

7. Постійність територіальної та тимчасової структури досліджуваної сукупності.

Теоретична обґрунтованість моделей взаємозв'язку, побудованих на основі кореляційно-регресійного аналізу, забезпечується дотриманням наступних основних умов.

1. Всі ознаки та їх спільні розподіли повинні підкорятися нормальному закону розподілу;

2. Дисперсія модельованої ознаки (У) повинна весь час залишатися постійною при зміні величини (У) і значень факторних ознак.

3. Окремі спостереження д/б незалежними, т. е. результати, отримані в i - му спостереженні, не повинні бути пов'язані з попередніми і містити інформацію про подальші спостереження, а також впливати на них.

ЗАВДАННЯ ЗВЕДЕННЯ ТА ЇЇ ЗМІСТ

спостереження дає відомості щодо кожної одиниці досліджуваного об'єкта. Отримані дані є узагальнюючими показниками. З їхньою допомогою не можна зробити висновки в цілому про об'єкт без попередньої обробки даних.

Тому мета наступного етапу статистичного дослідження полягає у систематизації первинних даних та отриманні на цій основі зведеної характеристики всього об'єкта за допомогою узагальнюючих статистичних пок-лей.

Зведення - комплекс послідовних операцій з узагальнення конкретних одиничних фактів, що утворюють сукупність, виявлення типових рис і закономірностей, властивих явищу, що вивчається в цілому.

якщо при статистичному спостереженні збирають дані про кожну одиницю об'єкта, то результатом зведення є докладні дані, що відображають у цілому всю сукупність

Стат-ая зведення має вестися з урахуванням попереднього теоретичного аналізу явищ і процесів, щоб під час зведення не втратити інформацію про досліджуваному явище і всі статистичні результати відбивали найважливіші характерні риси об'єкта.

По глибині обробки матеріалу зведення буває просте і складне.

Простий зведенням наз-ся операція з підрахунку загальних підсумків по сов-ти одиниць спостереження.

Складне зведення - комплекс операцій, що включають угруповання одиниць спостереження, підрахунок підсумків по кожній групі та по всьому об'єкту та подання результатів угруповання та зведення у вигляді статистичних табл.

Проведенню зведення передує розробка її програми, що складається з наступних етапів: вибір групувальних ознак; визначення порядку формування груп; розробка системи статистичних пок-лей для характеристики груп та об'єкта загалом; розробка системи макетів статистичних табл, у яких мають бути представлені результати зведення.

За формою обробки матеріалу зведення: децентралізована та централізована.

При децентралізованому зведенні (саме вона використовується, як правило, при обробці стат-ой звітності) розробка матеріалу проводиться послідовними етапами. Так, звіти підприємств зводяться статистичними органами суб'єктів Російської Федерації, а вже підсумки по регіону надходять до Держкомстату Росії, і там визначаються пок-лі в цілому по народному господарству країни.

При централізованому зведенні весь первинний матеріал надходить в одну організацію, де і піддається обробці від початку до кінця. Централізоване зведення зазвичай використовується для обробки матеріалів одноразових статистичних обстежень.

За технікою виконання статистична зведення поділяється на механізовану та ручну.

Механізоване зведення - за якого всі операції здійснюються за допомогою застосування електронно-обчислювальних машин. При ручному зведенні всі основні операції (підрахунок групових та загальних підсумків) здійснюються вручну.

Для проведення зведення складається план, в якому викладаються організаційні питання: ким і коли будуть здійснюватися всі операції, порядок її проведення, склад відомостей, що підлягають опублікуванню в періодичній пресі.

Змикання рядів дин-ки

При аналізі рядів дин-ки виникає необхідність їх змикання-об'єднання двох і більше рядів в один ряд. Змикання необхідне в тих випадках, коли рівні рядів непорівнянні у зв'язку з територіальними змінами, у зв'язку зі зміною цін та у зв'язку зі зміною М-дики обчислення рівнів ряду. необхідно зімкнути (об'єднати) наведені вище два ряди на один. Це можна зробити за допомогою коефіцієнта сумісності. Помножуючи на отриманий коефіцієнт дані за р., отримаємо зімкнений (порівняний) ряд дин-ки абсолютних величин 2 спосіб змикання рядів дин-ки (спосіб приведення до однієї основи) полягає в тому, що рівні року, в якому відбулися зміни, як до зміни , і після изме-й приймаються за 100%, інші ж перераховуються у відсотках по отн-ию до цих рівням відповідно.

30. М-ди вирівнювання рядів дин-ки

Кожен ряд дин-ки теоретично може бути представлений у вигляді трьох складових:

Тренда (основний тенд- та розвитку динамічного ряду);

циклічних (періодичних) коливань, у тому числі сезонних;

Випадкові коливання.

Однією із завдань, що виникають під час аналізу рядів дин-ки, є встановлення зміни рівнів досліджуваного явища. У деяких випадках закономірність зміни рівнів ряду дин-ки цілком зрозуміла, наприклад, або систематичне зниження рівнів ряду, або їх підвищення. іноді рівні ряду зазнають найрізноманітніших змін (то зростають, го зменшуються). У цьому випадку можна говорити лише про загальну тенд-і розвитку: або до зростання, або до зниження.

Виявлення основний тенд-і розвитку (тренду) наз-ся вирівнюванням часового ряду, а м-ди виявлення основний тенден-м-ди вирівнювання.

Безпосереднє виділення тренда то, можливо вироблено трьома ме-ми.

* М-д укрупнення інтервалів. Цей м-д заснований на укрупненні пір часу, до яких належать рівні низки. Наприклад, ряд дин-ки

добового випуску продукції замінюється поряд місячного випуску проекції тощо.

* М-д ковзної середньої. У цьому рядку вихідні рівні ряду замінюються середніми величинами, які отримують з цього рівня і кількох симетрично його оточуючих. Ціле число рівнів, якими розраховується середнє значення, називають інтервалом згладжування. Інтервал згладжування може бути непарним (3, 5, 7 і т.д. точок) та парним (2, 4, 6 і т.д. точок). Розрахунок середніх ведеться способом ковзання, тобто поступовим винятком із прийнятого періоду ковзання першого рівня та включення наступного. При непарному згладжуванні отримане середнє арифметичне значення закріплюють за серединою розрахункового інтервалу.

"-" М-дики згладжування ковзними середніми полягає в умовності визначення згладжених рівнів для точок на початку і кінці ряду.

* Аналіт-е вирівнювання-є найбільш ефективним способом виявлення основний тенд-і розвитку. У цьому рівні низки дин-ки виражаються як функції часу: Yt=f(t)

Метою аналіт-ого вирівнювання дин-го ряду є визначення аналіт-ої зав-ти f(t). На практиці за наявним часовим рядом задають вигляд і знаходять параметри функції f(t), а потім аналізують поведінку відхилень від тенд-і.

В економіці часто застосовується функція виду: Уi = а0 + ∑ аi + ti

З функції виду (3.12) найчастіше при вирівнюванні використовується лінійна зав-ть /(*) = ао + а1 * t або параболічна f (t) = a0 + att + a2 t2.

Коефіцієнти ао,а,а2,...,ар у формулі перебувають МНК.

Відповідно до цього м-ду для знаходження параметрів полінома р-ого ступеня необхідно вирішити систему про нормальних рівнянь:

nаo+a1∑t=∑Y

ao∑t+ a1∑t*t= ∑Y*t.

Тренд показує, як впливають систематичні фактори на уро- ряду дин-ки. Коливання рівнів у тренда є мірою впливу залишкових (випадкових) чинників. Цю міру впливу можна оцінити

за формулою середнього квадратичного відхилення.

Основні поняття кореляційно-регресійного аналізу.

Статистичний ряд розподілу– це впорядкований розподіл одиниць сукупності на групи за певною ознакою, що варіює.
Залежно від ознаки, покладеної в основу утворення ряду розподілу, розрізняють атрибутивні та варіаційні ряди розподілу.

Наявність загальної ознаки є основою освіти статистичної сукупності, що є результати опису чи виміру загальних ознак об'єктів дослідження.

Предметом вивчення в статистиці є ознаки, що змінюються (варіюють) або статистичні ознаками.

Види статистичних ознак.

Атрибутивними називають ряди розподілу, побудовані за якісними ознаками Атрибутивний- Це ознака, що має найменування, (наприклад професія: швачка, вчитель і т.д.).
Ряд розподілу прийнято оформляти як таблиць. У табл. 2.8 наведено атрибутивний ряд розподілу.
Таблиця 2.8 – Розподіл видів юридичної допомоги, наданої адвокатами громадянам одного з регіонів РФ.

Варіаційний ряд- Це значення ознаки (або інтервали значень) та їх частоти.
Варіаційними рядами називають ряди розподілу, побудовані за кількісною ознакою Будь-який варіаційний ряд складається з двох елементів: варіантів та частот.
Варіантами вважаються окремі значення ознаки, які він набуває в варіаційному ряду.
Частоти – це чисельності окремих варіантів чи кожної групи варіаційного низки, тобто. це числа, що показують, як часто зустрічаються ті чи інші варіанти у розподілі. Сума всіх частот визначає чисельність усієї сукупності, її обсяг.
Частинами називаються частоти, виражені у частках одиниці чи відсотках до результату. Відповідно сума частостей дорівнює 1 або 100%. Варіаційний ряд дозволяє за фактичними даними оцінити форму закону розподілу.

Залежно від характеру варіації ознаки розрізняють дискретні та інтервальні варіаційні ряди.
Приклад дискретного варіаційного ряду наведено у табл. 2.9.
Таблиця 2.9 - Розподіл сімей за кількістю кімнат в окремих квартирах в 1989 р. в РФ.

У першій колонці таблиці представлені варіанти дискретного варіаційного ряду, у другій – вміщено частоти варіаційного ряду, у третій – показники частоти.

Варіаційний ряд

У генеральній сукупності досліджується деяка кількісна ознака. З неї випадково витягується вибірка обсягу n, тобто кількість елементів вибірки дорівнює n. На першому етапі статистичної обробки виробляють ранжуваннявибірки, тобто. упорядкування чисел x 1 , x 2 , …, x nза зростанням. Кожне значення, що спостерігається x iназивається варіантом. Частота m i- Це число спостережень значення x iу вибірці. Відносна частота (частина) w i- Це відношення частоти m iдо обсягу вибірки n: .
При вивченні варіаційного ряду також використовують поняття накопиченої частоти та накопиченої частоти. Нехай xкілька. Тоді кількість варіантів , значення яких менше xназивається накопиченою частотою: для x i nназивається накопиченою частиною w i max.
Ознака називається дискретно варіюється, якщо його окремі значення (варіанти) відрізняються один від одного на деяку кінцеву величину (зазвичай ціле число). Варіаційний ряд такої ознаки називається дискретним варіаційним рядом.

Таблиця 1. Загальний вигляд дискретного варіаційного ряду частот

Значення ознакиx i x 1 x 2 x n
Частотиm i m 1 m 2 m n

Ознака називається безперервно варіюючим, якщо його значення відрізняються один від одного на скільки завгодно малу величину, тобто. ознака може набувати будь-яких значень у певному інтервалі. Безперервний варіаційний ряд для такої ознаки називається інтервальною.

Таблиця 2. Загальний вигляд інтервального варіаційного ряду частот

Таблиця 3. Графічні зображення варіаційного ряду

РядПолігон чи гістограмаЕмпірична функція розподілу
Дискретний
Інтервальний
Переглядаючи результати проведених спостережень, визначають, скільки значень варіантів потрапило до кожного конкретного інтервалу. Передбачається, що кожному інтервалу належить один із його кінців: або у всіх випадках ліві (частіше), або у всіх випадках праві, а частоти чи частоти показують кількість варіантів, укладених у зазначених межах. Різниці a i – a i +1називаються частковими інтервалами. Для полегшення наступних розрахунків інтервальний варіаційний ряд можна замінити умовно дискретним. У цьому випадку середнє значення i-го інтервалу приймають за варіант x i, а відповідну інтервальну частоту m i- За частоту цього інтервалу.
Для графічного зображення варіаційних рядів найчастіше використовуються полігон, гістограма, крива кумулятивна і емпірична функція розподілу.

У табл. 2.3 (Угруповання населення Росії за розміром середньодушового доходу у квітні 1994р.) представлений інтервальний варіаційний ряд.
Зручно ряди розподілу аналізувати за допомогою графічного зображення, що дозволяє судити і про форму розподілу. Наочне уявлення про характер зміни частот варіаційного ряду дають полігон та гістограма.
Полігон використовується при зображенні дискретних варіаційних рядів.
Зобразимо, наприклад, графічно розподіл житлового фонду за типом квартир (табл. 2.10).
Таблиця 2.10 – Розподіл житлового фонду міського району за типом квартир (цифри умовні).


Рис. Полігон розподілу житлового фонду


На осі ординат можуть наноситися як значення частот, а й частостей варіаційного ряду.
Гістограма приймається для зображення інтервального варіаційного ряду. При побудові гістограми осі абсцис відкладаються величини інтервалів, а частоти зображуються прямокутниками, побудованими на відповідних інтервалах. Висота стовпчиків у разі рівних інтервалів має бути пропорційна частотам. Гістограма - графік, на якому ряд зображений у вигляді суміжних один з одним стовпчиків.
Зобразимо графічно інтервальний ряд розподілу, наведений у таблиці. 2.11.
Таблиця 2.11 – Розподіл сімей за розміром житлової площі, що припадає на одну особу (цифри умовні).
N п/п Групи сімей за розміром житлової площі, що припадає на одну особу Число сімей з цим розміром житлової площі Накопичена кількість сімей
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
ВСЬОГО 115 ----


Рис. 2.2. Гістограма розподілу сімей за розміром житлової площі, що припадає на одну особу


Використовуючи дані накопиченого ряду (табл. 2.11), збудуємо кумуляту розподілу.


Рис. 2.3. Кумулята розподілу сімей за розміром житлової площі, що припадає на одну особу


Зображення варіаційного ряду у вигляді кумуляти є особливо ефективним для варіаційних рядів, частоти яких виражені в частках або відсотках до суми частот ряду.
Якщо при графічному зображенні варіаційного ряду у вигляді кумуляти осі поміняти, ми отримаємо огиву. На рис. 2.4 наведено огива, побудована на основі даних табл. 2.11.
Гістограма може бути перетворена на полігон розподілу, якщо знайти середини сторін прямокутників і потім ці точки з'єднати прямими лініями. Отриманий полігон розподілу зображено на рис. 2.2 пунктирною лінією.
При побудові гістограми розподілу варіаційного ряду з нерівними інтервалами по осі ординат наносять частоти, а щільність розподілу ознаки у відповідних інтервалах.
Щільність розподілу – це частота, розрахована одиницю ширини інтервалу, тобто. скільки одиниць у кожній групі посідає одиницю величини інтервалу. Приклад розрахунку густини розподілу представлений у табл. 2.12.
Таблиця 2.12 – Розподіл підприємств за кількістю зайнятих (цифри умовні)
N п/п Групи підприємств за кількістю зайнятих, чол. Число підприємств Розмір інтервалу, чол. Щільність розподілу
А 1 2 3=1/2
1 До 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
ВСЬОГО 147 ---- ----

Для графічного зображення варіаційних рядів може також використовуватися кумулятивна крива. За допомогою кумуляти (кривий сум) зображується ряд накопичених частот. Накопичені частоти визначаються шляхом послідовно підсумовування частот за групами і показують, скільки одиниць сукупності мають значення ознаки не більше ніж розглянуте значення.


Рис. 2.4. Огива розподілу сімей за розміром житлової площі, що припадає на одну особу

При побудові кумуляти інтервального варіаційного ряду осі абсцис відкладаються варіанти ряду, а по осі ординат накопичені частоти.

Статистичні ряди розподілу являють собою впорядковане розташування одиниць сукупності, що вивчається, на групи за групувальною ознакою.

Розрізняють атрибутивні та варіаційні ряди розподілу.

Атрибутивний - це низка розподілу, побудований за якісними ознаками. Він характеризує склад сукупності за різними суттєвими ознаками.

За кількісною ознакою будується варіаційний ряд розподілу. Він складається з частоти (чисельності) окремих варіантів чи кожної групи варіаційного ряду. Дані числа показують, як часто зустрічаються різні варіанти (значення ознаки) у ряді розподілу. Сума всіх частот визначає чисельність усієї сукупності.

Чисельності груп виражаються в абсолютних та відносних величинах. У абсолютних величинах виражається числом одиниць сукупності у кожній виділеній групі, а відносних величинах - як часток, питомих терезів, поданих у відсотках до результату.

Залежно від характеру варіації ознаки розрізняють дискретні та інтервальні варіаційні ряди розподілу. У дискретному варіаційному ряді розподілу групи складені за ознакою, що змінюється дискретно і приймає лише цілі значення.

В інтервальному варіаційному ряді розподілу групувальна ознака, що становить основу угруповання, може приймати в певному інтервалі будь-які значення.

Варіаційні ряди складаються з двох елементів: частоти та варіанти.

Варіантою називають окреме значення ознаки, що варіюється, яке він приймає в ряду розподілу.

Частота- це чисельність окремих варіантів або кожної групи варіаційного ряду. Якщо частоти виражені у частках одиниці чи відсотках до результату, їх називають частостями.

Правила та принципи побудови інтервальних рядів розподілу будуються за аналогічними правилами та принципами побудови статистичних угруповань. Якщо інтервальний варіаційний ряд розподілу побудований з рівними інтервалами, частоти дозволяють будувати висновки про ступеня заповнення інтервалу одиницями сукупності. Для проведення порівняльного аналізу заповненості інтервалів визначають показник, який характеризуватиме щільність розподілу.

Щільність розподілу- Це відношення числа одиниць сукупності до ширини інтервалу.

Варіаційниминазивають ряди розподілу, побудовані за кількісним ознакою. Будь-який варіаційний ряд складається з двох елементів: варіантів та частот. Варіантамивважаються окремі значення ознаки, які він приймає в варіаційному ряду, тобто конкретне значення варіює ознаки. Частоти- це чисельності окремих варіантів або кожної групи варіаційного ряду, тобто це числа, що показують, як часто зустрічаються ті чи інші варіанти у ряді розподілу. Сума всіх частот визначає чисельність усієї сукупності, її обсяг.

Частинаминазиваються частоти, виражені у частках одиниці чи відсотках до результату. Відповідно сума частостей дорівнює 1 чи 100%.

Залежно від характеру варіації ознаки розрізняють дискретні та інтервальні варіаційні ряди.

Як відомо, варіація кількісних ознак може бути дискретною (перервною) або безперервною.

У разі дискретної варіації величина кількісної ознаки набуває лише цілі значення. Отже, дискретний варіаційний ряд характеризуєрозподіл одиниць сукупності за дискретною ознакою Прикладом дискретного варіаційного ряду є розподіл сімей за кількістю кімнат в окремих квартирах, наведений у таблиці. 3.12.

У першій колонці таблиці представлені варіанти дискретного варіаційного ряду, у другій - вміщено частоти варіаційного ряду, а в третій - показано частоти.

У разі безперервної варіації величина ознаки в одиниць сукупності може приймати в певних межах будь-які значення, що відрізняються один від одного на скільки завгодно малу величину. Побудова інтервальних варіаційних рядівдоцільно насамперед при безперервній варіації ознаки, і навіть якщо дискретна варіація проявляється у межах, т. е. число варіантів дискретного ознаки досить велике. У табл. 3.3 подано інтервальний варіаційний ряд.

Графічне зображення рядів розподілу

Аналіз рядів розподілу можна проводити на основі їхнього графічного зображення. Лінійчасті та кругові діаграми будуються для відображення структури сукупності.

Застосовуються разом з діаграмами такі лінії, як полігон, кумулята, огива, гістограма. Під час зображення дискретних варіаційних рядів використовується полігон.

Полігон- ламана крива, будується з урахуванням прямокутної системи координат, як у осі Х відкладаються значення ознаки, а, по осі У - частоти.

Гладка крива, що з'єднує крапки- це емпірична густина розподілу.

Кумулята- ламана крива, що будується на основі прямокутної системи координат, коли по осі Х відкладаються значення ознаки, а по осі - накопичені частоти.

Для дискретних рядів осі відкладаються самі значення ознаки, а інтервальних - середини інтервалів.

На основі гістограм можна будувати діаграми накопичених частот із подальшою побудовою інтегральної емпіричної функції розподілу.



Останні матеріали розділу:

Перше ополчення у смутні часи презентація
Перше ополчення у смутні часи презентація

Слайд 1Смутний час Слайд 2На початку XVII століття Російська держава була охоплена пожежею громадянської війни та глибокою кризою. Сучасники...

Слова паразити у дитячій мові
Слова паразити у дитячій мові

Однією з найважливіших проблем сучасного суспільства є проблема мови. Ні для кого не секрет, що останнім часом наша мова зазнала...

Презентація для уроків літературного читання у початковій школі про Е
Презентація для уроків літературного читання у початковій школі про Е

Слайд 2 04.11.2009р. Н.С. Папулова 2 Олена Олександрівна Благініна. (1903-1989) – російський поет, перекладач. Слайд 3 Дочка багажного касира на...