Скласти варіаційний ряд прикладу. Бібліотека постів MEDSTATISTIC про аналіз медичних даних

Сукупність предметів чи явищ, об'єднаних якоюсь загальною ознакою чи властивістю якісного чи кількісного характеру, називається об'єктом спостереження .

Будь-який об'єкт статистичного спостереження складається з окремих елементів. одиниць спостереження .

Результати статистичного спостереження є цифровою інформацією - дані . Статистичні дані - це відомості про те, які значення набув цікавий дослідника ознака у статистичній сукупності.

Якщо значення ознаки виражаються числами, то ознака називається кількісним .

Якщо ознака характеризує деяку властивість чи стан елементів сукупності, то ознака називається якісним .

Якщо дослідженню підлягають усі елементи сукупності (суцільне спостереження), то статистичну сукупність називають генеральної.

Якщо дослідженню підлягає частина елементів генеральної сукупності, то статистичну сукупність називають вибірковою (вибіркою) . Вибірка з генеральної сукупності вилучається випадково, так що кожен з n елементів вибірки мав рівні шанси бути відібраним.

Значення ознаки під час переходу від одного елемента сукупності до іншого змінюються (варіюють), у статистиці різні значення ознаки також називають варіантами . Варіанти зазвичай позначаються латинськими малими літерами x, y, z.

Порядковий номер варіанта (значення ознаки) називається рангом . x 1 – 1-й варіант (1-е значення ознаки), x 2 – 2-й варіант (2-е значення ознаки), x i – i-й варіант (i-е значення ознаки).

Упорядкований у порядку зростання чи спадання ряд значень ознаки (варіантів) з відповідними їм вагами називається варіаційним рядом (рядом розподілу).

В якості ваг виступають частоти чи частоти.

Частота(m i) показує скільки разів зустрічається той чи інший варіант (значення ознаки) у статистичній сукупності.

Частина чи відносна частота(w i) показує, яка частина одиниць сукупності має той чи інший варіант. Частина розраховується як ставлення частоти тієї чи іншої варіанта до суми всіх частот ряду.

. (6.1)

Сума всіх частот дорівнює 1.

. (6.2)

Варіаційні ряди бувають дискретними та інтервальними.

Дискретні варіаційні рядибудують зазвичай у разі, якщо значення досліджуваного ознаки можуть відрізнятися друг від друга щонайменше ніж деяку кінцеву величину.

У дискретних варіаційних рядах задаються точкові значення ознаки.

Загальний вигляд дискретного варіаційного ряду вказано у таблиці 6.1.

Таблиця 6.1

де i = 1, 2, …, l.

В інтервальних варіаційних рядах у кожному інтервалі виділяють верхню та нижню межі інтервалу.

Різниця між верхньою та нижньою межами інтервалу називають інтервальною різницею або довжиною (величиною) інтервалу .

Розмір першого інтервалу k 1 визначається за такою формулою:

k 1 = а 2 - а 1;

другого: k 2 = а 3 - а 2; …

останнього: k l = a l - a l -1.

Загалом інтервальна різниця k i розраховується за формулою:

k i = xi (max) - xi (min) . (6.3)

Якщо інтервал має обидві межі, його називають закритим .

Перший та останній інтервали можуть бути відкритими , тобто. мати лише один кордон.

Наприклад, перший інтервал може бути заданий як "до 100", другий - "100-110", …, передостанній - "190-200", останній - "200 і більше". Вочевидь, перший інтервал немає нижньої кордону, а останній - верхньої, обидва вони - відкриті.

Часто відкриті інтервали доводиться умовно закривати. І тому зазвичай величину першого інтервалу приймають рівної величині другого, а величину останнього - величині передостаннього. У прикладі величина другого інтервалу дорівнює 110-100=10, отже, нижня межа першого інтервалу умовно складе 100-10=90; величина передостаннього інтервалу дорівнює 200-190=10, отже, верхня межа останнього інтервалу умовно становитиме 200+10=210.

Крім цього, в інтервальному варіаційному ряді можуть траплятися інтервали різної довжини. Якщо інтервали у варіаційному ряді мають однакову довжину (інтервальну різницю), їх називають рівновеликими , в іншому випадку - нерівновеликі.

При побудові інтервального варіаційного ряду часто виникає проблема вибору величини інтервалів (інтервальної різниці).

Для визначення оптимальної величини інтервалів (у тому випадку, якщо будується ряд із рівними інтервалами) застосовують формулу Стерджесса:

, (6.4)

де n – число одиниць сукупності,

x (max) і x (min) - найбільше та найменше значення варіантів ряду.

Для характеристики варіаційного ряду поряд із частотами та частотами використовуються накопичені частоти та частоти.

Накопичені частоти (частини)показують скільки одиниць сукупності (яка їхня частина) не перевищують заданого значення (варіанту) х.

Накопичені частоти ( v i) за даними дискретного ряду можна розрахувати за такою формулою:

. (6.5)

Для інтервального варіаційного ряду – це сума частот (частин) всіх інтервалів, що не перевищують даний.

Дискретний варіаційний ряд графічно можна подати за допомогою полігону розподілу частот чи частостей.

При побудові полігону розподілу осі абсцис відкладаються значення ознаки (варіанти), а осі ординат - частоти чи частоти. На перетині значень ознаки і відповідних частот (частин) відкладаються точки, які, у свою чергу, з'єднуються відрізками. Отримана таким чином ламана називається полігоном розподілу частот (частин).

x k
x 2
x 1 x i


Рис. 6.1.

Інтервальні варіаційні ряди графічно можна представити за допомогою гістограми, тобто. стовпчастої діаграми.

При побудові гістограми по осі абсцис відкладаються значення ознаки, що вивчається (кордону інтервалів).

У разі, якщо інтервали - однакової величини, по осі ординат можна відкладати частоти чи частоти.

Якщо інтервали мають різну величину, по осі ординат необхідно відкладати значення абсолютної або відносної щільності розподілу.

Абсолютна щільність- Відношення частоти інтервалу до величини інтервалу:

; (6.6)

де: f(a) i - абсолютна густина i-го інтервалу;

m i - Частота i-го інтервалу;

k i - величина i-го інтервалу (інтервальна різниця).

Абсолютна щільність показує, скільки одиниць сукупності посідає одиницю інтервалу.

Відносна густина- Відношення частоти інтервалу до величини інтервалу:

; (6.7)

де: f(о) i - відносна щільність i-го інтервалу;

w i - Частина i-го інтервалу.

Відносна щільність показує, яка частина одиниць сукупності посідає одиницю інтервалу.

a l
a 1 x i
a 2

І дискретні та інтервальні варіаційні ряди графічно можна подати у вигляді кумуляти та огива.

При побудові кумулятиза даними дискретного ряду з осі абсцис відкладаються значення ознаки (варіанти), а, по осі ординат - накопичені частоти чи частоти. На перетині значень ознаки (варіантів) та відповідних ним накопичених частот (частин) будуються точки, які, своєю чергою, з'єднуються відрізками чи кривою. Отримана таким чином ламана (крива) називається кумулятою (кумулятивною кривою).

При побудові кумуляти за даними інтервального ряду осі абсцис відкладаються межі інтервалів. Абсцисами точок є верхні межі інтервалів. Ординати утворюють накопичені частоти (частини) відповідних інтервалів. Часто додають ще одну точку, абсцисою якої є нижня межа першого інтервалу, а ордината дорівнює нулю. З'єднуючи крапки відрізками чи кривою, отримаємо кумуляту.

Огівабудується аналогічно кумуляті з тією лише різницею, що на осі абсцис наносяться точки, що відповідають накопиченим частотам (частотам), а по осі ординат – значення ознаки (варіанти).

В результаті освоєння дайного розділу студент повинен: знати

  • показники варіації та їх взаємозв'язок;
  • основні закони розподілу ознак;
  • сутність критеріїв згоди; вміти
  • розраховувати показники варіації та критерії згоди;
  • визначати характеристики розподілу;
  • оцінювати основні числові характеристики статистичних рядів розподілу;

володіти

  • методами статистичного аналізу рядів розподілу;
  • основами дисперсійного аналізу;
  • прийомами перевірки статистичних рядів розподілу відповідність основним законам розподілу.

Показники варіації

При статистичному дослідженні ознак різних статистичних сукупностей великий інтерес представляє вивчення варіації ознаки окремих статистичних одиниць сукупності, і навіть характеру розподілу одиниць за цією ознакою. Варіація -це відмінності індивідуальних значень ознаки в одиниць сукупності, що вивчається. Дослідження варіації має велике практичного значення. За рівнем варіації можна будувати висновки про межі варіації ознаки, однорідності сукупності за цією ознакою, типовості середньої, взаємозв'язку чинників, визначальних варіацію. Показники варіації використовуються для характеристики та впорядкування статистичних сукупностей.

Результати зведення та угруповання матеріалів статистичного спостереження, оформлені у вигляді статистичних рядів розподілу, являють собою впорядкований розподіл одиниць сукупності, що вивчається, на групи за групувальною (варіюючою) ознакою. Якщо за основу угруповання взято якісну ознаку, то такий ряд розподілу називають атрибутивним(Розподіл за професією, за статтю, за кольором і т.д.). Якщо ряд розподілу побудований за кількісною ознакою, то такий ряд називають варіаційним(розподіл за зростанням, вагою, за розміром заробітної плати тощо). Побудувати варіаційний ряд - отже впорядкувати кількісний розподіл одиниць сукупності за значеннями ознаки, підрахувати число одиниць сукупності із цими значеннями (частоту), результати оформити до таблиці.

Замість частоти варіанта можливе застосування її ставлення до загального обсягу спостережень, що називається частотою (відносною частотою).

Виділяють два види варіаційного ряду: дискретний та інтервальний. Дискретний ряд- це такий варіаційний ряд, основою побудови якого покладено ознаки з перервним зміною (дискретні ознаки). До останніх можна віднести кількість працівників на підприємстві, тарифний розряд, кількість дітей у сім'ї тощо. Дискретний варіаційний ряд представляє таблицю, що складається із двох граф. У першій графі вказується конкретне значення ознаки, тоді як у другий - число одиниць сукупності з певним значенням ознаки. Якщо ознака має безперервну зміну (розмір доходу, стаж роботи, вартість основних фондів підприємства тощо, які у певних межах можуть приймати будь-які значення), то для цієї ознаки можлива побудова інтервального варіаційного ряду.Таблиця під час побудови інтервального варіаційного ряду також має дві графи. У першій вказується значення ознаки в інтервалі від - до (варіанти), у другій - число одиниць, що входять в інтервал (частота). Частота (частота повторення) – число повторень окремого варіанта значень ознаки. Інтервали можуть бути закриті та відкриті. Закриті інтервали обмежені по обидва боки, тобто. мають межу як нижню («від»), і верхню («до»). Відкриті інтервали мають якусь одну межу: або верхню, або нижню. Якщо варіанти розташовані за зростанням або спаданням, то ряди називаються ранжованими.

Для варіаційних рядів існує два типи варіантів частотних характеристик: накопичена частота та накопичена частота. Накопичена частота показує, у скількох спостереженнях величина ознаки прийняла значення менше заданого. Накопичена частота визначається шляхом підсумовування значень частоти ознаки цієї групи з усіма частотами попередніх груп. Накопичена частина характеризує питому вагу одиниць спостереження, які мають значення ознаки перевищують верхню межу дайної групи. Таким чином, накопичена частина показує питому вагу варіант у сукупності, що мають значення не більше даного. Частота, частота, абсолютна та відносна щільності, накопичені частота та частота є характеристиками величини варіанта.

Варіації ознаки статистичних одиниць сукупності, і навіть характер розподілу вивчаються з допомогою показників і показників варіаційного ряду, до яких ставляться середній рівень низки, середнє лінійне відхилення, середнє квадратичне відхилення, дисперсія, коефіцієнти осциляції, варіації, асиметрії, ексцесу та інших.

Для характеристики центру розподілу використовуються середні величини. Середня являє собою узагальнюючу статистичну характеристику, в якій отримує кількісне вираження типовий рівень ознаки, яким володіють члени сукупності, що вивчається. Однак можливі випадки збігу середніх арифметичних при різному характері розподілу, тому як статистичні характеристики варіаційних рядів розраховуються так звані структурні середні - мода, медіана, а також квантили, які ділять ряд розподілу на рівні частини (квартилі, децилі, перцентілі тощо). ).

Модаце значення ознаки, що зустрічається у ряді розподілу частіше, ніж інші його значення. Для дискретних рядів – це варіанти, що мають найбільшу частоту. В інтервальних варіаційних рядах з метою визначення моди необхідно визначити насамперед інтервал, в якому вона знаходиться, так званий модальний інтервал. У варіаційному ряду з рівними інтервалами модальний інтервал визначається за найбільшою частотою, у рядах з нерівними інтервалами - але найбільшою густиною розподілу. Потім для визначення моди в рядах із рівними інтервалами застосовують формулу

де Мо – значення моди; х Мо - нижня межа модального інтервалу; h -ширина модального інтервалу; / Мо - частота модального інтервалу; / Mo j - частота домодального інтервалу; / Мо+1 - частота післямодального інтервалу, а для ряду з нерівними інтервалами в даній формулі розрахунку замість частот / Мо, / Мо, / Мо слід використовувати густини розподілу Розум 0 _| , Розум 0> Умо+"

Якщо є єдина мода, розподіл ймовірностей випадкової величини називається унімодальним; якщо є більш ніж одна мода, воно називається багатомодальним (полімодальним, мультимодальним), у разі двох мод – бімодальним. Як правило, багатомодальність вказує, що розподіл, що досліджується, не підпорядковується закону нормального розподілу. Для однорідних сукупностей, зазвичай, характерні одновершинні розподіли. Багатовершинність свідчить також про неоднорідність сукупності, що вивчається. Поява двох і більше вершин робить необхідним перегрупування даних з метою виділення однорідніших груп.

В інтервальному варіаційному ряді моду можна визначити графічно за допомогою гістограми. Для цього з верхніх точок найвищого стовпця гістограми до верхніх точок двох суміжних стовпців проводять дві лінії, що перетинаються. Потім із точки їх перетину опускають перпендикуляр на вісь абсцис. Значення ознаки на осі абсцис, що відповідає перпендикуляру, є модою. У багатьох випадках при характеристиці сукупності як узагальнений показник віддається перевагу моді, а не середній арифметичній.

Медіана -це центральне значення ознаки, ним має центральний член ранжованого ряду розподілу. У дискретних рядах, щоб знайти значення медіани, спочатку визначається її порядковий номер. Для цього при непарному числі одиниць до суми всіх частот додається одиниця, число поділяється на два. При парному числі одиниць у ряду буде дві медіані одиниці, тому в цьому випадку медіана визначається як середня із значень двох медіанних одиниць. Таким чином, медіаною в дискретному варіаційному ряду є значення, яке поділяє ряд на дві частини, що містять однакову кількість варіантів.

В інтервальних рядах після визначення порядкового номера медіани знаходиться медіальний інтервал за накопиченими частотами (частотами), а потім за допомогою формули розрахунку медіани визначається значення самої медіани:

де Me – значення медіани; х Ме -нижня межа медіанного інтервалу; h -ширина медіанного інтервалу; - Сума частот ряду розподілу; /Д - накопичена частота домедіанного інтервалу; / Ме – частота медіанного інтервалу.

Медіану можна знайти графічно за допомогою кумуляти. Для цього на шкалі накопичених частот (частин) кумуляти з точки, що відповідає порядковому номеру медіани, проводиться пряма, паралельна осі абсцис, до перетину з кумулятою. Далі з точки перетину зазначеної прямої з кумулятою опускається перпендикуляр на вісь абсцис. Значення ознаки на осі абсцис, що відповідає проведеній ординаті (перпендикуляру), є медіаною.

Медіана характеризується такими властивостями.

  • 1. Вона залежить від тих значень ознаки, які розташовані з обох боків від неї.
  • 2. Вона має властивість мінімальності, яка полягає в тому, що сума абсолютних відхилень значень ознаки від медіани є мінімальною величиною порівняно з відхиленням значень ознаки від будь-якої іншої величини.
  • 3. При об'єднанні двох розподілів із відомими медіанами неможливо заздалегідь передбачити величину медіани нового розподілу.

Ці властивості медіани широко використовуються при проектуванні розташування пунктів масового обслуговування – шкіл, поліклінік, автозаправних станцій, водозабірних колонок тощо. Наприклад, якщо у певному кварталі міста передбачається побудувати поліклініку, то розташувати її доцільніше у такій точці кварталу, яка ділить навпіл не довжину кварталу, а кількість жителів.

Співвідношення моди, медіани та середньої арифметичної вказує на характер розподілу ознаки в сукупності, що дозволяє оцінити симетричність розподілу. Якщо x Me має місце правостороння асиметрія ряду. При нормальному розподілі х - Me - Мо.

К. Пірсон на основі вирівнювання різних типів кривих визначив, що для помірно асиметричних розподілів справедливі такі наближені співвідношення між середньою арифметичною, медіаною та модою:

де Me – значення медіани; Мо – значення моди; х арифм - значення середньої арифметичної.

Якщо виникає необхідність вивчити структуру варіаційного ряду докладніше, то обчислюють значення ознаки, аналогічні медіані. Такі значення ознаки ділять усі одиниці розподілу на рівні чисельності, їх називають квантилями чи градієнтами. Квантилі поділяються на квартілі, децилі, перцентілі тощо.

Квартілі ділять сукупність чотирма рівні частини. Першу квартиль обчислюють аналогічно медіані за формулою розрахунку першої квартілі, попередньо визначивши перший квартальний інтервал:

де Qi – значення першої квартілі; x Q^-нижня межа першого квартильного інтервалу; h- Ширина першого квартального інтервалу; /, - Частоти інтервального ряду;

Накопичена частота в інтервалі, що передує першому квартільї інтервалу; Jq (- Частота першого квартильного інтервалу.

Перша квартиль показує, що 25% одиниць сукупності менше за її значення, а 75% - більше. Друга квартиль дорівнює медіані, тобто. Q 2 = Me.

За аналогією розраховують третю квартиль, попередньо знайшовши третій квартальний інтервал:

де – нижня межа третього квартильного інтервалу; h- Ширина третього квартильного інтервалу; /, - Частоти інтервального ряду; /X" -накопичена частота в інтервалі, що передує

г

третьому квартільйому інтервалу; Jq – частота третього квартильного інтервалу.

Третя квартиль показує, що 75% одиниць сукупності менше за її значення, а 25% - більше.

Різниця між третьою і першою квартилями є міжквартильний інтервал:

де Aq – значення міжквартильного інтервалу; Q 3 -значення третьої квартири; Q - значення першої квартілі.

Децилі ділять сукупність на 10 рівних частин. Дециль - це значення ознаки у ряді розподілу, якому відповідають десяті частки чисельності сукупності. За аналогією з квартилями перший дециль показує, що 10% одиниць сукупності менше його значення, а 90% - більше, а дев'ятий дециль виявляє, що 90% одиниць сукупності менше його значення, а 10% - більше. Співвідношення дев'ятого та першого децилей, тобто. децильний коефіцієнт, широко застосовується щодо диференціації доходів для виміру співвідношення рівнів доходів 10% найбільш забезпеченого і 10% найменш забезпеченого населення. Перцентілі ділять ранжовану сукупність на 100 рівних частин. Розрахунок, значення та застосування перцентилів аналогічні децилям.

Квартілі, децилі та інші структурні характеристики можна визначити графічно за аналогією з медіаною за допомогою кумуляти.

Для вимірювання розміру варіації застосовуються такі показники: розмах варіації, середнє лінійне відхилення, середнє квадратичне відхилення, дисперсія. Розмір розмаху варіації цілком залежить від випадковості розподілу крайніх членів низки. Цей показник становить інтерес у випадках, коли важливо знати, яка амплітуда коливань значень ознаки:

де R -значення розмаху варіації; х тах – максимальне значення ознаки; х тт -мінімальне значення ознаки.

При розрахунку розмаху варіації значення переважної більшості членів низки не враховується, тоді як варіація пов'язані з кожним значенням члена ряду. Цього недоліку позбавлені показники, що є середніми, отриманими з відхилень індивідуальних значень ознаки від їх середньої величини: середнє лінійне відхилення та середнє квадратичне відхилення. Між індивідуальними відхиленнями від середньої та коливання конкретної ознаки існує пряма залежність. Чим сильніша коливання, тим більші абсолютні розміри відхилень від середньої.

Середнє лінійне відхилення є середню арифметичну з абсолютних величин відхилень окремих варіантів від їх середньої величини.

Середнє лінійне відхилення для несгрупованих даних

де / пр – значення середнього лінійного відхилення; х, - значення ознаки; х - п -кількість одиниць сукупності.

Середнє лінійне відхилення згрупованого ряду

де / вз – значення середнього лінійного відхилення; х - значення ознаки; х -середнє значення ознаки для досліджуваної сукупності; / - Число одиниць сукупності в окремій групі.

Знаки відхилень у разі ігноруються, інакше сума всіх відхилень дорівнюватиме нулю. Середнє лінійне відхилення в залежності від угруповання аналізованих даних розраховується за різними формулами: для згрупованих та негрунірованих даних. Середнє лінійне відхилення в силу його умовності окремо від інших показників варіації застосовується на практиці порівняно рідко (зокрема, для характеристики виконання договірних зобов'язань щодо рівномірності постачання; в аналізі обороту зовнішньої торгівлі, складу працюючих, ритмічності виробництва, якості продукції з урахуванням технологічних особливостей виробництва та т.п.).

Середнє квадратичне відхилення характеризує, наскільки в середньому відхиляються індивідуальні значення ознаки, що вивчається від середнього значення за сукупністю, і виражається в одиницях вимірювання ознаки, що вивчається. Середнє квадратичне відхилення, будучи однією з основних заходів варіації, широко використовується в оцінці меж варіації ознаки в однорідної сукупності, щодо значень ординат кривої нормального розподілу, соціальній та розрахунках, що з організацією вибіркового спостереження і встановленням точності вибіркових характеристик. Середнє квадратичне відхилення але необгрунтованим даним обчислюється за наступним алгоритмом: кожне відхилення від середньої зводиться в квадрат, всі квадрати підсумовуються, після чого сума квадратів ділиться на число членів ряду і з приватного витягується квадратний корінь:

де a Iip – значення середнього квадратичного відхилення; Xj -значення ознаки; х- Середнє значення ознаки для досліджуваної сукупності; п -кількість одиниць сукупності.

Для згрупованих аналізованих даних середнє відхилення даних розраховується за зваженою формулою

де - значення середнього квадратичного відхилення; Xj -значення ознаки; х -середнє значення ознаки для досліджуваної сукупності; f x -кількість одиниць сукупності в окремій групі.

Вираз під коренем в обох випадках зветься дисперсією. Таким чином, дисперсія обчислюється як середній квадрат відхилень значень ознаки їх середньої величини. Для незважених (простих) значень ознаки дисперсія визначається так:

Для зважених значень ознаки

Існує також спеціальний спрощений спосіб розрахунку дисперсії: у загальному вигляді

для невважених (простих) значень ознаки для зважених значень ознаки
з використанням методу відліку від умовного нуля

де а 2 – значення дисперсії; х, - значення ознаки; х -середнє значення ознаки, h -величина групового інтервалу, т 1 -ваги (А =

Дисперсія має самостійний вираз у статистиці і належить до найважливіших показників варіації. Вона вимірюється в одиницях, що відповідають квадрату одиниць вимірювання ознаки, що вивчається.

Дисперсія має такі властивості.

  • 1. Дисперсія постійної величини дорівнює нулю.
  • 2. Зменшення всіх значень ознаки на ту саму величину Л не змінює величини дисперсії. Це означає, що середній квадрат відхилень можна обчислити за заданими значеннями ознаки, а, по відхиленням їх від якогось постійного числа.
  • 3. Зменшення вєх значень ознаки kраз зменшує дисперсію в k 2 рази, а середнє квадратичне відхилення - у kразів, тобто. всі значення ознаки можна розділити якесь постійне число (скажімо, на величину інтервалу ряду), обчислити середнє квадратичне відхилення, та був помножити їх у постійне число.
  • 4. Якщо обчислити середній квадрат відхилень від будь-якої величини А утією чи іншою мірою відрізняється від середньої арифметичної, він завжди буде більше середнього квадрата відхилень, обчисленого від середньої арифметичної. Середній квадрат відхилень при цьому буде більшим на цілком певну величину - на квадрат різниці середньої і цієї умовно взятої величини.

Варіація альтернативної ознаки полягає в наявності або відсутності досліджуваної властивості одиниць сукупності. Кількісно варіація альтернативної ознаки виражається двома значеннями: наявність у одиниці досліджуваної властивості позначається одиницею (1), яке відсутність - нулем (0). Частку одиниць, які мають досліджувану властивість, позначають через Р, а частку одиниць, що не володіють цією властивістю, - через G.Таким чином, дисперсія альтернативної ознаки дорівнює добутку частки одиниць, що володіють даною властивістю (Р), на частку одиниць, що даною властивістю не мають (G).Найбільша варіація сукупності досягається у випадках, коли частина сукупності, що становить 50% від усього обсягу сукупності, має ознаку, а інша частина сукупності, також рівна 50%, не має даної ознаки, при цьому дисперсія досягає максимального значення, що дорівнює 0,25, т .е. Р = 0,5, G = 1 - Р = 1 - 0,5 = 0,5 та про 2 = 0,5 0,5 = 0,25. Нижня межа цього показника дорівнює нулю, що відповідає ситуації, коли у сукупності відсутня варіація. Практичне застосування дисперсії альтернативної ознаки полягає у побудові довірчих інтервалів під час проведення вибіркового спостереження.

Чим менше значення дисперсії та середнього квадратичного відхилення, тим однорідніша сукупність і тим більш типовою буде середня величина. На практиці статистики часто виникає необхідність порівняння варіацій різних ознак. Наприклад, цікавим є порівняння варіацій віку робітників та їх кваліфікації, стажу роботи та розміру заробітної плати, собівартості та прибутку, стажу роботи та продуктивності праці тощо. Для таких зіставлень показники абсолютної коливань ознак непридатні: не можна порівнювати коливання стажу роботи, вираженого в роках, з варіацією заробітної плати, вираженої в рублях. Для здійснення таких порівнянь, а також порівнянь коливання однієї й тієї ж ознаки в кількох сукупностях з різними середніми арифметичними використовуються показники варіації - коефіцієнт осциляції, лінійний коефіцієнт варіації та коефіцієнт варіації, які показують міру коливань крайніх значень навколо середньої.

Коефіцієнт осциляції:

де V R -значення коефіцієнта осциляції; R- Значення розмаху варіації; х -

Лінійний коефіцієнт варіації.

де Vj -значення лінійного коефіцієнта варіації; I -значення середнього лінійного відхилення; х -середнє значення ознаки для досліджуваної сукупності.

Коефіцієнт варіації:

де V a -значення коефіцієнта варіації; а – значення середнього квадратичного відхилення; х -середнє значення ознаки для досліджуваної сукупності.

Коефіцієнт осциляції - це відсоткове відношення розмаху варіації до середнього значення ознаки, що досліджується, а лінійний коефіцієнт варіації - це відношення середнього лінійного відхилення до середнього значення досліджуваної ознаки, виражене у відсотках. Коефіцієнт варіації є відсоткове відношення середнього квадратичного відхилення до середнього значення досліджуваної ознаки. Як відносна величина, виражена у відсотках, коефіцієнт варіації застосовується для порівняння ступеня варіації різних ознак. З допомогою коефіцієнта варіації оцінюється однорідність статистичної сукупності. Якщо коефіцієнт варіації менше 33%, то досліджувана сукупність є однорідною, а варіація слабкою. Якщо коефіцієнт варіації більше 33%, то досліджувана сукупність є неоднорідною, варіація сильною, а середня величина – нетиповою і її не можна використовувати як узагальнюючий показник цієї сукупності. Крім того, коефіцієнти варіації використовуються для порівняння коливання однієї ознаки в різних сукупностях. Наприклад, з метою оцінки варіації стажу роботи працівників на двох підприємствах. Чим більше значення коефіцієнта, тим варіація ознаки суттєвіша.

На основі розрахованих квартилів є можливість розрахувати також відносний показник квартальної варіації за формулою

де Q 2 і

Міжквартильний розмах визначається за формулою

Квартильне відхилення застосовується замість розмаху варіації, щоб уникнути недоліків, пов'язаних із використанням крайніх значень:

Для нерівноінтервальпих варіаційних рядів розраховується також густина розподілу. Вона визначається як окреме від поділу відповідної частоти або частоти на величину інтервалу. У нерівноінтервальних рядах використовуються абсолютна та відносна щільності розподілу. Абсолютна щільність розподілу – це частота, що припадає на одиницю довжини інтервалу. Відносна густина розподілу - частота, що припадає на одиницю довжини інтервалу.

Все вищезазначене справедливо для розподілу, закон розподілу яких добре описується нормальним законом розподілу або близький до нього.

Варіаційні лави: визначення, види, основні характеристики. Методика розрахунку
моди, медіани, середньої арифметичної у медико-статистичних дослідженнях
(Показати на умовному прикладі).

Варіаційний ряд - це ряд числових значень досліджуваної ознаки, що відрізняються один від одного за своєю величиною і розташованих у певній послідовності (у висхідному або спадному порядку). Кожне числове значення ряду називають варіантом (V), а числа, що показують, як часто зустрічається та чи інша варіанта у складі цього ряду, називається частотою (р).

Загальна кількість випадків спостережень, у тому числі варіаційний ряд складається, позначають буквою n. Відмінність у значенні досліджуваних ознак називається варіацією. У разі якщо варіювальна ознака не має кількісної міри, варіацію називають якісною, а ряд розподілу – атрибутивним (наприклад, розподіл за результатом захворювання, станом здоров'я тощо).

Якщо ознака, що варіює, має кількісне вираження, таку варіацію називають кількісною, а ряд розподілу - варіаційним.

Варіаційні ряди діляться на перервні і безперервні – за характером кількісної ознаки, прості та зважені – за частотою варіант.

У простому варіаційному ряду кожна варіанта зустрічається лише один раз (р = 1), у зваженому - одна й та ж варіанта зустрічається кілька разів (р> 1). Приклади таких рядів будуть розглянуті далі за текстом. Якщо кількісний ознака має безперервний характер, тобто. між цілими величинами є проміжні дробові величини, варіаційний ряд називається безперервним.

Наприклад: 10,0 – 11,9

14,0 - 15,9 і т.д.

Якщо кількісний ознака має перервний характер, тобто. окремі значення (варіанти) відрізняються один від одного на ціле число і не мають проміжних дробових значень, варіаційний ряд називають перервним або дискретним.

Використовуючи дані попереднього прикладу про частоту пульсу

у 21 студентів, збудуємо варіаційний ряд (табл. 1).

Таблиця 1

Розподіл студентів-медиків за частотою пульсу (уд/хв)

Отже, побудувати варіаційний ряд – означає числові значення (варіанти) систематизувати, упорядкувати, тобто. розташувати у певній послідовності (у висхідному або спадному порядку) з відповідними частотами. У прикладі варіанти розташовані у висхідному порядку і виражені у вигляді цілих перервних (дискретних) чисел, кожна варіанта зустрічається кілька разів, тобто. ми маємо справу з виваженим, перервним чи дискретним варіаційним рядом.

Як правило, якщо кількість спостережень у вивчається нами статистичної сукупності не перевищує 30, то достатньо всі значення ознаки, що вивчається, розмістити в варіаційному ряду в наростаючому, як у табл. 1, або спадному порядку.

При великій кількості спостережень (n>30) кількість варіантів може бути дуже великим, в цьому випадку складається інтервальний або згрупований варіаційний ряд, в якому для спрощення подальшої обробки і з'ясування характеру розподілу варіанти об'єднані в групи.

Зазвичай число групових варіантів коливається від 8 до 15.

Їх має не менше 5, т.к. інакше це буде надто грубе, надмірне укрупнення, що спотворює загальну картину варіювання і дуже позначається на точності середніх величин. При числі групових варіант більше 20-25 збільшується точність обчислення середніх величин, але суттєво спотворюються особливості варіювання ознаки та ускладнюється математична обробка.

При складанні згрупованого ряду необхідно врахувати,

− групи варіант повинні розташовуватися в певному порядку (у висхідному або низхідному);

− інтервали у групах варіант мають бути однаковими;

− значення меж інтервалів нічого не винні збігатися, т.к. неясно буде, до яких груп відносити окремі варіанти;

− необхідно враховувати якісні особливості матеріалу, що збирається при встановленні меж інтервалів (наприклад, при вивченні ваги дорослих людей інтервал 3-4 кг допустимо, а для дітей перших місяців життя він не повинен перевищувати 100 г.)

Побудуємо згрупований (інтервальний) ряд, що характеризує дані про частоту пульсу (число ударів за хвилину) у 55 студентів-медиків перед іспитом: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Для побудови згрупованого ряду необхідно:

1. Визначити величину інтервалу;

2. Визначити середину, початок та кінець груп варіант варіаційного ряду.

● Розмір інтервалу (i) визначається за кількістю передбачуваних груп (r), кількість яких встановлюється залежно від числа спостережень (n) за спеціальною таблицею

Число груп в залежності від числа спостережень:

У нашому випадку, для 55 студентів можна скласти від 8 до 10 груп.

Розмір інтервалу (i) визначається за такою формулою –

i = V max-V min/r

У прикладі величина інтервалу дорівнює 82- 58/8= 3.

Якщо величина інтервалу є дробовим числом, отриманий результат слід округлити до цілого числа.

Розрізняють кілька видів середніх величин:

● середня арифметична,

● середня геометрична,

● середня гармонійна,

● середня квадратична,

● середня прогресивна,

● медіана

У медичній статистиці найчастіше користуються середніми арифметичними величинами.

Середня арифметична величина (М) є узагальнюючою величиною, яка визначає те типове, що притаманно всієї сукупності. Основними способами розрахунку М є: середньоарифметичний спосіб та спосіб моментів (умовних відхилень).

Середньоарифметичний спосіб застосовується для обчислення середньої арифметичної простої та середньої арифметичної зваженої. Вибір методу розрахунку середньої арифметичної величини залежить від виду варіаційного ряду. У разі простого варіаційного ряду, в якому кожен варіант зустрічається лише один раз, визначається середня арифметична проста за формулою:

де: М - Середня арифметична величина;

V - значення варіює ознаки (варіанти);

Σ – вказує дію – підсумовування;

n – загальна кількість спостережень.

Приклад розрахунку середньої арифметичної простий. Частота дихання (число дихальних рухів за хвилину) у 9 чоловіків віком 35 років: 20, 22, 19, 15, 16, 21, 17, 23, 18.

Для визначення середнього рівня частоти дихання у чоловіків віком 35 років необхідно:

1. Побудувати варіаційний ряд, розташувавши всі варіанти у зростаючому чи спадному порядку Ми отримали простий варіаційний ряд, т.к. Значення варіант зустрічаються лише один раз.

M = ∑V/n = 171/9 = 19 дихальних рухів за хвилину

Висновок. Частота дихання у чоловіків віком 35 років у середньому дорівнює 19 дихальним рухам за хвилину.

Якщо окремі значення варіант повторюються, нема чого виписувати в лінію кожну варіанту, достатньо перерахувати розміри варіант (V), що зустрічаються, і поруч вказати число їх повторень (р). такий варіаційний ряд, у якому варіанти як би зважуються за кількістю відповідних їм частот, носить назву - зважений варіаційний ряд, а середня величина, що розраховується, - середньої арифметичної зваженої.

Середня арифметична зважена визначається за такою формулою: M= ∑Vp/n

де n – число спостережень, що дорівнює сумі частот – Σр.

Приклад розрахунку середньої арифметичної зваженої.

Тривалість непрацездатності (в днях) у 35 хворих на гострі респіраторні захворювання (ГРЗ), що лікувалися у дільничного лікаря протягом I-го кварталу поточного року склала: 6, 7, 5, 3, 9, 8, 7, 5, 6, 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6, 7 днів .

Методика визначення середньої тривалості непрацездатності у хворих на ГРЗ наступна:

1. Побудуємо зважений варіаційний ряд, т.к. окремі значення варіанта повторюються кілька разів. Для цього можна розмістити всі варіанти у зростаючому або спадному порядку з відповідними частотами.

У нашому випадку варіанти розташовані у зростаючому порядку

2. Розрахуємо середню арифметичну виважену за формулою: M = ∑Vp/n = 233/35 = 6,7 днів

Розподіл хворих з ГРЗ за тривалістю непрацездатності:

Тривалість непрацездатності (V) Число хворих (p) Vp
∑p = n = 35 ∑Vp = 233

Висновок. Тривалість непрацездатності у хворих на гострі респіраторні захворювання склала в середньому 6,7 днів.

Мода (Мо) – варіанти, що найчастіше зустрічаються в варіаційному ряду. Для розподілу, представленого в таблиці, моді відповідає варіанта, що дорівнює 10, вона зустрічається частіше за інших - 6 разів.

Розподіл хворих за тривалістю перебування на лікарняному ліжку (в днях)

V
p

Іноді точну величину моди встановити важко, оскільки в даних може існувати кілька спостережень, що зустрічаються «найчастіше».

Медіана (Ме) - непараметричний показник, що ділить варіаційний ряд на дві рівні половини: в обидві сторони від медіани розташовується однакова кількість варіантів.

Наприклад, для розподілу, зазначеного в таблиці, медіана дорівнює 10 т.к. по обидві сторони цієї величини розташовується по 14 варіант, тобто. число 10 займає центральне положення у цьому ряду і є його медіаною.

Враховуючи, що кількість спостережень у цьому прикладі парна (n=34), медіану можна визначити таким чином:

Me = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Це означає, що середина ряду посідає сімнадцяту за рахунком варіанта, якій відповідає медіана, що дорівнює 10. Для розподілу, представленого в таблиці, середня арифметична дорівнює:

M = ∑Vp/n = 334/34 = 10,1

Отже, для 34 спостережень із табл. 8 ми отримали: Мо=10, Ме=10, середня арифметична (М) дорівнює 10,1. У нашому прикладі всі три показники виявилися рівними або близькими один до одного, хоча вони абсолютно різні.

Середня арифметична є результативною сумою всіх впливів, у формуванні її беруть участь усі без винятку варіанти, у тому числі й крайні, часто нетипові для даного явища чи сукупності.

Мода і медіана, на відміну від середньої арифметичної, не залежать від величини всіх індивідуальних значень ознаки, що варіює (значень крайніх варіант і ступеня розсіювання ряду). Середня арифметична характеризує всю масу спостережень, мода та медіана – основну масу

Група чисел, що об'єднується якоюсь ознакою, називається сукупністю.

Як було зазначено вище, первинний статистичний спортивний матеріал є групою розрізнених чисел, що не дають тренеру уявлення про сутність явища або процесу. Завдання полягає в тому, щоб перетворити цю сукупність на систему та скористатися її показниками для отримання необхідної інформації.

Складання варіаційного ряду якраз і є формуванням певної математичної

Приклад 2. У 34 спортсменів-лижників зареєстровано такий час відновлення пульсу після проходження дистанції (у секундах):

81; 78: 84; 90; 78; 74; 84; 85; 81; 84: 79; 84; 74; 84; 84;

85; 81; 84; 78: 81; 74; 84; 81; 84; 85; 81; 78; 81; 81; 84;

Як видно, ця група цифр не несе жодної інформації.

Для складання варіаційного ряду спочатку робимо операцію ранжування -розташування чисел у порядку зростання чи спадання. Наприклад, у порядку зростання ранжування призводить до наступного;

78; 78; 78; 78; 78; 78;

81; 81; 81; 81; 81; 81; 81; 81; 81;

84; 84; 84; 84; 84; 84; 84; 84; 84; 84; 84;

У порядку зменшення ранжування призводить до такої групи чисел:

84; 84; 84; 84; 84; 84; 84; 84: 84: 84; 84;

81; 81; 81; 81; 8!; 81: 81; 81; 81;

78; 78; 78; 78; 78; 78;

Після проведення ранжирування стає очевидною нераціональна форма запису цієї групи чисел-одні й самі числа повторюються багаторазово. Тому виникає природна думка перетворити запис таким чином, щоб вказати, скільки разів повторюється. Наприклад, враховуючи ранжування у порядку зростання:

Тут зліва записано число, що вказує час відновлення пульсу спортсмена, праворуч-число повторень цього показання у цій групі з 34 спортсменів.

Відповідно до наведених вище понять про математичні символи розглянуту групу вимірювань позначимо будь-якою літерою, наприклад х. Враховуючи зростаючий порядок чисел у цій групі: х 1 -74 с; х 2 – 78 с; х 3 – 81 с; х 4 – 84 с; х 5 – 85 с; х 6 -х n - 90 с, кожне розглянуте число можна позначити символом X i.

Позначимо число повторень розглянутих вимірів літерою n. Тоді:

n 1 = 4; n 2 = 6; n 3 = 9; n 4 = 11; n 5 =3;n 6 =n n =1, а кожне число повторень можна позначити як n i .

Загальна кількість проведених вимірювань, як випливає з умови прикладу, є 34. Це означає, що сума всіх n дорівнює 34. Або символічно:

Позначимо цю суму однією літерою – n. Тоді вихідні дані прикладу можна записати в такому вигляді (табл. 1).

Отримана група чисел є перетвореним рядом хаотично розсіяних показань, отриманих тренером на початку роботи.

Таблиця 1

х i n i
n=34

Така група є певною системою, параметри якої характеризують проведені вимірювання. Числа, що є результатами вимірювань (х i), називають варіантами; n i - числа їх повторень - називаються частотами; n - сума всіх частот - є обсяг сукупності.

Вся отримана система називається варіаційним рядом.Іноді ці ряди називаються емпіричними чи статистичними.

Неважко помітити, що можливий окремий випадок варіаційного ряду, коли всі частоти дорівнюють одиниці n i ==1, тобто кожен вимір у цій групі чисел зустрівся лише один раз.

Отриманий варіаційний ряд, як і будь-який інший, можна уявити графічно. Для побудови графіка отриманого ряду необхідно передусім домовитися про масштаб на горизонтальній та вертикальній осі.

У цій задачі на горизонтальній осі відкладатимемо значення часу відновлення пульсу (х 1) таким чином, що одиниці довжини, обраної довільно, відповідає значення однієї секунди. Відкладати ці значення почнемо з 70 секунд умовно відступаючи від місця перетину двох осей 0.

На вертикальній осі відкладемо значення частот нашого ряду (n i), приймаючи масштаб: одиниця довжини дорівнює одиниці частоти.

Підготувавши таким чином умови для побудови графіка, приступаємо до роботи з варіаційним рядом.

Першу пару чисел х1 = 74, n1 = 4 наносимо на графік так: на осі х; знаходимо х 1 =74 і відновлюємо перпендикуляр з цієї точки, на осі n знаходимо n 1 =4 і проводимо з неї горизонтальну лінію до перетину з відновленим раніше перпендикуляром. Обидві лінії-вертикаль і горизонталь є лініями допоміжними і тому наносяться на малюнок пунктиром. Точка їх перетину є масштабом даного графіка співвідношення Х 1 =74 і n 1 =4.

Так само наносяться всі інші точки графіка. Потім з'єднуються відрізками прямих. Щоб графік мав замкнутий вигляд, крайні точки з'єднуємо відрізками з сусідніми точками горизонтальної осі.

Отримана фігура є графіком нашого варіаційного ряду (рис. 1).

Цілком зрозуміло, кожен варіаційний ряд представляється своїм власним графіком.

Рис. 1. Графічне уявлення варіаційного ряду.

На рис. 1 видно:

1) із усіх обстежених найбільшу групу склали спортсмени, час відновлення пульсу у яких 84 с;

2) у багатьох цей час 81 с;

3) найменшу групу склали спортсмени з малим часом відновлення пульсу – 74 с та більшим – 90 с.

Таким чином, виконавши серію випробувань, слід ранжувати отримані числа і скласти варіаційний ряд, що є певною математичною системою. Для наочності варіаційний ряд можна ілюструвати графіком.

Наведений вище варіаційний ряд називається ще дискретнимпоряд - таким, у якого кожен варіант виражений одним числом.

Наведемо ще кілька прикладів складання варіаційних рядів.

приклад 3. 12 стрільців, виконуючи вправу лежачи з 10 пострілів, показали такі результати (в окулярах):

94; 91; 96; 94; 94; 92; 91; 92; 91; 95; 94; 94.

Для утворення варіаційного ряду здійснимо ранжування даних чисел;

94; 94; 94; 94; 94;

Після ранжирування складаємо варіаційний ряд (табл. 3).

Угруповання- Це розбиття сукупності на групи, однорідні за якоюсь ознакою.

Призначення сервісу. За допомогою онлайн-калькулятора Ви зможете:

  • побудувати варіаційний ряд, побудувати гістограму та полігон;
  • знайти показники варіації (середню, моду (зокрема і графічним способом), медіану, розмах варіації, квартили, децили, квартильний коефіцієнт диференціації, коефіцієнт варіації та інші показники);

Інструкція. Для групування ряду необхідно вибрати вид варіаційного ряду, що отримується (дискретний або інтервальний) і вказати кількість даних (кількість рядків). Отримане рішення зберігається у файлі Word (див. приклад угруповання статистичних даних).

Якщо угруповання вже здійснено та задані дискретний варіаційний рядабо інтервальний ряд, то необхідно скористатися онлайн-калькулятором Показники варіації. Перевірка гіпотези про вид розподілупроводиться за допомогою сервісу Вивчення форми розподілу.

Види статистичних угруповань

Варіаційний ряд. У разі спостережень дискретної випадкової величини те саме значення можна зустріти кілька разів. Такі значення x i випадкової величини записують із зазначенням n i числа разів його появи в n спостереженнях, і є частота даного значення.
У разі безперервної випадкової величини практично застосовують угруповання.
  1. Типологічне угруповання- Це поділ досліджуваної якісно різнорідної сукупності на класи, соціально-економічні типи, однорідні групи одиниць. Для побудови цього угруповання використовуйте параметр Дискретний варіаційний ряд.
  2. Структурним називається угруповання, в якій відбувається поділ однорідної сукупності на групи, що характеризують її структуру за якою-небудь ознакою, що варіює. Для побудови цього угруповання використовуйте параметр Інтервальний ряд.
  3. Угруповання, що виявляє взаємозв'язки між досліджуваними явищами та їх ознаками, називається аналітичним угрупованням(Див. аналітичне угруповання ряду).

Приклад №1. За даними таблиці 2 побудуйте ряди розподілу по 40 комерційних банків РФ. За отриманими рядами розподілу визначте: прибуток у середньому однією комерційний банк, кредитні вкладення загалом однією комерційний банк, модальне і медіанне значення прибутку; квартилі, децили, розмах варіації, середнє лінійне відхилення, середнє квадратичне відхилення, коефіцієнт варіації.

Рішення:
В розділі «Вигляд статистичного ряду»обираємо Дискретний ряд. Натискаємо Вставити з Excel. Кількість груп: за формулою Стерджесса

Принципи побудови статистичних угруповань

Ряд спостережень, упорядкованих за зростанням, називається варіаційним рядом. Групувальною ознакоюназивається ознака, яким виробляється розбивка сукупності деякі групи. Його називають основою угруповання. В основі угруповання можуть бути покладені як кількісні, так і якісні ознаки.
Після визначення підстави угруповання слід вирішити питання кількості груп, куди треба розбити досліджувану сукупність.

У разі використання персональних комп'ютерів для обробки статистичних даних групування одиниць об'єкта здійснюється за допомогою стандартних процедур.
Одна з таких процедур базується на використанні формули Стерджесу для визначення оптимальної кількості груп:

k = 1+3,322*lg(N)

Де k – кількість груп, N – число одиниць сукупності.

Довжину часткових інтервалів обчислюють як h=(x max -x min)/k

Потім підраховують числа попадань спостережень у ці інтервали, які приймають за частоти n i . Нечисленні частоти, значення яких менше 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
В якості нових значень варіант беруть середини інтервалів x i = (c i-1 + c i) /2.

Приклад №3. В результаті 5% власно-випадкової вибірки отримано наступний розподіл виробів за вмістом вологи. Розрахуйте: 1) середній відсоток вологості; 2) показники, що характеризують варіацію вологості.
Рішення отримано за допомогою калькулятора: Приклад №1

Побудувати варіаційний ряд. Знайденим рядом побудувати полігон розподілу, гістограму, кумуляту. Визначити моду та медіану.
Завантажити рішення

приклад. За результатами вибіркового спостереження (вибірка А додаток):
а) складіть варіаційний ряд;
б) обчисліть відносні частоти та накопичені відносні частоти;
в) збудуйте полігон;
г) складіть емпіричну функцію розподілу;
буд) побудуйте графік емпіричної функції розподілу;
е) обчисліть числові характеристики: середнє арифметичне, дисперсію, середнє відхилення квадратичне. Рішення

На основі даних, наведених у Таблиці 4 (Додаток 1) та відповідних Вашому варіанту, виконати:

  1. На основі структурного угруповання побудувати варіаційний частотний та кумулятивний ряди розподілу, використовуючи рівні закриті інтервали, прийнявши число груп рівним 6. Результати подати у вигляді таблиці та зобразити графічно.
  2. Проаналізувати варіаційний ряд розподілу, обчисливши:
    • середнє арифметичне значення ознаки;
    • моду, медіану, перший квартиль, перший і дев'ятий дециль;
    • середнє квадратичне відхилення;
    • коефіцієнт варіації.
  3. Зробити висновки.

Потрібно: ранжувати ряд, побудувати інтервальний ряд розподілу, обчислити середнє значення, коливання середнього значення, моду та медіану для ранжованого та інтервального рядів.

На основі вихідних даних побудувати дискретний варіаційний ряд; подати його у вигляді статистичної таблиці та статистичних графіків. 2). На основі вихідних даних побудувати інтервальний варіаційний ряд із рівними інтервалами. Число інтервалів вибрати самостійно та пояснити цей вибір. Подати отриманий варіаційний ряд у вигляді статистичної таблиці та статистичних графіків. Вказати види застосованих таблиць та графіків.

З метою визначення середньої тривалості обслуговування клієнтів у пенсійному фонді, кількість клієнтів якого є дуже великою, за схемою власне-випадкової безповторної вибірки проведено обстеження 100 клієнтів. Результати обстеження представлені у таблиці. Знайти:
а) межі, у яких із ймовірністю 0.9946 укладено середній час обслуговування всіх клієнтів пенсійного фонду;
б) ймовірність того, що частка всіх клієнтів фонду з тривалістю обслуговування менше 6 хвилин відрізняється від частки таких клієнтів у вибірці не більше ніж на 10% (за абсолютною величиною);
в) обсяг повторної вибірки, у якому з ймовірністю 0.9907 можна стверджувати, частка всіх клієнтів фонду із тривалістю обслуговування менше 6 хвилин відрізняється від частки таких клієнтів у вибірці лише на 10% (за абсолютною величиною).
2. За даними завдання 1, використовуючи X 2 критерій Пірсона, лише на рівні значимості α = 0,05 перевірити гіпотезу у тому, що випадкова величина Х – час обслуговування клієнтів – розподілено за нормальним законом. Побудувати на одному кресленні гістограму емпіричного розподілу та відповідну нормальну криву.
Завантажити рішення

Дано вибірку зі 100 елементів. Необхідно:

  1. Побудувати ранжований варіаційний ряд;
  2. Знайти максимальний та мінімальний члени ряду;
  3. Знайти розмах варіації та кількість оптимальних проміжків для побудови інтервального ряду. Знайти довжину проміжку інтервального ряду;
  4. Побудувати інтервальний ряд. Знайти частоти потрапляння елементів вибірки до складених проміжків. Знайти середні точки кожного проміжку;
  5. Побудувати гістограму та полігон частот. Порівняти з нормальним розподілом (аналітично та графічно);
  6. Побудувати графік емпіричної функції розподілу;
  7. Розрахувати вибіркові числові характеристики: вибіркове середнє та центральний вибірковий момент;
  8. Розрахувати наближені значення середнього квадратичного відхилення, асиметрії та ексцесу (користуючись пакетом аналізу MS Excel). Порівняти наближені розрахункові значення з точними (розраховані за формулами MS Excel);
  9. Порівняти вибіркові графічні характеристики із відповідними теоретичними.
Завантажити рішення

Є такі вибіркові дані (вибірка 10%-ная, механічна) про випускати продукцію і суму прибутку, млн. крб. За вихідними даними:
Завдання 13.1.
13.1.1. Побудуйте статистичний ряд розподілу підприємств за сумою прибутку, утворивши п'ять груп із рівними інтервалами. Побудуйте графіки ряду розподілу.
13.1.2. Розрахуйте числові характеристики ряду розподілу підприємств за сумою прибутку: середню арифметичну, середнє відхилення, дисперсію, коефіцієнт варіації V. Зробіть висновки.
Завдання 13.2.
13.2.1. Визначте межі, в яких із ймовірністю 0.997 укладено суму прибутку одного підприємства в генеральній сукупності.
13.2.2. Використовуючи x2-критерій Пірсона , при рівні значимості α перевірити гіпотезу у тому, що випадкова величина X – сума прибутку – розподілено за нормальним законом.
Завдання 13.3.
13.3.1. Визначте коефіцієнти вибіркового рівняння регресії.
13.3.2. Встановіть наявність та характер кореляційного зв'язку між вартістю виробленої продукції (X) та сумою прибутку на одне підприємство (Y). Побудуйте діаграму розсіювання та лінію регресії.
13.3.3. Розрахуйте лінійний коефіцієнт кореляції. Використовуючи t-критерій Стьюдента, перевірте значення коефіцієнта кореляції. Зробіть висновок про тісноту зв'язку між факторами X та Y, використовуючи шкалу Чеддока.
Методичні рекомендації. Завдання 13.3 виконується за допомогою цього сервісу.
Завантажити рішення

Завдання. Наступні дані є витрати часу клієнтів на укладення договорів. Побудувати інтервальний варіаційний ряд представлених даних, гістограму, знайти незміщену оцінку математичного очікування, зміщену та незміщену оцінку дисперсії.

Приклад. За даними таблиці 2:
1) Побудуйте ряди розподілу по 40 комерційних банків РФ:
а) за величиною прибутку;
б) за величиною кредитних вкладень.
2) За отриманими рядами розподілу визначте:
а) прибуток у середньому однією комерційний банк;
Б) кредитні вкладення загалом однією комерційний банк;
В) модальне та медіанне значення прибутку; квартили, децилі;
Г) модальне та медіанне значення кредитних вкладень.
3) За отриманими у п. 1 рядах розподілу розрахуйте:
а) розмах варіації;
б) середнє лінійне відхилення;
в) середнє квадратичне відхилення;
г) коефіцієнт варіації.
Необхідні розрахунки оформіть у табличній формі. Результати проаналізуйте. Зробіть висновки.
Побудуйте графіки одержаних рядів розподілу. Графічно визначте моду та медіану.

Рішення:
Для побудови угруповання з рівними інтервалами скористаємося сервісом Угруповання статистичних даних.

Рисунок 1 – Введення параметрів

Опис параметрів
Кількість рядків: кількість вихідних даних. Якщо розмірність ряду невелика, вкажіть його кількість. Якщо вибірка досить об'ємна, натисніть кнопку Вставити з Excel .
Кількість груп: 0 – число груп визначатиметься за формулою Стерджесса.
Якщо вказано конкретну кількість груп, вкажіть її (наприклад, 5).
Вид ряду: Дискретний ряд
Рівень значущості: наприклад, 0.954 . Цей параметр визначається для визначення довірчого інтервалу середнього значення.
Вибірка: Наприклад, проведена 10%-на механічна вибірка. Вказуємо число 10 . Для даних вказуємо 100 .

Останні матеріали розділу:

Основний план дій та способи виживання Вночі тихо, вдень вітер посилюється, а надвечір затихає
Основний план дій та способи виживання Вночі тихо, вдень вітер посилюється, а надвечір затихає

5.1. Поняття про місце існування людини. Нормальні та екстремальні умови життєпроживання. Виживання 5.1.1. Поняття про довкілля людини...

Англійські звуки для дітей: читаємо транскрипцію правильно
Англійські звуки для дітей: читаємо транскрипцію правильно

А ви знали, що англійський алфавіт складається з 26 літер та 46 різних звуків? Одна й та сама буква може передавати кілька звуків одночасно.

Контрольний тест з історії на тему Раннє Середньовіччя (6 клас)
Контрольний тест з історії на тему Раннє Середньовіччя (6 клас)

М.: 2019. – 128 с. М.: 2013. – 160 с. Посібник включає тести з історії Середніх віків для поточного та підсумкового контролю та відповідає змісту...