Середньоквадратичне відхилення формула приклад. Стандартне відхилення

Найбільш досконалою характеристикою варіації є середнє квадратичне відкладення, яке називають стандартом (або стандартним відхиленням). Середнє квадратичне відхилення() дорівнює квадратному кореню із середнього квадрата відхилень окремих значень ознаки від середньої арифметичної:

Середнє квадратичне відхилення просте:

Середнє зважене квадратичне відхилення застосовується для згрупованих даних:

Між середнім квадратичним та середнім лінійним відхиленнями в умовах нормального розподілу має місце таке співвідношення: ~ 1,25.

Середнє квадратичне відхилення, будучи основною абсолютною мірою варіації, використовується щодо значень ординат кривої нормального розподілу, у розрахунках, пов'язаних з організацією вибіркового спостереження та встановленням точності вибіркових характеристик, і навіть в оцінці меж варіації ознаки в однорідної сукупності.

Дисперсія, її види, середньоквадратичне відхилення.

Дисперсія випадкової величини- міра розкиду цієї випадкової величини, тобто її відхилення від математичного очікування. У статистиці часто використовується позначення чи . Квадратний корінь з дисперсії називається середньоквадратичним відхиленням, стандартним відхиленням або стандартним розкидом.

Загальна дисперсія (σ 2) вимірює варіацію ознаки у всій сукупності під впливом всіх факторів, що зумовили цю варіацію. Разом з тим, завдяки методу угруповань можна виділити та виміряти варіацію, зумовлену групувальною ознакою, та варіацію, що виникає під впливом неврахованих факторів.

Міжгрупова дисперсія (σ 2 м.гр) характеризує систематичну варіацію, тобто відмінності у величині досліджуваної ознаки, що виникають під впливом ознаки - фактора, покладеного в основу угруповання.

Середньоквадратичне відхилення(Синоніми: середнє квадратичне відхилення, середньоквадратичне відхилення, квадратичне відхилення; близькі терміни: стандартне відхилення, стандартний розкид) - в теорії ймовірностей і статистиці найбільш поширений показник розсіювання значень випадкової величини щодо її математичного очікування. При обмежених масивах вибірок значень замість математичного очікування використовується середнє арифметичне сукупності вибірок.

p align="justify"> Середньоквадратичне відхилення вимірюється в одиницях вимірювання самої випадкової величини і використовується при розрахунку стандартної помилки середнього арифметичного, при побудові довірчих інтервалів, при статистичній перевірці гіпотез, при вимірі лінійного взаємозв'язку між випадковими величинами. Визначається як квадратний корінь з дисперсії випадкової величини.


Середньоквадратичне відхилення:

Стандартне відхилення(Оцінка середньоквадратичного відхилення випадкової величини xщодо її математичного очікування на основі незміщеної оцінки її дисперсії):

де - Дисперсія; - i-й елемент вибірки; - Обсяг вибірки; - Середнє арифметичне вибірки:

Слід зазначити, що обидві оцінки є зміщеними. Загалом незміщену оцінку побудувати неможливо. Проте оцінка з урахуванням оцінки несмещенной дисперсії є заможною.

Сутність, сфера застосування та порядок визначення моди та медіани.

Крім статечних середніх у статистиці для відносної характеристики величини ознаки, що варіює, і внутрішньої будови рядів розподілу користуються структурними середніми, які представлені, в основному, модою та медіаною.

Мода— це варіант ряду, що найчастіше зустрічається. Мода застосовується, наприклад, щодо розміру одягу, взуття, що користується найбільшим попитом у покупців. Модою для дискретного ряду є варіанти, що мають найбільшу частоту. При обчисленні моди для інтервального варіаційного ряду необхідно спочатку визначити модальний інтервал (за максимальною частотою), а потім значення модальної величини ознаки за формулою:

- - Значення моди

- нижня межа модального інтервалу

- - Величина інтервалу

- - Частота модального інтервалу

- - Частота інтервалу, що передує модальному

- - Частота інтервалу, наступного за модальним

Медіанаце значення ознаки, що лежить в основі ранжованого ряду та ділить цей ряд на дві рівні за чисельністю частини.

Для визначення медіани в дискретному ряду за наявності частот спочатку обчислюють напівсуму частот, а потім визначають яке значення варіанта припадає на неї. (Якщо відсортований ряд містить непарну кількість ознак, то номер медіани обчислюють за формулою:

М е = (n (число ознак у сукупності) + 1)/2,

у разі парного числа ознак медіана дорівнюватиме середньої з двох ознак що знаходяться в середині ряду).

При обчисленні медіанидля інтервального варіаційного ряду спочатку визначають медіанний інтервал, в межах якого знаходиться медіана, а потім значення медіани за формулою:

- - Шукана медіана

- нижня межа інтервалу, який містить медіану

- - Величина інтервалу

- - Сума частот або число членів ряду

Сума накопичених частот інтервалів, що передують медіанному

- - Частота медіанного інтервалу

приклад. Знайти моду та медіану.

Рішення:
У цьому прикладі модальний інтервал перебуває у межах вікової групи 25-30 років, оскільки цей інтервал припадає найбільша частота (1054).

Розрахуємо величину моди:

Це означає, що модальний вік студентів дорівнює 27 рокам.

Обчислимо медіану. Медіанний інтервал знаходиться у віковій групі 25-30 років, тому що в межах цього інтервалу розташована варіанта, яка поділяє сукупність на дві рівні частини (?f i/2=3462/2=1731). Далі підставляємо у формулу необхідні числові дані та отримуємо значення медіани:

Це означає, що одна половина студентів має вік до 27,4 року, а інша понад 27,4 роки.

Крім моди і медіани можуть бути використані такі показники, як квартилі, що ділять ранжований ряд на 4 рівні частини, децилі- 10 частин та перцентілі – на 100 частин.

Поняття вибіркового спостереження та сфера його застосування.

Вибіркове спостереженнязастосовується, коли застосування суцільного спостереження фізично неможливочерез великий масив даних або економічно недоцільно. Фізична неможливість має місце, наприклад, щодо пасажиропотоків, ринкових цін, сімейних бюджетів. Економічна недоцільність має місце в оцінці якості товарів, що з їх знищенням, наприклад, дегустація, випробування цегли на міцність тощо.

Статистичні одиниці, відібрані для спостереження, становлять вибіркову сукупність чи вибірку, а їх масив - генеральну сукупність (ГС). При цьому число одиниць у вибірці позначають n, а у всій ГС - N. Ставлення n/Nназивається відносний розмір або частка вибірки.

Якість результатів вибіркового спостереження залежить від репрезентативності вибірки, тобто від цього, наскільки вона представницька в ГС. Для забезпечення репрезентативності вибірки необхідно дотримуватись принцип випадковості відбору одиниць, який передбачає, що у включення одиниці ГС у вибірку неспроможна вплинути якийсь інший чинник крім випадку.

Існує 4 способи випадкового відборуу вибірку:

  1. Власне випадковийвідбір або «метод лото», коли статистичним величинам присвоюються порядкові номери, що заносяться на певні предмети (наприклад, барила), які потім перемішуються в деякій ємності (наприклад, в мішку) і вибираються навмання. Насправді цей спосіб здійснюють за допомогою генератора випадкових чисел або математичних таблиць випадкових чисел.
  2. Механічнийвідбір, за яким відбирається кожна ( N/n)-я величина генеральної сукупності. Наприклад, якщо вона містить 100 000 величин, а потрібно вибрати 1 000, то вибірку потрапить кожна 100 000 / 1000 = 100-а величина. Причому якщо вони не ранжовані, то перша вибирається навмання з першої сотні, а номери інших будуть на сотню більше. Наприклад, якщо першою виявилася одиниця № 19, то наступною має бути № 119, потім № 219, потім № 319 тощо. Якщо одиниці генеральної сукупності ранжовані, то першою вибирається № 50, потім № 150, потім № 250 і таке інше.
  3. Відбір величин із неоднорідного масиву даних ведеться стратифікованим(Розшарованим) способом, коли генеральна сукупність попередньо розбивається на однорідні групи, до яких застосовується випадковий або механічний відбір.
  4. Особливий спосіб складання вибірки є серійнийвідбір, у якому випадково чи механічно вибирають окремі величини, які серії (послідовності з якогось номера за якийсь поспіль), всередині яких ведуть суцільне спостереження.

Якість вибіркових спостережень залежить і від типу вибірки: повторнаабо безповторна.

При повторному відборістатистичні величини, що потрапили у вибірку, або їх серії після використання повертаються в генеральну сукупність, маючи шанс потрапити в нову вибірку. При цьому у всіх величин генеральної сукупності однакова можливість включення у вибірку.

Неповторний відбірозначає, що статистичні величини, що потрапили у вибірку, або їх серії після використання не повертаються в генеральну сукупність, а тому для інших величин останньої підвищується ймовірність потрапляння в наступну вибірку.

Безповторний відбір дає точніші результати, тому застосовується частіше. Але є ситуації, коли його не можна застосувати (вивчення пасажиропотоків, споживчого попиту тощо) і тоді ведеться повторний відбір.

Гранична помилка вибірки спостереження, середня помилка вибірки, порядок їхнього розрахунку.

Розглянемо докладно перелічені вище способи формування вибіркової сукупності і помилки, що виникають при цьому. репрезентативності .
Власне-випадковаВибірка ґрунтується на відборі одиниць з генеральної сукупності навмання без будь-яких елементів системності. Технічно власне-випадковий відбір проводять методом жеребкування (наприклад, розіграші лотерей) або за таблицею випадкових чисел.

Власно-випадковий відбір «у чистому вигляді» у практиці вибіркового спостереження застосовується рідко, але він є вихідним серед інших видів відбору, у ньому реалізуються основні засади вибіркового спостереження. Розглянемо деякі питання теорії вибіркового методу та формули помилок для простої випадкової вибірки.

Помилка вибіркового спостереження- це різницю між величиною параметра у генеральній сукупності, та її величиною, обчисленої за результатами вибіркового спостереження. Для середньої кількісної ознаки помилка вибірки визначається

Показник називається граничною помилкою вибірки.
Вибіркова середня є випадковою величиною, яка може набувати різних значень залежно від того, які одиниці потрапили у вибірку. Отже, помилки вибірки є випадковими величинами і можуть приймати різні значення. Тому визначають середню із можливих помилок - середню помилку вибірки, яка залежить від:

Об'єм вибірки: чим більша чисельність, тим менша величина середньої помилки;

Ступені зміни досліджуваної ознаки: що менше варіація ознаки, отже, і дисперсія, то менше середня помилка вибірки.

При випадковому повторному відборісередня помилка розраховується:
.
Практично генеральна дисперсія точно не відома, але в теорії ймовірностідоведено, що
.
Оскільки величина за досить великих n близька до 1, вважатимуться, що . Тоді середня помилка вибірки може бути розрахована:
.
Але у випадках малої вибірки (при n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

При випадковій безповторній вибірцінаведені формули коригуються на величину. Тоді середня помилка безповторної вибірки:
і .
Т.к. завжди менше, то множник () завжди менше 1. Це означає, що середня помилка при безповторному відборі завжди менше, ніж при повторному.
Механічна вибірказастосовується, коли генеральна сукупність у будь-який спосіб упорядкована (наприклад, списки виборців за алфавітом, телефонні номери, номери будинків, квартир). Відбір одиниць здійснюється через певний інтервал, що дорівнює зворотному значенню відсотка вибірки. Так за 2% вибірці відбирається кожна 50 одиниця =1/0,02 , при 5% кожна 1/0,05=20 одиниця генеральної сукупності.

Початок відліку вибирається різними способами: випадковим чином, із середини інтервалу, зі зміною початку відліку. Головне при цьому – уникнути систематичної помилки. Наприклад, при 5% вибірці, якщо першою одиницею обрано 13-ту, то наступні 33, 53, 73 і т.д.

За точністю механічний відбір близький до власно-випадкової вибірки. Тому визначення середньої помилки механічної вибірки використовують формули власне-випадкового відбору.

При типовому відборі обстежувана сукупність попередньо розбивається на однорідні, однотипні групи. Наприклад, при обстеженні підприємств це можуть бути галузі, підгалузі, щодо населення - райони, соціальні чи вікові групи. Потім здійснюється незалежний вибір із кожної групи механічним або власне-випадковим способом.

Типова вибірка дає більш точні результати проти іншими способами. Типізація генеральної сукупності забезпечує представництво у вибірці кожної типологічної групи, що дозволяє виключити вплив міжгрупової дисперсії на середню помилку вибірки. Отже, при знаходженні помилки типової вибірки згідно з правилом складання дисперсій () необхідно врахувати лише середню з групових дисперсій. Тоді середня помилка вибірки:
при повторному відборі
,
при безповторному відборі
,
де - середня із внутрішньогрупових дисперсій у вибірці.

Серійний (або гніздовий) відбір застосовується у разі, коли генеральна сукупність розбита на серії чи групи на початок вибіркового обстеження. Цими серіями можуть бути упаковки готової продукції, студентські групи, бригади. Серії для обстеження вибираються механічним чи власне-випадковим способом, а всередині серії проводиться суцільне обстеження одиниць. Тому середня помилка вибірки залежить лише від міжгрупової (міжсерійної) дисперсії, яка обчислюється за такою формулою:

де r – число відібраних серій;
- середня і-та серія.

Середня помилка серійної вибірки розраховується:

при повторному відборі:
,
при безповторному відборі:
,
де R – загальна кількість серій.

Комбінованийвідбірє поєднанням розглянутих способів відбору.

Середня помилка вибірки за будь-якого способу відбору залежить головним чином абсолютної чисельності вибірки й у меншою мірою - від відсотка вибірки. Припустимо, що проводиться 225 спостережень у першому випадку з генеральної сукупності 4500 одиниць і у другому - 225000 одиниць. Дисперсії в обох випадках дорівнюють 25. Тоді в першому випадку при 5% відборі помилка вибірки складе:

У другому випадку при 0,1%-ному відборі вона дорівнюватиме:


Таким чином, при зменшенні відсотка вибірки у 50 разів, помилка вибірки збільшилася незначно, оскільки чисельність вибірки не змінилася.
Припустимо, що кількість вибірки збільшили до 625 спостережень. У цьому випадку помилка вибірки дорівнює:

Збільшення вибірки в 2,8 разу за однієї й тієї ж чисельності генеральної сукупності знижує розміри помилки вибірки більш як 1,6 разу.

Методи та способи формування вибіркової сукупності.

У статистиці застосовуються різні способи формування вибіркових сукупностей, що обумовлюється завданнями дослідження та залежить від специфіки об'єкта вивчення.

Основною умовою проведення вибіркового обстеження є запобігання виникненню систематичних помилок, що виникають внаслідок порушення принципу рівних можливостей потрапляння у вибірку кожної одиниці генеральної сукупності. Попередження систематичних помилок досягається внаслідок застосування науково обґрунтованих способів формування вибіркової сукупності.

Існують такі способи відбору одиниць із генеральної сукупності:

1) індивідуальний відбір - у вибірку відбираються окремі одиниці;

2) груповий відбір - у вибірку потрапляють якісно однорідні групи або серії одиниць, що вивчаються;

3) комбінований відбір - це комбінація індивідуального та групового відбору.
Способи відбору визначаються правилами формування вибіркової сукупності.

Вибірка може бути:

  • власне-випадковаполягає в тому, що вибіркова сукупність утворюється в результаті випадкового (ненавмисного) відбору окремих одиниць із генеральної сукупності. При цьому кількість відібраних у вибіркову сукупність одиниць зазвичай визначається, виходячи з прийнятої частки вибірки. Частка вибірки є відношення числа одиниць вибіркової сукупності n чисельності одиниць генеральної сукупності N, тобто.
  • механічнаполягає в тому, що відбір одиниць у вибіркову сукупність виробляється з генеральної сукупності, розбитої на рівні інтервали (групи). При цьому розмір інтервалу в генеральній сукупності дорівнює зворотній величині частки вибірки. Так, при 2% вибірці відбирається кожна 50-а одиниця (1:0,02), при 5% вибірці - кожна 20 одиниця (1:0,05) і т.д. Таким чином, відповідно до прийнятої частки відбору, генеральна сукупність механічно розбивається на рівновеликі групи. З кожної групи у вибірку відбирається лише одна одиниця.
  • типова -при якій генеральна сукупність спочатку розчленовується на однорідні типові групи. Потім із кожної типової групи власне-випадковою або механічною вибіркою проводиться індивідуальний відбір одиниць у вибіркову сукупність. Важливою особливістю типової вибірки і те, що вона дає точніші результати проти іншими способами відбору одиниць у вибіркову сукупність;
  • серійна- за якої генеральну сукупність ділять на однакові за обсягом групи - серії. У вибіркову сукупність відбираються серії. Усередині серій проводиться суцільне спостереження одиниць, що потрапили до серії;
  • комбінована- вибірка може бути двоступінчастою. У цьому генеральна сукупність спочатку розбивається групи. Потім здійснюють відбір груп, а всередині останніх здійснюється відбір окремих одиниць.

У статистиці розрізняють такі способи відбору одиниць у вибіркову сукупність:

  • одноступінчаставибірка - кожна відібрана одиниця відразу ж піддається вивченню за заданою ознакою (власне-випадкова та серійна вибірки);
  • багатоступінчаставибірка - виробляють підбір з генеральної сукупності окремих груп, та якщо з груп вибираються окремі одиниці (типова вибірка з механічним способом відбору одиниць у вибіркову сукупність).

Крім того розрізняють:

  • повторний відбір- За схемою повернутої кулі. При цьому кожна одиниця, що потрапила у вибірку, іди серія повертається в генеральну сукупність і тому має шанс знову потрапити у вибірку;
  • безповторний відбір- За схемою неповернутої кулі. Він має більш точні результати при тому самому обсязі вибірки.

Визначення необхідного обсягу вибірки (використання таблиці Стьюдента).

Одним із наукових принципів у теорії вибіркового методу є забезпечення достатньої кількості відібраних одиниць. Теоретично необхідність дотримання цього принципу представлена ​​в доказах граничних теорем теорії ймовірностей, які дозволяють встановити, який обсяг одиниць слід вибрати з генеральної сукупності, щоб він був достатнім та забезпечував репрезентативність вибірки.

Зменшення стандартної помилки вибірки, а отже, збільшення точності оцінки завжди пов'язане зі збільшенням обсягу вибірки, тому вже на стадії організації вибіркового спостереження доводиться вирішувати питання про те, яким має бути обсяг вибіркової сукупності, щоб була забезпечена необхідна точність результатів спостережень. Розрахунок необхідного обсягу вибірки будується за допомогою формул, виведених з формул граничних помилок вибірки (А), відповідних тому чи іншому виду та способу відбору. Так, для випадкового повторного обсягу вибірки (n) маємо:

Суть цієї формули - у цьому, що з випадковому повторному відборі необхідної чисельності обсяг вибірки прямо пропорційний квадрату коефіцієнта довіри (t2)і дисперсії варіаційної ознаки (?2) і обернено пропорційний квадрату граничної помилки вибірки (?2). Зокрема, зі збільшенням граничної помилки вдвічі необхідна чисельність вибірки може бути зменшена вчетверо. З трьох параметрів два (t і ?) задаються дослідником.

При цьому дослідник виходячиз метою завдань вибіркового обстеження має вирішити питання: у якому кількісному поєднанні краще включити ці параметри для забезпечення оптимального варіанту? В одному випадку його може більше влаштовувати надійність отриманих результатів (t), ніж міра точності (?), В іншому - навпаки. Складніше вирішити питання щодо величини граничної помилки вибірки, тому що цим показником дослідник на стадії проектування вибіркового спостереження не має, тому в практиці прийнято ставити величину граничної помилки вибірки, як правило, в межах до 10% передбачуваного середнього рівня ознаки. До встановлення передбачуваного середнього рівня можна підходити по-різному: використовувати дані подібних раніше проведених обстежень або скористатися даними основи вибірки і зробити невелику пробну вибірку.

Найбільш складно встановити під час проектування вибіркового спостереження третій параметр у формулі (5.2) - дисперсію вибіркової сукупності. У цьому випадку необхідно використовувати всю інформацію, що є у розпорядженні дослідника, отриману в раніше проведених подібних та пробних обстеженнях.

Питання визначеннянеобхідної чисельності вибірки ускладнюється, якщо вибіркове обстеження передбачає вивчення кількох ознак одиниць відбору. У цьому випадку середні рівні кожної з ознак та їх варіація, як правило, різні, і тому вирішити питання про те, дисперсії якої з ознак віддати перевагу, можливо лише з урахуванням мети та завдань обстеження.

При проектуванні вибіркового спостереження передбачаються заздалегідь задана величина припустимої помилки вибірки відповідно до завдань конкретного дослідження та ймовірність висновків за результатами спостереження.

Загалом формула граничної помилки вибіркової середньої величини дозволяє визначати:

Величину можливих відхилень показників генеральної сукупності від показників вибіркової сукупності;

Необхідну чисельність вибірки, що забезпечує необхідну точність, коли межі можливої ​​помилки не перевищать деякої заданої величини;

Імовірність того, що у проведеній вибірці помилка матиме задану межу.

Розподіл Стьюдентатеоретично ймовірностей — це однопараметричне сімейство абсолютно безперервних розподілів.

Ряди динаміки (інтервальні, моментні), змикання рядів динаміки.

Ряди динаміки- це значення статистичних показників, які представлені у певній хронологічній послідовності.

Кожен динамічний ряд містить дві складові:

1) показники періодів часу (роки, квартали, місяці, дні чи дати);

2) показники, що характеризують об'єкт, що досліджується, за тимчасові періоди або на відповідні дати, які називають рівнями ряду.

Рівні ряду виражаютьсяяк абсолютними, і середніми чи відносними величинами. Залежно від характеру показників будують динамічні ряди абсолютних, відносних та середніх величин. Ряди динаміки з відносних та середніх величин будують на основі похідних рядів абсолютних величин. Розрізняють інтервальні та моментні ряди динаміки.

Динамічний інтервальний рядмістить значення показників за певний період часу. В інтервальному ряду рівні можна підсумовувати, одержуючи обсяг явища за триваліший період, або звані накопичені результати.

Динамічний моментний рядвідбиває значення показників на певний час (дату часу). У моментних рядах дослідника може цікавити лише різницю явищ, що відбиває зміна рівня низки між певними датами, оскільки сума рівнів тут немає реального змісту. Накопичені результати тут не розраховуються.

Найважливішою умовою правильної побудови динамічних рядів є сумісність рівнів рядів, що належать до різних періодів. Рівні повинні бути представлені в однорідних величинах, повинна мати місце однакова повнота охоплення різних частин явища.

Для того щобуникнути спотворення реальної динаміки; у статистичному дослідженні проводяться попередні розрахунки (змикання рядів динаміки), які передують статистичному аналізу динамічних рядів. Під змиканням рядів динаміки розуміється об'єднання до одного ряду двох і більше рядів, рівні яких розраховані за різною методологією або не відповідають територіальним кордонам тощо. Змикання рядів динаміки може припускати також приведення абсолютних рівнів рядів динаміки до загальної основи, що нівелює непорівнянність рівнів динаміки.

Поняття сумісності рядів динаміки, коефіцієнти, темпи зростання та приросту.

Ряди динаміки- Це ряди статистичних показників, що характеризують розвиток явищ природи та суспільства в часі. Статистичні збірники, що публікуються Держкомстатом Росії, містять велику кількість рядів динаміки в табличній формі. Ряди динаміки дозволяють виявити закономірності розвитку явищ, що вивчаються.

Ряди динаміки містять два види показників. Показники часу(Роки, квартали, місяці та ін) або моменти часу (на початок року, на початок кожного місяця і т.п.). Показники рівнів ряду. Показники рівнів рядів динаміки можуть бути виражені абсолютними величинами (виробництво продукту в тоннах або рублях), відносними величинами (питома вага міського населення у %) та середніми величинами (середня заробітна плата працівників галузі за роками тощо). У табличній формі ряд динаміки містить два стовпці або два рядки.

Правильне побудова рядів динаміки передбачає виконання низки вимог:

  1. усі показники низки динаміки мають бути науково обґрунтованими, достовірними;
  2. показники низки динаміки мають бути зіставні за часом, тобто. мають бути обчислені за однакові періоди часу чи однакові дати;
  3. показники низки динаміки мають бути зіставні територією;
  4. показники низки динаміки мають бути зіставні за змістом, тобто. обчислені за єдиною методологією, однаковим способом;
  5. показники низки динаміки мають бути зіставні по колу господарств, що враховуються. Усі показники низки динаміки повинні бути наведені в одних і тих самих одиницях вимірювання.

Статистичні показникиможуть характеризувати або результати досліджуваного процесу у період, або стан досліджуваного явища певний час, тобто. показники можуть бути інтервальними (періодичними) та моментними. Відповідно спочатку ряди динаміки можуть бути або інтервальними, або моментними. Моментні ряди динаміки у свою чергу можуть бути з рівними та нерівними проміжками часу.

Початкові ряди динаміки можуть бути перетворені на ряд середніх величин і ряд відносних величин (ланцюговий та базисний). Такі ряди динаміки називають похідними рядами динаміки.

Методика розрахунку середнього рівня серед динаміки різна, обумовлена ​​виглядом низки динаміки. На прикладах розглянемо види рядів динаміки та формули для розрахунку середнього рівня.

Абсолютні прирости (Δy) показують, наскільки одиниць змінився наступний рівень ряду порівняно з попереднім (гр.3 - ланцюгові абсолютні прирости) або в порівнянні з початковим рівнем (гр.4 - базисні абсолютні прирости). Формули розрахунку можна записати так:

При зменшенні абсолютних значень ряду буде відповідно "зменшення", "зниження".

Показники абсолютного приросту свідчать, що, наприклад, 1998 р. виробництво продукту " А " збільшилося проти 1997 р. на 4 тис. т, а проти 1994 р. — на 34 тис. т.; за рештою років див. табл. 11.5 гр. 3 та 4.

Коефіцієнт зростанняпоказує, скільки разів змінився рівень низки проти попереднім (гр.5 — ланцюгові коефіцієнти зростання чи зниження) чи порівняно з початковим рівнем (гр.6 — базисні коефіцієнти зростання чи зниження). Формули розрахунку можна записати так:

Темпи зростанняпоказують, скільки відсотків становить наступний рівень низки проти попереднім (гр.7 — ланцюгові темпи зростання) чи проти початковим рівнем (гр.8 — базисні темпи зростання). Формули розрахунку можна записати так:

Приміром, 1997 р. обсяги виробництва продукту " А " проти 1996 р. становив 105,5 % (

Темпи прироступоказують, скільки відсотків збільшився рівень звітного періоду проти попереднім (гр.9- ланцюгові темпи приросту) чи проти початковим рівнем (гр.10- базисні темпи приросту). Формули розрахунку можна записати так:

Т пр = Т р - 100% або Т пр = абсолютний приріст / рівень попереднього періоду * 100%

Приміром, 1996 р. проти 1995 р. продукту " А " вироблено більше на 3,8 % (103,8 %- 100%) чи (8:210)х100%, а проти 1994 р. - на 9% (109% - 100%).

Якщо абсолютні рівні в ряду зменшуються, то темп буде меншим за 100% і відповідно буде темп зниження (темп приросту зі знаком мінус).

Абсолютне значення 1% приросту(Гр. 11) показує, скільки одиниць треба зробити в даному періоді, щоб рівень попереднього періоду зріс на 1%. У прикладі, 1995 р. треба було виробити 2,0 тис. т., а 1998 р. — 2,3 тис. т., тобто. значно більше.

Визначити величину абсолютного значення 1% приросту можна двома способами:

Рівень попереднього періоду поділити на 100;

Ланцюгові абсолютні прирости розділити на відповідні ланцюгові темпи приросту.

Абсолютне значення 1% приросту =

У динаміці, особливо протягом тривалого періоду, важливий спільний аналіз темпів приросту зі змістом кожного відсотка приросту чи зниження.

Зауважимо, що розглянута методика аналізу рядів динаміки застосовна як для рядів динаміки, рівні яких виражені абсолютними величинами (т, тис. руб., Число працівників і т.д.), так і для рядів динаміки, рівні яких виражені відносними показниками (% шлюбу ,% зольності вугілля та ін) або середніми величинами (середня врожайність у ц/га, середня заробітна плата тощо).

Поряд із розглянутими аналітичними показниками, що обчислюються за кожен рік у порівнянні з попереднім або початковим рівнем, при аналізі рядів динаміки необхідно обчислити середні за період аналітичні показники: середній рівень ряду, середній річний абсолютний приріст (зменшення) та середній річний темп зростання та темп приросту.

Методи розрахунку середнього рівня низки динаміки було розглянуто вище. У аналізованому нами інтервальному ряду динаміки середній рівень ряду обчислюється за формулою середньої арифметичної простий:

Середньорічний обсяг виробництва товару за 1994- 1998 гг. становив 218,4 тис. т.

Середньорічний абсолютний приріст обчислюється також за формулою середньої арифметичної простий:

Щорічні абсолютні прирости змінювалися за роками від 4 до 12 тис.т (див.гр.3), а середньорічний приріст виробництва у період 1995 — 1998 гг. становив 8,5 тис. т.

Методи розрахунку середнього темпу зростання та середнього темпу приросту вимагають докладнішого розгляду. Розглянемо їх з прикладу наведених у таблиці річних показників рівня низки.

Середній рівень низки динаміки.

Ряд динаміки (або часовий ряд)- це числові значення певного статистичного показника у послідовні моменти чи періоди часу (тобто розташовані у хронологічному порядку).

Числові значення того чи іншого статистичного показника, що становить низку динаміки, називають рівнями рядуі зазвичай позначають буквою y. Перший член ряду y 1називають початковим або базисним рівнем, а останній y n - кінцевим. Моменти або періоди часу, до яких належать рівні, позначають через t.

Ряди динаміки, як правило, представляють у вигляді таблиці або графіка, причому по осі абсцис будується шкала часу t, а по осі ординат - шкала рівнів ряду y.

Середні показники низки динаміки

Кожен ряд динаміки можна розглядати як сукупність nмінливих у часі показників, які можна узагальнювати як середніх величин. Такі узагальнені (середні) показники особливо необхідні у порівнянні змін того чи іншого показника в різні періоди, у різних країнах тощо.

Узагальненою характеристикою низки динаміки може бути перш за все середній рівень ряду. Спосіб розрахунку середнього рівня залежить від того, чи моментний ряд або інтервальний (періодний).

В разі інтервальногонизки його середній рівень визначається за формулою простий середньої арифметичної величини з рівнів низки, тобто.

=
Якщо мається моментнийряд, що містить nрівнів ( y1, y2, …, yn) з рівними проміжками між датами (моментами часу), такий ряд легко перетворити на ряд середніх величин. При цьому показник (рівень) початку кожного періоду одночасно є показником на кінець попереднього періоду. Тоді середня величина показника для кожного періоду (проміжок між датами) може бути розрахована як напівсума значень упочатку і поклала край періоду, тобто. як . Кількість таких середніх буде. Як зазначалося раніше, для рядів середніх величин середній рівень розраховується за середньою арифметичною.

Отже, можна записати:
.
Після перетворення чисельника отримуємо:
,

де Y1і Yn- Перший та останній рівні ряду; Yi- Проміжні рівні.

Ця середня відома у статистиці як середня хронологічнадля моментних лав. Таку назву вона отримала від слова «cronos» (час, лат.), оскільки розраховується з показників, що змінюються в часі.

У разі нерівнихпроміжків між датами середню хронологічну для моментного ряду можна розрахувати як середню арифметичну із середніх значень рівнів на кожну пару моментів, зважених за величиною відстаней (відрізків часу) між датами, тобто.
.
В даному випадкупередбачається, що в проміжках між датами рівні набули різних значень, і ми з двох відомих ( yiі yi+1) визначаємо середні, з яких потім вже розраховуємо загальну середню для всього періоду, що аналізується.
Якщо ж передбачається, що кожне значення yiзалишається незмінним до наступного (i+ 1)- го моменту, тобто. відома точна дата зміни рівнів, то розрахунок можна здійснювати за формулою середньої арифметичної зваженої:
,

де - час, протягом якого рівень залишався незмінним.

Крім середнього рівня у лавах динаміки розраховуються й інші середні показники - середня зміна рівнів ряду (базисним та ланцюговим способами), середній темп зміни.

Базова середня абсолютна змінаявляє собою приватне від поділу останньої базової абсолютної зміни на кількість змін. Тобто

Ланцюгова середня абсолютна зміна рівнів ряду є часткою від поділу суми всіх ланцюгових абсолютних змін на кількість змін, тобто

По знаку середніх абсолютних змін судять про характер зміни явища у середньому: зростання, спад чи стабільність.

З правила контролю базисних та ланцюгових абсолютних змін випливає, що базисна та ланцюгова середня зміна мають бути рівними.

Поруч із середніми абсолютним зміною розраховується і середнє відносне теж базисним і ланцюговим методами.

Базисна середня відносна змінавизначається за формулою:

Ланцюгова середня відносна змінавизначається за формулою:

Природно, базисне і ланцюгове середнє відносне зміни мають бути однаковими і порівнянням їх із критеріальним значенням 1 робиться висновок про характер зміни явища в середньому: зростання, спад чи стабільність.
Відніманням 1 з базисної або ланцюгової середньої відносної зміни утворюється відповідний середній темп зміни, за знаком якого можна судити про характер зміни досліджуваного явища, відбитого даним рядом динаміки.

Сезонні коливання та індекси сезонності.

Сезонні коливання – стійкі внутрішньорічні коливання.

Основний принцип господарювання для отримання максимального ефекту – це максимізація доходів та мінімізація витрат. Вивчаючи сезонні коливання, вирішується завдання максимального рівняння в кожному рівні року.

При вивченні сезонних коливань вирішуються дві взаємозалежні завдання:

1. Виявлення специфіки розвитку явища у внутрішньорічній динаміці;

2. Вимірювання сезонних коливань з побудовою моделі сезонної хвилі;

Для вимірювання сезонних коливань зазвичай обчислюють індичок сезонності. У загальному вигляді вони визначаються ставленням вихідних рівнянь низки динаміки до теоретичних рівнянь, що виступають як база для порівняння.

Оскільки на сезонні коливання накладаються випадкові відхилення, їх усунення роблять усереднення індексів сезонності.

В цьому випадку для кожного періоду річного циклу визначаються узагальнені показники у вигляді середніх сезонних індексів:

Середні індекси сезонних коливань вільні від впливу випадкових відхилень основної тенденції розвитку.

Залежно від характеру тренду, формула середнього індексу сезонності може приймати такі види:

1.Для рядів внутрішньорічної динаміки з яскраво вираженою основною тенденцією розвитку:

2. Для рядів внутрішньорічної динаміки в якій тренд, що підвищується або знижується, відсутній, або незначний:

Де – загальне середнє;

Методи аналізу основної тенденції.

На розвиток явищ за часом впливають фактори різні за характером та силою впливу. Деякі їх носять випадковий характер, інші мають практично постійний вплив і формують у лавах динаміки певну тенденцію розвитку.

Важливим завданням статистики є виявлення серед динаміки тренду, звільненого від дії різних випадкових чинників. З цією метою ряди динаміки піддаються обробці методами укрупнення інтервалів, ковзної середньої та аналітичного вирівнювання та ін.

Метод укрупнення інтервалівзаснований на укрупненні періодів часу, до яких відносяться рівні динаміки, тобто. являє собою заміну даних, що стосуються дрібних часових періодів, даними по більшим періодам. Особливо ефективний, коли початкові рівні ряду належать до коротких проміжків часу. Наприклад, ряди показників, що стосуються щоденних подій, замінюються рядами, що належать до тижневих, помісячних і т.д. Це дозволить більш чітко показати «вісь розвитку явища». Середня, обчислена за укрупненими інтервалами, дозволяє виявляти напрям та характер (прискорення чи уповільнення зростання) основної тенденції розвитку.

Метод ковзної середньоїсхожий з попереднім, але в даному випадку фактичні рівні замінюються середніми рівнями, розрахованими для послідовно рухливих (ковзаючих) укрупнених інтервалів, що охоплюють mрівнів низки.

Наприклад, якщо прийняти m=3,то спочатку розраховується середня з перших трьох рівнів ряду, потім - з того ж числа рівнів, але починаючи з другого за рахунком, далі - починаючи з третього і т.д. Отже, середня хіба що «ковзає» з низки динаміки, пересуваючись однією термін. Розраховані з mчленів ковзаючі середні відносяться до середини (центру) кожного інтервалу.

Цей метод усуває лише випадкові коливання. Якщо ж ряд має сезонну хвилю, то вона збережеться і після згладжування методом ковзної середньої.

Аналітичне вирівнювання. З метою усунення випадкових коливань та виявлення тренду застосовується вирівнювання рівнів ряду за аналітичними формулами (або аналітичне вирівнювання). Його суть полягає у заміні емпіричних (фактичних) рівнів теоретичними, які розраховані за певним рівнянням, прийнятим за математичну модель тренда, де теоретичні рівні розглядаються як функція часу: . У цьому кожен фактичний рівень сприймається як сума двох складових: , де - систематична складова і виражена певним рівнянням, а - випадкова величина, що викликає коливання навколо тренда.

Завдання аналітичного вирівнювання зводиться до наступного:

1. Визначення на основі фактичних даних виду гіпотетичної функції, здатної найбільш адекватно відобразити тенденцію розвитку досліджуваного показника.

2. Знаходження за емпіричними даними параметрів зазначеної функції (рівняння)

3. Розрахунок за знайденим рівнянням теоретичних (вирівняних) рівнів.

Вибір тієї чи іншої функції здійснюється, зазвичай, з урахуванням графічного зображення емпіричних даних.

Як моделі служать рівняння регресії, параметри яких розраховують за способом найменших квадратів

Нижче наводяться найчастіше використовувані для вирівнювання динамічних рядів рівняння регресії із зазначенням для відображення яких саме тенденцій розвитку вони найбільше підходять.

Для знаходження параметрів наведених вище рівнянь існують спеціальні алгоритми та комп'ютерні програми. Зокрема, для знаходження параметрів рівняння прямої може бути використаний такий алгоритм:

Якщо періоди або моменти часу пронумерувати так, щоб вийшло St = 0, то наведені вище алгоритми істотно спростяться і перетворяться на

Вирівняні рівні на графіку розташуються на одній прямій, що проходить на найближчій відстані від фактичних рівнів даного динамічного ряду. Сума квадратів відхилень є відображенням впливу випадкових факторів.

З її допомогою розрахуємо середню (стандартну) помилку рівняння:

Тут n – число спостережень, а m – число параметрів у рівнянні (їх у нас два – b 1 і b 0).

Основна тенденція (тренд) показує, як впливають систематичні чинники на рівні низки динаміки, а коливання рівнів біля тренду () служить мірою впливу залишкових факторів.

Для оцінки якості використовуваної моделі динамічного ряду застосовується також критерій F Фішера. Він є відношення двох дисперсій, саме ставлення дисперсії, викликаної регресією, тобто. досліджуваним чинником, дисперсії, викликаної випадковими причинами, тобто. залишковою дисперсією:

У розгорнутому вигляді формула цього критерію може бути подана так:

де n – число спостережень, тобто. число рівнів ряду,

m – число параметрів у рівнянні, y – фактичний рівень ряду,

Вирівняний рівень ряду - середній рівень ряду.

Більше вдала, ніж інші, модель не завжди може виявитися досить задовільною. Її можна визнати такою тільки в тому випадку, коли критерій F у неї переступить відому критичну межу. Ця межа встановлюється за допомогою таблиць F-розподілу.

Сутність та класифікація індексів.

Під індексом у статистиці розуміють відносний показник, що характеризує зміну величини будь-якого явища в часі, просторі або в порівнянні з будь-яким зразком.

Основним елементом індексного відношення є індексована величина. Під індексованою величиною розуміють значення ознаки статистичної сукупності, зміна якого є об'єктом вивчення.

За допомогою індексів вирішуються три основні завдання:

1) оцінка зміни складного явища;

2) визначення впливу окремих чинників зміну складного явища;

3) порівняння величини якогось явища з величиною минулого періоду, величиною по іншій території, а також з нормативами, планами, прогнозами.

Індекси класифікують за 3-ма ознаками:

2) за рівнем охоплення елементів сукупності;

3) за методами розрахунку загальних індексів.

За змістоміндексованих величин індекси поділяються на індекси кількісних (об'ємних) показників та індекси якісних показників. Індекси кількісних показників - індекси фізичного обсягу промислової продукції, фізичного обсягу продажів, чисельності та ін Індекси якісних показників - індекси цін, собівартості, продуктивності праці, середньої заробітної плати та ін.

За рівнем охоплення одиниць сукупності індекси поділяються на два класи: індивідуальні та загальні. Для їх характеристики введемо такі умовні позначення, прийняті на практиці застосування індексного методу:

q- кількість (обсяг) будь-якого продукту в натуральному виразі ; р- Вартість одиниці виробленої продукції; z- собівартість одиниці виробленої продукції; t- Витрати часу на виробництво одиниці продукції (трудоємність) ; w- Вироблення продукції у вартісному вираженні в одиницю часу; v- Вироблення продукції в натуральному вираженні в одиницю часу; Т- Загальні витрати часу чи чисельність працівників.

Для того щоб розрізняти, до якого періоду або об'єкта відносяться індексовані величини, прийнято праворуч внизу за відповідним символом ставити підрядкові знаки. Так, наприклад, в індексах динаміки, як правило, для порівнюваних (поточних, звітних) періодів використовується підрядковий знак 1 і для періодів, з якими проводиться порівняння,

Індивідуальні індексислужать для характеристики зміни окремих елементів складного явища (наприклад-зміна обсягу випуску продукції одного виду). Вони є відносні величини динаміки, виконання зобов'язань, порівняння індексованих величин.

Індивідуальний індекс фізичного обсягу продукції визначається

З аналітичної точки зору наведені індивідуальні індекси динаміки аналогічні коефіцієнтам (темпам) зростання і характеризують зміну індексованої величини в поточному періоді в порівнянні з базисним, тобто показують, у скільки разів вона зросла (зменшилася) або скільки відсотків складає її зростання (зниження). Значення індексів виражають у коефіцієнтах чи процентах.

Загальний (зведений) індексвідбиває зміна всіх елементів складного явища.

Агрегатний індексє основною формою індексу. Агрегатним він називається тому, що його чисельник і знаменник являють собою набір «агрегат»

Середні індекси, визначення.

Крім агрегатних індексів у статистиці застосовується інша їх форма - середньозважені індекси. До їх обчислення вдаються тоді, коли інформація, що є в розпорядженні, не дозволяє розрахувати загальний агрегатний індекс. Так, якщо відсутні дані про ціни, але є інформація про вартість продукції в поточному періоді і відомі індивідуальні індекси цін за кожним товаром, то загальний індекс цін як агрегатний визначити не можна, проте можливо обчислити його як середній з індивідуальних. Так само, якщо не відомі кількості вироблених окремих видів продукції, але відомі індивідуальні індекси та вартість продукції базисного періоду, то можна визначити загальний індекс фізичного обсягу продукції як середньозважену величину.

Середній індекс -цеіндекс, обчислений як середня величина із індивідуальних індексів. Агрегатний індекс є основною формою загального індексу, тому середній індекс має бути тотожним агрегатному індексу. При обчисленні середніх індексів використовують дві форми середніх: арифметична і гармонійна.

Середній арифметичний індекс тотожний агрегатному індексу, якщо вагами індивідуальних індексів будуть складові знаменника агрегатного індексу. Тільки в цьому випадку величина індексу, розрахованого за формулою середньої арифметичної, дорівнюватиме агрегатному індексу.

Матеріал з Вікіпедії – вільної енциклопедії

Середньоквадратичне відхилення(синоніми: середнє квадратичне відхилення, середньоквадратичне відхилення, квадратичне відхилення; близькі терміни: стандартне відхилення, стандартний розкид) - в теорії ймовірностей та статистики найбільш поширений показник розсіювання значень випадкової величини щодо її математичного очікування. При обмежених масивах вибірок значень замість математичного очікування використовують середнє арифметичне сукупності вибірок.

Основні відомості

Середньоквадратичне відхилення вимірюється в одиницях виміру самої випадкової величини і використовується при розрахунку стандартної помилки середнього арифметичного при побудові довірчих інтервалів при статистичній перевірці гіпотез при вимірюванні лінійного взаємозв'язку між випадковими величинами. Визначається як квадратний корінь із дисперсії випадкової величини.

Середньоквадратичне відхилення:

\sigma=\sqrt(\frac(1)(n)\sum_(i=1)^n\left(x_i-\bar(x)\right)^2).

Стандартне відхилення(Оцінка середньоквадратичного відхилення випадкової величини xщодо її математичного очікування на основі незміщеної оцінки її дисперсії) s:

s=\sqrt(\frac(n)(n-1)\sigma^2)=\sqrt(\frac(1)(n-1)\sum_(i=1)^n\left(x_i-\bar (x) \right)^2);

Правило трьох сигм

Правило трьох сигм (3\sigma) - практично всі значення нормально розподіленої випадкової величини лежать в інтервалі \left(\bar(x)-3\sigma;\bar(x)+3\sigma\right). Суворіше - приблизно з ймовірністю 0,9973 значення нормально розподіленої випадкової величини лежить у зазначеному інтервалі (за умови, що величина \bar(x)справжня, а чи не отримана внаслідок обробки вибірки).

Якщо ж справжня величина \bar(x)невідома, то слід користуватися не \sigma, а s. Таким чином, правило трьох сигм перетворюється на правило трьох s .

Інтерпретація величини середньоквадратичного відхилення

Більше значення середньоквадратичного відхилення показує більший розкид значень у представленій множині із середньою величиною множини; менше значення, відповідно, показує, що значення у множині згруповані навколо середнього значення.

Наприклад, у нас є три числові множини: (0, 0, 14, 14), (0, 6, 8, 14) і (6, 6, 8, 8). У всіх трьох множин середні значення дорівнюють 7, а середньоквадратичні відхилення, відповідно, дорівнюють 7, 5 і 1. У останньої множини середньоквадратичне відхилення маленьке, тому що значення у множині згруповані навколо середнього значення; у першої множини найбільше значення середньоквадратичного відхилення - значення всередині множини сильно розходяться із середнім значенням.

У загальному сенсі середньоквадратичне відхилення вважатимуться мірою невизначеності. Наприклад, у фізиці середньоквадратичне відхилення використовується визначення похибки серії послідовних вимірів будь-якої величини. Це значення дуже важливо для визначення правдоподібності досліджуваного явища в порівнянні з передбаченим теорією значенням: якщо середнє значення вимірювань сильно відрізняється від передбачених теорією значень (велике значення середньоквадратичного відхилення), то отримані значення або метод їх отримання слід перевіряти ще раз.

Практичне застосування

На практиці середньоквадратичне відхилення дозволяє оцінити, наскільки значення з множини можуть відрізнятися від середнього значення.

Економіка та фінанси

Середнє квадратичне відхилення прибутковості портфеля \sigma =\sqrt(D[X])ототожнюється із ризиком портфеля.

Клімат

Припустимо, існують два міста з однаковою максимальною середньої денною температурою, але одне розташоване на узбережжі, а інше на рівнині. Відомо, що в містах, розташованих на узбережжі, безліч різних максимальних денних температур менше, ніж у міст, розташованих усередині континенту. Тому середньоквадратичне відхилення максимальних денних температур у прибережного міста буде менше, ніж у другого міста, незважаючи на те, що середнє значення цієї величини у них однакове, що на практиці означає, що ймовірність того, що максимальна температура повітря кожного конкретного дня в році буде сильнішою. відрізнятиметься від середнього значення, вище у міста, розташованого всередині континенту.

Спорт

Припустимо, що є кілька футбольних команд, які оцінюються за деяким набором параметрів, наприклад, кількістю забитих і пропущених голів, гольових моментів і т.п. Чим менше у команди середньоквадратичне відхилення по кожному з представлених параметрів, тим більш передбачуваним є результат команди, такі команди є збалансованими. З іншого боку, у команди з великим значенням середньоквадратичного відхилення складно передбачити результат, що пояснюється дисбалансом, наприклад, сильним захистом, але слабким нападом.

Використання середньоквадратичного відхилення параметрів команди дозволяє в тій чи іншій мірі передбачити результат матчу двох команд, оцінюючи сильні та слабкі сторони команд, а отже, і способів боротьби, що вибираються.

Див. також

Напишіть відгук про статтю "Середньоквадратичне відхилення"

Література

  • Боровиков Ст. STATISTICA. Мистецтво аналізу даних на комп'ютері: Для професіоналів/В. Боровиков. - СПб. : Пітер, 2003. – 688 с. - ISBN 5-272-00078-1..

Уривок, що характеризує Середньоквадратичне відхилення

І, швидко відчинивши двері, він вийшов рішучими кроками на балкон. Гомін раптом замовк, шапки і картузи знялися, і всі очі піднялися до графа, що вийшов.
– Здрастуйте, хлопці! - Сказав граф швидко і голосно. - Дякую що прийшли. Я зараз вийду до вас, але перш за все нам треба впоратися з лиходієм. Нам треба покарати лиходія, від якого загинула Москва. Зачекайте на мене! - І граф так само швидко повернувся до покоїв, міцно грюкнувши дверима.
По натовпу пробіг схвальне ремствування задоволення. «Він, значить, лиходіїв управить усіх! А ти кажеш француз… він тобі всю дистанцію розв'яже! – говорили люди, ніби дорікаючи один одному за своє маловір'я.
За кілька хвилин із парадних дверей поспішно вийшов офіцер, наказав щось, і драгуни витяглися. Натовп від балкона жадібно посунувся до ґанку. Вийшовши гнівно швидкими кроками на ганок, Растопчин поспішно озирнувся довкола себе, ніби шукаючи когось.
- Де він? - сказав граф, і в ту ж хвилину, як він сказав це, він побачив з-за рогу будинку молодого чоловіка, що виходив між двома драгунами, з довгою тонкою шиєю, з до половини поголеною і заросла головою. Молодий чоловік цей був одягнений у колись чепурного, критий синім сукном, потертий лисий кожух і в брудні покінні арештантські шаровари, засунуті в нечищені, стоптані тонкі чоботи. На тонких, слабких ногах важко висіли кайдани, що ускладнювали нерішучу ходу хлопця.
– А! - сказав Растопчин, поспішно відвертаючи свій погляд від молодого чоловіка в лисячому кожушку і вказуючи на нижню сходинку ганку. - Поставте його сюди! - Молодий чоловік, брязкаючи кайданами, важко переступив на вказану сходинку, притримавши пальцем комір кожуха, повернув двічі довгою шиєю і, зітхнувши, покірним жестом склав перед животом тонкі, неробочі руки.
Декілька секунд, поки молодик встановлювався на сходинці, тривала мовчанка. Тільки в задніх рядах людей, що стискалися до одного місця, чулися кректання, стогін, поштовхи і тупіт ніг, що переставлялися.
Розтопчин, чекаючи на те, щоб він зупинився на вказаному місці, хмурно потирав рукою обличчя.
- Хлопці! – сказав Растопчин металево дзвінким голосом, – ця людина, Верещагін – той самий мерзотник, від якого загинула Москва.
Молодий чоловік у лисячому кожусі стояв у покірній позі, склавши кисті рук разом перед животом і трохи зігнувшись. Схудле, з безнадійним виразом, понівечене голеною головою молоде обличчя його було опущене вниз. При перших словах графа він повільно підняв голову і подивився знизу на графа, ніби бажаючи щось сказати йому чи хоч зустріти його погляд. Але Растопчин не дивився на нього. На довгій тонкій шиї юнака, як мотузка, напружилася і посиніла жила за вухом, і раптом почервоніло обличчя.
Всі очі були спрямовані на нього. Він глянув на натовп, і, ніби обнаділений тим виразом, який він прочитав на обличчях людей, він сумно й несміливо посміхнувся і, знову опустивши голову, одужав ногами на сходинці.
- Він зрадив своєму цареві та вітчизні, він передався Бонапарту, він один із усіх росіян осоромив ім'я російського, і від нього гине Москва, - говорив Растопчин рівним, різким голосом; але раптом швидко глянув униз на Верещагіна, який продовжував стояти в тій самій покірній позі. Наче цей погляд підірвав його, він, піднявши руку, закричав майже, звертаючись до народу: - Своїм судом розправляйтеся з ним! віддаю його вам!
Народ мовчав і тільки все тісніше й тісніше натискав один на одного. Тримати один одного, дихати в цій зараженій задусі, не мати сили поворухнутися і чекати чогось невідомого, незрозумілого і страшного ставало нестерпно. Люди, що стояли в передніх рядах, бачили і чули все те, що відбувалося перед ними, всі з перелякано широко розплющеними очима і роззявленими ротами, напружуючи всі свої сили, утримували на своїх спинах натиск задніх.
- Бий його!.. Нехай загине зрадник і не соромить ім'я російської! - Закричав Растопчин. – Рубі! Я наказую! - Почувши не слова, але гнівні звуки голосу Растопчина, натовп застогнав і насунувся, але знову зупинився.
— Граф!.. — промовив серед тиші, що знову настала, боязкий і разом театральний голос Верещагіна. – Граф, один бог над нами… – сказав Верещагін, піднявши голову, і знову налилася кров'ю товста жила на його тонкій шиї, і фарба швидко виступила та втекла з його обличчя. Він не домовив того, що хотів сказати.
- Руби його! Я наказую!.. – прокричав Растопчин, раптом зблідаючи так само, як Верещагін.
- Шаблі геть! – крикнув офіцер драгунам, сам виймаючи шаблю.
Інша ще сильна хвиля злетіла по народу, і, добігши до передніх рядів, ця хвиля зрушила передні, хитаючи, піднесла до самих сходів ганку. Високий малий, з скам'янілим виразом обличчя і з піднятою рукою, що зупинилася, стояв поруч з Верещагіним.
– Рубі! - прошепотів майже офіцер драгунам, і один із солдатів раптом з кривлявою злобою обличчям ударив Верещагіна тупим палашем по голові.
"А!" – коротко і здивовано скрикнув Верещагін, злякано озираючись і не розуміючи, навіщо це було з ним зроблено. Такий же стогін здивування та жаху пробіг по натовпу.
"О Боже!" – почувся чиєсь сумний вигук.
Але за вигуком подиву, що вирвався У Верещагіна, він жалібно скрикнув від болю, і цей крик погубив його. Та натягнута до вищого ступеня перешкода людського почуття, яка ще тримала натовп, прорвалося миттєво. Злочин був започаткований, необхідно було довершити його. Жалобний стогін докору був заглушений грізним і гнівним ревом натовпу. Як останній сьомий вал, що розбиває кораблі, злетіла з задніх рядів ця остання нестримна хвиля, долинула до передніх, збила їх і поглинула все. Драгун, що вдарив, хотів повторити свій удар. Верещагін із криком жаху, затуляючись руками, кинувся до народу. Високий хлопець, на якого він натрапив, вчепився руками в тонку шию Верещагіна і з диким криком, з ним разом, упав під ноги народу, що навалився.
Одні били та рвали Верещагіна, інші високого малого. І крики задавлених людей і тих, хто намагався врятувати високого малого, тільки збуджували лють натовпу. Довго драгуни було неможливо звільнити закривавленого, до смерті побитого фабричного. І довго, незважаючи на всю спекотну поспішність, з якою натовп намагався довершити раз розпочату справу, ті люди, які били, душили і рвали Верещагіна, не могли вбити його; але натовп тиснув їх з усіх боків, з ними в середині, як одна маса, колихався з боку в бік і не давав їм можливості ні добити, ні кинути його.

Мудрі математики та статистики вигадали більш надійний показник, хоча й дещо іншого призначення – середнє лінійне відхилення. Цей показник характеризує міру розкиду значень сукупності даних навколо їхнього середнього значення.

Для того, щоб показати міру розкиду даних потрібно спочатку визначитися, щодо чого цей самий розкид буде вважатися - зазвичай це середня величина. Далі потрібно порахувати, наскільки значення аналізованої сукупності даних далеко від середньої. Зрозуміло, що кожному значенню відповідає деяка величина відхилення, але нас цікавить загальна оцінка, що охоплює всю сукупність. Тому розраховують середнє відхилення за формулою звичайної середньої арифметичної. Але! Але для того, щоб розрахувати середнє відхилення, їх потрібно спочатку скласти. І якщо ми складемо позитивні та негативні числа, то вони взаємознищаться і їхня сума буде прагнути до нуля. Щоб цього уникнути, всі відхилення беруться за модулем, тобто всі негативні числа стають позитивними. Ось тепер середнє відхилення показуватиме узагальнену міру розкиду значень. У результаті середньо лінійне відхилення буде розраховуватися за формулою:

a- Середнє лінійне відхилення,

x– аналізований показник, з рисою зверху – середнє значення показника,

n– кількість значень у аналізованій сукупності даних,

оператор підсумовування, сподіваюся, нікого не лякає.

Розраховане за зазначеною формулою середнє лінійне відхилення відбиває середнє абсолютне відхилення від середньої величини за цією сукупністю.

На малюнку червона лінія – це середнє значення. Відхилення кожного спостереження середнього вказані маленькими стрілочками. Саме вони беруться за модулем і підсумовуються. Потім усе поділяється на кількість значень.

Для повноти картини слід навести ще й приклад. Припустимо, є фірма з виробництва живців для лопат. Кожен черешок має бути 1,5 метра завдовжки, але, що ще важливіше, усі мають бути однаковими або, принаймні, плюс-мінус 5 см. Проте недбайливі працівники то 1,2 м відпилять, то 1,8 м. Дачники незадоволені . Вирішив директор фірми провести статистичний аналіз довжини живців. Відібрав 10 штук і заміряв їх довжину, знайшов середню та розрахував середнє лінійне відхилення. Середня вийшла якраз, що треба - 1,5 м. А ось середнє лінійне відхилення вийшло 0,16 м. Ось і виходить, що кожен живець довший або коротший, ніж потрібно в середньому на 16 см. Є, про що поговорити з працівниками . Насправді я не зустрічав реального використання цього показника, тому приклад вигадав сам. Проте у статистиці є такий показник.

Дисперсія

Як і середнє лінійне відхилення, дисперсія також відбиває міру розкиду даних навколо середньої величини.

Формула для розрахунку дисперсії виглядає так:

(Для варіаційних рядів (зважена дисперсія))

(Для несгрупованих даних (проста дисперсія))

Де: σ 2 – дисперсія, Xi- аналізований показник (значення ознаки), - середнє значення показника, fi - кількість значень в аналізованій сукупності даних.

Дисперсія – це середній квадрат відхилень.

Спочатку розраховується середнє значення, потім береться різниця між кожним вихідним та середнім значенням, зводиться у квадрат, множиться на частоту відповідного значення ознаки, складається і потім ділиться на кількість значень у даній сукупності.

Однак у чистому вигляді, як, наприклад, середня арифметична, або індекс, дисперсія не використовується. Це скоріше допоміжний та проміжний показник, який використовується для інших видів статистичного аналізу.

Спрощений спосіб розрахунку дисперсії

Середньоквадратичне відхилення

Щоб використовувати дисперсію для аналізу даних з неї витягують квадратний корінь. Виходить так зване середньоквадратичне відхилення.

До речі, стандартне відхилення ще називають сигмою – від грецької літери, якою його означають.

Середньоквадратичне відхилення, очевидно, також характеризує міру розсіювання даних, але тепер (на відміну дисперсії) його можна порівнювати з вихідними даними. Як правило, середньоквадратичні показники у статистиці дають точніші результати, ніж лінійні. Отже, середньоквадратичне відхилення є точнішим показником міри розсіювання даних, ніж середнє лінійне відхилення.

Отримані з досвіду величини неминуче містять похибки, зумовлені найрізноманітнішими причинами. Серед них слід розрізняти похибки систематичні та випадкові. Систематичні помилки зумовлюються причинами, що діють цілком певним чином, і можуть бути завжди усунуті або досить точно враховані. Випадкові помилки викликаються дуже великою кількістю окремих причин, які не піддаються точному обліку і діють у кожному окремому вимірі по-різному. Ці помилки неможливо виключити; врахувати їх можна лише у середньому, навіщо необхідно знати закони, яким підпорядковуються випадкові помилки.

Означатимемо вимірювану величину через А, а випадкову помилку при вимірюванні х. Так як помилка х може набувати будь-яких значень, то вона є безперервною випадковою величиною, яка цілком характеризується своїм законом розподілу.

Найбільш простим і досить точно відображає дійсність (у переважній більшості випадків) є так званий нормальний закон розподілу помилок:

Цей закон розподілу може бути отриманий з різних теоретичних передумов, зокрема, з вимоги, щоб найбільш ймовірним значенням невідомої величини, для якої безпосереднім виміром отримано ряд значень з однаковим ступенем точності, було середнє арифметичне цих значень. Величина 2 називається дисперсієюцього нормального закону.

Середнє арифметичне

Визначення дисперсії за дослідними даними. Якщо для будь-якої величини А безпосереднім виміром отримано n значень a i з однаковим ступенем точності і якщо помилки величини А підпорядковані нормальному закону розподілу, то найімовірнішим значенням буде А середнє арифметичне:

a - середнє арифметичне,

a i - виміряне значення на i-му кроці.

Відхилення значення (для кожного спостереження) a i величини А від середнього арифметичного: a i - a.

Для визначення дисперсії нормального закону розподілу помилок у цьому випадку користуються формулою:

2 - дисперсія,
a - середнє арифметичне,
n - кількість вимірювань параметра,

Середньоквадратичне відхилення

Середньоквадратичне відхиленняпоказує абсолютне відхилення виміряних значень від середньоарифметичного. Відповідно до формули для міри точності лінійної комбінації середня квадратична помилкасереднього арифметичного визначається за такою формулою:

, де


a - середнє арифметичне,
n - кількість вимірювань параметра,
a i - виміряне значення на i-му кроці.

Коефіцієнт варіації

Коефіцієнт варіаціїхарактеризує відносну міру відхилення виміряних значень від середньоарифметичного:

, де

V - коефіцієнт варіації,
- середньоквадратичне відхилення,
a – середнє арифметичне.

Чим більше значення коефіцієнта варіаціїтим більший розкид і менша вирівняність досліджуваних значень. Якщо коефіцієнт варіаціїменше 10%, то мінливість варіаційного ряду прийнято вважати незначною, від 10% до 20% відноситься до середньої, більше 20% і менше 33% до значної і якщо коефіцієнт варіаціїперевищує 33%, то це говорить про неоднорідність інформації та необхідність виключення найбільших і найменших значень.

Середнє лінійне відхилення

Один із показників розмаху та інтенсивності варіації - середнє лінійне відхилення(Середній модуль відхилення) від середнього арифметичного. Середнє лінійне відхиленнярозраховується за формулою:

, де

_
a - середнє лінійне відхилення,
a - середнє арифметичне,
n - кількість вимірювань параметра,
a i - виміряне значення на i-му кроці.

Для перевірки відповідності досліджуваних значень закону нормального розподілу застосовують відношення показника асиметріїдо його помилки та ставлення показника ексцесудля його помилки.

Показник асиметрії

Показник асиметрії(A) та його помилка (m a) розраховується за такими формулами:

, де

А – показник асиметрії,
- середньоквадратичне відхилення,
a - середнє арифметичне,
n - кількість вимірювань параметра,
a i - виміряне значення на i-му кроці.

Показник ексцесу

Показник ексцесу(E) та його помилка (m e) розраховується за такими формулами:

, де

Заняття №4

Тема: «Описова статистика. Показники різноманітності ознаки у сукупності»

Основними критеріями різноманітності ознаки у статистичній сукупності є: ліміт, амплітуда, середнє квадратичне відхилення, коефіцієнт осциляції та коефіцієнт варіації. На попередньому занятті обговорювалося, що середні величини дають лише узагальнюючу характеристику ознаки, що вивчається, в сукупності і не враховують значення окремих його варіант: мінімальне і максимальне значення, вище середнього, нижче середнього і т.д.

приклад. Середні величини двох різних числових послідовностей: -100; -20; 100; 20 та 0,1; -0,2; 0,1 абсолютно однакові та рівніО.Однак діапазони розкиду даних цих послідовностей відносного середнього значення дуже різні.

Визначення перелічених критеріїв розмаїття ознаки передусім здійснюється з урахуванням його значення окремих елементів статистичної сукупності.

Показники виміру варіації ознаки бувають абсолютніі відносні. До абсолютних показників варіації відносять: розмах варіації, ліміт, середнє відхилення, дисперсію. Коефіцієнт варіації та коефіцієнт осциляції відносяться до відносних показників варіації.

Ліміт (lim) -це критерій, який визначається крайніми значеннями варіант у варіаційному ряду. Іншими словами, даний критерій обмежується мінімальною та максимальною величинами ознаки:

Амплітуда (Am)або розмах варіації –це різниця крайніх варіантів. Розрахунок даного критерію здійснюється шляхом віднімання з максимального значення ознаки його мінімального значення, що дозволяє оцінити ступінь розкиду варіант:

Недоліком ліміту та амплітуди як критеріїв варіабельності є те, що вони повністю залежать від крайніх значень ознаки варіаційного ряду. У цьому не враховуються коливання значень ознаки всередині ряду.

Найбільш повну характеристику різноманітності ознаки у статистичній сукупності дає середнє квадратичне відхилення(сигма), яке є загальним заходом відхилення варіант від своєї середньої величини. Середнє квадратичне відхилення часто називають також стандартним відхиленням.

У основі середнього квадратичного відхилення лежить зіставлення кожної варіанти із середньої арифметичної цієї сукупності. Оскільки в сукупності завжди будуть варіанти як менше, і більше, ніж вона, то сума відхилень , мають знак " " , погашатиметься сумою відхилень, мають знак " " , тобто. сума всіх відхилень дорівнює нулю. А, щоб уникнути впливу символів різниць беруть відхилення варіант від середнього арифметичного у квадраті, тобто. . Сума квадратів відхилень не дорівнює нулю. Щоб отримати коефіцієнт, здатний виміряти мінливість, беруть середнє від суми квадратів – це величина називається дисперсії:

За змістом дисперсія – це середній квадрат відхилень індивідуальних значень ознаки від його середньої величини. Дисперсія квадрат середнього квадратичного відхилення.

Дисперсія є розмірною величиною (іменованою). Так, якщо варіанти числового ряду виражені в метрах, дисперсія дає квадратні метри; якщо варіанти виражені у кілограмах, то дисперсія дає квадрат цього заходу (кг 2), і т.д.

Середнє квадратичне відхилення- Квадратний корінь з дисперсії:

, то при розрахунку дисперсії та середнього квадратичного відхилення у знаменнику дробу замістьнеобхідно ставити.

Розрахунок середнього квадратичного відхилення можна розбити на шість етапів, які необхідно здійснити у певній послідовності:

Застосування середньоквадратичного відхилення:

а) для судження про коливання варіаційних рядів та порівняльної оцінки типовості (представницькості) середніх арифметичних величин. Це необхідно в диференціальній діагностиці щодо стійкості ознак.

б) на реконструкцію варіаційного ряду, тобто. відновлення його частотної характеристики на основі правила «трьох сигм». В інтервалі (М±3σ) знаходиться 99,7% всіх варіантів ряду, в інтервалі (М±2σ) - 95,5% та в інтервалі (М±1σ) - 68,3% варіант ряду(Рис.1).

в) для виявлення «вискакуючих» варіант

г) для визначення параметрів норми та патології за допомогою сигмальних оцінок

д) для розрахунку коефіцієнта варіації

е) до розрахунку середньої помилки середньої арифметичної величини.

Для характеристики будь-якої генеральної сукупності, що маєнормальний тип розподілу , достатньо знати два параметри: середню арифметичну та середнє квадратичне відхилення.

Малюнок 1. Правило «трьох сигм»

приклад.

У педіатрії середньоквадратичне відхилення використовують для оцінки фізичного розвитку дітей шляхом порівняння даних конкретної дитини з відповідними стандартними показниками. За стандарт беруться середні арифметичні показники фізичного розвитку здорових дітей. Порівняння показників зі стандартами проводять за спеціальними таблицями, в яких стандарти наводяться разом із відповідними їм сигмальними шкалами. Вважається, що якщо показник фізичного розвитку дитини знаходиться в межах стандарту (середнє арифметичне) ±σ, то фізичний розвиток дитини (за цим показником) відповідає нормі. Якщо показник знаходиться в межах стандарту ±2σ, то є незначне відхилення від норми. Якщо показник виходить за ці межі, то фізичний розвиток дитини різко відрізняється від норми (можлива патологія).

Крім показників варіації, що у абсолютних величинах, у статистичному дослідженні використовуються показники варіації, виражені у відносних величинах. Коефіцієнт осциляції -це відношення розмаху варіації до середньої величини ознаки. Коефіцієнт варіації -це відношення середнього квадратичного відхилення до середньої величини ознаки. Як правило, ці величини виражаються у відсотках.

Формули розрахунку відносних показників варіації:

З наведених формул видно, що чим більший коефіцієнт V наближений до нуля, тим менша варіація значень ознаки. Чим більше V, тим паче мінливий ознака.

У статистичній практиці найчастіше застосовується коефіцієнт варіації. Він використовується як для порівняльної оцінки варіації, але й характеристики однорідності сукупності. Сукупність вважається однорідною, якщо коефіцієнт варіації вбирається у 33% (для розподілів, близьких до нормального). Арифметично ставлення і середньої арифметичної нівелює вплив абсолютної величини цих характеристик, а відсоткове співвідношення робить коефіцієнт варіації величиною безрозмірною (неіменованою).

Отримане значення коефіцієнта варіації оцінюється відповідно до орієнтовних градацій ступеня різноманітності ознаки:

Слабке - до 10%

Середнє - 10 - 20%

Сильне – понад 20 %

Використання коефіцієнта варіації є доцільним у випадках, коли доводиться порівнювати ознаки різні за своєю величиною та розмірністю.

Відмінність коефіцієнта варіації з інших критеріїв розкиду наочно демонструє приклад.

Таблиця 1

Склад працівників промислового підприємства

З наведених у прикладі статистичних показників можна дійти невтішного висновку щодо відносної однорідності вікового складу та освітнього рівня працівників підприємства за низької професійної стійкості обстеженого контингенту. Неважко помітити, що спроба судити про ці соціальні тенденції за середнім квадратичним відхиленням призвела б до помилкового висновку, а спроба порівняння облікових ознак «стаж роботи» та «вік» з обліковою ознакою «освіта» взагалі була б некоректною через різнорідність цих ознак.

Медіана та перцентілі

Для порядкових (рангових) розподілів, де критерієм середини ряду є медіана, середньоквадратичне відхилення та дисперсія не можуть бути характеристиками розсіювання варіант.

Те саме властиво і для відкритих варіаційних рядів. Зазначена обставина пов'язана з тим, що відхилення, за якими обчислюються дисперсія та σ, відраховуються від середнього арифметичного, яке не обчислюється у відкритих варіаційних рядах та у рядах розподілів якісних ознак. Тому для стисненого опису розподілів використовується інший параметр розкиду – квантиль(синонім - «nерцентиль»), придатний для опису якісних та кількісних ознак за будь-якої форми їх розподілу. Цей параметр може використовуватися і для переведення кількісних ознак у якісні. І тут такі оцінки присвоюються залежно від цього, якому порядку квантилю відповідає та чи інша конкретна варіанта.

У практиці медико-біологічних досліджень найчастіше використовуються такі кванти:

- Медіана;

, – квартили (чверті), де – нижній квартиль, верхній квартиль.

Квантилі ділять область можливих змін варіантів у варіаційному ряду на певні інтервали. Медіана (квантиль) - це варіанта, яка знаходиться в середині варіаційного ряду і ділить цей ряд навпіл, на дві рівні частини ( 0,5 і 0,5 ). Квартиль ділить ряд на чотири частини: перша частина (нижній квартиль) - це варіанти, що відокремлює варіанти, числові значення яких не перевищують 25% максимально можливого в даному ряду, квартиль відокремлює варіанти з числовим значенням до 50% максимально можливого. Верхній квартиль () відокремлює варіанти завбільшки до 75% від максимально можливих значень.

У разі асиметричності розподілу змінної щодо середнього арифметичного для його характеристики використовуються медіана та квартилі.І тут використовується наступна форма відображення середньої величини – Ме (;). Наприклад, Досліджуваний ознака – «термін, у якому дитина почав самостійно ходити» - у досліджуваній групі має асиметричний розподіл. При цьому нижньому квартилю () відповідає термін початку ходьби – 9,5 місяців, медіані – 11 місяців, верхньому квартилю () – 12 місяців. Відповідно, характеристика середньої тенденції зазначеної ознаки буде представлена ​​як 11 (9,5; 12) місяців.

Оцінка статистичної значущості результатів дослідження

Під статистичної значимістю даних розуміють ступінь відповідності відображуваної дійсності, тобто. статистично значимими даними вважаються ті, які спотворюють і правильно відбивають об'єктивну реальність.

Оцінити статистичну значимість результатів дослідження – означає визначити, з якою ймовірністю можна перенести результати, отримані на вибірковій сукупності, всю генеральну сукупність. Оцінка статистичної значущості необхідна розуміння того, наскільки щодо явища можна будувати висновки про явище загалом і його закономірностях.

Оцінка статистичної значущості результатів дослідження складається з:

1. помилок репрезентативності (помилок середніх та відносних величин) - m;

2. довірчих меж середніх чи відносних величин;

3. достовірності різниці середніх чи відносних величин за критерієм t.

Стандартна помилка середньої арифметичноїабо помилка репрезентативностіхарактеризує коливання середньої. При цьому необхідно відзначити, що чим більший обсяг вибірки, тим менше розкид середніх величин. Стандартна помилка середнього обчислюється за такою формулою:

У сучасній науковій літературі середня арифметична записується разом із помилкою репрезентативності:

або разом із середньоквадратичним відхиленням:

Як приклад розглянемо дані щодо 1500 міських поліклінік країни (генеральна сукупність). Середня кількість пацієнтів, які обслуговуються в поліклініці, дорівнює 18150 осіб. Випадковий відбір 10% об'єктів (150 поліклінік) дає середню кількість пацієнтів, що дорівнює 20051 чоловік. Помилка вибірки, очевидно пов'язана з тим, що не всі 1500 поліклінік потрапили у вибірку, дорівнює різниці між цими середніми – генеральним середнім ( Mген) та вибірковим середнім ( Мвиб). Якщо сформувати іншу вибірку того самого обсягу з нашої генеральної сукупності, то вона дасть іншу величину помилки. Всі ці вибіркові середні за досить великих вибірках розподілені нормально навколо генеральної середньої за досить великої кількості повторень вибірки однієї й тієї кількості об'єктів з генеральної сукупності. Стандартна помилка середнього m- це неминучий розкид вибіркових середніх довкола генеральної середньої.

У разі коли результати дослідження представлені відносними величинами (наприклад, відсотковими частками) – розраховується стандартна помилка частки:

де P – показник %, n – кількість спостережень.

Результат відображається у вигляді (P±m)%. Наприклад,відсоток одужання серед хворих становив (95,2±2,5)%.

У тому випадку, якщо кількість елементів сукупності, то при розрахунку стандартних помилок середнього та частки у знаменнику дробу замістьнеобхідно ставити.

Для нормального розподілу (розподіл вибіркових середніх є нормальним) відомо, яка частина сукупності потрапляє у будь-який інтервал навколо середнього значення. Зокрема:

Насправді проблема полягає в тому, що характеристики генеральної сукупності нам невідомі, а вибірка робиться саме з метою їх оцінки. Це означає, що якщо ми робитимемо вибірки одного і того ж обсягу nіз генеральної сукупності, то в 68,3% випадків на інтервалі буде знаходитись значення M(воно ж у 95,5% випадків перебуватиме на інтервалі та у 99,7% випадків – на інтервалі).

Оскільки реально робиться лише одна вибірка, то формулюється це твердження у термінах ймовірності: з ймовірністю 68,3% середнє значення ознаки у генеральній сукупності укладено в інтервалі, з ймовірністю 95,5% - в інтервалі та ін.

На практиці навколо вибіркового значення будується такий інтервал, який із заданою (досить високою) ймовірністю – довірчою ймовірністю –«накривав» справжнє значення цього параметра в генеральній сукупності. Цей інтервал називається довірчим інтервалом.

Довірча ймовірністьP це ступінь упевненості в тому, що довірчий інтервал справді міститиме справжнє (невідоме) значення параметра в генеральній сукупності.

Наприклад, якщо довірча ймовірність Рдорівнює 90%, це означає, що 90 вибірок зі 100 дадуть правильну оцінку параметра в генеральній сукупності. Відповідно, можливість помилки, тобто. неправильної оцінки генерального середнього за вибіркою, що дорівнює у відсотках: . Для цього це означає, що 10 вибірок зі 100 дадуть неправильну оцінку.

Очевидно, що ступінь впевненості (довірча ймовірність) залежить від величини інтервалу: чим ширший інтервал, тим вища впевненість, що до нього потрапить невідоме значення для генеральної сукупності. Насправді для побудови довірчого інтервалу береться, як мінімум, подвоєна помилка вибірки, щоб забезпечити впевненість щонайменше 95,5%.

Визначення довірчих меж середніх і відносних величин дозволяє знайти два їх крайніх значення - мінімально можливе і максимально можливе, в межах яких показник може зустрічатися у всій генеральній сукупності. Виходячи з цього, довірчі межі (або довірчий інтервал)- це межі середніх чи відносних величин, вихід межі яких унаслідок випадкових коливань має незначну ймовірність.

Довірчий інтервал може бути переписаний у вигляді: , де t- Довірчий критерій.

Довірчі межі середньої арифметичної величини в генеральній сукупності визначають за такою формулою:

М ген = М виб + t m M

для відносної величини:

Р ген = Р виб + t m Р

де М гені Р ген- значення середньої та відносної величини для генеральної сукупності; М вибі Р виб- значення середньої та відносної величини, отримані на вибірковій сукупності; m Mі m P- помилки середньої та відносної величин; t- довірчий критерій (критерій точності, який встановлюється при плануванні дослідження і може дорівнювати 2 або 3); t m- це довірчий інтервал або Δ – гранична помилка показника, отриманого під час вибіркового дослідження.

Слід зазначити, що величина критерію tПевною мірою пов'язана з ймовірністю безпомилкового прогнозу (р), вираженої в %. Її обирає сам дослідник, керуючись необхідністю отримати результат із потрібним ступенем точності. Так, для ймовірності безпомилкового прогнозу 95,5% величина критерію tстановить 2, для 99,7% – 3.

Наведені оцінки довірчого інтервалу прийнятні лише статистичних сукупностей із кількістю спостережень понад 30. При меншому обсязі сукупності (малих вибірках) визначення критерію t користуються спеціальними таблицями. У даних таблицях шукане значення перебуває на перетині рядка, відповідної чисельності сукупності (n-1), та стовпця, що відповідає рівню ймовірності безпомилкового прогнозу (95,5%; 99,7%), обраному дослідником. У медичних дослідженнях при встановленні довірчих кордонів будь-якого показника прийнято можливість безпомилкового прогнозу 95,5% і більше. Це означає, що величина показника, отримана на вибірковій сукупності, повинна зустрічатися в генеральній сукупності як мінімум у 95,5% випадків.

    Запитання по темі заняття:

    Актуальність показників різноманітності ознаки у статистичній сукупності.

    Загальна характеристика абсолютних показників варіації.

    Середнє квадратичне відхилення, розрахунок, застосування.

    Відносні показники варіації.

    Медіана, квартильна оцінка.

    Оцінка статистичної значущості результатів дослідження.

    Стандартна помилка середньої арифметичної, формула розрахунку, приклад використання.

    Розрахунок частки та її стандартної помилки.

    Концепція довірчої ймовірності, приклад використання.

10. Поняття довірчого інтервалу, його застосування.

    Тестові завдання на тему з зразками відповідей:

1. ДО АБСОЛЮТНИХ ПОКАЗНИКІВ ВАРІАЦІЇ ВІДНОСИТЬСЯ

1) коефіцієнт варіації

2) коефіцієнт осциляції

4) медіана

2. ДО ВІДНОСНИХ ПОКАЗНИКІВ ВАРІАЦІЇ ВІДНОСИТЬСЯ

1) дисперсія

4) коефіцієнт варіації

3. КРИТЕРІЙ, ЯКИЙ ВИЗНАЧАЄТЬСЯ КРАЙНІМИ ЗНАЧЕННЯМИ ВАРІАНТ У ВАРІАЦІЙНОМУ РЯДУ

2) амплітуда

3) дисперсія

4) коефіцієнт варіації

4. РІЗНІСТЬ КРАЙНІХ ВАРІАНТ - ЦЕ

2) амплітуда

3) середнє квадратичне відхилення

4) коефіцієнт варіації

5. СЕРЕДНІЙ КВАДРАТ ВІДКЛОНЕНЬ ІНДИВІДУАЛЬНИХ ЗНАЧЕНЬ ОЗНАКУ ВІД ЙОГО СЕРЕДНЬОЇ ВЕЛИЧИНИ – ЦЕ

1) коефіцієнт осциляції

2) медіана

3) дисперсія

6. ВІДНОСИННЯ РОЗМАХУ ВАРІАЦІЇ ДО СЕРЕДНЬОЇ ВЕЛИЧИНИ ПРИЗНАКУ – ЦЕ

1) коефіцієнт варіації

2) середнє квадратичне відхилення

4) коефіцієнт осциляції

7. ВІДНОСІННЯ СЕРЕДНЬОГО КВАДРАТИЧНОГО ВІДКЛОНЕННЯ ДО СЕРЕДНЬОЇ ВЕЛИЧИНИ ОЗНАКУ – ЦЕ

1) дисперсія

2) коефіцієнт варіації

3) коефіцієнт осциляції

4) амплітуда

8. ВАРІАНТА, ЯКА ЗНАХОДИТЬСЯ В СЕРЕДИНІ ВАРІАЦІЙНОГО РЯДУ І ДІЛИТЬ ЙОГО НА ДВІ РІВНІ ЧАСТИНИ – ЦЕ

1) медіана

3) амплітуда

9. У МЕДИЧНИХ ДОСЛІДЖЕННЯХ ПРИ ВСТАНОВЛЕННІ ДОВЕРЧИХ КОРДОНІВ БУДЬ-ЯКОГО ПОКАЗНИКА ПРИЙНЯТА ІМОВІТНІСТЬ БЕЗПРИМИЛНОГО ПРОГНОЗУ

10. ЯКЩО 90 ВИБІРОК ЗІ 100 ДАЮТЬ ПРАВИЛЬНУ ОЦІНКУ ПАРАМЕТРА В ГЕНЕРАЛЬНІЙ СУКУПНОСТІ, ТО ЦЕ ОЗНАЧАЄ, ЩО ДОВЕРЧА ІМОВІРНІСТЬ PРІВНА

11. У РАЗІ, ЯКЩО 10 ВИБІРОК З 100 ДАЮТЬ НЕВЕРНУ ОЦІНКУ, ІМОВІТНІСТЬ ПОМИЛКИ РІВНА

12. КОРДОНИ СЕРЕДНІХ АБО ВІДНОСНИХ ВЕЛИЧИН, ВИХІД ЗА МЕЖИ ЯКИХ ВСЛІДСТВО ВИПАДКОВИХ КОЛИВАНЬ МАЄ НЕЗНАЧНУ ІМОВІРНІСТЬ – ЦЕ

1) довірчий інтервал

2) амплітуда

4) коефіцієнт варіації

13. МАЛИЙ ВИБІРКОЮ ВВАЖАЄТЬСЯ ТА СУКУПНІСТЬ, У ЯКІЙ

1) n менше або дорівнює 100

2) n менше або дорівнює 30

3) n менше або дорівнює 40

4) n близько до 0

14. ДЛЯ ймовірності безпомилкового прогнозу 95% ВЕЛИЧИНА КРИТЕРІЯ tСкладає

15. ДЛЯ ймовірності безпомилкового прогнозу 99% ВЕЛИЧИНА КРИТЕРІЯ tСкладає

16. ДЛЯ РОЗПОДІЛ, БЛИЗЬКИХ ДО НОРМАЛЬНОГО, СУКУПНІСТЬ ВВАЖАЄТЬСЯ ОДНОРІДНОЮ, ЯКЩО КОЕФІЦІЄНТ ВАРІАЦІЇ НЕ ПЕРЕВИЩУЄ

17. ВАРІАНТА, ЩО ВІДДІЛЮЄ ВАРІАНТИ, ЧИСЛОВІ ЗНАЧЕННЯ ЯКИХ НЕ ПЕРЕВИЩУЮТЬ 25% МАКСИМАЛЬНО МОЖЛИВОГО У ДАНОМУ РЯДУ – ЦЕ

2) нижній квартиль

3) верхній квартиль

4) квартиль

18. ДАНІ, ЯКІ НЕ СПОКАЖУЮТЬ І ПРАВИЛЬНО ВІДБИЛЯЮТЬ ОБ'ЄКТИВНУ РЕАЛЬНІСТЬ, НАЗИВАЮТЬСЯ

1) неможливі

2) рівноможливі

3) достовірні

4) випадкові

19. ЗГОДНО ПРАВИЛУ "ТРОХ СИГМ", ПРИ НОРМАЛЬНОМУ РОЗПОДІЛІ ОЗНАКУ У МЕЖАХ
БУДЕ ЗНАХОДИТИСЯ

1) 68,3% варіант



Останні матеріали розділу:

Дати та події великої вітчизняної війни
Дати та події великої вітчизняної війни

О 4-й годині ранку 22 червня 1941 року війська фашистської Німеччини (5,5 млн осіб) перейшли кордони Радянського Союзу, німецькі літаки (5 тис) почали...

Все, що ви повинні знати про радіацію Джерела радіації та одиниці її виміру
Все, що ви повинні знати про радіацію Джерела радіації та одиниці її виміру

5. Дози випромінювання та одиниці виміру Дія іонізуючих випромінювань є складним процесом. Ефект опромінення залежить від величини...

Мізантропія, або Що робити, якщо я ненавиджу людей?
Мізантропія, або Що робити, якщо я ненавиджу людей?

Шкідливі поради: Як стати мізантропом і всіх радісно ненавидіти Ті, хто запевняє, що людей треба любити незалежно від обставин або...