Які величини порівнювати між собою. Порівняння величин

Спочатку розглянемо завдання порівняння величини що вимірюється в експерименті, з константою а. Величину можна визначити лише приблизно, обчислюючи середнє за вимірами. Потрібно дізнатися, чи виконується співвідношення . У цьому випадку ставлять два завдання, пряме та зворотне:

а) за відомою величиною знайти константу а, яку перевершує із заданою ймовірністю

б) знайти можливість те, що , де а - задана константа.

Очевидно, якщо ймовірність того, що менше 1/2. Цей випадок не становить інтересу, і далі вважатимемо, що

Завдання зводиться до завдань, розібраних у п. 2. Нехай за вимірами визначено X та його стандарт

Число вимірювань вважатимемо не дуже малим, так що є випадкова величина з нормальним розподілом. Тоді з критерію Стьюдента (9) при врахуванні симетрії нормального розподілу випливає, що для довільно обраної ймовірності виконується умова

Вважаючи перепишемо цей вислів у такому вигляді:

де - Задані в таблиці 23 коефіцієнти Стьюдента. Тим самим, пряме завдання вирішено: знайдено константу а, яку з ймовірністю перевищує

Зворотне завдання вирішується за допомогою прямої. Перепишемо формули (23) наступним чином:

Це означає, що треба обчислити t за відомими значеннями а, вибрати в таблиці 23 рядок з даними - і знайти за величиною t відповідне значення Воно визначає ймовірність

Дві випадкові величини. Часто потрібно встановити вплив деякого фактора на досліджувану величину - наприклад, чи збільшує (і наскільки) міцність металу певна присадка. Для цього треба виміряти міцність вихідного металу і міцність легованого металу і порівняти ці дві величини, тобто знайти

Порівнювані величини є випадковими; так, властивості металу певної марки змінюються від плавки до плавки, оскільки сировина та режим плавки не строго однакові. Позначимо ці величини через . Величина досліджуваного ефекту дорівнює і потрібно визначити, чи виконується умова

Таким чином, завдання звелося до порівняння випадкової величини з константою а, розібраному вище. Пряме та зворотне завдання порівняння в цьому випадку формулюються наступним чином:

а) за результатами вимірювань визначити константу а, яку перевершує із заданою ймовірністю (тобто оцінити величину досліджуваного ефекту);

б) визначити ймовірність того, що а - бажана величина ефекту; при цьому означає, що треба визначити ймовірність, з якої

Для вирішення цих завдань треба обчислити z та дисперсію цієї величини. Розглянемо два способи їхнього знаходження.

Незалежні виміри. Виміряємо величину експериментах, а величину експериментах, незалежних від перших експериментів. Обчислимо середні значення за звичайними формулами:

Ці середні самі є випадковими величинами, причому їх стандарти (не плутати зі стандартами одиничних вимірів!) приблизно визначаються незміщеними оцінками:

Оскільки експерименти незалежні, то випадкові величини х і також незалежні, так що при обчисленні їх математичні очікування віднімаються, а дисперсії складаються:

Дещо точніша оцінка дисперсії така:

Таким чином, її дисперсія знайдені, і подальші обчислення проводяться за формулами (23) або (24).

Узгоджені виміри. Більш високу точність дає інший спосіб обробки, як у кожному з експериментів одночасно вимірюють . Наприклад, після випуску половини плавки залишився в печі метал додають присадку, а потім порівнюють зразки металу з кожної половини плавки.

У цьому, сутнісно, ​​у кожному експерименті вимірюють відразу значення однієї випадкової величини , що треба порівняти з константою а. Обробка вимірювань тоді проводиться за формулами (21)-(24), де замість треба скрізь підставити z.

Дисперсія при узгоджених вимірах буде меншою, ніж при незалежних, оскільки вона обумовлена ​​лише частиною випадкових факторів: ті фактори, які узгоджено змінюють, не впливають на розкид їх різниці. Тому такий спосіб дозволяє отримати достовірніші висновки.

приклад. Цікавою ілюстрацією порівняння величин є визначення переможця у тих видах спорту, де суддівство ведеться «на вічко» – гімнастика, фігурне катання тощо.

Таблиця 24. Суддівські оцінки у балах

У таблиці 24 наведено протокол змагань з виїздки на Олімпійських іграх 1972 р. Видно, що розкид суддівських оцінок великий, причому жодну оцінку не можна визнати грубо помилковою і відкинути. На погляд здається, що достовірність визначення переможця невелика.

Розрахуємо, наскільки правильно визначено переможця, тобто яка ймовірність події. Оскільки оцінки обом вершницям виставлялися одними й тими самими суддями, можна скористатися способом узгоджених вимірів. За таблицею 24 обчислюємо підставляючи у формулу (24) ці значення та отримаємо .

Вибираючи в таблиці 23 рядок, знаходимо, що цьому значенню t відповідає Звідси, тобто з ймовірністю 90% золота медаль присуджена правильно.

Порівняння за способом незалежних вимірів дасть дещо гіршу оцінку, оскільки воно не використовує інформацію про те, що оцінки виставляли ті самі судді.

Порівняння дисперсій. Нехай потрібно порівняти дві методики експерименту. Очевидно, точніше та методика, у якої дисперсія одиничного виміру менша (зрозуміло, якщо при цьому не збільшується систематична помилка). Отже, треба встановити, чи виконується нерівність.

Погляньте на малюнок. Ви бачите дві мензурки, у кожній з яких налито кілька рідин. Скажіть, у якій із мензурок рідини більше? Якщо ви вважаєте, що у правій – ви помиляєтесь! Правильна відповідь така: похибка, що виникає при вимірюванні об'єму рідини цими мензурками, не дозволяє сказати, в якій мензурці налито більше рідини.

Як це слід розуміти? Згадаймо, що використання будь-якого вимірювального приладу обов'язково супроводжується похибкою вимірювання. Вона залежить від ціни поділу шкали цього приладу. Оскільки на правій мензурці розподіли більші, значить, похибка вимірювання обсягу буде більшою. Виміряємо обсяги рідин у мензурках з урахуванням похибок.

Зобразимо на двох числових прямих виміряні значення обсягів (позначені жовтими точками) та інтервали між межами похибок вимірів:



На відміну від виміряних значень, справжні значення об'ємів рідин знаходяться у невідомому місці всередині інтервалів. Справжній об'єм рідини у лівій мензурці може дорівнювати, наприклад, 270 мл, а справжній об'єм рідини у правій мензурці, наприклад, 250 мл (позначені червоними крапками).



Ми спеціально вибрали друге «червоне» число менше першого (адже така ситуація також може бути). А це означає, що права мензурка може містити менший обсяг рідини, ніж ліва, незважаючи на те, що рівень рідини у правій мензурці вищий. Неймовірно, але факт!

Відносна величина- Це результат поділу (порівняння) двох абсолютних величин. У чисельнику дробу стоїть величина, яку порівнюють, а знаменнику – величина, з якою порівнюють (база порівняння). Наприклад, якщо порівняти величини експорту навіть Росії, які у 2005 року становили 904,383 і 243,569 млрд. дол. відповідно, то відносна величина покаже, що величина експорту США у 3,71 разу (904,383/243,569) більше експорту Росії, у своїй бази порівняння є величина експорту Росії. Отримана відносна величина виражена у вигляді коефіцієнта, Який показує, у скільки разів порівнювана абсолютна величина більша за базисну. У цьому прикладі база порівняння прийнято за одиницю. Якщо підстава приймається за 100, відносна величина виражається в відсотках (% ), якщо за 1000 – в проміле (). Вибір тієї чи іншої форми відносної величини залежить від її абсолютного значення:

- якщо порівнювана величина більша за базу порівняння в 2 рази і більше, то вибирають форму коефіцієнта (як у вищенаведеному прикладі);

– якщо відносна величина близька до одиниці, то, як правило, її виражають у відсотках (наприклад, порівнявши величини експорту Росії у 2006 та 2005 роках, які склали 304,5 та 243,6 млрд. дол. відповідно, можна сказати, що експорт у 2006 році становить 125% від 2005 року);

– якщо відносна величина значно менше одиниці (близька до нуля), її виражають у промілі (наприклад, у 2004 році Росія експортувала до країн СНД всього 4142 тис. т нафтопродуктів, у тому числі до Грузії 10,7 тис. т, що становить 0,0026, або 2,6 від усього експорту нафтопродуктів до країн СНД).

Розрізняють відносні величини динаміки, структури, координації, порівняння та інтенсивності, для стислості звані надалі індексами.

Індекс динамікихарактеризує зміна будь-якого явища у часі. Він є відношенням значень однієї й тієї ж абсолютної величини в різні періоди часу. Цей індекс визначається за формулою (2):

де цифри означають: 1 – звітний чи аналізований період, 0 – минулий чи базисний період.

Критеріальним значенням індексу динаміки служить одиниця (чи 100%), тобто якщо >1, має місце зростання (збільшення) явища у часі; якщо =1 – стабільність; якщо<1 – наблюдается спад (уменьшение) явления. Еще одно название индекса динамики – індекс зміни, віднімаючи з якого одиницю (100%), отримують темп зміни (динаміки)з критеріальним значенням 0, що визначається за формулою (3):

Якщо T>0, має місце зростання явища; Т=0 - стабільність, Т<0 – спад.


У розглянутому вище прикладі про експорт Росії у 2006 та 2005 році було розраховано саме індекс динаміки за формулою (2): i Д= 304,5/243,6*100% = 125%, що більше за критеріальне значення 100%, що свідчить про збільшення експорту. Використовуючи формулу (3), отримаємо темп зміни: Т= 125% - 100% = 25%, який показує, що експорт збільшився на 25%.

Різновидами індексу динаміки є індекси планового завдання та виконання плану, що розраховуються для планування різних величин та контролю їх виконання.

Індекс планового завдання- Це відношення планового значення ознаки до базисного. Він визначається за формулою (4):

де X’ 1- Заплановане значення; X 0- Базисне значення ознаки.

Наприклад, митне управління перерахувало до федерального бюджету 2006 року 160 млрд.руб., але в наступного року запланували перерахувати 200 млрд.руб., отже за формулою (4): i пз= 200/160 = 1,25, тобто планове завдання митного управління на 2007 рік становить 125% від попереднього року.

Для визначення відсотка виконання плану необхідно розрахувати індекс виконання плану, тобто відношення значення ознаки до планового (оптимального, максимально можливого) значення за формулою (5):

Наприклад, на січень-листопад 2006 року митні органи запланували перерахувати до федерального бюджету 1,955 трлн. крб., але практично перерахували 2,59 трлн. руб., означає за формулою (5): i ВП= 2,59/1,955 = 1,325, чи 132,5%, тобто планове завдання виконали на 132,5%.

Індекс структури (частка) – це ставлення будь-якої частини об'єкта (сукупності) до всього об'єкту. Він визначається за формулою (6):

У розглянутому вище прикладі для експорту нафтопродуктів до країн СНД була розрахована частка цього експорту до Грузії за формулою (6): d= 10,7/4142 = 0,0026, або 2,6 .

Індекс координації- Це ставлення будь-якої частини об'єкта до іншої його частини, прийнятої за основу (базу порівняння). Він визначається за формулою (7):

Наприклад, імпорт Росії у 2006 році становив 163,9 млрд.дол., тоді, порівнявши його з експортом (база порівняння), розрахуємо індекс координації за формулою (7): i До= 163,9/304,5 = 0,538, який показує співвідношення між двома складовими частинами зовнішньоторговельного обороту, тобто величина імпорту Росії 2006 року становить 53,8% від величини експорту. Змінюючи базу порівняння на імпорт, за тією самою формулою отримаємо: i До= 304,5/163,9 = 1,858, тобто експорт Росії 2006 року у 1,858 разу більше імпорту, чи експорт становить 185,8% від імпорту.

Індекс порівняння- Це порівняння (співвідношення) різних об'єктів за однаковими ознаками. Він визначається за формулою (8):

де А, Б- Порівнювані об'єкти.

У розглянутому вище прикладі, в якому зіставлялися величини експорту США та Росії, розрахували саме індекс порівняння за формулою (8): i з= 904,383/243,569 = 3,71. Змінюючи базу порівняння (тобто експорт Росії – об'єкт А, а експорт США – об'єкт Б), за тією самою формулою отримаємо: i з= 243,569/904,383 = 0,27, тобто експорт Росії становить 27% експорту США.

Індекс інтенсивності- Це співвідношення різних ознак одного об'єкта між собою. Він визначається за формулою (9):

де X- Одна ознака об'єкта; Y- Інша ознака цього ж об'єкта

Наприклад, показники виробітку продукції в одиницю робочого часу, витрат на одиницю продукції, ціни одиниці продукції і т.д.

Середні величини

У клінічній медицині та практиці охорони здоров'я ми часто стикаємося з ознаками, що мають кількісну характеристику (зростання, кількість днів непрацездатності, рівень кров'яного тиску, відвідування поліклініки, чисельність населення дільниці тощо). Кількісні значення можуть бути дискретними чи безперервними. Приклад дискретного значення – кількість дітей у ній, пульс; приклад безперервного значення - артеріальний тиск, зростання, вага (число може бути дробовим, що переходить у наступне)

Кожне числове значення одиниці спостереження називається варіантом(x). Якщо всі варіанти побудувати у зростаючому чи спадному порядку та вказати частоту кожної варіанти (p), то можна отримати так званий варіаційний ряд.

Варіаційний ряд, що має нормальний розподіл, графічно є дзвіном (гістограма, полігон).

Для характеристики варіаційного ряду, що має нормальний розподіл (або розподіл Гаус-Ляпунова), завжди використовуються дві групи параметрів:

1. Параметри, що характеризують основну тенденцію ряду: середня величина (х), мода (Мо), медіана (Ме).

2. Параметри, що характеризують розсіяність низки: середнє квадратичне відхилення (d), коефіцієнт варіації (V).

Середня величина(`x) – це величина, що визначає одним числом кількісну характеристику якісно однорідної сукупності.

Мода (Мо)- Найчастіше зустрічається варіанти варіаційного ряду.

Медіана (Ме)- варіанти, що ділить варіаційний ряд на рівні половини.

Середнє квадратичне відхилення(d) показує, як у середньому відхиляється кожен варіант від середньої величини.

Коефіцієнт варіації (V) визначає мінливість варіаційного ряду у відсотках і дає можливість судити про якісну однорідність досліджуваної сукупності. Доцільно використовувати для порівняння варіації різних ознак (а також ступеня мінливості груп, що сильно відрізняються, груп особин різних видів, наприклад, вага новонароджених і семирічних дітей).

Ліміти чи межі(lim) – мінімальне та максимальне значення варіант. найпростіший спосіб дати характеристику варіаційному ряду, вказати його розмах, мінімальне та максимальне значення ряду, тобто його ліміти. Однак ліміти не вказують на те, як розподіляються за ознакою, що вивчається окремі члени сукупності, тому використовують зазначені вище дві групи параметрів варіаційного ряду.

Існують різні модифікації обчислення параметрів варіаційного ряду. Їх вибір залежить від варіаційного ряду і технічних засобів.

Залежно від того, як варіює ознака – дискретно чи безперервно, у широкому чи вузькому діапазоні розрізняють простий незважений, простий зважений (для дискретних величин) та інтервальний варіаційний ряд (для безперервних величин).

Угруповання рядів проводять при великій кількості спостережень наступним шляхом:

1. Визначають розмах ряду відніманням мінімальної варіанти з максимальної.

2. Отримане число поділяють на бажану кількість груп (мінімальне число – 7, максимальне – 15). Так визначається інтервал.

3. Починаючи з мінімальної варіанти, будують варіаційний ряд. Межі інтервалів мають бути чіткі, що виключають попадання однієї й тієї ж варіанти до різних груп.

Обчислення параметрів варіаційного ряду ведеться від центральної варіанти. Якщо ряд безперервний, то центральна варіанта обчислюється як напівсума початкових варіантів попередньої та наступної груп. Якщо це перервний ряд, то центральна варіанта обчислюється як напівсума початкової та кінцевої варіант групи.

Обчислення параметрів варіаційного ряду

Алгоритм обчислення параметрів простого невваженого варіаційного ряду:

1. Мають у своєму розпорядженні варіанти у зростаючому порядку

2. Підсумовують усі варіанти (Sx);

3. Розділивши суму на кількість спостережень, отримують незважену середню;

4. Обчислюють порядковий номер медіани (Ме);

5. Визначають варіант медіани (Ме)

6. Знаходять відхилення (d) кожної варіанти від середньої (d = x - x)

7. Зводять відхилення квадрат (d 2);

8. Підсумовують d 2 (Sd 2);

9. Обчислюють середнє квадратичне відхилення за формулою: ±;

10. Визначають коефіцієнт варіації за такою формулою: .

11. Роблять висновок про отримані результати.

Примітка:в однорідній статистичній сукупності коефіцієнт варіації буває 5-10%, 11-20% - середня варіація, понад 20% - висока варіація.

Приклад:

У відділенні реанімації та інтенсивної терапії було проведено лікування 9 хворих із судинним ураженням мозку. Тривалість лікування кожного хворого днями: 7, 8, 12, 6, 4, 10, 9, 5,11.

1. Будуємо варіаційний ряд (x): 4,5,6,7,8,9,10,11,12

2. Обчислюємо суму варіант: Sx = 72

3. Обчислюємо середнє значення варіаційного низки: =72/9=8 днів;

4. ;

5. Ме n = 5 = 8 днів;

x d d 2
-4
-3
-2
-1
+1
+2
+3
+4
S=72 S=0 Sd 2 = 60

9. (Днів);

10. Коефіцієнт варіації дорівнює: ;

Алгоритм обчислення параметрів простого виваженого варіаційного ряду:

1. Мають варіанти у зростаючому порядку із зазначенням їх частоти (p);

2. Перемножують кожну варіанту свою частоту (x*p);

3. Підсумовують твори xp (Sxp);

4. Обчислюють середню величину за формулою (x) = ;

5. Знаходять порядковий номер медіани;

6. Визначають варіант медіани (Ме);

7. Найчастіше зустрічається варіанта приймають за моду (Мо);

8. Знаходять відхилення d кожної варіанти від середньої (d = x - x);

9. Зводять відхилення квадрат (d 2);

10. Перемножують d 2 на p (d 2 * p);

11. Підсумовують d 2 *p (Sd 2 *p);

12. Обчислюють середнє квадратичне відхилення (s) за формулою: ±;

13. Визначають коефіцієнт варіації за такою формулою: .

приклад.

Вимірювався систолічний артеріальний тиск у дівчат віком 16 років.

Систолічний артеріальний тиск, мм рт. x Число обстежених, p x*p d d 2 d 2 * p
-11.4 130.0 260.0
-9.4 88.4 265.2
-7.4 54.8 219.2
-5.4 29.2 175.2
-1.4 2.0 20.0
+0.6 0.4 9.6
2.6 6.8 40.8
4.6 21.2 84.8
6.6 43.6 130.8
10.6 112.4 337.2
12.6 158.8 317.6
n=67 Sxp=7194 Sd 2 p=1860.4

мм рт.ст.;

Мм рт.ст.

;

Ме=108 мм рт.ст.; Мо = 108 мм рт.

Алгоритм обчислення параметрів згрупованого варіаційного ряду способом моментів:

1. Розташувати варіанти у зростаючому порядку із зазначенням їх частоти (р)

2. Провести угруповання варіант

3. Обчислити центральний варіант

4. Варіанту із найвищою частотою приймають за умовну середню (А)

5. Обчислити умовне відхилення (а) кожної центральної варіанти від умовної середньої (А)

6. Перемножують а на р (а * р)

7. Підсумовують твори ар

8. Визначають величину інтервалу y шляхом віднімання центральної варіанти з попередньої

9. Обчислюють середню величину за такою формулою:

;

10. Для обчислення умовного відхилення квадратного умовні відхилення зводять у квадрат (а 2)

11. Перемножують а 2 * р

12. Підсумовують твори а*р 2

13. Обчислюють середнє відхилення за формулою

приклад

Є дані чоловіків віком 30-39 років

маса, кг х Число обстежених р Серединна варіанта х з а а 2 а 2 * р а*р Накопичені частоти
45-49 47,5 -4 -4
50-54 52,5 -3 -9
55-59 57,5 -2 -14
60-64 62,5 -1 -10
65-69 67,5
70-74 72,5
75-79 77,5
80-84 82,5
85-89 87,5
сума

- Середня арифметична

; - Середнє квадратичне відхилення; - помилка середньої

Оцінка достовірності

Статистична оцінка достовірності результатів медико-статистичного дослідження складається із низки етапів – точність результатів залежить окремих етапів.

При цьому трапляються дві категорії помилок: 1) помилки, які не можна заздалегідь врахувати математичними методами (помилки точності, уваги, типовості, методичні помилки тощо); 2) помилки репрезентативності, пов'язані з вибірковим дослідженням.

Величина помилки репрезентативності визначається як обсягом вибірки, так і різноманітністю ознаки та виражається середньою помилкою. Середня помилка показника обчислюється за такою формулою:

де m – середня помилка показника;

p – статистичний показник;

q - величина зворотна p (1-p, 100-p, 1000-p, і т.д.)

n – кількість спостережень.

При числі спостережень менше 30 у формулу вводиться виправлення:

Помилка середньої величини обчислюється за формулами:

; ;

де s – середнє квадратичне відхилення;

n – кількість спостережень.

приклад 1.

Зі стаціонару вибуло 289 осіб, померло – 12.

Летальність становитиме:

; ;

Під час проведення повторних досліджень середня (М) у 68% випадків коливатиметься не більше ±m, тобто. ступінь ймовірності (p), з якою ми отримаємо такі довірчі межі середньої, дорівнює 0,68. Однак такий ступінь ймовірності зазвичай не задовольняє дослідників. Найменшим ступенем ймовірності, з якою хочуть отримати певні межі коливання середнього (довірчі межі), є 0,95 (95%). У цьому випадку довірчі межі середньої мають бути розширені шляхом множення помилки (m) на довірчий коефіцієнт (t).

Довірчий коефіцієнт (t) - число, що показує, у скільки разів потрібно збільшити помилку середньої величини, щоб при цьому числі спостережень з бажаним ступенем ймовірності (p) стверджувати, що середня величина не вийде за межі, що отримуються таким чином.

p=0.95 (95%) t=2, тобто. M±tm=M+2m;

p=0.99 (99%) t=3, тобто. M±tm=M+3m;

Порівняння середніх показників

При порівнянні двох середніх арифметичних (або двох показників), обчислених за різні періоди часу або в деяких умовах, визначається суттєвість відмінностей між ними. При цьому застосовується таке правило: різниця між середніми (або показниками) вважається суттєвою в тому випадку, якщо арифметична різниця між порівнюваними середніми (або показниками) буде більшою, ніж два квадратні корені із суми квадратів помилок цих середніх (або показників), тобто .

(Для порівнюваних середніх);

(Для порівнюваних показників).



Останні матеріали розділу:

Теорія ймовірності та математична статистика
Теорія ймовірності та математична статистика

Математика включає безліч областей, однією з яких, поряд з алгеброю і геометрією, є теорія ймовірності. Існують терміни,...

В'язь: слідами російської каліграфії
В'язь: слідами російської каліграфії

Автор під ніком anta_rus, досліджуючи російську писемність та способи зображення букв, розробив квадратну кирилицю та сонячну візерункову в'язь,...

Lim х прагне до 3 х.  Межі.  Приклади рішень
Lim х прагне до 3 х. Межі. Приклади рішень

Елементарні функції та їх графіки. Основними елементарними функціями вважаються: статечна функція, показова функція, логарифмічна...