Емпіричною функцією розподілу називають функцію. Емпірична функція розподілу, властивості
Визначення емпіричної функції розподілу
Нехай $ X $ - випадкова величина. $F(x)$ - функція розподілу цієї випадкової величини. Проводитимемо в одних і тих самих незалежних один від одного умов $n$ дослідів над даною випадковою величиною. При цьому отримаємо послідовність значень $x_1, x_2 $, ..., $ x_n $, яка і називається вибіркою.
Визначення 1
Кожне значення $x_i$ ($i=1,2\$, ...,$\n$) називається варіантом.
Однією з оцінок теоретичної функції розподілу є емпірична функція розподілу.
Визначення 3
Емпіричною функцією розподілу $F_n(x)$ називається функція, яка визначає для кожного значення $x$ відносну частоту події $X \
де $n_x$ - число варіантів, менших за $x$, $n$ -- обсяг вибірки.
Відмінність емпіричної функції від теоретичної полягає в тому, що теоретична функція визначає можливість події $X
Властивості емпіричної функції розподілу
Розглянемо тепер кілька основних властивостей функції розподілу.
Область значень функції $F_n\left(x\right)$ - відрізок $$.
$F_n\left(x\right)$ функція, що не спадає.
$F_n\left(x\right)$ безперервна зліва функція.
$F_n\left(x\right)$ шматково-постійна функція і зростає тільки в точках значень випадкової величини $X$
Нехай $X_1$ - найменша, а $X_n$ - найбільша варіанта. Тоді $F_n\left(x\right)=0$ при $(x\le X)_1$і $F_n\left(x\right)=1$ при $x\ge X_n$.
Введемо теорему, яка пов'язує між собою теоретичну та емпіричну функції.
Теорема 1
Нехай $F_n\left(x\right)$ - емпірична функція розподілу, а $F\left(x\right)$ - теоретична функція розподілу генеральної вибірки. Тоді виконується рівність:
\[(\mathop(lim)_(n\to \infty ) (|F)_n\left(x\right)-F\left(x\right)|=0\ )\]
Приклади завдань перебування емпіричної функції розподілу
Приклад 1
Нехай розподіл вибірки має такі дані, записані за допомогою таблиці:
Малюнок 1.
Знайти обсяг вибірки, скласти емпіричну функцію розподілу та побудувати її графік.
Обсяг вибірки: $ n = 5 +10 +15 +20 = 50 $.
За якістю 5, маємо, що з $x\le 1$ $F_n\left(x\right)=0$, а за $x>4$ $F_n\left(x\right)=1$.
Значення $x
Значення $x
Значення $x
Таким чином, отримуємо:
Малюнок 2.
Малюнок 3.
Приклад 2
З міст центральної частини Росії випадково обрано 20 міст, для яких отримані такі дані щодо вартості проїзду в громадському транспорті: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14, 15, 13 13, 12, 12, 15, 14, 14.
Скласти емпіричну функцію розподілу цієї вибірки та побудувати її графік.
Запишемо значення вибірки у порядку зростання та порахуємо частоту кожного значення. Отримуємо таку таблицю:
Малюнок 4.
Обсяг вибірки: $ n = 20 $.
За якістю 5, маємо, що з $x\le 12$ $F_n\left(x\right)=0$, а за $x>15$ $F_n\left(x\right)=1$.
Значення $x
Значення $x
Значення $x
Таким чином, отримуємо:
Малюнок 5.
Побудуємо графік емпіричного розподілу:
Малюнок 6.
Оригінальність: $92,12%.
Варіаційний ряд. Полігон та гістограма.
Ряд розподілу- являє собою впорядкований розподіл одиниць сукупності, що вивчається, на групи за певною варіюючою ознакою.
Залежно від ознаки, покладеної в основу освіти, ряду розподілу розрізняють атрибутивні та варіаційніряди розподілу:
§ Ряди розподілу, побудовані в порядку зростання або спадання значень кількісної ознаки називаються варіаційними.
Варіаційний ряд розподілу складається із двох стовпців:
У першому стовпці наводяться кількісні значення ознаки, що називаються, які називаються варіантамиі позначаються. Дискретна варіанта - виражається цілим числом. Інтервальний варіант знаходиться в межах від і до. Залежно від типу варіанти, можна побудувати дискретний або інтервальний варіаційний ряд.
У другому стовпці міститься кількість конкретних варіант, Виражене через частоти або частоти:
Частоти- це абсолютні числа, що показують стільки разів у сукупності зустрічається це значення ознаки, які позначають . Сума всіх частот дорівнює повинна дорівнювати чисельності одиниць всієї сукупності.
Частини() - Це частоти виражені у відсотках до підсумку. Сума всіх частостей виражених у відсотках повинна дорівнювати 100% у частках одиниці.
Графічне зображення рядів розподілу
Наочно ряди розподілу надаються за допомогою графічних зображень.
Ряди розподілу зображуються у вигляді:
§ Полігона
§ Гістограми
§ Кумуляти
Полігон
При побудові полігону на горизонтальній осі (вісь абсцис) відкладають значення ознаки, що варіює, а на вертикальній осі (вісь ординат) - частоти або частоти.
1. Полігон на рис. 6.1 побудований за даними мікроперепису населення Росії у 1994 р.
Гістограма
Для побудови гістограми по осі абсцис вказують значення меж інтервалів і на їх підставі будують прямокутники, висота яких пропорційна до частот (або частот).
На рис. 6.2. зображено гістограму розподілу населення Росії у 1997 р. за віковими групами.
Рис.1. Розподіл населення Росії за віковими групами
Емпірична функція розподілу, властивості.
Нехай відомий статистичний розподіл частот кількісної ознаки X. Позначимо через число спостережень, у яких спостерігалося значення ознаки, менше x і n – загальна кількість спостережень. Очевидно, відносна частота події X Емпіричною функцією розподілу (функцією розподілу вибірки) називають функцію , що визначає для кожного значення x відносну частоту події X На відміну від емпіричної функції розподілу вибірки, функцію розподілу генеральної сукупності називають теоретичною функцією розподілу. Відмінність між цими функціями у тому, що теоретична функція визначає можливість події X У разі зростання n відносна частота події X Основні властивості Нехай зафіксовано елементарний результат. Тоді є функцією розподілу дискретного розподілу, що задається наступною функцією ймовірності: де , а Математичне очікування цього розподілу має вигляд: Таким чином, вибіркове середнє - це теоретичне середнє вибіркового розподілу. Аналогічно, вибіркова дисперсія – це теоретична дисперсія вибіркового розподілу. Випадкова величина має біномний розподіл: Вибіркова функція розподілу є незміщеною оцінкою функції розподілу: Дисперсія вибіркової функції розподілу має вигляд: Згідно з посиленим законом великих чисел, вибіркова функція розподілу сходиться майже напевно до теоретичної функції розподілу: Вибіркова функція розподілу є асимптотично нормальною оцінкою теоретичної функції розподілу. Якщо то За розподілом при . Визначення емпіричної функції розподілу Нехай $ X $ - випадкова величина. $F(x)$ - функція розподілу цієї випадкової величини. Проводитимемо в одних і тих самих незалежних один від одного умов $n$ дослідів над даною випадковою величиною. При цьому отримаємо послідовність значень $x_1, x_2 $, ..., $ x_n $, яка і називається вибіркою. Визначення 1 Кожне значення $x_i$ ($i=1,2\$, ...,$\n$) називається варіантом. Однією з оцінок теоретичної функції розподілу є емпірична функція розподілу. Визначення 3 Емпіричною функцією розподілу $F_n(x)$ називається функція, яка визначає для кожного значення $x$ відносну частоту події $X \ де $n_x$ - число варіантів, менших за $x$, $n$ -- обсяг вибірки. Відмінність емпіричної функції від теоретичної полягає в тому, що теоретична функція визначає можливість події $X Розглянемо тепер кілька основних властивостей функції розподілу. Область значень функції $F_n\left(x\right)$ - відрізок $$. $F_n\left(x\right)$ функція, що не спадає. $F_n\left(x\right)$ безперервна зліва функція. $F_n\left(x\right)$ шматково-постійна функція і зростає тільки в точках значень випадкової величини $X$ Нехай $X_1$ - найменша, а $X_n$ - найбільша варіанта. Тоді $F_n\left(x\right)=0$ при $(x\le X)_1$і $F_n\left(x\right)=1$ при $x\ge X_n$. Введемо теорему, яка пов'язує між собою теоретичну та емпіричну функції. Теорема 1 Нехай $F_n\left(x\right)$ - емпірична функція розподілу, а $F\left(x\right)$ - теоретична функція розподілу генеральної вибірки. Тоді виконується рівність: \[(\mathop(lim)_(n\to \infty ) (|F)_n\left(x\right)-F\left(x\right)|=0\ )\] Приклад 1 Нехай розподіл вибірки має такі дані, записані за допомогою таблиці: Малюнок 1. Знайти обсяг вибірки, скласти емпіричну функцію розподілу та побудувати її графік. Обсяг вибірки: $ n = 5 +10 +15 +20 = 50 $. За якістю 5, маємо, що з $x\le 1$ $F_n\left(x\right)=0$, а за $x>4$ $F_n\left(x\right)=1$. Значення $x Значення $x Значення $x Таким чином, отримуємо: Малюнок 2. Малюнок 3. Приклад 2 З міст центральної частини Росії випадково обрано 20 міст, для яких отримані такі дані щодо вартості проїзду в громадському транспорті: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14, 15, 13 13, 12, 12, 15, 14, 14. Скласти емпіричну функцію розподілу цієї вибірки та побудувати її графік. Запишемо значення вибірки у порядку зростання та порахуємо частоту кожного значення. Отримуємо таку таблицю: Малюнок 4. Обсяг вибірки: $ n = 20 $. За якістю 5, маємо, що з $x\le 12$ $F_n\left(x\right)=0$, а за $x>15$ $F_n\left(x\right)=1$. Значення $x Значення $x Значення $x Таким чином, отримуємо: Малюнок 5. Побудуємо графік емпіричного розподілу: Малюнок 6. Оригінальність: $92,12%.- Кількість елементів вибірки, рівних . Зокрема, якщо всі елементи вибірки є різними, то
.
.
.
.
майже напевно при .
Властивості емпіричної функції розподілу
Приклади завдань перебування емпіричної функції розподілу