Множинний коефіцієнт кореляції в Excel (Ексель). Кореляційний аналіз як зробити в excel

У наукових дослідженнях часто виникає необхідність у знаходженні зв'язку між результативними та факторними змінними (урожайністю будь-якої культури та кількістю опадів, зростанням та вагою людини в однорідних групах за статтю та віком, частотою пульсу та температурою тіла тощо).

Другі є ознаки, сприяють зміні таких, що з ними (першими).

Поняття про кореляційний аналіз

Існує безліч Виходячи з вищевикладеного, можна сказати, що кореляційний аналіз - це метод, що застосовується з метою перевірки гіпотези про статистичну значущість двох і більше змінних, якщо дослідник їх може вимірювати, але не змінювати.

Є й інші визначення поняття, що розглядається. Кореляційний аналіз - це метод обробки полягає у вивченні коефіцієнтів кореляції між змінними. При цьому порівнюються коефіцієнти кореляції між однією парою або безліччю пар ознак для встановлення між ними статистичних взаємозв'язків. Кореляційний аналіз - це метод вивчення статистичної залежності між випадковими величинами з необов'язковою наявністю суворого функціонального характеру, при якій динаміка однієї випадкової величини призводить до динаміки математичного очікування іншої.

Поняття про хибність кореляції

При проведенні кореляційного аналізу необхідно враховувати, що його можна провести по відношенню до будь-якої сукупності ознак, часто абсурдних один до одного. Часом вони не мають жодного причинного зв'язку один з одним.

У цьому випадку говорять про хибну кореляцію.

Завдання кореляційного аналізу

Виходячи з наведених вище визначень, можна сформулювати такі завдання описуваного методу: отримати інформацію про одну з змінних, що шукаються, за допомогою іншої; визначити тісноту зв'язку між досліджуваними змінними.

Кореляційний аналіз передбачає визначення залежності між ознаками, що досліджуються, у зв'язку з чим завдання кореляційного аналізу можна доповнити такими:

  • виявлення факторів, що мають найбільший вплив на результативну ознаку;
  • виявлення невивчених раніше причин зв'язків;
  • побудова кореляційної моделі з її параметричним аналізом;
  • вивчення значимості властивостей зв'язку та його інтервальна оцінка.

Зв'язок кореляційного аналізу з регресійним

Метод кореляційного аналізу часто не обмежується знаходженням тісноти зв'язку між досліджуваними величинами. Іноді він доповнюється складанням рівнянь регресії, які отримують за допомогою однойменного аналізу, і є описом кореляційної залежності між результуючим і факторним (факторними) ознакою (ознаками). Цей метод разом із аналізованим аналізом становить метод

Умови використання методу

Результативні чинники залежить від однієї до кількох чинників. Метод кореляційного аналізу може застосовуватися в тому випадку, якщо є велика кількість спостережень про величину результативних та факторних показників (факторів), при цьому досліджувані фактори мають бути кількісними та відображатись у конкретних джерелах. Перше може визначатися нормальним законом - у цьому випадку результатом кореляційного аналізу виступають коефіцієнти кореляції Пірсона, або, якщо ознаки не підкоряються цьому закону, використовується коефіцієнт рангової кореляції Спірмена.

Правила відбору факторів кореляційного аналізу

При застосуванні даного методу необхідно визначитися з факторами, які впливають на результативні показники. Їх відбирають з урахуванням того, що між показниками мають бути причинно-наслідкові зв'язки. У разі створення багатофакторної кореляційної моделі відбирають ті з них, які істотно впливають на результуючий показник. чи функціональний характер.

Відображення результатів

Результати кореляційного аналізу можуть бути представлені у текстовому та графічному видах. У першому випадку вони видаються як коефіцієнт кореляції, у другому - у вигляді діаграми розкиду.

За відсутності кореляції між параметрами точки на діаграмі розташовані хаотично, середній ступінь зв'язку характеризується більшим ступенем упорядкованості та характеризується більш-менш рівномірною віддаленістю нанесених позначок медіани. Сильна зв'язок прагне прямий і за r=1 точковий графік є рівною лінію. Зворотна кореляція відрізняється спрямованістю графіка з лівого верхнього в правий нижній, пряма — з нижнього лівого у верхній правий кут.

Тривимірне уявлення діаграми розкиду (розсіювання)

Крім традиційного 2D-подання діаграми розкиду, в даний час використовується 3D-відображення графічного представлення кореляційного аналізу.

Також використовується матриця діаграми розсіювання, яка відображає всі парні графіки на одному малюнку в матричному форматі. Для n змінних матриця містить n рядків та n стовпців. Діаграма, розташована на перетині i-го рядка і j-ого стовпця, є графік змінних Xi в порівнянні з Xj. Таким чином, кожен рядок і стовпець є одним виміром, окремий осередок відображає діаграму розсіювання двох вимірів.

Оцінка тісноти зв'язку

Тіснота кореляційного зв'язку визначається за коефіцієнтом кореляції (r): сильна – r = ±0,7 до ±1, середня – r = ±0,3 до ±0,699, слабка – r = 0 до ±0,299. Ця класифікація перестав бути суворої. На малюнку показано дещо іншу схему.

Приклад застосування методу кореляційного аналізу

У Великій Британії було зроблено цікаве дослідження. Воно присвячене зв'язку куріння з раком легенів, та проводилося шляхом кореляційного аналізу. Це спостереження наведено нижче.

Вихідні дані для кореляційного аналізу

Професійна група

смертність

Фермери, лісники та рибалки

Шахтарі та працівники кар'єрів

Виробники газу, коксу та хімічних речовин

Виробники скла та кераміки

Працівники печей, ковальських, ливарних та прокатних станів

Працівники електротехніки та електроніки

Інженерні та суміжні професії

Деревообробні виробництва

Кожувенники

Текстильні робітники

Виробники робочого одягу

Працівники харчової, питної та тютюнової промисловості

Виробники паперу та друку

Виробники інших продуктів

Будівельники

Художники та декоратори

Водії стаціонарних двигунів, кранів тощо.

Робочі, не включені до інших місць

Працівники транспорту та зв'язку

Складські робітники, комірники, пакувальники та працівники розливальних машин

Канцелярські працівники

Продавці

Працівники служби спорту та відпочинку

Адміністратори та менеджери

Професіонали, технічні працівники та художники

Розпочинаємо кореляційний аналіз. Рішення краще починати для наочності з графічного способу, навіщо побудуємо діаграму розсіювання (розкиду).

Вона показує прямий зв'язок. Однак на підставі лише графічного методу зробити однозначний висновок складно. Тому продовжимо виконувати кореляційний аналіз. Приклад розрахунку коефіцієнта кореляції наведено нижче.

За допомогою програмних засобів (з прикладу MS Excel буде описано далі) визначаємо коефіцієнт кореляції, який становить 0,716, що означає сильний зв'язок між досліджуваними параметрами. Визначимо статистичну достовірність отриманого значення за відповідною таблицею, для чого нам потрібно відняти з 25 пар значень 2, в результаті чого отримаємо 23 і по цьому рядку в таблиці знайдемо r критичне для p=0,01 (оскільки це медичні дані, тут використовується більш строга залежність, в решті випадків достатньо p=0,05), яке становить 0,51 для цього кореляційного аналізу. Приклад продемонстрував, що розрахункове більше r критичного, значення коефіцієнта кореляції вважається статистично достовірним.

Використання ПЗ під час проведення кореляційного аналізу

Вигляд статистичної обробки даних, що описується, може здійснюватися за допомогою програмного забезпечення, зокрема, MS Excel. Кореляційний передбачає обчислення наступних параметрів з використанням функцій:

1. Коефіцієнт кореляції визначається за допомогою функції КОРРЕЛ (масив1; масив2). Масив1,2 - осередок інтервалу значень результативних і факторних змінних.

Лінійний коефіцієнт кореляції також називається коефіцієнтом кореляції Пірсона, у зв'язку з чим, починаючи з Excel 2007 можна використовувати функцію з тими ж масивами.

Графічне відображення кореляційного аналізу в Excel здійснюється за допомогою панелі "Діаграми" з вибором "Точкова діаграма".

Після вказівки вихідних даних отримуємо графік.

2. Оцінка значимості коефіцієнта парної кореляції з допомогою t-критерію Стьюдента. Розраховане значення t-критерію порівнюється з табличною (критичною) величиною даного показника з відповідної таблиці значень аналізованого параметра з урахуванням заданого рівня значущості та числа ступенів свободи. Ця оцінка здійснюється з використанням функції СТЬЮДРАСПОБР (імовірність; ступеня_свободи).

3. Матриця коефіцієнтів парної кореляції. Аналіз здійснюється за допомогою засобу "Аналіз даних", в якому вибирається "Кореляція". Статистичну оцінку коефіцієнтів парної кореляції здійснюють у порівнянні його абсолютної величини з табличним (критичним) значенням. При перевищенні розрахункового коефіцієнта парної кореляції над таким критичним можна говорити, з урахуванням заданого ступеня ймовірності, що нульова гіпотеза про значимість лінійного зв'язку не відкидається.

На закінчення

Використання в наукових дослідженнях методу кореляційного аналізу дозволяє визначити зв'язок між різними факторами та результативними показниками. При цьому необхідно враховувати, що високий коефіцієнт кореляції можна отримати і з абсурдної пари або безлічі даних, у зв'язку з чим даний вид аналізу потрібно здійснювати досить великий масив даних.

Після отримання розрахункового значення r бажано порівняти з r критичним для підтвердження статистичної достовірності певної величини. Кореляційний аналіз може здійснюватися вручну з використанням формул або за допомогою програмних засобів, зокрема MS Excel. Тут же можна побудувати діаграму розкиду (розсіювання) з метою наочного уявлення про зв'язок між факторами кореляційного аналізу, що вивчаються, і результативною ознакою.

Ви вже стикалися з необхідністю розрахувати рівень зв'язку двох статистичних величин і визначити формулу, за якою вони корелюють? Нормальна людина може запитати, навіщо це взагалі може бути потрібне. Як не дивно, це дійсно потрібно. Знання достовірних кореляцій може допомогти вам заробляти шалені гроші, якщо ви, скажімо, біржовий трейдер. Проблема в тому, що чомусь ці кореляції ніхто не розкриває (дивно, чи не так?).

Давайте порахуємо їх самі! Наприклад, я вирішив спробувати порахувати кореляцію рубля до долара через євро. Давайте розберемо, як це робиться докладно.

Ця стаття розрахована на сучасний рівень володіння Microsoft Excel. Якщо у вас немає часу, щоб читати всю статтю, ви можете завантажити файл і розібратися з ним самостійно.

Якщо ви часто стикаєтеся з необхідністю зробити щось подібне, настійно рекомендую подумати про покупку книги Статистичні обчислення в середовищі Excel.

Що важливо знати про кореляції

Щоб розрахувати достовірну кореляцію, необхідно мати достовірну вибірку, що більше вона буде, то достовірнішим буде результат. Для цілей цього прикладу я взяв щоденну вибірку курсів валют за 10 років. Дані є у вільному доступі, я їх брав із сайту http://oanda.com.

Що я, власне, зробив

(1) Коли я мав вихідні дані, я почав з того, що перевірив ступінь кореляції цих двох наборів даних. Для цього я скористався функцією CORREL (КОРРЕЛ) - про неї є небагато інформації. Вона повертає рівень кореляції двох діапазонів даних. Результат, прямо скажемо, вийшов не дуже вражаючим (всього близько 70%). А взагалі, ступінь співвідношення двох величин прийнято вважати, як квадрат цієї величини, тобто кореляція вийшла достовірною приблизно на 49%. Це дуже мало!

(2) Мені це здалося дуже дивним. Які помилки могли закрастись у мої розрахунки? Тому я вирішив побудувати графік та подивитися, що могло статися. Графік був простоєний спеціально з розбивкою за роками, щоб можна було візуально побачити, де рве кореляцію. Графік вийшов ось таким

(3) З графіка очевидно, що у діапазоні близько 35 рублів за євро кореляцію починає рвати дві частини. Через це вона і вийшла недостовірною. Необхідно було визначити у зв'язку із чим це відбувається.

(4) За кольором видно, що ці дані відносяться до 2007, 2008, 2009 років. Звичайно! p align="justify"> Періоди економічних піків і спадів зазвичай недостовірні статистично, що і сталося в даному випадку. Тому я спробував виключити з даних ці періоди (і для перевірки, я перевірив ступінь кореляції даних у цьому періоді). Ступінь кореляції цих даних становить 0.01%, тобто вона відсутня в принципі. Проте без них дані корелюють приблизно на 81%. Це вже достовірна кореляція. Ось графік із функцією.

Подальші кроки

Теоретично, функцію кореляції можна уточнити, якщо перевести її з лінійної до експоненційної або логарифмічної. У цьому статистична достовірність кореляції зростає приблизно один відсоток, але складність застосування формули підвищується неймовірно. Тому для себе я ставлю питання: а чи це потрібно насправді? Вирішувати вам – для кожного конкретного випадку.

«Кореляція» у перекладі з латинської означає «співвідношення», «взаємозв'язок». Кількісна характеристика взаємозв'язку можна отримати при обчисленні коефіцієнта кореляції. Цей популярний у статистичних аналізах коефіцієнт показує, чи пов'язані якісь параметри один з одним (наприклад, зростання та вага; рівень інтелекту та успішність; кількість травм та тривалість роботи).

Використання кореляції

Обчислення кореляції особливо широко використовується в економіці, соціологічних дослідженнях, медицині та біометрії — скрізь, де можна отримати два масиви даних, між якими може виявитися зв'язок.

Розрахувати кореляцію можна вручну, виконуючи нескладні арифметичні дії. Однак процес обчислення виявляється дуже трудомістким, якщо набір даних є великим. Особливість методу в тому, що він вимагає збирання великої кількості вихідних даних, щоб найточніше відобразити, чи є зв'язок між ознаками. Тому серйозне використання кореляційного аналізу неможливе без застосування обчислювальної техніки. Однією з найбільш популярних та доступних програм для вирішення цього завдання є.

Як виконати кореляцію в Excel?

Найбільш трудомістким етапом визначення кореляції є набір масиву даних. Порівнювані дані розташовуються зазвичай у двох колонках чи рядках. Таблицю слід робити без перепусток у осередках. Сучасні версії Excel (з 2007 і молодше) не вимагають встановлення додаткових налаштувань для статистичних розрахунків; необхідні маніпуляції можна зробити:

  1. Вибрати порожній осередок, до якого буде виведено результат розрахунків.
  2. Натисніть у головному меню Excel пункт Формули.
  3. Серед кнопок, згрупованих у «Бібліотеку функцій», виберіть «Інші функції».
  4. У списках, що випадають, вибрати функцію розрахунку кореляції (Статистичні — КОРРЕЛ).
  5. В Excel відкриється панель "Аргументи функції". Масив 1 і Масив 2 - це діапазони порівнюваних даних. Для автоматичного заповнення цих полів можна виділити потрібні осередки таблиці.
  6. Натиснути "ОК", закривши вікно аргументів функції. У комірці з'явиться підрахований коефіцієнт кореляції.

Кореляція може бути пряма (якщо коефіцієнт більший за нуль) і зворотна (від -1 до 0).

Перша означає, що при зростанні одного параметра зростає інший. Зворотна (негативна) кореляція відбиває факт, що з зростанні однієї змінної інша зменшується.

Кореляція може бути близькою до нуля. Це свідчить, що досліджувані параметри пов'язані друг з одним. Але іноді нульова кореляція виникає, якщо зроблена невдала вибірка, яка відбила зв'язок, чи зв'язок має складний нелінійний характер.

Якщо коефіцієнт показує середній або сильний взаємозв'язок (від ±0,5 до ±0,99), слід пам'ятати, що це лише статистичний взаємозв'язок, який зовсім не гарантує впливу одного параметра на інший. Також не можна виключати ситуації, що обидва параметри незалежні один від одного, але на них впливає якийсь третій неврахований фактор. Excel допомагає моментально обчислити коефіцієнт кореляції, але зазвичай лише кількісних методів недостатньо встановлення причинно-наслідкових зв'язків у співвідносних вибірках.

Утиліта, яка широко використовується в багатьох компаніях та на підприємствах. Реалії такі, що практично будь-який працівник повинен тією чи іншою мірою володіти Екселем, тому що ця програма застосовується для вирішення широкого спектру завдань. Працюючи з таблицями, нерідко доводиться визначати, чи пов'язані між собою певні змінні. Для цього використовується так звана кореляція. У цій статті докладно розглянемо, як розрахувати коефіцієнт кореляції в Excel. Давайте розумітися. Поїхали!

Почнемо з того, що таке коефіцієнт кореляції загалом. Він показує ступінь взаємозв'язку між двома елементами і завжди знаходиться в діапазоні від -1 (сильний зворотний зв'язок) до 1 (сильний прямий взаємозв'язок). Якщо коефіцієнт дорівнює 0, це свідчить, що взаємозв'язок між значеннями відсутня.

Тепер, розібравшись із теорією, перейдемо до практики. Щоб знайти взаємозв'язок між змінними та у, скористайтеся вбудованою функцією Microsoft Excel «КОРРЕЛ». Для цього натисніть кнопку майстра функцій (вона розташована поряд з полем для формул). У вікні виберіть зі списку функцій «КОРРЕЛ». Після цього вкажіть діапазон у полях «Массив1» і «Массив2». Наприклад, для "Масив1" виділіть значення у, а для "Масив2" виділіть значення х. У результаті ви отримаєте розрахований програмою коефіцієнт кореляції.

Наступний спосіб буде актуальним для студентів, від яких вимагають знайти залежність за заданою формулою. Насамперед, потрібно знати середні значення змінних x та y. Для цього виділіть значення змінної та скористайтеся функцією «СРЗНАЧ». Далі необхідно обчислити різницю між кожним x і x порівн, і y порівн. У вибраних осередках напишіть формули x-x, y-. Не забудьте закріпити комірки із середніми значеннями. Потім розтягніть формулу вниз, щоб вона застосовалась і до решти.

Тепер коли є всі необхідні дані, можна порахувати кореляцію. Перемножте отримані різниці таким чином: (x-x ср) * (y-y ср). Після того як ви отримаєте результат для кожної зі змінних, підсумуйте отримані числа за допомогою функції суми. У такий спосіб розраховується чисельник.

Тепер перейдемо до знаменника. Пораховані різниці потрібно звести у квадрат. Для цього в окремій колонці введіть формули: (x-x ср) 2 і (y-y ср) 2 . Потім розтягніть формули на весь діапазон. Після, за допомогою кнопки "Автосума", знайдіть суму по всіх колонках (для x і для y). Залишилося перемножити знайдені суми та витягти з них квадратний корінь. Останній крок – поділіть чисельник на знаменник. Отриманий результат і буде шуканим коефіцієнтом кореляції.

Як бачите, вміючи правильно працювати з функціями Microsoft Excel, можна суттєво спростити собі завдання розрахунку непростих математичних виразів. Завдяки засобам, реалізованим у програмі, ви легко зробите кореляційний аналіз в Excel всього за пару хвилин, заощадивши час і сили. Пишіть у коментарях, чи допомогла вам стаття розібратися у питанні, питайте про все, що зацікавило вас із розглянутої теми.

Територіями регіону наводяться дані за 200Х р.

Номер регіону Середньодушовий прожитковий мінімум на день одного працездатного, руб., х Середньоденна заробітна плата, руб., у
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

Завдання:

1. Побудуйте поле кореляції та сформулюйте гіпотезу про форму зв'язку.

2. Розрахуйте параметри рівняння лінійної регресії

4. Дайте за допомогою середнього (загального) коефіцієнта еластичності порівняльну оцінку сили зв'язку фактора із результатом.

7. Розрахуйте прогнозне значення результату, якщо прогнозне значення фактора збільшиться на 10% його середнього рівня. Визначте довірчий інтервал прогнозу рівня значущості .

Рішення:

Вирішимо це завдання за допомогою Excel.

1. Зіставивши наявні дані х і у, наприклад, ранжирувавши їх у порядку зростання фактора х, можна спостерігати наявність прямої залежності між ознаками, коли збільшення середньодушового прожиткового мінімуму збільшує середньоденну заробітну плату. Виходячи з цього, можна зробити припущення, що зв'язок між ознаками прямий і його можна описати рівнянням прямий. Той самий висновок підтверджується і основі графічного аналізу.

Щоб побудувати поле кореляції, можна скористатися ППП Excel. Введіть вихідні дані у послідовності: спочатку х, потім у.

Виділіть область клітинок, що містить дані.

Потім оберіть: Вставка / Точкова діаграма / Точкова з маркерамияк показано малюнку 1.

Малюнок 1 Побудова поля кореляції

Аналіз поля кореляції показує наявність близької прямолінійної залежності, оскільки точки розташовані практично по прямій лінії.

2. Для розрахунку параметрів рівняння лінійної регресії
скористаємося вбудованою статистичною функцією Лінейн.

Для цього:

1) Відкрийте існуючий файл, що містить дані, що аналізуються;
2) Виділіть область порожніх осередків 5×2 (5 рядків, 2 стовпці) для виведення результатів регресійної статистики.
3) Активізуйте Майстер функцій: у головному меню оберете Формули / Вставити функцію.
4) У вікні Категоріяви берете Статистичні, у вікні функція - Лінейн. Клацніть по кнопці ОКяк показано на малюнку 2;

Рисунок 2 Діалогове вікно «Майстер функцій»

5) Заповніть аргументи функції:

Відомі значення у

Відомі значення х

Константа- логічне значення, що вказує на наявність або відсутність вільного члена в рівнянні; якщо Константа = 1, вільний член розраховується звичайним чином, якщо Константа = 0, то вільний член дорівнює 0;

Статистика- логічне значення, яке вказує, виводити додаткову інформацію щодо регресійного аналізу чи ні. Якщо Статистика = 1, то додаткова інформація виводиться, якщо Статистика = 0, виводяться лише оцінки параметрів рівняння.

Клацніть по кнопці ОК;

Рисунок 3 Діалогове вікно аргументів функції ЛІНІЙН

6) У лівому верхньому осередку виділеної області з'явиться перший елемент підсумкової таблиці. Щоб розкрити всю таблицю, натисніть клавішу , а потім на комбінацію клавіш ++ .

Додаткова регресійна статистика буде виводитись у порядку, зазначеному в наступній схемі:

Значення коефіцієнта b Значення коефіцієнта a
Стандартна помилка b Стандартна помилка a
Стандартна помилка y
F-статистика
Регресійна сума квадратів

Рисунок 4 Результат обчислення функції ЛІНІЙН

Набули рівняння регресії:

Робимо висновок: Зі збільшенням середньодушового прожиткового мінімуму на 1 руб. середньоденна вести збільшується загалом на 0,92 крб.

Означає, що 52% варіації заробітної плати (у) пояснюється варіацією фактора х – середньодушового прожиткового мінімуму, а 48% – дією інших факторів, не включених до моделі.

За обчисленим коефіцієнтом детермінації можна розрахувати коефіцієнт кореляції: .

Зв'язок оцінюється як тісний.

4. За допомогою середнього (загального) коефіцієнта еластичності визначимо силу впливу фактора на результат.

Для рівняння прямий середній (загальний) коефіцієнт еластичності визначимо за такою формулою:

Середні значення знайдемо, виділивши область осередків зі значеннями х, і виберемо Формули / Автосума / Середнє, і те саме зробимо зі значеннями у.

Рисунок 5 Розрахунок середніх значень функції та аргумент

Таким чином, за зміни середньодушового прожиткового мінімуму на 1% від свого середнього значення середньоденна заробітна плата зміниться в середньому на 0,51%.

За допомогою інструмента аналізу даних Регресіяможна отримати:
- результати регресійної статистики,
- результати дисперсійного аналізу,
- результати довірчих інтервалів,
- залишки та графіки підбору лінії регресії,
- залишки та нормальну ймовірність.

Порядок дій наступний:

1) перевірте доступ до Пакету аналізу. У головному меню виберіть: Файл/Параметри/Надбудови.

2) У списку, що розкривається Управліннявиберіть пункт Надбудови Excelта натисніть кнопку Перейти.

3) У вікні Надбудовивстановіть прапорець Пакет аналізу, а потім натисніть кнопку ОК.

Якщо Пакет аналізувідсутня у списку поля Доступні надбудови, натисніть кнопку Огляд, щоб здійснити пошук.

Якщо відображається повідомлення про те, що пакет аналізу не встановлено на комп'ютері, натисніть кнопку Так, щоб встановити його.

4) У головному меню послідовно виберіть: Дані / Аналіз даних / Інструменти аналізу / Регресія, а потім натисніть кнопку ОК.

5) Заповніть діалогове вікно введення даних та параметрів виведення:

Вхідний інтервал Y- Діапазон, що містить дані результативної ознаки;

Вхідний інтервал X- Діапазон, що містить дані факторної ознаки;

Мітки- прапорець, який вказує, чи містить перший рядок назви стовпців чи ні;

Константа - нуль- Прапорець, що вказує на наявність або відсутність вільного члена у рівнянні;

Вихідний інтервал- Досить вказати ліву верхню комірку майбутнього діапазону;

6) Новий робочий лист – можна задати довільне ім'я нового листа.

Потім натисніть кнопку ОК.

Рисунок 6 Діалогове вікно введення параметрів інструменту Регресія

Результати регресійного аналізу даних завдань представлені малюнку 7.

Рисунок 7 Результат застосування інструменту регресія

5. Оцінимо за допомогою середньої помилки апроксимації якість рівнянь. Скористаємося результатами регресійного аналізу, представленого на Рисунку 8.

Рисунок 8 Результат застосування інструменту регресія «Виведення залишку»

Складемо нову таблицю як показано малюнку 9. У графі З розрахуємо відносну помилку апроксимації по формуле:

Рисунок 9 Розрахунок середньої помилки апроксимації

Середня помилка апроксимації розраховується за формулою:

Якість побудованої моделі оцінюється як хороша, тому що не перевищує 8 – 10%.

6. З таблиці з регресійною статистикою (Малюнок 4) випишемо фактичне значення F-критерію Фішера:

Оскільки при 5%-ном рівні значимості, можна дійти невтішного висновку про значимість рівняння регресії (зв'язок доведено).

8. Оцінку статистичної значущості параметрів регресії проведемо за допомогою t-статистики Стьюдента та шляхом розрахунку довірчого інтервалу кожного з показників.

Висуваємо гіпотезу Н 0 про статистично незначну відмінність показників від нуля:

.

для числа ступенів свободи

На малюнку 7 є фактичні значення t-статистики:

t-критерій для коефіцієнта кореляції можна розрахувати двома способами:

I спосіб:

де - Випадкова помилка коефіцієнта кореляції.

Дані до розрахунку візьмемо з таблиці на Рисунку 7.

II спосіб:

Фактичні значення t-статистики перевищують табличні значення:

Тому гіпотеза Н 0 відхиляється, тобто параметри регресії та коефіцієнт кореляції не випадково відрізняються від нуля, а статистично значущі.

Довірчий інтервал для параметра a визначається як

Для параметра a 95% межі як показано на малюнку 7 склали:

Довірчий інтервал для коефіцієнта регресії визначається як

Для коефіцієнта регресії b 95% межі як показано на малюнку 7 склали:

Аналіз верхньої та нижньої меж довірчих інтервалів призводить до висновку про те, що з ймовірністю параметри a і b, перебуваючи у зазначених межах, не набувають нульових значень, тобто. є статистично незначущими і істотно відмінні від нуля.

7. Отримані оцінки рівняння регресії дають змогу використовувати його для прогнозу. Якщо прогнозне значення прожиткового мінімуму становитиме:

Тоді прогнозне значення прожиткового мінімуму становитиме:

Помилку прогнозу розрахуємо за такою формулою:

де

Дисперсію вважатимемо також за допомогою ППП Excel. Для цього:

1) Активізуйте Майстер функцій: у головному меню оберете Формули / Вставити функцію.

3) Заповніть діапазон, що містить числові дані факторної ознаки. Натисніть ОК.

Рисунок 10 Розрахунок дисперсії

Набули значення дисперсії

Для підрахунку залишкової дисперсії на один ступінь свободи скористаємося результатами дисперсійного аналізу, як показано на Рисунку 7.

Довірчі інтервали прогнозу індивідуальних значень у при ймовірності 0,95 визначаються виразом:

Інтервал досить широкий, передусім, рахунок малого обсягу спостережень. Загалом виконаний прогноз середньомісячної заробітної плати виявився надійним.

Умову задачі взято з: Практикум з економетрики: Навч. посібник/І.І. Єлісєєва, С.В. Куришева, Н.М. Гордєєнко та ін; За ред. І.І. Єлісєєвої. – М.: Фінанси та статистика, 2003. – 192 с.: іл.



Останні матеріали розділу:

Пабло Ескобар - найвідоміший наркобарон в історії
Пабло Ескобар - найвідоміший наркобарон в історії

Пабло Еміліо Ескобар Гавіріа – найвідоміший наркобарон та терорист із Колумбії. Увійшов до підручників світової історії як найжорстокіший злочинець.

Михайло Олексійович Сафін.  Сафін Марат.  Спортивна біографія.  Професійний старт тенісиста
Михайло Олексійович Сафін. Сафін Марат. Спортивна біографія. Професійний старт тенісиста

Володар одразу двох кубків Великого Шолома в одиночній грі, двічі переможець змагань на Кубок Девіса у складі збірної Росії, переможець...

Чи потрібна вища освіта?
Чи потрібна вища освіта?

Ну, на мене питання про освіту (саме вищу) це завжди палиця з двома кінцями. Хоч я сам і вчуся, але в моїй ДУЖЕ великій сім'ї багато прикладів...