Тимчасові ряди та їх аналіз. Аналіз часових рядів та прогнозування в Excel на прикладі

Мета аналізу часових рядів зазвичай полягає у побудові математичної моделі ряду, за допомогою якої можна пояснити його поведінку та здійснити прогноз на певний період часу. Аналіз часових рядів включає такі основні етапи.

Аналіз часового ряду зазвичай починається з побудови та вивчення його графіка.

Якщо нестаціонарність часового ряду очевидна, то насамперед треба виділити та видалити нестаціонарну складову ряду. Процес видалення тренду та інших компонентів ряду, що призводять до порушення стаціонарності, може проходити в кілька етапів. На кожному з них розглядається ряд залишків, отриманий в результаті віднімання вихідного ряду підібраної моделі тренда, або результат різницевих та інших перетворень ряду. Крім графіків, ознаками нестаціонарності часового ряду можуть бути автокореляційна функція, що не прагне до нуля (за винятком дуже великих значень лагів).

Вибір моделі для тимчасового ряду.Після того, як вихідний процес максимально наближений до стаціонарного, можна приступити до вибору різних моделей отриманого процесу. Мета цього етапу – опис та облік у подальшому аналізі кореляційної структури аналізованого процесу. При цьому на практиці найчастіше використовуються параметричні моделі авторегресії-ковзного середнього (ARIMA-моделі)

Модель може вважатися підібраною, якщо залишкова компонента ряду є процесом типу «білого шуму», коли залишки розподілені за нормальним законом із вибірковим середнім рівним 0. Після підбору моделі зазвичай виконуються:

    оцінка дисперсії залишків, яка надалі може бути використана для побудови довірчих інтервалів прогнозу;

    аналіз залишків із метою перевірки адекватності моделі.

Прогнозування та інтерполяція. Останнім етапом аналізу часового ряду може бути прогнозування його майбутніх (екстраполяція) або відновлення пропущених (інтерполяція) значень та вказівки точності цього прогнозу на основі підібраної моделі. Не завжди вдається добре підібрати математичну модель для часового ряду. Неоднозначність підбору моделі може спостерігатись як на етапі виділення детермінованої компоненти ряду, так і при виборі структури ряду залишків. Тому дослідники часто вдаються до методу кількох прогнозів, зроблених з допомогою різних моделей.

Методи аналізу.При аналізі часових рядів зазвичай використовуються такі методи:

    графічні методи подання часових рядів та їх супутніх числових характеристик;

    методи зведення до стаціонарних процесів: видалення тренду, моделі ковзного середнього та авторегресії;

    методи дослідження внутрішніх зв'язків між елементами часових рядів

3.5. Графічні методи аналізу часових рядів

Для чого потрібні графічні методи.У вибіркових дослідженнях найпростіші числові характеристики описової статистики (середнє, медіана, дисперсія, стандартне відхилення) зазвичай дають досить інформативне уявлення про вибірку. Графічні методи подання та аналізу вибірок при цьому грають лише допоміжну роль, дозволяючи краще зрозуміти локалізацію та концентрацію даних, їх закон розподілу.

Роль графічних методів при аналізі часових рядів зовсім інша. Справа в тому, що табличне уявлення часового ряду та описові статистики найчастіше не дозволяють зрозуміти характер процесу, тоді як за графіком часового ряду можна зробити досить багато висновків. Надалі вони можуть бути перевірені та уточнені за допомогою розрахунків.

При аналізі графіків можна впевнено визначити:

    наявність тренду та його характер;

    наявність сезонних та циклічних компонентів;

    ступінь плавності чи уривчастості змін послідовних значень ряду після усунення тренду. За цим показником можна будувати висновки про характері і величині кореляції між сусідніми елементами ряду.

Побудова та вивчення графіка.Побудова графіка часового ряду – зовсім не таке просте завдання, як це здається на перший погляд. Сучасний рівень аналізу часових рядів передбачає використання тієї чи іншої комп'ютерної програми для побудови їх графіків та всього наступного аналізу. Більшість статистичних пакетів та електронних таблиць мають ті чи інші методи налаштування на оптимальне подання тимчасового ряду, але навіть при їх використанні можуть виникати різні проблеми, наприклад:

    через обмеженість роздільної здатності екранів комп'ютерів розміри графіків, що виводяться, можуть бути також обмежені;

    при великих обсягах аналізованих рядів точки на екрані, що зображають спостереження часового ряду, можуть перетворитися на суцільну чорну смугу.

Для боротьби з цими труднощами використовують різні способи. Наявність у графічній процедурі режиму «лупи» або «збільшення» дозволяє зобразити більш вибрану частину ряду, проте при цьому стає важко судити про характер поведінки ряду на всьому аналізованому інтервалі. Доводиться роздруковувати графіки для окремих частин ряду та стиковувати їх разом, щоб побачити картину поведінки ряду загалом. Іноді для покращення відтворення довгих рядів використовується проріджування,тобто вибір та відображення на графіку кожної другої, п'ятої, десятої тощо. точки часового ряду. Ця процедура дозволяє зберегти цілісне уявлення ряду та корисна для виявлення трендів. Насправді корисне поєднання обох процедур: розбиття ряду частини і проріджування, оскільки дозволяють визначити особливості поведінки часового ряду.

Ще одну проблему під час відтворення графіків створюють викиди– спостереження, у кілька разів перевищують за величиною більшість інших значень низки. Їхня присутність теж призводить до невиразності коливань часового ряду, оскільки масштаб зображення програма автоматично підбирає так, щоб усі спостереження помістилися на екрані. Вибір іншого масштабу на осі ординат усуває цю проблему, але різко відрізняються спостереження у своїй залишаються поза екрана.

Допоміжні графіки.При аналізі часових рядів часто використовуються допоміжні графіки для числових характеристик ряду:

    графік вибіркової автокореляційної функції (корелограми) з довірчою зоною (трубкою) для нульової автокореляційної функції;

    графік вибіркової приватної автокореляційної функції з довірчою зоною для нульової приватної автокореляційної функції;

    графік періодограми.

Перші два з цих графіків дозволяють судити про зв'язок (залежності) сусідніх значень тимчасового рада, вони використовуються при доборі параметричних моделей авторегресії та ковзного середнього. Графік періодограми дозволяє судити про наявність гармонійних складових у часовому ряді.

Надіслати свою гарну роботу до бази знань просто. Використовуйте форму нижче

Студенти, аспіранти, молоді вчені, які використовують базу знань у своєму навчанні та роботі, будуть вам дуже вдячні.

Розміщено на http://www.allbest.ru/

Федеральне агентство з освіти

Волгоградський державний технічний університет

КОНТРОЛЬНАРОБОТА

з дисципліни: Модягли та методи в економіці

на тему «Аналіз часових рядів»

Виконав: студентка групи ЕЗБ 291с Селіванова О.В.

Волгоград 2010р.

Вступ

Класифікація часових рядів

Методи аналізу часових рядів

Висновок

Література

Вступ

Дослідження динаміки соціально-економічних явищ, виявлення та характеристика основних тенденцій розвитку та моделей взаємозв'язку дає основу для прогнозування, тобто визначення майбутніх розмірів економічного явища.

Особливо актуальними стають питання прогнозування за умов переходу на міжнародні системи та методики обліку та аналізу соціально-економічних явищ.

Важливе місце у системі обліку займають статистичні методи. Застосування та використання прогнозування передбачає, що закономірність розвитку, що діє у минулому, зберігається і прогнозованому майбутньому.

Таким чином, вивчення методів аналізу якості прогнозів сьогодні є дуже актуальним. Саме ця тема обрана як об'єкт дослідження у цій роботі.

Тимчасовий ряд - це впорядкована за часом послідовність значень деякої довільної змінної величини. Кожне окреме значення цієї змінної називається відліком часового ряду. Тим самим, тимчасовий ряд істотно відрізняється від простої вибірки даних.

Класифікація часових рядів

Тимчасові ряди класифікуються за такими ознаками.

1. За формою подання рівнів:

Ш ряди абсолютних показників;

Відносних показників;

середніх величин.

2. За характером часового параметра:

Шмоментні. У моментних часових рядах рівні характеризують значення показника за станом певні моменти часу. У інтервальних рядах рівні характеризують значення показника певні періоди часу.

Ш інтервальні тимчасові ряди. Важлива особливість інтервальних часових рядів абсолютних величин полягає у можливості підсумовування їх рівнів.

3. Відстань між датами та інтервалами часу:

Ш повні (рівновіддалені) - коли дати реєстрації або закінчення періодів йдуть один за одним з рівними інтервалами.

Ш неповні (не рівновіддалені) - коли принцип рівних інтервалів не дотримується.

4. Залежно від наявності основної тенденції:

Ш стаціонарні ряди - у яких середнє значення та дисперсія постійні.

Ш нестаціонарні – містять основну тенденцію розвитку.

Методи аналізу часових рядів

Тимчасові ряди досліджуються з різними цілями. У одному ряді випадках буває достатньо отримати опис характерних рис ряду, а іншому ряді випадків потрібно як прогнозувати майбутні значення часового ряду, а й управляти його поведінкою. Метод аналізу часового ряду визначається, з одного боку, цілями аналізу, з другого боку, імовірнісною природою формування його значень.

Методи аналізу часових рядів.

1. Спектральний аналіз. Дозволяє знаходити періодичні складові часового ряду.

2. Кореляційний аналіз. Дозволяє знаходити суттєві періодичні залежності та відповідні їм затримки (лаги) як усередині одного ряду (автокореляція), так і між кількома рядами. (кроскореляція)

3. Сезонна модель Бокса-Дженкінса. Застосовується коли тимчасовий ряд містить явно виражений лінійний тренд та сезонні складові. Дозволяє передбачати майбутні значення низки. Модель була запропонована у зв'язку з аналізом авіаперевезень.

4. Прогноз експоненційно зваженим ковзним середнім. Найпростіша модель прогнозування часового ряду. Застосовується у багатьох випадках. У тому числі охоплює модель ціноутворення на основі випадкових блукань.

Ціль спектрального аналізу- розкласти ряд на функції синусів і косінусів різних частот, визначення тих, поява яких особливо суттєво і значимо. Один із можливих способів зробити це - вирішити задачу лінійної множинної регресії, де залежна змінна - тимчасовий ряд, а незалежні змінні або регресори: функції синусів всіх можливих (дискретних) частот. Така модель лінійної множинної регресії може бути записана як:

x t = a 0 + (для k = 1 до q)

Наступне загальне поняття класичного гармонійного аналізу на цьому рівнянні - (лямбда) -це кругова частота, виражена в радіанах за одиницю часу, тобто. = 2** k , де константа пі = 3.1416 і k = k/q. Тут важливо усвідомити, що обчислювальна задача припасування функцій синусів і косінусів різних довжин до даних може бути вирішена за допомогою множинної лінійної регресії. Зауважимо, що коефіцієнти ak при косинусах і коефіцієнти bk при синусах - це коефіцієнти регресії, що показують ступінь, з яким відповідні функції корелюють з даними. Усього існує q різних синусів та косінусів; Інтуїтивно ясно, що число функцій синусів і косінусів не може бути більшим за кількість даних у ряді. Не вдаючись у подробиці, відзначимо, якщо n - кількість даних, то буде n/2+1 функцій косінусів та n/2-1 функцій синусів. Іншими словами, різних синусоїдальних хвиль буде стільки ж, скільки даних, і ви зможете повністю відтворити ряд основних функцій.

У результаті спектральний аналіз визначає кореляцію функцій синусів і косінусів різної частоти з даними, що спостерігаються. Якщо знайдена кореляція (коефіцієнт при певному синусі або косинус) велика, то можна зробити висновок, що існує строга періодичність на відповідній частоті в даних.

Аналіз розподілених лагів- це спеціальний метод оцінки запізнювальної залежності між рядами. Наприклад, припустимо, ви робите комп'ютерні програми і хочете встановити залежність між числом запитів, що надійшли від покупців, і числом реальних замовлень. Ви могли б записувати ці дані щомісяця протягом року і потім розглянути залежність між двома змінними: кількість запитів і кількість замовлень залежить від запитів, але залежить від запізнювання. Однак очевидно, що запити передують замовленням, тому можна очікувати кількість замовлень. Іншими словами, залежно між числом запитів та числом продажів є тимчасове зрушення (лаг) (див. також автокореляції та кроскореляції).

Такі залежності з запізненням особливо часто виникають в економетриці. Наприклад, дохід від інвестицій у нове обладнання чітко виявиться не відразу, а лише через певний час. Вищий дохід змінює вибір житла людьми; проте ця залежність, очевидно, теж проявляється із запізненням.

У всіх цих випадках є незалежна або пояснювальна змінна, яка впливає на залежні змінні з деяким запізненням (лагом). Метод розподілених лагів дозволяє досліджувати таку залежність.

Загальна модель

Нехай y - залежна змінна, a незалежна чи пояснююча x. Ці змінні вимірюються кілька разів протягом певного часу. У деяких підручниках з економетрики залежна змінна називається також ендогенною змінною, а залежна або пояснювана змінна екзогенною змінною. Найпростіший спосіб описати залежність між цими двома змінними дає наступне лінійне рівняння:

У цьому рівнянні значення залежної змінної момент часу t є лінійною функцією змінної x, виміряної моменти t, t-1, t-2 і т.д. Таким чином, залежна змінна є лінійними функціями x і x, зрушених на 1, 2, і т.д. тимчасові періоди. Бета коефіцієнти (i) можуть розглядатися як параметри нахилу у цьому рівнянні. Розглядатимемо це рівняння як спеціальний випадок рівняння лінійної регресії. Якщо коефіцієнт змінної з певним запізненням (лагом) значущий, можна зробити висновок, що змінна y передбачається (чи пояснюється) із запізненням.

Процедури оцінки параметрів та прогнозування, описані у розділі, припускають, що математична модель процесу відома. У реальних даних часто немає чітко виражених регулярних складових. Окремі спостереження містять значну помилку, тоді як ви хочете не лише виділити регулярні компоненти, а й побудувати прогноз. Методологія АРПСС, розроблена Бокс і Дженкінс (1976), дозволяє це зробити. Даний метод надзвичайно популярний у багатьох додатках, і практика підтвердила його потужність та гнучкість (Hoff, 1983; Pankratz, 1983; Vandaele, 1983). Однак через потужність та гнучкість, АРПСС - складний метод. Його не так просто використовувати, і потрібна велика практика, щоб оволодіти ним. Хоча часто він дає задовільні результати, вони залежить від кваліфікації користувача (Bails and Peppers, 1982). Наступні розділи познайомлять вас із його основними ідеями. Для тих, хто цікавиться коротким, розрахованим на застосування (нематематичним) введенням в АРПСС, рекомендуємо книгу McCleary, Meidinger, Hay (1980).

Модель АРПСС

Загальна модель, запропонована Боксом і Дженкінс (1976) включає як параметри авторегресії, так і параметри ковзного середнього. Саме, є три типи параметрів моделі: параметри автомобільної регресії (p), порядок різниці (d), параметри ковзного середнього (q). В позначеннях Бокса і Дженкінса модель записується як АРПСС (p, d, q). Наприклад, модель (0, 1, 2) містить 0 (нуль) параметрів авто регресії (p) і 2 параметри ковзного середнього (q), які обчислюються для ряду після взяття різниці з лагом 1.

Як зазначено раніше, для моделі АРПСС необхідно, щоб ряд був стаціонарним, це означає, що його середнє постійно, а вибіркова дисперсія та автокореляція не змінюються у часі. Тому зазвичай необхідно брати різниці ряду доти, доки він не стане стаціонарним (часто також застосовують логарифмічне перетворення для стабілізації дисперсії). Число різниць, які були взяті для досягнення стаціонарності, визначаються параметром d (див. попередній розділ). Для того, щоб визначити необхідний порядок різниці, потрібно дослідити графік ряду та автокорелограму. Сильні зміни рівня (сильні стрибки вгору чи вниз) зазвичай вимагають взяття несезонної різниці першого порядку (лаг=1). Сильні зміни нахилу вимагають взяття різниці другого порядку. Сезонна складова вимагає взяття відповідної сезонної різниці (див. нижче). Якщо є повільне зменшення вибіркових коефіцієнтів автокореляції залежно від лага, зазвичай беруть різницю першого порядку. Однак слід пам'ятати, що для деяких часових рядів потрібно брати різниці невеликого порядку або зовсім не брати їх. Зауважимо, що надмірна кількість взятих різниць призводить до менш стабільних оцінок коефіцієнтів.

На цьому етапі (який зазвичай називають ідентифікацією порядку моделі, див. нижче) ви також повинні вирішити, як багато параметрів авто регресії (p) і ковзного середнього (q) має бути присутнім в ефективній та економній моделі процесу. (Економність моделі означає, що в ній є найменша кількість параметрів та найбільша кількість ступенів свободи серед усіх моделей, що підганяються до даних). Насправді дуже рідко буває, що число параметрів p чи q більше 2 (див. нижче повніше обговорення).

Наступний, після ідентифікації, крок (Оцінювання) полягає в оцінюванні параметрів моделі (для чого використовуються процедури мінімізації функції втрат, див. нижче; докладнішу інформацію про процедури мінімізації наведено в розділі Нелінійне оцінювання). Отримані оцінки параметрів використовуються на останньому етапі (Прогноз), щоб обчислити нові значення ряду і побудувати довірчий інтервал для прогнозу. Процес оцінювання проводиться за перетвореними даними (підданим застосуванню оператора різниці). До побудови прогнозу необхідно виконати зворотну операцію (інтегрувати дані). Таким чином, прогноз методології порівнюватиметься з відповідними вихідними даними. На інтегрування даних вказує літера П у загальній назві моделі (АРПСС = Авто регресійне Проінтегроване Ковзне Середнє).

Додатково моделі АРПСС можуть містити константу, інтерпретація якої залежить від моделі, що підганяється. Саме, якщо (1) у моделі немає параметрів авто регресії, то константа є середнє значення ряду, якщо (2) параметри авто регресії є, то константа є вільним членом. Якщо бралася різниця ряду, то константа є середнім або вільним членом перетвореного ряду. Наприклад, якщо бралася перша різниця (різниця першого порядку), а параметрів автомобільної регресії в моделі немає, то константа є середнім значенням перетвореного ряду і, отже, коефіцієнт нахилу лінійного тренда вихідного.

Експонентне згладжування- це дуже популярний метод прогнозування багатьох часових лав. Історично метод був незалежно відкритий Броуном та Холтом.

Просте експоненційне згладжування

Проста і прагматично ясна модель часового ряду має такий вигляд:

де b – константа та (епсілон) – випадкова помилка. Константа b відносно стабільна на кожному інтервалі часу, але може також повільно змінюватися з часом. Один з інтуїтивно ясних способів виділення b полягає в тому, щоб використовувати згладжування ковзним середнім, в якому останнім спостереженням приписуються більші ваги, ніж передостаннім, передостаннім більші ваги, ніж передостаннім і т.д. Просте експонентне саме так і влаштовано. Тут більш старим спостереженням приписуються експоненційно спадні ваги, причому, на відміну ковзного середнього, враховуються всі попередні спостереження низки, а чи не ті, що потрапили у певне вікно. Точна формула простого експоненційного згладжування має такий вигляд:

S t = *X t + (1-)*S t-1

Коли ця формула застосовується рекурсивно, то кожне нове згладжене значення (яке є також прогнозом) обчислюється як виважене середнє поточного спостереження та згладженого ряду. Очевидно, що результат згладжування залежить від параметра (альфа). Якщо дорівнює 1, попередні спостереження повністю ігноруються. Якщо 0, то ігноруються поточні спостереження. Значення між 0, 1 дають проміжні результати.

Емпіричні дослідження Makridakis та ін. (1982; Makridakis, 1983) показали, що часто просте експоненційне згладжування дає досить точний прогноз.

Вибір найкращого значення параметра (альфа)

Gardner (1985) обговорює різні теоретичні та емпіричні аргументи на користь вибору певного параметра згладжування. Очевидно, з наведеної вище формули випливає, що повинно потрапляти в інтервал між 0 (нулем) і 1 (хоча Brenner et al., 1968, для подальшого застосування аналізу АРПСС вважають, що 0<<2). Gardner (1985) сообщает, что на практике обычно рекомендуется брать меньше.30. Однако в исследовании Makridakis et al., (1982), большее.30, часто дает лучший прогноз. После обзора литературы, Gardner (1985) приходит к выводу, что лучше оценивать оптимально по данным (см. ниже), чем просто "гадать" или использовать искусственные рекомендации.

Оцінювання найкращого значення за допомогою даних. Насправді параметр згладжування часто шукається з пошуком на сітці. Можливі параметри розбиваються сіткою з певним кроком. Наприклад, розглядається сітка значень від = 0.1 до = 0.9 з кроком 0.1. Потім вибирається, для якого сума квадратів (або середніх квадратів) залишків (спостерігаються мінус прогнози на крок вперед) є мінімальною.

Індекси якості припасування

Найпряміший спосіб оцінки прогнозу, отриманого на основі певного значення - побудувати графік значень, що спостерігаються, і прогнозів на один крок вперед. Цей графік включає також залишки (відкладені на правій осі Y). З графіка ясно видно, на яких ділянках прогноз кращий чи гірший.

Така візуальна перевірка точності прогнозу часто дає найкращі результати. Існують також інші заходи помилки, які можна використовувати для визначення оптимального параметра (див. Makridakis, Wheelwright, and McGee, 1983):

Середня помилка. Середня помилка (СО) обчислюється простим усереднення помилок на кожному кроці. Очевидним недоліком цього заходу є те, що позитивні та негативні помилки анулюють одна одну, тому вона не є добрим індикатором якості прогнозу.

Середня абсолютна помилка. Середня абсолютна помилка (САО) обчислюється як середня абсолютна помилка. Якщо вона дорівнює 0 (нулю), то маємо досконале припасування (прогноз). У порівнянні із середньою квадратичною помилкою, цей захід "не надає надто великого значення" викидам.

Сума квадратів помилок (SSE), середньоквадратична помилка. Ці величини обчислюються як сума (чи середня) квадратів помилок. Це найчастіше використовувані індекси якості припасування.

Відносна помилка (ГО). У попередніх заходах використовувалися дійсні значення помилок. Звісно ж природним висловити індекси якості припасування у термінах відносних помилок. Наприклад, при прогнозі місячних продажів, які можуть сильно флуктуювати (наприклад, за сезонами) з місяця на місяць, ви можете бути цілком задоволені прогнозом, якщо він має точність? 10%. Іншими словами, при прогнозуванні абсолютна помилка може бути не така цікава як відносна. Щоб зважити на відносну помилку, було запропоновано кілька різних індексів (див. Makridakis, Wheelwright, and McGee, 1983). У першому відносна помилка обчислюється як:

ГО t = 100 * (X t - F t) / X t

де X t - значення, що спостерігається в момент часу t, і F t - прогноз (згладжене значення).

Середня відносна помилка (СОВ). Це значення обчислюється як середнє відносних помилок.

Середня абсолютна відносна помилка (САОВ). Як і у випадку зі звичайною середньою помилкою, негативні та позитивні відносні помилки будуть пригнічувати один одного. Тому для оцінки якості припасування в цілому (для всього ряду) краще використовувати середню абсолютну відносну помилку. Часто ця міра виразніша, ніж середньоквадратична помилка. Наприклад, знання те, що точність прогнозу ±5%, корисно саме собою, тоді як значення 30.8 для середньої квадратичної помилки може бути так просто проінтерпретовано.

Автоматичний пошук найкращого параметра. Для мінімізації середньої квадратичної помилки, середньої абсолютної помилки або середньої абсолютної відносної помилки використовується квазіньютонівська процедура (та ж, що і в АРПСС). У більшості випадків ця процедура більш ефективна, ніж звичайний перебір на сітці (особливо якщо параметрів згладжування кілька), і оптимальне значення можна швидко знайти.

Перше згладжене значення S0. Якщо ви знову поглянете на формулу простого експоненційного згладжування, то побачите, що слід мати значення S 0 для обчислення першого згладженого значення (прогнозу). Залежно від вибору параметра (зокрема, якщо близько 0), початкове значення згладженого процесу може мати істотний вплив прогноз для багатьох наступних спостережень. Як і в інших рекомендаціях щодо застосування експонентного згладжування, рекомендується брати початкове значення, що дає найкращий прогноз. З іншого боку, вплив вибору зменшується з довжиною низки і стає некритичним за великої кількості спостережень.

економічний тимчасовий ряд статистичний

Висновок

Аналіз часових рядів - сукупність математико-статистичних методів аналізу, призначених виявлення структури часових рядів та їх прогнозу. Сюди належать, зокрема, методи регресійного аналізу. Виявлення структури часового ряду необхідне у тому, щоб побудувати математичну модель того явища, що є джерелом аналізованого часового ряду. Прогноз майбутніх значень часового ряду використовується для ефективного ухвалення рішень.

Тимчасові ряди досліджуються з різними цілями. Метод аналізу часового ряду визначається, з одного боку, цілями аналізу, з другого боку, імовірнісною природою формування його значень.

Основними методами дослідження часових рядів є:

Спектральний аналіз.

Ш Кореляційний аналіз

Сезонна модель Бокса-Дженкінса.

Прогноз експоненційно зваженим ковзним середнім.

Література

1. Безручко Б. П., Смирнов Д. А. Математичне моделювання та хаотичні часові ряди. - Саратов: ДержУНЦ "Коледж", 2005. - ISBN 5-94409-045-6

2. Блехман І. І., Мишкіс А. Д., Пановко Н. Г., Прикладна математика: Предмет, логіка, особливості підходів. Із прикладами з механіки: Навчальний посібник. - 3-тє вид., Випр. та дод. - М.: УРСС, 2006. - 376 с. ISBN 5-484-00163-3

3. Введення у математичне моделювання. Навчальний посібник. За ред. П. В. Трусова. - М.: Логос, 2004. - ISBN 5-94010-272-7

4. Горбань А. Н., Хлібопрос Р. Г., Демон Дарвіна: Ідея оптимальності та природний відбір. - М: Наука. Гол ред. фіз.-мат. літ., 1988. - 208 с. (Проблеми науки та технічного прогресу) ISBN 5-02-013901-7 (Глава «Виготовлення моделей»).

5. Журнал Математичне моделювання (заснований у 1989 році)

6. Малков С. Ю., 2004. Математичне моделювання історичної динаміки: підходи та моделі // Моделювання соціально-політичної та економічної динаміки / Ред. М. Г. Дмитрієв. - М.: РДСУ. - с. 76-188.

7. Мишкіс А. Д., Елементи теорії математичних моделей. - 3-тє вид., Випр. - М.: КомКнига, 2007. - 192 з ISBN 978-5-484-00953-4

8. Самарський А. А., Михайлов А. П. Математичне моделювання. Ідеї. Методи. Приклади.. - 2-ге вид., випр.. - М.: Фізматліт, 2001. - ISBN 5-9221-0120-X

9. Рад Б. Я., Яковлєв С. А., Моделювання систем: Навч. для вузів - 3-тє вид., перераб. та дод. - М.: Вищ. шк., 2001. - 343 с. ISBN 5-06-003860-2

Розміщено на Allbest.ru

Подібні документи

    Поняття та основні етапи розробки прогнозу. Завдання аналізу часових рядів. Оцінка стану та тенденцій розвитку прогнозування на основі аналізу часових рядів СУ-167 ВАТ "Мозирпромбуд", практичні рекомендації щодо його вдосконалення.

    курсова робота , доданий 01.07.2013

    Методика проведення аналізу динамічних лав соціально-економічних явищ. Компоненти, що формують рівні під час аналізу рядів динаміки. Порядок складання моделі експорту та імпорту Нідерландів. рівні автокореляції. Кореляція рядів динаміки.

    курсова робота , доданий 13.05.2010

    Методи аналізу структури часових рядів, що містять сезонні коливання. Розгляд підходу методом ковзної середньої та побудова адитивної (або мультиплікативної) моделі часового ряду. Розрахунок оцінок сезонної компоненти у мультиплікативній моделі.

    контрольна робота , доданий 12.02.2015

    Аналіз системи показників, що характеризують як адекватність моделі, і її точність; визначення абсолютної та середньої помилок прогнозу. Основні показники динаміки економічних явищ, використання середніх значень для згладжування часових рядів.

    контрольна робота , доданий 13.08.2010

    Сутність та відмінні риси статистичних методів аналізу: статистичне спостереження, угруповання, аналізу рядів динаміки, індексний, вибірковий. Порядок проведення аналізу рядів динаміки, аналізу основної тенденції розвитку у лавах динаміки.

    курсова робота , доданий 09.03.2010

    Проведення експериментального статистичного дослідження соціально-економічних явищ та процесів Смоленської області на основі заданих показників. Побудова статистичних графіків, рядів розподілу, варіаційних рядів, їх узагальнення та оцінка.

    курсова робота , доданий 15.03.2011

    Види часових рядів. Вимоги до вихідної інформації. Описові показники динаміки соціально-економічних явищ. Прогнозування методом експоненційних середніх. Основні показники динаміки економічних показників.

    контрольна робота , доданий 02.03.2012

    Поняття та значення тимчасового ряду в статистиці, його структура та основні елементи, значення. Класифікація та різновиди часових рядів, особливості сфери їх застосування, відмінні характеристики та порядок визначення в них динаміки, стадії, ряди.

    контрольна робота , доданий 13.03.2010

    Визначення поняття цін на продукцію та послуги; принципи їхньої реєстрації. Розрахунок індивідуальних та загальних індексів вартості товарів. Сутність базових методів соціально-економічних досліджень - структурних середніх, рядів розподілу та рядів динаміки.

    курсова робота , доданий 12.05.2011

    Машинне навчання та статистичні методи аналізу даних. Оцінка точності прогнозування. Попередня обробка даних. Методи класифікації, регресії та аналізу часових рядів. Методи найближчих сусідів, опорних векторів, простору, що спрямовує.

Цілі аналізу часових рядів.При практичному вивченні часових рад на підставі економічних даних на певному проміжку часу економетрист повинен зробити висновки про властивості цього ряду та про ймовірнісний механізм, що породжує цей ряд. Найчастіше щодо тимчасових рядів ставляться такі цели:

1. Короткий (стислий) опис характерних особливостей ряду.

2. Підбір статистичної моделі, що описує часовий ряд.

3. Передбачення майбутніх значень з урахуванням минулих спостережень.

4. Управління процесом, що породжує тимчасовий ряд.

На практиці ці та подібні цілі досяжні далеко не завжди і далеко не повною мірою. Часто цьому перешкоджає недостатній обсяг спостережень через обмежений час спостережень. Ще частіше – статистична структура часового ряду, що змінюється з часом.

Стадії аналізу часових рядів. Зазвичай при практичному аналізі часових рядів послідовно проходять такі етапи:

1. Графічне подання та опис поведінки тимчасової ради.

2. Виділення та видалення закономірних складових тимчасового рада, що залежать від часу: тренду, сезонних та циклічних складових.

3. Виділення та видалення низько- або високочастотних складових процесу (фільтрація).

4. Дослідження випадкової складової часового ряду, що залишилася після видалення перерахованих вище складових.

5. Побудова (підбір) математичної моделі для опису випадкової складової та перевірка її адекватності.

6. Прогнозування майбутнього розвитку процесу, представленого тимчасовим рядом.

7. Дослідження взаємодій між різними часовими радами.

Методи аналізу часових рядів.Для вирішення цих завдань існує велика кількість різних методів. З них найбільш поширеними є такі:

1. Кореляційний аналіз, що дозволяє виявити суттєві періодичні залежності та їх лаги (затримки) усередині одного процесу (автокореляція) або між декількома процесами (кроскореляція).

2. Спектральний аналіз, що дозволяє знаходити періодичні та квазіперіодичні складові тимчасового ряду.

3. Згладжування та фільтрація, призначені для перетворення часових рядів з метою видалення з них високочастотних або сезонних коливань.

5. Прогнозування, що дозволяє на основі підібраної моделі поведінки тимчасового рада передбачати його значення у майбутньому.

Моделі тренду та методи його виділення з часового ряду

Найпростіші моделі тренду.Наведемо моделі трендів, що найчастіше використовуються при аналізі економічних часових рядів, а також у багатьох інших областях. По-перше, це проста лінійна модель

де а 0 , а 1- Коефіцієнти моделі тренду;

t – час.

Як одиниця часу може бути годину, день (добу), тиждень, місяць, квартал або рік. Модель 3.1. незважаючи на свою простоту, виявляється корисною у багатьох реальних завданнях. Якщо нелінійний характер тренду очевидний, то може підійти одна з таких моделей:

1. Поліноміальна :

(3.2)

де значення ступеня полінома пу практичних завданнях рідко перевищує 5;

2. Логарифмічна:

Ця модель найчастіше застосовується даних, мають тенденцію зберігати постійні темпи приросту;

3. Логістична :

(3.4)

Гомперця

(3.5)

Дві останні моделі задають криві тренди S-подібної форми. Вони відповідають процесам з поступово зростаючими темпами зростання в початковій стадії і поступово загасаючими темпами зростання в кінці. Необхідність подібних моделей зумовлена ​​неможливістю багатьох економічних процесів тривалий час розвиватися з постійними темпами зростання або за поліноміальними моделями у зв'язку з їх досить швидким зростанням (або зменшенням).

При прогнозуванні тренд використовують насамперед для довгострокових прогнозів. Точність короткострокових прогнозів, заснованих тільки на підібраній кривій тренда, як правило, недостатня.

Для оцінки та видалення трендів з часових рядів найчастіше використовується метод найменших квадратів. Цей метод досить докладно розглядався у другому розділі посібника у завданнях лінійного регресійного аналізу. Значення часового ряду розглядають як відгук (залежну змінну), а час t- Як фактор, що впливає на відгук (незалежну змінну).

Для тимчасових рядів характерна взаємна залежністьйого членів (принаймні не далеко віддалених за часом) і це є істотною відмінністю від звичайного регресійного аналізу, для якого всі спостереження передбачаються незалежними. Тим не менш, оцінки тренду і в цих умовах зазвичай виявляються розумними, якщо обрано адекватну модель тренду і якщо серед спостережень немає викидів. Згадані вище порушення обмежень регресійного аналізу позначаються не так на значеннях оцінок, як на їх статистичних властивостях. Так, за наявності помітної залежності між членами часового ряду оцінки дисперсії, засновані на залишковій сумі квадратів (2.3), дають неправильні результати. Неправильними виявляються довірчі інтервали для коефіцієнтів моделі, тощо. У разі їх можна як дуже наближені.

Це положення може бути частково виправлено, якщо застосовувати модифіковані методи алгоритму найменших квадратів, такі як зважений метод найменших квадратів. Однак для цих методів потрібна додаткова інформація про те, як змінюється дисперсія спостережень або їх кореляція. Якщо така інформація недоступна, дослідникам доводиться застосовувати класичний метод найменших квадратів, попри зазначені недоліки.

16.02.15 Віктор Гаврилов

44859 0

Тимчасовим рядом називається послідовність значень, що змінюються у часі. Про деякі прості, але ефективні підходи до роботи з подібними послідовностями я спробую розповісти в цій статті. Прикладів таких даних можна зустріти дуже багато – котирування валют, обсяги продажу, звернення клієнтів, дані у різних прикладних науках (соціологія, метеорологія, геологія, спостереження у фізиці) та багато іншого.

Ряди є поширеною і важливою формою опису даних, оскільки дозволяють спостерігати всю історію зміни значення, що нас цікавить. Це дає нам можливість судити про «типову» поведінку величини та про відхилення від такої поведінки.

Переді мною постало завдання вибрати набір даних, на якому можна було б продемонструвати особливості тимчасових рядів. Я вирішив скористатися статистикою пасажиропотоку на міжнародних авіалініях, оскільки цей набір даних дуже наочний і став свого роду стандартним (http://robjhyndman.com/tsdldata/data/airpass.dat, джерело Time Series Data Library, RJ Hyndman). Ряд визначає кількість пасажирів міжнародних авіаліній на місяць (у тисячах) за період з 1949 по 1960 роки.

Оскільки в мене завжди під рукою, в якій є цікавий інструмент для роботи з рядами, я скористаюся саме ним. Перед імпортуванням даних у файл потрібно додати стовпець з датою, щоб прив'язувати значення часу, і стовпець з іменем ряду для кожного спостереження. Нижче видно, як виглядає мій вихідний файл, який я імпортував у Prognoz Platform за допомогою майстра імпорту безпосередньо із інструмента аналізу часових рядів.

Перше, що ми зазвичай робимо з тимчасовим рядом, відображаємо його на графіку. Prognoz Platform дозволяє побудувати графік, просто перетягнувши ряд в робочу книгу.

Тимчасовий ряд на графіку

Символ 'M' наприкінці імені ряду означає, що ряд має місячну динаміку (інтервал між спостереженнями дорівнює одному місяцю).

Вже з графіка бачимо, що ряд демонструє дві особливості:

  • тренд- На нашому графіку це довгострокове зростання значень, що спостерігаються. Видно, що тренд практично лінійний.
  • сезонність- На графіку це періодичні коливання величини. У наступній статті на тему часових рядів ми дізнаємося, як можна визначити період.

Наш ряд досить «акуратний», проте часто зустрічаються ряди, які, крім двох описаних вище характеристик, демонструють ще одну – наявність «шуму», тобто. випадкових варіацій у тій чи іншій формі. Приклад такого ряду можна побачити на графіці нижче. Це синусоїдальний сигнал, змішаний із випадковою величиною.

При аналізі рядів нас цікавить виявлення їхньої структури та оцінка всіх основних компонентів – тренду, сезонності, шуму та інших особливостей, а також можливість будувати прогнози зміни величини у майбутніх періодах.

Працюючи з рядами наявність шуму часто ускладнює аналіз структури ряду. Щоб унеможливити його вплив і краще побачити структуру ряду, можна використовувати методи згладжування рядів.

Найпростіший метод згладжування рядів – ковзне середнє. Ідея у тому, що з будь-якого непарного кількості точок послідовності ряду замінювати центральну точку на середнє арифметичне інших точок:

де x i- Вихідний ряд, s i- Згладжений ряд.

Нижче можна побачити результат застосування даного алгоритму до двох наших рядів. Prognoz Platform за промовчанням пропонує використовувати згладжування з розміром вікна в 5 точок ( kу нашій формулі вище дорівнюватиме 2). Зверніть увагу, що згладжений сигнал вже не так схильний до впливу шуму, проте разом з шумом, звичайно, пропадає і частина корисної інформації про динаміку ряду. Також видно, що згладжений ряд відсутні перші (і також останні) kточок. Це з тим, що згладжування виконується для центральної точки вікна (у разі для третьої точки), після чого вікно зсувається однією точку, і обчислення повторюються. Для другого, випадкового ряду я використовував згладжування з вікном рівним 30, щоб краще виявити структуру ряду, так як ряд «високочастотний», точок дуже багато.

Метод ковзного середнього має певні недоліки:

  • Ковзне середнє неефективне у обчисленні. Для кожної точки середнє необхідно перераховувати за новою. Ми не можемо перевикористати результат, обчислений для попередньої точки.
  • Ковзне середнє не можна продовжити на перші та останні точки ряду. Це може спричинити проблему, якщо нас цікавлять саме ці точки.
  • Ковзне середнє не визначено за межами ряду, і як наслідок, не може використовуватися для прогнозування.

Експонентне згладжування

Найбільш просунутий метод згладжування, який також можна використовувати для прогнозування – експоненційне згладжування, яке іноді називається методом Хольта-Уінтерса (Holt-Winters) на честь імен його творців.

Існує наскільки варіантів даного методу:

  • одинарне згладжування для рядів, у яких немає тренду та сезонності;
  • подвійне згладжування для рядів, які мають тренд, але немає сезонності;
  • потрійне згладжування для рядів, які мають і тренд, і сезонність.

Метод експонентного згладжування обчислює значення згладженого ряду шляхом оновлення значень, розрахованих на попередньому кроці, використовуючи інформацію з поточного кроку. Інформація з попереднього та поточного кроків береться з різними вагами, якими можна керувати.

У найпростішому варіанті одинарного згладжування таке співвідношення:

Параметр α визначає співвідношення між незгладженим значенням на поточному кроці та згладженим значенням з попереднього кроку. При α =1 ми братимемо лише точки вихідного ряду, тобто. ніякого згладжування не буде. При α =0 ряд ми братимемо лише згладжені значення з попередніх кроків, тобто. ряд перетвориться на константу.

Щоб зрозуміти, чому згладжування називається експоненційним, нам потрібно розкрити співвідношення рекурсивно:

Зі співвідношення видно, що всі попередні значення ряду роблять внесок у поточне згладжене значення, однак їхній внесок згасає експоненційно за рахунок зростання ступеня параметра α .

Однак, якщо в даних є тренд, просте згладжування «відставатиме» від нього (або доведеться брати значення α близькими до 1, але тоді згладжування буде недостатнім). Потрібно використовувати подвійне експонентне згладжування.

Подвійне згладжування використовує вже два рівняння – одне рівняння оцінює тренд як різницю між поточним та попереднім згладженим значеннями, потім згладжує тренд простим згладжуванням. Друге рівняння виконує згладжування як у випадку простого варіанту, але у другому доданку використовується сума попереднього згладженого значення та тренду.

Потрійне згладжування включає ще один компонент - сезонність і використовує ще одне рівняння. При цьому розрізняються два варіанти сезонного компонента - адитивний та мультиплікативний. У першому випадку амплітуда сезонного компонента стала і з часом не залежить від базової амплітуди ряду. У другому випадку амплітуда змінюється разом із зміною базової амплітуди низки. Це якраз наш випадок, як видно із графіка. Зі зростанням низки амплітуда сезонних коливань зростає.

Так як наш перший ряд має і тренд, і сезонність, вирішив підібрати параметри потрійного згладжування для нього. У Prognoz Platform це досить просто зробити, тому що при оновленні значення параметра платформа відразу перемальовує графік згладженого ряду, і візуально можна відразу побачити, наскільки добре він описує вихідний ряд. Я зупинився на наступних значеннях:

Як я вирахував період, ми розглянемо в наступній статті про тимчасові ряди.

Зазвичай як перші наближення можна розглядати значення між 0,2 і 0,4. Prognoz Platform також використовує модель із додатковим параметром ɸ що демпфує тренд так, що він наближається до константи в майбутньому. Для ɸ я взяв значення 1, що відповідає звичайній моделі.

Також я зробив прогноз значень низки даним методом на останні 2 роки. На малюнку нижче я помітив точку початку прогнозу, провівши через неї межу. Як видно, вихідний ряд і згладжений дуже непогано збігаються, в тому числі і на період прогнозування - непогано для такого простого методу!

Prognoz Platform також дозволяє автоматично підібрати оптимальні значення параметрів, використовуючи систематичний пошук у просторі значень параметрів та мінімізуючи суму квадратів відхилень згладженого ряду від вихідного.

Описані методи дуже прості, їх легко застосовувати, і вони є гарною відправною точкою для аналізу структури та прогнозування часових рядів.

Ще більше про тимчасові ряди читайте у наступній статті.



Останні матеріали розділу:

Есперанто - мова міжнародного спілкування
Есперанто - мова міжнародного спілкування

Місто населяли білоруси, поляки, росіяни, євреї, німці, литовці. Люди різних національностей нерідко ставилися один до одного з підозрами і навіть...

Методи обчислення визначників
Методи обчислення визначників

У випадку правило обчислення визначників $n$-го порядку є досить громіздким. Для визначників другого та третього порядку...

Теорія ймовірності та математична статистика
Теорія ймовірності та математична статистика

Математика включає безліч областей, однією з яких, поряд з алгеброю і геометрією, є теорія ймовірності. Існують терміни,...