Регресійний аналіз
Характеристики варіації даних
Мінімум - найменше значення вибірки .
Максимум - найбільше значення вибірки .
Розмах - різниця між найбільшим і найменшим значеннями вибірки .
Дисперсія - це середнє арифметичне квадратів відхилень значень від їх середнього .
Стандартне відхилення - квадратний корінь з дисперсії вибірки - міра того , наскільки широко розкидані точки даних відносно їх середнього .
Характеристики варіації даних
Ексцес показує " гостроту піку" розподілу , характеризує відносну загостреним або згладженість розподілу порівняно з нормальним розподілом. Позитивний ексцес - пік загострений. Негативний ексцес -пік закруглений.
Якщо ексцес істотно відрізняється від нуля , то розподіл має або більше закруглений пік , ніж нормальне , або , навпаки , має більш гострий пік (можливо , є кілька піків ) . Ексцес нормального розподілу дорівнює нулю.
Асиметрія або асиметричність показує відхилення розподілу від симетричного . Якщо асиметрія істотно відрізняється від нуля , то розподіл несиметрично , нормальний розподіл абсолютно симетрично. Якщо розподіл має довгий правий хвіст , асиметрія позитивна; якщо довгий лівий хвіст - негативна.
Викиди ( outliers ) - дані , що різко відрізняються від основного числа даних.
Розглянемо коротко етапи регресійного аналізу .
1. Формулювання завдання. На цьому етапі формуються попередні гіпотези про залежність досліджуваних явищ.
2. Визначення залежних і незалежних (пояснюючих ) змінних.
3. Збір статистичних даних. Дані повинні бути зібрані для кожної з змінних, включених у регресійну модель.
4. Формулювання гіпотези про форму зв'язку (проста або множинна, лінійна або нелінійна ).
5. Визначення функції регресії ( полягає в розрахунку чисельних значень параметрів рівняння регресії)
6. Оцінка точності регресійного аналізу .
7. Інтерпретація отриманих результатів. Отримані результати регресійного аналізу порівнюються з попередніми гіпотезами. Оцінюється коректність і правдоподібність отриманих результатів.
8. Передбачення невідомих значень залежної змінної.
Завдання регресійного аналізу
• встановлення форми залежності
• визначення функції регресії
• оцінка невідомих значень залежної змінної.
Рішення завдання в MS Excel
Для вирішення завдання регресійного аналізу в MS Excel вибираємо в меню Сервіс " Пакет аналізу" і інструмент аналізу " Регресія " . Задаємо вхідні інтервали X і Y.
Вхідний інтервал Y - це діапазон залежних аналізованих даних , він повинен включати один стовпець. Вхідний інтервал X - це діапазон незалежних даних , які необхідно проаналізувати. Число вхідних діапазонів повинно бути не більше 16 .