Регресійний аналіз

Характеристики варіації даних

Мінімум - найменше значення вибірки .

Максимум - найбільше значення вибірки .

Розмах - різниця між найбільшим і найменшим значеннями вибірки .

Дисперсія - це середнє арифметичне квадратів відхилень значень від їх середнього .

Стандартне відхилення - квадратний корінь з дисперсії вибірки - міра того , наскільки широко розкидані точки даних відносно їх середнього .

Характеристики варіації даних

Ексцес показує " гостроту піку" розподілу , характеризує відносну загостреним або згладженість розподілу порівняно з нормальним розподілом. Позитивний ексцес - пік загострений. Негативний ексцес -пік закруглений.

Якщо ексцес істотно відрізняється від нуля , то розподіл має або більше закруглений пік , ніж нормальне , або , навпаки , має більш гострий пік (можливо , є кілька піків ) . Ексцес нормального розподілу дорівнює нулю.

Асиметрія або асиметричність показує відхилення розподілу від симетричного . Якщо асиметрія істотно відрізняється від нуля , то розподіл несиметрично , нормальний розподіл абсолютно симетрично. Якщо розподіл має довгий правий хвіст , асиметрія позитивна; якщо довгий лівий хвіст - негативна.

Викиди ( outliers ) - дані , що різко відрізняються від основного числа даних.

Розглянемо коротко етапи регресійного аналізу .

1. Формулювання завдання. На цьому етапі формуються попередні гіпотези про залежність досліджуваних явищ.

2. Визначення залежних і незалежних (пояснюючих ) змінних.

3. Збір статистичних даних. Дані повинні бути зібрані для кожної з змінних, включених у регресійну модель.

4. Формулювання гіпотези про форму зв'язку (проста або множинна, лінійна або нелінійна ).

5. Визначення функції регресії ( полягає в розрахунку чисельних значень параметрів рівняння регресії)

6. Оцінка точності регресійного аналізу .

7. Інтерпретація отриманих результатів. Отримані результати регресійного аналізу порівнюються з попередніми гіпотезами. Оцінюється коректність і правдоподібність отриманих результатів.

8. Передбачення невідомих значень залежної змінної.

Завдання регресійного аналізу

• встановлення форми залежності

• визначення функції регресії

• оцінка невідомих значень залежної змінної.

Рішення завдання в MS Excel
Для вирішення завдання регресійного аналізу в MS Excel вибираємо в меню Сервіс " Пакет аналізу" і інструмент аналізу " Регресія " . Задаємо вхідні інтервали X і Y.

Вхідний інтервал Y - це діапазон залежних аналізованих даних , він повинен включати один стовпець. Вхідний інтервал X - це діапазон незалежних даних , які необхідно проаналізувати. Число вхідних діапазонів повинно бути не більше 16 .