Проверка значимости коэффициентов регрессии
Напомним вид уравнения множественной линейной регрессии:
(1)
В программе «Регрессия» коэффициенты регрессии 
приведены в строке «Коэффициенты». Строка «Y-пересечение» - свободный член
; в других строка ниже:
(«Переменная Х1»);
(«Переменная Х2»). и т.д. Отметим, что на рис.2 приведен пример расчета парной регрессии
, которая является частным случаем множественной.
Возможна ситуация, когда часть вычисленных коэффициентов регрессии не обладает необходимой степенью значимости. В этом случае значения рассматриваемых коэффициентов будут меньше величины их стандартной ошибки.
Поэтому наряду с проверкой адекватности полученного уравнения регрессии в целом (по значимости коэффициента детерминации
) необходимо выполнить проверку значимости каждого коэффициента регрессии.
Проверку значимости коэффициентов регрессии выполняют с помощью
-критерия Стьюдента:
, (2)
где
- значение рассматриваемого коэффициента регрессии;
;
- стандартная ошибка (погрешность) коэффициента
;
- расчетное значение коэффициента Стьюдента.
Формула для определения
громоздкая и ее приводить не будем.
Коэффициент регрессии считается значимым при выполнении условия:
(3)
где
- табличное значение коэффициента Стьюдента, выбираемое в зависимости от уровня значимости
(обычно
) и степени свободы
. (4)
Здесь
- количество факторов 
;
- число экспериментальных данных. В Excel для определения
используется статистическая функция:
=СТЬДРАСПОБР(
;
).
В программе «Регрессия» значения
приведены в столбце «Стандартная ошибка»; значения
- в столбце «
-статистика». Вместо условия (3) в данной программе вычисляются значения уровней значимости
, соответствующие расчетным значениям
. Они приведены в столбце «Р-значения». Для определения
используется функция:
=СТЬЮДРАСП(
).
Если выполняется условие
, (5)
то коэффициент
считается значимым. Здесь
- заданный уровень значимости (обычно
).
Зная значения
можно найти границы доверительных интервалов для коэффициентов регрессии:

;
(6)
.
В программе «Регрессия»
приведены в столбце «Нижние 95%»;
- «Верхние 95%».
Если незначимым окажется свободный член
, то для пересчета уравнения регрессии без этого коэффициента в диалоговом окне «Регрессия» следует активировать флажок «Константы - ноль». В случае, если незначимым является коэффициент при факторном признаке 
, то следует исключить этот признак при задании уравнения регрессии.
Пример 1: получим уравнение множественной регрессии для зависимости функции
от двух факторов, т.е.
. Линейное уравнение имеет следующий вид:
.
Воспользуемся данными из таблицы п. 2.1. В этой табл.:
- уровень преступности (
);
- уровень образования (
);
- уровень безработицы (
).
Результаты расчетов по программе «Регрессия» приведены на рис. 3.

Рис. 3. Лист Excel с результатами работы программы «Регрессия»
(множественная регрессия)
Видно, что в целом уравнение значимо, но коэффициент
при переменной
не значим и его следует исключить из анализа (т.е. при обращении к программе не указывать массив
). Получив уравнение
увидим, что в целом качество этого нового уравнения регрессии повысится (получим большее значение «F» и, следовательно, меньшую величину «Значимость F»).
Пример 2: по данным таблицы получить уравнение
. Убедится, что не значим коэффициент
. Исключить его, т.е. получить уравнение вида:
. Выполнить самостоятельно.
| Номер предприятия | Прибыль, млн. руб. | Величина оборотных средств, млн. руб. | Стоимость основных фондов, млн. руб. |
|
|
| |