Парная линейная регрессия. Метод наименьших квадратов
Пусть установлено наличие статистически значимой зависимости между физическими величинами и . Тогда эту зависимость можно аппроксимировать эмпирической формулой. Термин «аппроксимировать» имеет смысл «приближенно описать». Термины – «эмпирическая формула», «аппроксимирующая формула», «уравнение регрессии» имеют примерно одинаковое значение. Эмпирическая формула – это формула, полученная путем описания эмпирических (экспериментальных) данных.
Результаты экспериментов представляют в виде таблицы:
Независимая переменная (фактор) | … | … | |||||
Экспериментальные значения функции отклика | … | … |
Здесь - объем выборки (число опытов), ; например, - продолжительность жизни человека (годы); - количество выкуриваемых в день сигарет (штук). Другой пример: - предел прочности металла (МПа); - температура нагрева металла ().
Выбор вида формулы для описания зависимости начинают с нанесения опытных значений и на график. Формула может быть линейной, квадратичной, степенной. Вид формулы подбирают по общему расположению опытных точек на графике. Пусть точки группируются около прямой линии. Тогда зависимость можно аппроксимировать линейным уравнением регрессии:
, (1)
где - расчетные (по уравнению (1)) значения, и - коэффициенты регрессии. Новое обозначение «» указывает, что формула (1) отображает с некоторой вероятностью экспериментальную зависимость (- исходные экспериментальные значения). Формула (1) является уравнением парной регрессии, так как зависит от одного фактора , т.е. рассматривается пара -.
Коэффициенты и неизвестны и определяются по парам экспериментальных значений с помощью метода наименьших квадратов (МНК).
Суть МНК: коэффициенты регрессии и определяют из условия, что
сумма квадратов отклонений () опытных значений от рассчитанных по
формуле (1) должна быть минимальной:
, (2)
где - остатки (отклонения; см. рис. 1). Здесь и далее
Рис. 1. Графическая иллюстрация МНК
Для вычисления и , минимизирующих , необходимо вычислить частные производные функции по аргументам и и приравнять их нулю:
; . (3)
Подставим в (3) из выражения (2) и вычислим производную по правилу дифференцируемой сложной функции:
(4)
Преобразуем (4):
(5)
Систему (5) принято называть системой нормальных уравнений. Решаем линейные системы уравнений (5) относительно неизвестных и методом определителей (метод Крамера):
; ,
где , , - определители;
;
Пример. Имеются экспериментальные данные.
№ п/п | |||||||||
; ; ; ;
;
;
;
;
.
.
Например: .