Критерій згоди Пірсона (критерій ).
Нехай над дискретною випадковою величиною проведено
незалежних випробувань, результати яких зведені в інтервальний варіаційний ряд:
![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
Нехай відносні частоти
, що відповідають цьому інтервальному ряду.
Відповідний емпіричний розподіл:
![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
Нехай на основі аналізу емпіричного розподілу висунута гіпотеза про те, що теоретичний розподіл має вигляд і відповідна щільність є :
На основі цієї гіпотези будують теоретичний розподіл.
![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
де розраховуються на основі формул для відповідного теоретичного розподілу, тобто
, де
середина інтервалу
,
- крок.
Ймовірності називають емпіричними ймовірностями, а
теоретичними ймовірностями.
За міру розходжень між емпіричним і теоретичним розподілами вибирають число .
Вагові коефіцієнти вводяться тому, що одне і те саме відхилення
, взяте за модулем, може бути незначним, якщо ймовірність
велика, і значним якщо
мала. Тому треба взяти
обернено пропорційним ймовірностям
. Пірсон показав, якщо припустити, що
то при великих значеннях
закон розподілу величини
практично не залежить від функції розподілу
випадкової величини
і від числа випробувань
, а залежить тільки від числа інтервалів
і наближається до розподілу
з
ступенями свободи.
Нагадаємо, що у випадку коли кожна з незалежних випадкових величин
має нормований нормальний закон розподілу, то випадкова величина
матиме розподіл
з
ступенями свободи, щільність ймовірностей якої дорівнює
де гамма-функція.
При такому виборі коефіцієнтів міру розходження позначають через . Через
позначають емпіричні частоти, через
теоретичні частоти. Можна показати, що
.
Чим менше відрізняються емпіричні та теоретичні частоти, тим меншою є величина . Таким чином критерій
характеризує близькість теоретичного та емпіричного розподілів.
Алгоритм перевірки непараметричної статистичної гіпотези полягає в наступному:
1. задається рівень значимості
2. визначається число ступенів свободи де
число параметрів функції розподілу плюс одиниця.
3. По числам та
знаходиться число
. Для цього використовуються спеціальні таблиці, або функція Excel ХИ2ОБР
. Таблиця наведена у додатку.
4. На основі статистичних даних розраховується
5. У випадку якщо то гіпотеза
приймається, якщо
гіпотеза
відхиляється.