C2-критерий Пирсона
Выявление различий в распределении признака
Каждый ряд данных, полученных нами в результате диагностики, может быть описан с точки зрения распределения (см. подробнее стр. 42). Если мы докажем, что распределения (в двух группах одного и того же параметра; в одной группе разных параметров) статистически достоверно различаются, это может стать основой для построения классификации задач, типологии испытуемых. Методы выявления различий в распределении признака незаменимы в двух случаях:
1) в задачах, требующих доказательства неслучайности предпочтений в выборе из нескольких альтернатив (например, учитель делает замечания статистически достоверно чаще неуспевающим школьникам, чем успевающим);
2) в задачах, требующих обнаружения точки максимального расхождения между двумя распределениями, которая затем используется для перегруппировки данных с целью применения критерия φ* углового преобразования Фишера (например, активность детей в начале четверти достоверно выше, чем в конце четверти).
Данный критерий отвечает на вопрос о том, с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях. Данный метод позволяет сопоставлять распределения признаков, представленных в любой шкале, начиная от шкалы наименований. В тех случаях, когда признак измеряется количественно, возможно, придется объединить все обилие значений признака в несколько разрядов. Например, если время выполнения задания варьируется от10 до 350 секунд, то мы можем ввести 5 – 10 разрядов и сопоставлять частоты встречаемости разных разрядов признака (о том, как это сделать читай на странице 40).
Возможны два варианта статистических гипотез, на каждый из которых мы рассмотрим пример.
Гипотезы:
Первый вариант:
Н0: Полученное эмпирическое распределение признака не отличается от теоретического (например, равномерного) распределения.
Н1: Полученное эмпирическое распределение признака отличается от теоретического распределения.
Второй вариант:
Н0: Эмпирическое распределение 1 не отличается от эмпирического распределения 2.
Н1: Эмпирическое распределение 1 отличается от эмпирического распределения 2.
У данного критерия есть ряд ограничений:
1. Объем выборки должен быть достаточно большим, n ≥ 30. Причем, n может быть не только количество испытуемых, но и количество наблюдаемых реакций.
2. Теоретическая частота для каждой ячейки таблицы не должна быть меньше 5: f≥5. Например, если количество разрядов k (испытуемые, дни недели и т.п.) задано, то минимальное число наблюдений (nmin) определяется по формуле nmin= k ∙ 5.
3. Выбранные разряды должны охватывать все значения признака и быть одинаковыми в сопоставляемых распределениях.
4. Разряды должны быть неперекрещивающимися, т.е. если наблюдение отнесли к одному разряду, то его уже нельзя отнести к другому разряду.