C2-критерий Пирсона

Выявление различий в распределении признака

 

Каждый ряд данных, полученных нами в результате диагностики, может быть описан с точки зрения распределения (см. подробнее стр. 42). Если мы докажем, что распределения (в двух группах одного и того же параметра; в одной группе разных параметров) статистически достоверно различаются, это может стать основой для построения классификации задач, типологии испытуемых. Методы выявления различий в распределении признака незаменимы в двух случаях:

1) в задачах, требующих доказательства неслучайности предпочтений в выборе из нескольких альтернатив (например, учитель делает замечания статистически достоверно чаще неуспевающим школьникам, чем успевающим);

2) в задачах, требующих обнаружения точки максимального расхождения между двумя распределениями, которая затем используется для перегруппировки данных с целью применения критерия φ* углового преобразования Фишера (например, активность детей в начале четверти достоверно выше, чем в конце четверти).

 

 

Данный критерий отвечает на вопрос о том, с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях. Данный метод позволяет сопоставлять распределения признаков, представленных в любой шкале, начиная от шкалы наименований. В тех случаях, когда признак измеряется количественно, возможно, придется объединить все обилие значений признака в несколько разрядов. Например, если время выполнения задания варьируется от10 до 350 секунд, то мы можем ввести 5 – 10 разрядов и сопоставлять частоты встречаемости разных разрядов признака (о том, как это сделать читай на странице 40).

Возможны два варианта статистических гипотез, на каждый из которых мы рассмотрим пример.

Гипотезы:

Первый вариант:

Н0: Полученное эмпирическое распределение признака не отличается от теоретического (например, равномерного) распределения.

Н1: Полученное эмпирическое распределение признака отличается от теоретического распределения.

Второй вариант:

Н0: Эмпирическое распределение 1 не отличается от эмпирического распределения 2.

Н1: Эмпирическое распределение 1 отличается от эмпирического распределения 2.

У данного критерия есть ряд ограничений:

1. Объем выборки должен быть достаточно большим, n ≥ 30. Причем, n может быть не только количество испытуемых, но и количество наблюдаемых реакций.

2. Теоретическая частота для каждой ячейки таблицы не должна быть меньше 5: f≥5. Например, если количество разрядов k (испытуемые, дни недели и т.п.) задано, то минимальное число наблюдений (nmin) определяется по формуле nmin= k ∙ 5.

3. Выбранные разряды должны охватывать все значения признака и быть одинаковыми в сопоставляемых распределениях.

4. Разряды должны быть неперекрещивающимися, т.е. если наблюдение отнесли к одному разряду, то его уже нельзя отнести к другому разряду.