Группировка данных. Вариационный ряд

Следующим шагом в изучении признака является группировка – разделение членов совокупности на группы, в которых члены совокупности принимают либо одни и те же значения, либо значения внутри определенного интервала. Способы группировки зависят от вида признака.

 

· Группировка данных качественного признака

Пример 2. При опросе туристической группы (20 человек) выяснено, что среди них 5 человек городские жители, 5 – сельские. Данные сгруппированы в Таблице 2 .

Таблица 2.

Группировка туристов по месту жительства.

Туристы городские сельские всего
Количество

· Для группировки данных в случае количественного дискретного признака располагают все варианты в порядке возрастания и указывают частоту, с которой они встречаются в данной совокупности.

Пример 3.Имеются данные об оценках 24 студентов, полученных ими на экзамене

Минимальное значение оценки хmin – 2, максимальное хmax – 5. Подсчитав частоту, с которой встречаются варианты, оформим таблицу (см. Таблицу 3).

Таблица 3.

хi ni

 

Таблица, позволяющая судить о распределении частот между вариантами, называется дискретным вариационным рядом.

· Группировка данных в случае количественного непрерывного признака (или дискретного признака, когда число вариант велико).

В этом случае строят интервальный вариационный ряд. Для построения интервального вариационного рядя определяют величину (ширину) интервала, составляют шкалу интервалов и в соответствии с ней группируют результаты наблюдений. Для определения ширины интервала используют формулу: где h – ширина интервала, хmin и хmax – минимальная и максимальная варианты, k – число групп; или формулу Стэрджеса, позволяющую определить оптимальную величину интервала Если h оказывается дробным числом, то за ширину интервала принимают либо ближайшее целое число, либо ближайшую несложную дробь. За начало первого интервала рекомендуется принимать величину, равную (хmin – h/2), второго интервала (xmin + h/2) и т.д. Построение интервалов продолжают до тех пор, пока начало следующего по порядку интервала не будет равным или больше хmax.

Для подсчета числа вариант, входящих в тот или иной интервал, удобно, просматривая последовательно статистические данные, проставлять черточки справа от соответствующего интервала. При этом в интервал включаются варианты больше левой границы и меньше или равные правой границе. Число вариант, попавших в один интервал, называется частотой интервала.

Пример 4. В результате измерения веса 25 кроликов различной породы были получены значения, представленные в таблице:

3,2 4,5 5,2 5,6 6,6
3,8 4,7 5,2 5,7 6,3
4,1 4,9 5,3 5,8 6,4
4,3 5,0 5,3 5,8 6,7
4,3 5,1 5,4 5,9 7,3

 

Из таблицы видно, что хmax = 7,3, xmin = 3,2. Определим величину интервала Можно взять h=1. тогда левой границей первого интервала будет число xmin – h/2=3,2-0,5=2,7.

Таблица 4.

Распределение кроликов по весу

Интервалы ni (частоты)
2.7-3.7
3.7-4.7
4.7-5.7
5.7-6.7
6.7-7.7

n = 25