Исходные данные

Лекция 2. Рандомизация и мета анализ 10.09.12

Ненужных украшений (например, для диаграммы не

Делайте график простым, отказывайтесь от

Информацию

Постарайтесь уместить на графике всю нужную

На осях, сегментах и решетках должны быть

Информативным и недвусмысленным

Взаимосвязей между несколькими переменными

Исследование предположительно сложных

Наглядная визуализация результатов

Групп наблюдений

Выявление характерных зависимостей или

Применение лиц Чернова

Гистограмма –столбчатая диаграмма распределения частот для выбранной переменной.

Основное назначение: визуализация данных, разбитых на группы, для более точного и детального анализа

Используемые при визуальном анализе

Типы графиков, наиболее часто

Интерпретация значения величины.

1) Если отношение шансов =1, то шанс для первой группы равен шансу для второй группы

2) Если отношение шансов >1, то шанс для первой группы больше шанса для второй группы

3) Если отношение шансов <1, то шанс для первой группы меньше шанса для второй группы

■ Гистограмма (Frequency plot, Histogram, Bar chart)

■ График средних с ошибками (Error bar plot)

■ Диаграмма размаха (Box&whisker plot)

■ Диаграмма рассеяния (Scatter plot)

■ Диаграмма концентрации (Bag plot)

■ Диаграмма Вороного (Voronoi diagram)

■ Лица Чернова (Chernoff faces)

■ Категоризованные графики (Categorized plots)

заголовок графика должен быть кратким,

пометки; объясняйте значение символов

обязательно делать столбцы трехмерными)

Имеются данные о пациентах, поступивших в больницу для трансплантации сердца. Таблица с данными имеет вид:

Рис 1. Исходный файл данных

Первые три столбца в этой таблице есть даты трансплантации сердца (в следующей последовательности: месяц-день-год), 4, 5 и 6 столбцы - даты, когда соответствующий пациент либо умер, либо был изъят из наблюдения (иными словами, цензурирован, например, с пациентом была утрачена связь).

Переменная Цензурировано - Censored является индикатором цензурирования с кодом, который показывает, является соответствующее наблюдение завершенным или цензурированным (0-завершенно, т.е. пациент умер; 1-цензурированное). Переменная Age – возраст пациента, Antigen – показатель несовместимости антигенов, Mismatch – степень несовместимости тканей.

Переменная Hospital представляет собой фиктивную группирующую переменную, которая показывает, к какой из трех больниц относится пациент.