Исходные данные
Лекция 2. Рандомизация и мета анализ 10.09.12
Ненужных украшений (например, для диаграммы не
Делайте график простым, отказывайтесь от
Информацию
Постарайтесь уместить на графике всю нужную
На осях, сегментах и решетках должны быть
Информативным и недвусмысленным
Взаимосвязей между несколькими переменными
Исследование предположительно сложных
Наглядная визуализация результатов
Групп наблюдений
Выявление характерных зависимостей или
Применение лиц Чернова
Гистограмма –столбчатая диаграмма распределения частот для выбранной переменной.
Основное назначение: визуализация данных, разбитых на группы, для более точного и детального анализа
Используемые при визуальном анализе
Типы графиков, наиболее часто
Интерпретация значения величины.
1) Если отношение шансов =1, то шанс для первой группы равен шансу для второй группы
2) Если отношение шансов >1, то шанс для первой группы больше шанса для второй группы
3) Если отношение шансов <1, то шанс для первой группы меньше шанса для второй группы
■ Гистограмма (Frequency plot, Histogram, Bar chart)
■ График средних с ошибками (Error bar plot)
■ Диаграмма размаха (Box&whisker plot)
■ Диаграмма рассеяния (Scatter plot)
■ Диаграмма концентрации (Bag plot)
■ Диаграмма Вороного (Voronoi diagram)
■ Лица Чернова (Chernoff faces)
■ Категоризованные графики (Categorized plots)
заголовок графика должен быть кратким,
пометки; объясняйте значение символов
обязательно делать столбцы трехмерными)
Имеются данные о пациентах, поступивших в больницу для трансплантации сердца. Таблица с данными имеет вид:
Рис 1. Исходный файл данных
Первые три столбца в этой таблице есть даты трансплантации сердца (в следующей последовательности: месяц-день-год), 4, 5 и 6 столбцы - даты, когда соответствующий пациент либо умер, либо был изъят из наблюдения (иными словами, цензурирован, например, с пациентом была утрачена связь).
Переменная Цензурировано - Censored является индикатором цензурирования с кодом, который показывает, является соответствующее наблюдение завершенным или цензурированным (0-завершенно, т.е. пациент умер; 1-цензурированное). Переменная Age – возраст пациента, Antigen – показатель несовместимости антигенов, Mismatch – степень несовместимости тканей.
Переменная Hospital представляет собой фиктивную группирующую переменную, которая показывает, к какой из трех больниц относится пациент.