Это экспериментальная программа курса по введению в визуализацию данных.
Цель курса – показать, какую роль играет визуализация данных в работе социального учёного. Визуализация будет рассмотрена в широком смысле: не только как прикладной навык создания изображений, показывающих распределения в данных, но и как важный инструмент для исследования и презентации научной работы, являющийся одновременно междисциплинарной областью и искусством. Мы рассмотрим, как визуализация используется в научном ремесле социальных учёных, каковы основные правила создания правильных графиков, что говорят современные исследования об визуальном восприятии, а также с помощью чего современный учёный делает визуализацию своих данных.
Курс рассчитан на 6 лекционных занятий и не требует от студентов самостоятельной работы.
Что такое визуализация и зачем она нужна? Три основные черты визуализаций. Краткая история визуализации данных. Ценность визуализации как возможность рассказать историю. Эксплоративная и доказательная задачи визуализации в научной работе. Примеры хорошей визуализации данных.
Презентация потерялась :(
Литература к занятию
Tufte Edward. The Visual Display of Quantitative Information. Chapter 1 & 2.
Healy Kieran. Data Visualization in Sociology. Annual Review of Sociology, 40:105–128
Steele & Iliinsky. Beautiful Visualization, any chapters
Принципы построения диаграмм. Обязательные элементы: легенда, подписи осей, масштаб. Типы диаграмм:
- Диаграмма рассеяния (scatterplot)
- Диаграмма распределения / гистограмма (histogram)
- «Ящик с усами» / диаграмма размаха (boxplot, box-and-whiskers)
- Столбиковая диаграмма (bar chart)
- Линейная диаграмма (временной ряд)
- Круговая диаграмма, или диаграмма-пирог (pie chart)
- Радиальная диаграмма
Примеры разных типов диаграмм в научных статьях. Как (не) нужно строить графики: правила и частые ошибки. Очень плохие графики.
Литература к занятию
Field A., Miles J., Field Z. Discovering Statistics Using R. Chapter 4. Exploring Data with Graphs.
Tufte Edward. The Visual Display of Quantitative Information. Chapter 5: Chartjunk.
Howard Wainer. How to Display Data Badly. The American Statistician, Vol. 38, No. 2 (May, 1984), pp. 137-147.
Karl Broman. Top ten worst graphs
Cleveland William, Elements of Graphing Data. Chapter 2: Principles of graph construction & Chapter 3: Graphical methods.
Когнитивные задачи и восприятие. Теории и эксперименты в области визуального восприятия. Прикладные выводы из исследований: как правильно делать визуализацию? Цветовые схемы и их выбор. Оформление таблиц. Презентации в PowerPoint: что с ними не так? Случай катастрофы шаттла «Коламбия». Оформление и вид презентаций и слайдов. Как рассказывать о своей научной работе?
Литература к занятию
Christopher G. Healey, James T. Enns. Attention and Visual Memory in Visualization and Computer Graphics. IEEE Transactions on visualization and computer graphics, Vol. 18, No. 7, July 2012.
Edward Tufte, The Cognitive Style of PowerPoint
Cleveland William, Elements of Graphing Data. Chapter 4: Graphical Perception
ColorBrewer: Selecting good color schemes for maps. Cindy Brewer.
Kennedy Elliott. 39 studies on human perception in 40 minutes @ Medium
Карты. Геоданные, нанесение данных на карту. Инструменты для визуализации географических данных. Разные типы проекций Земли. Онлайн-платформы для визуализации геоданных. Социально-сетевой анализ как способ визуализировать связи. Основы SNA: узлы, ребра, сила связи, основные сетевые показатели. Программы для визуализации сетей.
Литература к занятию
Adam Perer. Finding Beautiful Insights in the Chaos of Social Network Visualizations. In: Steele & Iliinsky. Beautiful Visualization
Место визуализации в исследовательском цикле. Роль популярных визуализаций в продвижении научных продуктов. Инструменты для визуализации данных: Excel, статистические пакеты (SPSS, Stata, R), онлайн-инструменты, профессиональные графические пакеты (Adobe Illustrator). Интерактивные визуализации: data-driven documents (D3). Публикация данных, кода и картинок. Воспроизводимость научных исследований. Разделение кода и данных. Коллаборативная работа и системы контроля версий. Открытость результатов и промежуточных продуктов исследования. Введение в R.
Литература к занятию
Healy Kieran. Data Visualization in Sociology. Annual Review of Sociology, 40:105–128
Healy Kieran. The Plain Person’s Guide to Plain Text Social Science
Reproducibility guide
Bostock et al. Data Driven Documents
Занятие будет посвящено основам манипуляций с данными и создания графиков в среде RStudio. Предполагается использование студентами ноутбуков с предустановленными R и RStudio.