Визуализация данных: как выбрать график под задачу
Визуализация данных: как выбрать график под задачу
Занимаюсь исследованиями полного цикла: от постановки задачи до интерпретации результатов. Люблю находить закономерности в данных и переводить цифры в понятные выводы для бизнеса.
Руководитель проектов, Тибурон
Настя Федоренко
Визуализация данных — способ понятно донести результаты исследования. Одни и те же данные можно показать по-разному, и от выбранного формата зависит то, какой вывод сделает аудитория.
Корректный тип графика помогает быстро увидеть главное и принять решение, а неподходящий усложняет интерпретацию и снижает доверие к результатам.
В статье разбираем задачи визуализации и 11 форматов, которые их решают.
Задача: сопоставить по величине бренды, варианты ответа, сегменты.
В этой диаграмме шкалу оси важно начинать с нуля, чтобы не усиливать визуально различия между значениями.
Если данные представлены в процентах, шкалу стоит заканчивать на отметке 100%. При большом количестве категорий или длинных подписях лучше использовать горизонтальный формат, так данные читаются легче.
Точечная диаграмма (dot plot)
Задача: сравнить дискретные или категориальные значения (например, количество домашних животных у семей).
Точки выстраиваются в аккуратные линии или стопки. В отличие от столбчатой диаграммы, точечная показывает каждое значение отдельно, 1 точка = 1 значение. Такая диаграмма подходит для малых наборов данных.
Структура целого
Круговая диаграмма
Задача. Показать, из каких частей состоит целое и какова доля каждой.
Формат работает при небольшом количестве категорий, оптимально до пяти-шести, и при условии, что все значения суммарно дают 100%. Для отображения динамики или большого числа сегментов этот формат не подходит.
Шкалы и накопление
Столбчатая диаграмма с накоплением
Задачи: показать распределение ответов по шкале, а также общий итог и вклад каждой части.
Каждый столбец показывает полное распределение ответов внутри группы. Если привести все столбцы к 100%, группы разного размера становится удобно сравнивать напрямую.
Динамика
Линейный график
Задача: отобразить, как показатель менялся с течением времени.
На один график не стоит выводить слишком много линий: визуализация становится перегруженной и теряется фокус на ключевых изменениях.
Столбчатая диаграмма
Это другой способ показать изменения показателей во времени. Лучше всего применять, когда у вас не более восьми временных периодов.
Этапы процесса / конверсия
Воронка
Задача: отобразить последовательные этапы процесса и переход между ними.
Воронка подходит для визуализации пути клиента к покупке или пирамиды здоровья бренда, которая показывает уровни знания и пользования маркой.
Пересечение аудиторий
Диаграмма Эйлера
Задача: визуализировать пересечение аудиторий.
Важно учитывать, что при большем количестве пересечений схема становится сложной для восприятия и теряет наглядность.
Отклонение от опорной точки
Диаграмма «торнадо»
Задача: показать, насколько значения отклоняются от опорной точки и в каком направлении.
Опорной точкой может быть ноль, среднее по выборке, целевой показатель или нейтральная отметка на шкале.
Также этот формат часто применяют для визуализации индекса аффинити — он показывает, насколько целевая аудитория сконцентрирована в данном сегменте по сравнению со средним уровнем.
Диаграмма передает не только величину отклонения, но и его направление. Важно четко обозначить опорную отметку и сохранить единый масштаб для обеих сторон шкалы.
Карта показателей / квадрант-анализ
Диаграмма рассеяния (scatter plot)
Для построения карты показателей. Например, знание / покупка или удовлетворенность / лояльность.
В ней каждая точка соответствует одному объекту наблюдения — бренду, продукту или сегменту.
Если добавить на график средние значения по каждой оси, плоскость делится на четыре области для квадрант-анализа. Раскраска квадрантов помогает сразу считать, в какой зоне находится каждый объект.
Размер точки может кодировать третью переменную — например, размер бренда, долю рынка или объем аудитории. Это превращает диаграмму рассеяния в пузырьковую (bubble chart) и позволяет передать дополнительный слой информации без усложнения визуализации.
Сравнение по комплексу параметров
Радарная или лепестковая диаграмма (паутинка)
Задача: Сопоставить несколько брендов или сегментов по комплексу характеристик.
Каждая ось представляет отдельный параметр, значения отображаются относительно центральной точки.
Формат удобен для сравнения восприятия брендов по различным характеристикам.
Ключевое значение
Крупное число
Задача: передать результат без избыточных деталей.
Когда главный вывод — это одно число, сложная диаграмма не нужна. Крупно выведенное число с короткой подписью уместно в дашбордах и презентациях.
Правила выбора визуализации
Советы от автора
Выбор формата всегда начинается с формулировки мысли: что именно нужно показать. Ответ определяет задачу визуализации, а задача — формат.
Иногда таблица донесет результаты точнее, чем сложный график. Избыточное количество цветов, мелкий текст, 3D-эффекты и несколько смыслов в одном графике усложняют восприятие. Хороший график решает одну задачу и передает одну основную мысль.