Виды диаграмм, гистограмм и графиков для анализа данных с примерами
Визуализация данных помогает сравнивать и лучше воспринимать информацию — от финансовых показателей компании до результатов работы менеджера по продажам. Диаграммы, графики или гистограммы проиллюстрируют изменения намного лучше, чем сплошной текст без визуальных элементов. Рассказываем про основные типы диаграмм и для чего их используют.
Зачем нужна визуализация данных
Сегодня практически все компании работают с Big Data — а значит, массив информации нужно визуализировать в понятные графики и схемы для презентаций и отчетов. Создание диаграмм, гистограмм или других видов визуализации помогает систематизировать информацию, делает ее более понятной для восприятия аудитории.
Профессия / 12 месяцев
Аналитик данных
Находите закономерности и делайте выводы, которые помогут бизнесу
4 890 ₽/мес 8 150 ₽/мес
Визуализация данных — это любое графическое преобразование информации и аналитики: карты, схемы, круговые диаграммы и так далее. Просто цифры в документах не покажут взаимосвязь между процессами, зависимость определенных количественных показателей или временные отрезки роста и спада. Для бизнеса визуализация данных — незаменимый прием, который приведет огромное количество информации в упорядоченный вид, подчеркнет преимущества и сделает данные понятными для восприятия. Графическую передачу данных можно встретить практически на всех этапах бизнеса — от процесса найма до распределения бонусов лояльности клиентам.
Основные виды диаграмм
В работе аналитики используют различные способы и методы визуализации информации: карты, графики, схемы и дашборды. Рассмотрим наиболее распространенные варианты и расскажем, с какой задачей каждый из них может помочь.
Барчарт
Такой тип диаграммы состоит из вертикальных или горизонтальных прямоугольников разной длины. Есть два вида барчартов — столбчатые и линейчатые. Они взаимозаменяемы, все зависит от вводных данных и вашей цели.
Что показывает столбчатая или линейчатая диаграмма
Такая диаграмма помогает сравнивать несколько категорий на основании чисел. Получается, что каждый столбик — категория, а его длина должна отвечать на вопрос «Сколько?». Например, через барчарт можно показать динамику изменения количества жителей города или то, какой источник приносит больше целевых заявок на продукт. Обычно диаграммы используют для демонстрации положительных значений, однако можно показывать и отрицательные результаты. Столбцы или линейки ранжируются от большего значения к меньшему — а если наоборот, то получится рейтинг.
Особенности
Столбчатые и линейчатые барчарты выполняют одну задачу. Если названия для описания столбцов слишком длинные, лучше остановиться на горизонтальной диаграмме. Воспринимать информацию с такого слайда гораздо проще. Также помните, что ось в барчарте начинается с нуля, поэтому не стоит обрезать столбцы и начинать ось с наибольшего значения ваших данных.
Гистограмма
Внешне гистограмма схожа с барчартом, но задачи у них абсолютно разные. Гистограмма демонстрирует распределение одной переменной, где каждый столбец — определенный временной интервал. Особенно хорошо этот график поможет, если вам нужно показать частые колебания.
Что показывает гистограмма
Гистограмма визуализирует частоту определенных значений в наборе данных — например, показывает, сумку какого цвета чаще всего покупают, сколько времени подростки проводят в социальных сетях, или изменения температуры.
Особенности
- гистограмма бывает только вертикальной;
- между столбцами, как правило, нет промежутка или он небольшой.
Читайте также 8 понятий из математической статистики, без которых не обойтись дата-сайентисту
Пайчарт
Круговая диаграмма, или пайчарт — визуализация в виде круга, который разделен на несколько секторов. Представьте, что режете большой пирог — вот так и выглядит пайчарт.
Что показывает круговая диаграмма
Обычно ее используют для демонстрации доли от целого или процентного соотношения. Например, с помощью пайчарта можно визуализировать соотношение девочек и мальчиков в школе или распределение по уровню образования (колледж, бакалавриат, магистратура).
Особенности
Не спорим, что круговые диаграммы смотрятся очень эффектно и красиво, но все же с ними нужно быть аккуратнее. Они не всегда просты для восприятия.
Из-за формы диаграммы может быть сложно сравнить значения на глаз: если разница между 40 и 60% заметна, то между 48 и 52% — уже не так очевидна. В круг нельзя добавлять много значений, потому что доли получатся очень тонкими, их будет практически невозможно различить. Всегда держим в голове, что диаграмма должна нести практическую пользу.
Также важно помнить, что сумма значений всех «кусочков» пирога должна быть равна 100%, потому что диаграмма показывает значение доли от целого.
Линейная диаграмма
Линейная диаграмма демонстрирует динамику изменений данных в зависимости от разных факторов. В таком графике мы используем точки, или «маркеры», которые иллюстрируют информацию, и кривую, которая показывает изменения.
Что показывает линейная диаграмма
Этот вид графика идеально подойдет, если нужно показать изменения показателя за определенный временной отрезок. Например, можно продемонстрировать динамику продаж, численности населения и другие переменные. Диаграмма также отлично иллюстрирует резкие отклонения или скачки.
Особенности
Время на линейной диаграмме всегда отмечаем на горизонтальной оси, оно идет слева направо, то есть от старого к новому. Можно добавить больше одной переменной, но не стоит увлекаться различными цветами и дополнительными графиками. И очень важно: нужно следить за пропорциями графика, на нем должны быть видны резкие изменения в показателях.
Станьте аналитиком данных и получите востребованную специальность
Скаттерплот
Скаттерплот, или диаграмма рассеяния, визуализирует распределение элементов множества в одной плоскости между двумя переменными. За счет этого можно увидеть возможную зависимость одной от другой. У каждой точки на диаграмме есть две координаты — по оси X и Y. Обычно для визуального разграничения групп можно использовать точки разных цветов.
Что показывает диаграмма рассеяния
Скаттерплот подходит для демонстрации зависимости одного значения от другого. Например, когда нужно показать изменения количества пеших прогулок среди людей разного возраста. Также эти данные можно рассматривать в различных группах — например, среди жителей разных населенных пунктов.
Особенности
На горизонтальной оси нужно располагать независимую переменную, а на вертикальной — зависимую. Отметим, что корреляция не обязательно будет говорить, что переменные зависимы друг от друга и что одна из них точно воздействует на другую.
Главные принципы визуализации
Визуализация данных должна приносить практическую пользу, добавлять непонятные графики «для красоты» не стоит. Чтобы создать полезную, логичную и красивую визуализацию, важно придерживаться нескольких правил.
- У вас всегда должна быть цель. Прежде чем работать с инструментом, ответьте на вопросы: для чего этот график или диаграмма? Что именно вы демонстрируете через картинку? Не стоит делать схему ради схемы.
- Подбирайте инструментвизуализациипод вашиданныеи цель. Так, столбчатая диаграмма не подойдет для иллюстрации про долю рынка — в этом случае лучше выбрать круговую.
- Придерживайтесь единой стилистики. В вашем докладе или презентации должно быть единообразие, старайтесь все данные визуализировать в одном формате, иначе аудитория может запутаться.
- Диаграммаи текст — одно целое. Надо всегда держать в голове, что график и текст должны дополнять друг друга и быть единым целым. Поэтому все пояснения к визуализации нужно прописывать непосредственно на диаграмме или рядом.
- Меньше визуального шума. При составлении графиков лучше избегать дополнительного градиента и теней, сеток и отметок, большого количества текста. Чем меньше отвлекающих элементов, тем легче воспринимать информацию.
- Однадиаграммарешает только одну задачу. Не стоит визуализировать на одном дашборде все финансовые результаты компании за год. Лучше разбить такой массив информации и сделать акцент на преимуществах.
- Дизайн должен быть лаконичным. Элемент ради элемента не несет никакой смысловой нагрузки и только отвлекает внимание аудитории. Например, навсегда забудьте про круговые 3D-диаграммы.
- Выдерживайте визуализацию в одной цветовой гамме. Если одна из схем будет намного ярче предыдущих, то она не только перетянет внимание аудитории на себя, но и покажется ей более значимой.
Читайте также Кто такой аналитик данных и чем он занимается
Где создавать инфографику
Есть множество сервисов и инструментов для создания диаграмм и схем. Мы подобрали несколько платформ с удобным функционалом, где можно собрать практически любую задумку.
В этой программе можно работать с различными типами диаграмм для визуализации больших данных. Главное преимущество сервиса — даже в бесплатной версии доступно множество функций для реализации вашей идеи. Но интерфейс программы требует серьезного изучения.
Сервис отлично подойдет новичкам, для работы с ним не нужно уметь кодить.
С помощью этого инструмента можно создавать практически любые виды диаграмм, адаптивные таблицы и настраиваемые карты. Одна из сильных сторон — полученный результат визуализации можно экспортировать как код, а значит, все созданные элементы можно встраивать на сайт.
Один из самых простых инструментов в использовании. В работе он совместим не только с сервисами Google, но и с продуктами от Яндекса — например, Яндекс.Метрикой и Яндекс.Директом. Всего он работает с 17 сервисами от партнеров, в том числе MySQL, PostgreSQL, YouTube Analytics, файлы CSV, Adwords AP и другими.
Несмотря на то что у Google Data Studio достаточно большой инструментарий, по сравнению с другими сервисами он сильно проигрывает. Пользоваться можно бесплатно, но если превысить внутренние ограничения, некоторые из функций станут платными.
Этим сервисом пользуются многие аналитики, когда создают интерактивные графики, карты или дашборды. У всех проектов на Plotly есть свой уникальный URL, а значит их можно с легкостью встроить на сайт или в блог. В зависимости от купленного пакета, над созданием визуализации могут одновременно работать от пяти до десяти разработчиков.
- Различные плагины в Figma: Charts или Chart Market.
Подойдет тем, кто уже знаком с Figma и регулярно ей пользуется. Плагины добавляют новые инструменты для визуализации. Можно составить график. диаграмму, календарный план, отредактировать цвета, подгрузить данные из документов и с веб-страниц, экспортировать изображение для презентации в удобном формате.
И не забывайте об обычных таблицах и схемах в том же Excel: иногда самый простой вариант может стать идеальным решением задачи. Не усложняйте и не делайте диаграмму ради ее наличия в презентации.
Аналитик данных
Аналитики влияют на рост бизнеса. Они выясняют, какой товар и в какое время больше покупают. Считают юнит-экономику. Оценивают окупаемость рекламной кампании. Поэтому компании ищут и переманивают таких специалистов.
Создание и использование линейчатой диаграммы
Линейчатую диаграмму образуют строковое поле по оси Y и числовое поле (или поле доля/отношение) по оси X. Длина каждой линейки соответствует значению определенной категории.
С помощью линейчатых диаграмм можно найти ответы на такие вопросы о данных: Как числовые значения распределены или суммированы по категориям? Как ранжируются данные?
Примеры
Страховая компания изучает типы полисов, которые она предлагает, чтобы сравнить свои предложения с результатами недавно завершенного исследования рынка страхования. Первый шаг обзора – определение общего значения полисов для каждого класса. Для показа суммы общих страховых стоимостей (TIV) для каждого класса полисов можно использовать линейчатую диаграмму.
Показанная выше линейчатая диаграмма содержит сумму значений TIV для каждой категории страховых полисов: страхования автомобилей, нетрудоспособности, собственности и жизни. Если диаграмму упорядочить по возрастанию, можно увидеть ее максимальные и минимальные значения.
Страховая компания особенно заинтересована в расширении своего бизнеса в пяти определенных городах. Поле Subgroup может использоваться для сравнения общей страховой стоимости TIV по каждому классу полисов в городах.
Группированная линейчатая диаграмма наверху отображает распределение подгрупп для каждой категории. Значения Policy Class (классы полисов страхования собственности, жизни, потери трудоспособности и автострахования) разбиты на подгруппы, которые отображаются в виде линеек разного цвета для каждого города, включенного в фильтр карточек.
Создание линейчатой диаграммы
Для создания линейчатой диаграммы выполните следующие шаги:
- Выберите одну из следующих комбинаций данных:
- Одно или два строковых поля
- Одно или два строковых поля
плюс числовое
или поле доля/отношение
- Одно или два строковых поля
Примечание:
Если не были выбраны поля доли/отношения, то данные будут агрегированы, а количество будет показано на экране.
Вы можете выполнять поиск по полям с помощью строки поиска в панели данных.
- Перетащите выбранные поля в новую карточку.
- Наведите курсор над областью размещения Диаграмма .
- Перенесите выбранные поля в Линейчатую диаграмму .
Подсказка:
Также можно построить диаграммы с помощью меню Диаграмма над панелью данных или кнопки Тип визуализации на существующей карточке. В меню Диаграммы будут доступны только диаграммы, которые применимы к имеющейся выборке данных. В меню Тип визуализации будут только подходящие варианты визуализаций (карты, диаграммы или таблицы).
Примечания по использованию
Эта визуализация создает результирующий набор данных на панели данных, который включает поля, использованные для создания диаграммы. Результирующий набор данных можно использовать для создания дополнительных визуализаций, переименования полей на осях диаграммы или во всплывающих окнах, или применения фильтров к диаграмме.
Вы можете отобразить значение каждой линейки как количество объектов в каждой категории по оси y или как значение числового поля или поля доли/отношения. Если используется поле, то значения линеек могут быть вычислены как сумма, минимум, максимум, среднее, процентиль или медиана значений поля для каждой из категорий.
Примечание:
Медиана и процентиль не доступны для некоторых удаленных векторных слоев. Если удаленный векторный слой не поддерживает медиану или процентиль, можно скопировать слой в рабочую книгу.
Дополнительно на оси y может быть выбрано поле Подгруппы . Поле Подгруппы должно быть строковым, и оно используется для разбиения категорий по оси y на подкатегории.
Подсказка:
Вы можете оформить связанные карты с использованием того же поля, которое использовали для группировки значений на диаграмме. При работе с диаграммой или с картой вы можете одновременно видеть и категориальные, и пространственные характеристики.
Используйте кнопку Опции слоя , чтобы открыть панель Опции слоя и обновить следующие параметры конфигурации:
- Используйте вкладку Легенда
, чтобы просмотреть символы на диаграмме. Всплывающая кнопка легенды
отобразит легенду как отдельную карточку на вашей странице. Для создания выборки на диаграмме можно использовать легенду (доступно для уникальных символов). Чтобы поменять цвет, связанный со значением, нажмите на символ и выберите на палитре нужный цвет, либо введите его шестизначный код (только уникальные значения). Изменение символа на вкладке Легенда доступно только для уникальных символов.
- Вкладка Символы
используется для изменения Типа символа на Уникальный символ и включения или выключения надписей. Вкладка Символы недоступна, если для диаграммы указано поле подгруппы. Надписи отображают числовые значения, связанные с диаграммой. Для надписей доступны следующие настройки:
- Десятичные знаки — вы можете выбрать число десятичных знаков для надписей от нуля до пяти, либо выбрать По умолчанию или Авто . По умолчанию будет сокращать большие числа, а Авто будет выбирать подходящую точность.
- Выравнивание надписей — для диаграмм доступны четыре варианта выравнивания: Горизонтально, снаружи , Горизонтально, внутри , Вертикально, снаружи и Вертикально, внутри .
- Контекстная надпись — к надписи могут быть добавлены символы, такие как значок или единица измерения. Контекстная надпись может быть размещена слева (по умолчанию) или справа от значения.
- Вкладка Оформление
используется для изменения цвета символа (только единый цвет) и изменения цвета контура диаграммы.
Для отображения среднего, медианного, верхнего квартиля, нижнего квартиля или пользовательского значения используйте кнопку Статистика диаграммы .
Используйте кнопку Фильтр карточки , чтобы удалить все ненужные данные с карточки или отобразить только n верхних или нижних значений. Фильтры могут применяться ко всем строковым, числовых полям, полям доля/отношение и полям дата/время. Фильтр карточки не влияет на другие карточки, использующие этот набор данных.
Используйте кнопку Инструменты выборки , чтобы выбрать объекты на диаграмме с помощью инструментов выбора отдельного объекта или выбора рамкой, либо для переключения выборки.
Используйте кнопку Тип визуализации , чтобы напрямую переключаться между линейчатой диаграммой и другими типами визуализаций – суммарной таблицей, пузырьковой диаграммой или линейной диаграммой.
Кнопка Сортировать используется для сортировки категорийных данных по числовой переменной либо в возрастающем, либо в убывающем порядке, по алфавиту или вручную. Если вы выбрали Сортировать вручную , вы можете щелкнуть и перетащить столбцы в новое положение на диаграмме. Нажмите Применить , чтобы применить изменения, или Отмена , чтобы вернуться к предыдущему порядку.
Примечание:
Диаграммы в опубликованном отчете будут по умолчанию использовать тот же стиль сортировки, который использовался при публикации отчета. Сортировка вручную будет называться Предопределенной , и сортировка вручную будет недоступна для читателей. Диаграммы, которые при публикации были отсортированы по возрастанию, убыванию или в алфавитном порядке, не будут иметь опции сортировки Предопределенная .
Используйте кнопку Развернуть , чтобы увеличить карточку. Другие карточки на странице будут уменьшены до значков. Карточку можно вернуть к прежнему размеру при помощи кнопки Восстановить обратно
.
Используйте кнопку Включить кросс-фильтры , чтобы разрешить создание фильтров на карточке с использованием выборок на других карточках. Удаление кросс-фильтров производится с помощью кнопки Отключить кросс-фильтры
.
Используйте кнопку Перевернуть карточку , чтобы посмотреть обратную сторону карточки. Вкладка Информация о карточке
предоставляет информацию о данных на карточке, вкладка Экспорт изображения
позволяет пользователям экспортировать изображение карточки, а вкладка Экспорт данных
позволяет пользователям экспортировать данные с карточки.
Используйте кнопку Опции карточки , чтобы получить доступ к следующим опциям меню:
- Кнопка Оформление
— Изменение цвета фона, цвета переднего плана и границы карточки.
- Кнопка Редактировать надписи
— Создание пользовательских надписей для осей диаграммы. Чтобы изменить надписи, нажмите кнопку Редактировать надписи , затем щелкните ось, чтобы сделать ее редактируемой.
- Кнопка Порядок
— Переместить карточку вперед или назад относительно других карточек на странице.
- Кнопка Удалить
— удаляет карточку со страницы. Если вы не собирались удалять карточку, вы можете восстановить ее с помощью кнопки Отменить
.
Ресурсы
Изучите следующие ресурсы, чтобы узнать больше о диаграммах:
- Создание диаграммы
- Опции слоя диаграмм
- Панель инструментов Диаграммы
В этом разделе
- Примеры
- Создание линейчатой диаграммы
- Примечания по использованию
- Ресурсы
Линейчатые диаграммы в отчете с разбивкой на страницы (Построитель отчетов Power BI)
Линейчатая диаграмма отображает ряды в виде наборов горизонтальных полос в отчете Power BI с разбивкой на страницы. Простая линейчатая диаграмма очень напоминает гистограмму, на которой ряд отображается в виде наборов вертикальных линий, и линейчатую диаграмму диапазонов, на которой ряд отображается в виде наборов горизонтальных линий с разными начальными и конечными точками.
Линейчатая диаграмма представляет собой единственный тип диаграммы, на которой данные отображаются горизонтально. Поэтому линейчатые диаграммы часто применяются для представления данных, привязанных ко времени, при условии, что начальная и конечная даты относятся к конечному периоду. Кроме того, линейчатые диаграммы широко применяются для отображения категориальной информации, поскольку для демонстрации категорий может применяться горизонтальное расположение. Дополнительные сведения о добавлении данных в линейчатую диаграмму см. в статьях Диаграммы (Power BI построитель отчетов).
Пример линейчатой диаграммы показан на следующей иллюстрации. Линейчатая диаграмма хорошо подходит для этих данных, поскольку во всех трех рядах совместно используется общий период времени, что позволяет проводить объективные сравнения.
Варианты линейчатой диаграммы
- С накоплением. Линейчатая диаграмма, на которой несколько рядов наложены вертикально. Если в диаграмме только один ряд, то линейчатая диаграмма с накоплением выглядит точно так же, как обычная линейчатая диаграмма.
- Процент накопления. Линейчатая диаграмма, на которой несколько рядов наложены вертикально в целях подгонки к 100% области диаграммы. Если на диаграмме представлен только один ряд, то подгонка к 100% области диаграммы проводится применительно ко всем линейкам.
- Объемная кластеризация. Линейчатая диаграмма, на которой отдельные ряды показаны в отдельных строках в виде трехмерной диаграммы.
- Объемный цилиндр. Линейчатая диаграмма, на которой линейки представлены как цилиндрические столбики в виде трехмерной диаграммы.
Рекомендации по данным для линейчатых диаграмм
- В линейчатых диаграммах оси переставлены местами. Осью категорий является вертикальная ось (или «ось Y»), а осью значений — горизонтальная ось (или «ось X»). Это означает, что на линейчатой диаграмме имеется больше места для меток категорий, которые отображаются вдоль оси Y как список, предназначенный для чтения сверху вниз.
- Линейчатые диаграммы и гистограммы чаще всего используются для сравнения групп. Если на диаграмме представлено больше трех рядов, то лучше воспользоваться линейчатой диаграммой с накоплением или гистограммой. Можно также собрать линейчатые диаграммы с накоплением или гистограммы в несколько групп, если диаграмма содержит несколько рядов.
- На линейчатой диаграмме значения отображаются слева направо, что позволяет создавать диаграммы, в большей степени доступные для восприятия, если на них должны быть отображены данные, привязанные ко времени.
- Если требуется ввести линейные графические элементы в таблицу или матрицу в составе отчета, рассмотрите возможность использования линейного датчика вместо линейчатой диаграммы. Линейный датчик предназначен для представления одного значения вместо нескольких групп, поэтому допускает более гибкое использование в области данных списка или таблицы. Дополнительные сведения см. в разделе «Датчики» (Power BI построитель отчетов).
- Можно применить специальные стили рисования к отдельным линейкам на линейчатой диаграмме для усиления визуального впечатления. Возможные стили рисования: клин, рельефный, цилиндрический и от светлого к темному. Эти эффекты призваны улучшить внешний вид двумерной диаграммы. Эти стили применимы и к трехмерной диаграмме, но эффект будет несколько другим. Дополнительные сведения о добавлении стиля рисования в линейчатую диаграмму см. в разделе «Добавление биель», «Emboss» и «Стили текстур» в диаграмму (Power BI построитель отчетов).
- В линейчатых диаграммах с накоплением ряды размещаются друг над другом, в результате чего создается один bar stack. Предусмотрена также возможность разделения линейчатой диаграммы с накоплением на несколько наборов стеков для каждой категории. Диаграммы групп с накоплением отображаются параллельно. Диаграмма может содержать любое число сгруппированных рядов с накоплением.
- Когда на линейчатой диаграмме отображаются метки для точек данных, эти метки располагаются за пределами каждой линии. В результате метки могут перекрываться, когда линии занимают все пространство, выделенное внутри области диаграммы. Положение меток для точек данных, отображаемых для каждой линии, можно изменить, установив свойство BarLabelStyle на панели «Свойства».
- Если в наборе данных имеется большое (относительно размеров самой диаграммы) число точек данных, то размеры столбцов или линий, а также расстояния между ними сокращаются. Чтобы вручную установить ширину столбцов диаграммы, нужно изменить их ширину в пикселях, указанную в свойстве PointWidth . По умолчанию это свойство имеет значение 0,8. С увеличением ширины столбцов или линий в диаграмме расстояние между отдельными столбцами или линиями уменьшается.
Связанный контент
- Диаграммы (Построитель отчетов Power BI)
- Типы диаграмм (построитель отчетов Power BI)
- Пустые и пустые точки данных в диаграммах (Power BI построитель отчетов)
- Диаграммы столбцов (Построитель отчетов Power BI)
- Диаграммы диапазона (Построитель отчетов Power BI)
- Форматирование цветов рядов на диаграмме (Power BI построитель отчетов)
- Форматирование меток оси на диаграмме (Power BI построитель отчетов)
- Форматирование условных обозначений на диаграмме (Power BI построитель отчетов)
- Добавьте в диаграмму стили макетов, emboss и текстур (Power BI построитель отчетов)
- Руководство. Добавление линейчатой диаграммы в отчет (Power BI построитель отчетов)
Линейчатая диаграмма
Линейчатая диаграмма суммирует и сравнивает категории данных, используя длину линейки для отображения данных.
Линейчатые диаграммы состоят из оси X и оси Y. По оси x показаны категории, соответствующие одному или нескольким линейкам. Высота каждой линейки соответствует численному значению, которое откладывается по оси y.
Переменные
Линейчатая диаграмма отображает значения уникальных категорий из поля Категории или даты в виде линеек, размещенных вдоль оси x. Высота линеек соответствует исходным или агрегированным числовым значениям.
Если значения переменной категории уникальны (появляются в поле атрибута только один раз), агрегирование не требуется, но необходимо указать числовое поле. Например, если переменная категории — StateName , и в таблице есть только одна запись для каждого штата, высота линеек будет определяться числовым полем, а агрегирование не требуется.
Если значения категорий в таблице повторяются, необходимо выбрать метод Агрегирования , чтобы указать, как будут суммироваться данные. Например, если переменная категории — StateName для набора данных округа, название каждого штата встречается в таблице несколько раз, поэтому необходимо выполнить агрегирование, чтобы показать итоговые значения по штатам.
Если числовые поля не указаны, диаграмма будет использовать метод агрегации Count , который подсчитывает, сколько раз каждая уникальная категория встречается в поле категории. Например, переменная категорий установлена на StateName для набора данных округов с методом агрегации Count . Полученная диаграмма отобразит одну линейку для каждого штата, а высоты линеек будут соответствовать количеству округов штата.
- Сумма
- Среднее
- Медиана
- Минимум
- Максимум
Опции агрегирования по времени
Если поле даты используется для поля Категория или дата , опции агрегирования времени можно настроить, включив переключатель Включить временной биннинг . Если включен временной биннинг, несколько опций позволяют настроить размер интервала и связанные с бинингом настройки.
Размер интервала
Временные данные отсортированы по временным интервалам вдоль оси x. Размер интервала по умолчанию выбирается на основе временного экстента набора данных, и может быть изменен вручную с помощью опции Размер интервала .
Выравнивание по интервалам
Временные интервалы можно выровнять по первой точке данных, по последней точке данных или по определенному времени.
Опция Замкнуть на первую точку данных запускает разбиение на бины, начиная с самой ранней даты и двигаясь вперед.
Опция Замкнуть на первую точку данных запускает процесс разбиения на бины, начиная с самой недавней даты и двигаясь назад:
Опция Базовое время запускает разбиение на бины в конкретную заданную пользователем дату. Если значение базового времени оказывается до экстента набора данных, оно рассматривается в качестве первой точки данных временного интервала. И наоборот, если значение базового времени находится после экстента набора данных, оно рассматривается в качестве последней точки данных временного интервала.
Важно учитывать выравнивание по интервалам, поскольку в зависимости от конфигурации могут создаваться частично пустые бины. Частично пустые бины могут создать впечатление падения в значении или количестве в этот момент времени, хотя на самом деле сбор данных начался или закончился на протяжении этого бина. Чтобы избежать смещения бина, отметьте опцию Сократить неполный интервал . Это приведет к удалению из отображения частично заполненного бина.
Несколько серий
Для каждого отдельного значения категории по оси x можно отобразить несколько численных значений (рядов значений).
Линейчатые диаграммы с несколькими рядами можно создавать, добавляя числовые поля либо задав поле категории Разбить по .
При добавлении нескольких числовых полей для каждого поля каждого значения категории по оси x будет отображена линейка. Например, переменная категорий установлена на StateName для набора данных округов с методом Sum Агрегация и двумя числовыми полями: Population2010 и Population2015 . В результате диаграмма отображает две линейки для каждого штата; одна будет представлять собой сумму всех значений Population2010 для каждого округа в штате, а другая – сумму значений Population2015 для каждого округа в штате.
Каждая категория линейчатой диаграммы также может быть разбита на несколько серий по значениям поля другой категории. Например, переменная категорий установлена на StateName для набора данных округов с методом Count Агрегация и полем Разбить по ElectionWinner . Таблица Series будет заполнена для каждого уникального значения ElectionWinner , и в итоге диаграмма будет показывать три линейки для каждого штата, причем их высота будет соответствовать количеству округов, попавших в каждую категорию Разбить по : Democrat, Republican, Independent.
Примечание:
Категория Разбить по не может применяться, когда добавлено более одного числового поля.
Примечание:
Поля категорий с большим количеством уникальных значений не подходят для разбиения поля на несколько серий.
Показать несколько серий
Чтобы настроить линейчатую диаграмму с несколькими рядами, используйте параметр Отображать несколько рядов как на вкладке Серии на панели Свойства диаграммы . По умолчанию, несколько рядов отображаются в виде опции Смежные . Если несколько рядов представляют отношение часть-к-целому (другими словами, все эти ряды суммарно представляют 100 процентов какой-либо категории), их также можно показать с помощью опции Стековая или 100% Стековая . Вы также можете просмотреть столбчатую диаграмму с несколькими сериями в виде Сетчатой диаграммы (также известной как малые кратные) с помощью опции Сетка .
Смежные полосы подходят наилучшим образом для сравнения отдельных значений рядов по категориям. Стековые линейки лучше всего использовать, если вас интересуют общие значения категорий, но интересуют также и разбиения рядов. 100% стековые линейки применяются, когда вам нужна только визуализация отношения «часть к целому» и не требуются общие значения.
Опция Сетка отображает матрицу более мелких диаграмм, где каждая мини-диаграмма показывает данные только для отдельных серий. Сетчатые диаграммы подходят для сравнения трендов и закономерностей для подгрупп в данных. Вы можете настроить размеры компоновки сетчатой диаграммы, установив значение Мини-диаграмм на строку . Например, если задано Мини-диаграмм на строку как 3, то будет отображаться максимум 3 диаграммы в строке — общее количество строк сетки будет определяться количеством серий в вашей диаграмме. Отметив Предварительный просмотр диаграммы , вы сможете в динамике исследовать каждую мини-диаграмму более подробно, выбрав одну из них для просмотра на более крупном виде предварительного просмотра.
Оси
Несколько опций позволяют настроить оси и связанные настройки.
Ограничение символов надписи по оси X
Подписи категорий по умолчанию обрезаются до 11 символов. Если подписи обрезаются, полный текст можно увидеть, помещая над ними курсор. Чтобы отобразить полный текст подписи на диаграмме, увеличьте максимальное число символов подписи.
Границы по оси Y
Границы по оси Y устанавливаются в соответствии с диапазоном данных по оси Y. Эти значения можно изменить, вручную введя нужные граничные значения по оси. Задание границы оси y можно использовать для сохранения масштаба вашей диаграммы, подходящего для сравнения. Щелчок на кнопке сброса вернет граничные значения оси к настройкам по умолчанию.
Примечание:
Поскольку линейчатые диаграммы используют длину для представления относительного значения, важно, чтобы все диаграммы включали ноль как начало отсчета.
Границы по осям
- При применении к оси y можно использовать следующие параметры:
- Фиксированный — Применяет глобальные минимальные и максимальные границы ко всем мини-диаграммам.
- Адаптивный — Настраивается в соответствии с локальными минимальными и максимальными границами для каждой мини-диаграммы.
- Фиксированный — Каждая мини-диаграмма будет включать все категории, которые присутствуют в поле Категория или Дата , независимо от того, содержит ли серия записи для этой категории.
- Адаптивный — Позволяет настроить ось x для каждой мини-диаграммы таким образом, чтобы отображать только те категории, в которых есть данные.
Ориентация надписей
Подписи осей можно настроить для отображения в одной из следующих ориентаций: по горизонтали, по диагонали или по вертикали.
Числовой формат
Вы можете отформатировать способ отображения числовых значений оси, указав категорию форматирования или задав пользовательский формат. Например, $#,### можно использовать как строку пользовательского формата для отображения денежных значений.
Оформление
Несколько опций позволяют настроить оформление диаграммы и связанные настройки.
Заголовки и описание
Диаграммам и осям присваиваются названия по умолчанию на основе имен переменных и типа диаграммы. Эти значения можно редактировать на вкладке Общие панели Свойства диаграммы . Также для диаграммы можно ввести Описание , которое представляет из себя текстовый блок, появляющийся в нижней части окна диаграммы.
Визуальное форматирование
- Размер, цвет и стиль шрифта, используемого для заголовков осей, надписей осей, текста описания, заголовка легенды, текста легенды и надписей направляющих.
- Цвет, толщина и тип линии для линий сетки и осей
- Цвет фона диаграммы
Цвет
Линейчатые диаграммы без агрегирования или группировки будут соответствовать цветам, определенным в символах слоя по умолчанию. После применения группировки или агрегирования становится невозможным использование цветов символов слоя и применяется стандартная палитра цветов. Цвета можно изменить на вкладке Ряды на панели Свойства диаграммы , щелкнув инструмент выбора цвета Символ в таблице Ряды и выбрав новый цвет.
Сортировка
Линейчатые диаграммы автоматически сортируются в алфавитном порядке по категориям (по оси x по возрастанию). Эту настройку можно изменить с помощью параметров Сортировки на панели Свойства диаграммы . Для линейчатых диаграмм доступны приведенные ниже опции сортировки:
- Ось X по возрастанию – категории упорядочиваются в алфавитном порядке слева направо.
- Ось X по убыванию – категории упорядочиваются в обратном алфавитном порядке.
- Ось Y по возрастанию – категории упорядочиваются по значению (высоте линеек) от наименьшего к наибольшему.
- Ось Y по убыванию – категории упорядочиваются по значению (высоте линеек) от наибольшего к наименьшему.
- Пользовательская – категории упорядочиваются вручную в таблице Пользовательская сортировка . Например, вы можете организовать дни недели в их естественном порядке:
Надписи данных
Подписи со значениями всех линеек или рядов можно включить, отметив Подписать линейки на вкладке Данные панели Свойства диаграммы .
Ориентация
Линейки можно расположить горизонтально; для этого надо щелкнуть кнопку Повернуть диаграмму в окне диаграммы.
Направляющие
Направляющие или диапазоны могут быть добавлены на диаграммы для ориентировки или как способ выделить важнейшие значения. Чтобы добавить новые направляющие, на вкладке Направляющие панели Свойства диаграммы и щелкните Добавить направляющую . Чтобы нарисовать линию, введите Значение , для которого вы собираетесь ее нарисовать. Для создания диапазона введите значение до . Дополнительно можно добавить текст к направляющей, указав Подпись .
Скользящее среднее
Если вы используете для создания гистограммы поле даты, вы можете добавить скользящее среднее. Анализ временных данных может оказаться сложным из-за непоследовательного или ненадежного сбора данных. В этих случаях может оказаться полезным применить скользящее среднее, чтобы сгладить шум и получить более четкую картину общего тренда. Когда вы ставите отметку Показать скользящее среднее , на вашу линейчатую диаграмму накладывается линия, отображающая среднее значение за предыдущие n периодов, указанных в элементе управления Период скользящего среднего .
Примечание:
Скользящее среднее доступно только для временных линейчатых диаграмм с один рядом значений.
Пример
- Категория или Дата — Neighborhood
- Агрегирование — медиана
- Числовое поле — Price
- Разбить по — Room type
Связанные разделы