Что такое визуализация в информатике
Визуализация данных в науке и технике
Визуализация информации
1D-визуализация | 2D-визуализация | 3D-визуализация |
гистограмма секторная диаграмма | ломанная кривая точечная диаграмма векторная диаграмма полутоновое изображение топографическая карта карта уровней | поверхность векторная диаграмма карта объёма |
Многие программы для финансовых, научных, технических расчётов используют эти и некоторые другие способы визуализации данных. Визуальное представление информации является прекрасным инструментом при проведении научных исследований, наглядным и веским аргументом в научных статьях и дискуссиях.
Моделирование процессов и явлений
Современные графические системы обладают достаточной производительностью для создания сложных анимационных и динамических изображений. В системах моделирования, которые также называются симуляторами, пытаются получить и визуализировать картину процессов и явлений, которые происходят или могли бы происходить в реальности. Самым известным и наиболее сложным примером такой системы является симулятор полётов, который используют для моделирования обстановки и процесса полёта при обучении пилотов. В оптике симуляторы используются для моделирования сложных, дорогостоящих или опасных явлений. Например, моделирование формирования изображения или моделирования процессов в лазерных резонаторах.
Проектирование технических объектов
Проектирование является одной из основных стадий создания изделия в технике. Современные графические системы позволяют наглядно визуализировать проектируемый объект, что способствует скорейшему выявлению и решению многих проблем. Разработчик судит о своей работе не только по цифрам и косвенным параметрам, он видит предмет проектирования на свойм экране. Компьютерные системы позволяют организовать интерактивное взаимодействие с проектируемым объектом и иммитировать изготовление макета из пластичного материала. CAD-системы существенно упрощают и ускоряют работу инженера-конструктора, освобождая его от рутинного процесса черчения.
Организация пользовательского интерфеса
В последние 5-7 лет визуальная парадигма при организации интерфеса между компьютером и конечным пользователем стала доминирующей. Оконный графический интерфейс встроен во многие современные операционные системы. Уже достаточно стандартизован набор элементов управления, которые используются при построении такого интерфейса. Большинство пользователей уже привыкло к такой организации интерфейса, который позволяет пользователям чувствовать себя более комфортно и повышать эффективность взаимодействия.
Всё это, говорит о том, что в самой операционной системе должны быть уже реализованы достаточно большое количество функций для визуализации элементов управления. Например, операционная система Windows предоставляет разработчикам GDI (Graphics Device Interface). Как показывает практика для некоторых приложений возможностей, предоставляемых системной API, вполне достаточно для визуализации обрабатываемых данных (построения простейших графиков, представления моделируемых объектов и явлений). Но такие недостатаки, как низкая скорость отображения, отсутствие поддержки трехмерной графики не способствуют ее использованию для визуализации научных данных и компьютерного моделирования. В некоторых научных и технических программах со сложным графическим выводом требуются функции для более быстрой, мощной и гибкой визуализации вычисленных данных, моделируемых явлений, проектируемых объектов.
Технологии компьютерной графики
В современных научных и технических приложениях сложный графическая вызуализация реализуется с использованием библиотеки OpenGL, которая стала стандартом de facto в области трёхмерной визуализации. Библиотека OpenGL представляет собой высокоэффективный программный интерфейс к графическому аппаратному обеспечению. Наибольшую призводительность эта библиотека позволяет достичь в аппаратных системах работающих на основе современных графических ускорителей (аппаратное обеспечение, освобождающее процессор и выполняющее вычисления, необходимые для визуализации).
Архитектура и алгоритмы были библиотеки разработаны в 1992 году специалистами фирмы Silicon Graphics, Inc. (SGI) для собственного аппаратного обеспечения графических рабочих станций Iris. Через несколько лет библиотека была портирована на многие аппаратно-программные платформы (в том числе Intel+Windows) и сегодня является надёжной многоплатформенной библиотекой.
Библиотека OpenGL является бесплатно распространяемой, что является ее несомненным достоинством и причиной столь широкого использования.
Совместно с OpenGL обычно используется несколько вспомогательных библиотек, которые помогают наcтроить работу библиотеки в данной среде или выполнить более сложные, комплексные функции визуализации, которые реализуются посредством примитивных функций OpenGL. Кроме того существует большое количество графических библиотек специализированного назначения, которые используют библиотеку OpenGL в качестве низкоуровневого базиса, своеобразного ассемблера, на основе которого строятся сложные функции графического вывода (OpenInventor, vtk, IFL и многие другие). С сообществом пользователей OpenGL можно познакомиться на сайте www.opengl.org
Фирма Microsoft тоже разработала и предлагает использовать для подобных целей мультимедийную библиотеку DirectX. Эта библиотека широко используется в игровых и мультимедийных приложениях, а в научных и технических приложениях распространения не получила. Причина заключатся, скорее всего в том, что DirectX работает только под Windows.
11 правил визуализации данных
Ольга Базалева, создатель Data Vis и автор блога, написала статью специально для Нетологии о самых важных принципах визуализации. Статья участвует в конкурсе блога.
Хотите выделяться на фоне конкурентов? Чтобы ваши статьи, отчеты, презентации или посты в социальных сетях были профессиональными, интересными и доступными широкой аудитории? Используйте визуализацию данных!
Я более семи лет отработала в крупнейших медиакомпаниях и рекламных агентствах, на счету Афиша, Рамблер, РБК, создала сайт с наглядными обзорами рынков и собственный блог про визуализацию данных. Поэтому я очень хорошо понимаю то, о чем пойдет речь ниже.
Сегодня визуализация особенно важна, так как люди теряются в обилии окружающей информации и на ее восприятие тратится слишком много времени. Поэтому скучные непонятные тексты часто остаются без внимания. Читатель не будет тратить время, чтобы в них разобраться.
Визуально представленная информация в сравнении с обычным текстом и таблицами:
ПРАВИЛО 1. ПРАВИЛЬНЫЙ ТИП ГРАФИКА
Используйте правильный тип и формат визуализации.
Главная цель визуализации — упростить и ускорить восприятие информации. Выбранный формат и тип графика должны этому способствовать, а не мешать.
Например, если в круговой диаграмме больше трех-пяти значений, график становится нечитабельным. Лучше в таком случае выбрать обычную линейчатую диаграмму.
Еще пример неудачного использования круговой диаграммы, когда сумма категорий не равна 100%. Это грубейшая ошибка, так как данные просто-напросто искажаются.
Не менее важно следить, чтобы не нарушались общепринятые стандарты. Временные оси (года, месяца, кварталы) всегда должны располагаться горизонтально слева направо, это интуитивно понятно. Если же их расположить вертикально сверху вниз, это будет сильно затруднять понимание.
Помните, что неудачно выбранный тип и формат визуализации сразу снижает доверие к представленной информации.
ПРАВИЛО 2. ЛОГИЧЕСКИЙ ПОРЯДОК
Располагайте данные логично.
Обязательно располагайте данные в логическом порядке. Чаще всего это последовательно от большего к меньшему.
Если вы показываете на диаграмме результаты опроса, где есть деление на положительные и отрицательные ответы, то логичнее их выстроить в таком порядке: «Да, Скорее да, Нет, Скорее нет, Затрудняюсь ответить».
Данные можно выстраивать и от меньшего к большему, если это соответствует цели вашего сообщения. Цель всегда первична. Прежде чем приступать к построению графика, четко сформулируйте, какую идею вы хотите донести до читателей, на что хотите обратить внимание.
ПРАВИЛО 3. ПРОСТОЙ ДИЗАЙН
Дизайн не должен препятствовать пониманию или искажать данные.
Избегайте бесполезных элементов дизайна, таких как градиенты, тени, эффекты 3D. Они только отвлекают внимание читателя от сути вашего сообщения.
Ваш график не становится красивым и внушительным от того, что он нарисован объемным. Это могло удивить лет двадцать назад, на заре расцвета Excel, когда еще мало кто умел строить диаграммы. Более того, 3D–графики могут вызвать оптический обман.
Помните, если визуализация выполнена красиво, это еще не значит, что она выполнена качественно. Принципы хорошего дизайна: ясность, простота и минимализм.
ПРАВИЛО 4. ЛЕГКОЕ СРАВНЕНИЕ ДАННЫХ
Визуализируйте данные так, чтобы их можно было легко сравнивать.
Одна из главных целей визуализации – удобное и наглядное сравнение двух и более показателей.
Поэтому, чтобы ваши диаграммы были ценными и полезными, показывайте соотношение между данными. Если разбить однотипную информацию на много отдельных графиков, визуализация становится бессмысленной.
Именно быстрое понимание самых высоких и самых низких значений, тенденций и корреляций является главным преимуществом визуализации в сравнении с обычной таблицей или текстом. Диаграммы должны гораздо быстрее и яснее передавать ваши идеи. Если это не так, меняйте тип графика.
ПРАВИЛО 5. МИНИМУМ ЭЛЕМЕНТОВ
На диаграмме должны быть только необходимые элементы.
Убирайте с ваших графиков и диаграмм все неинформативные элементы, оставляйте только необходимые.
Загромождение ненужной информацией затрудняет восприятие.
Например, если есть подписи значений, то линии сетки и ось не нужны, так как это дублирование информации и является графическим «мусором». Основные и вспомогательные линии сетки, если они все же необходимы, должны быть простыми и не бросающимися в глаза. Акцент всегда должен быть на основной идее, а не на вспомогательных элементах. Если следовать этому совету, то нужная информация сразу выходит на первый план.
ПРАВИЛО 6. НЕ ПЕРЕГРУЖАЙТЕ ИНФОРМАЦИЕЙ
Следите, чтобы не было визуальной загроможденности.
Не пытайтесь уместить на одну диаграмму всю имеющуюся у вас информацию ради того, чтобы ваш график казался умным и значительным. Визуальный ряд не должен быть перегружен сложными и многоярусными диаграммами.
Когда необходимо визуализировать много разных типов данных и категорий, целесообразнее разделять диаграмму на несколько частей. Например, если на линейном графике больше четырех-пяти линий или на столбиковой диаграмме больше двух категорий, не стоит умещать их на одном графике.
ПРАВИЛО 7. ПОНЯТНЫЙ ФОРМАТ ЧИСЕЛ
Числа должны быть с разделителями разрядов и без лишних знаков после запятой.
В больших числах всегда разделяйте разряды: 10 000 000, а не 10000000, иначе цифры становятся нечитабельными.
Также не используйте знаки после запятой без осознанной необходимости. И следите, чтобы формат был единый. Если вы решили показать один знак после запятой, то сделайте так для всех подписей данных, а не выборочно: где-то два знака, где-то три, а где-то без единого знака.
ПРАВИЛО 8. НАЗВАНИЕ И ПОДПИСИ
У диаграммы должно быть название и полная легенда.
Следите, чтобы всегда у вашей диаграммы было полное понятное название и все необходимые подписи, иначе появляется риск неверного истолкования.
Всегда должен быть понятен период и единицы измерения. Не надейтесь, что пользователь вашего графика догадается об этом из контекста. Чтобы удостовериться, что данные будут верно интерпретированы, встаньте на место читателя, который видит вашу диаграмму впервые. Все должно быть предельно чётко, у читателя не должно остаться ни одного сомнения по поводу трактовки представленных данных.
Помните, что ваша задача при создании графиков и диаграмм — упростить восприятие данных, а не вызвать лишние вопросы.
ПРАВИЛО 9. ОБЩЕПРИНЯТЫЕ ЦВЕТОВЫЕ РЕШЕНИЯ
Не нарушайте общепринятое использование того или иного цвета.
Есть несколько основных категорий, которые у нас всегда ассоциируются с определенным цветом:
Если показывать данные категории на диаграммах в ожидаемой цветовой гамме, то пользователю даже не надо смотреть на легенду, без этого ясно, какой цвет что обозначает. Не пренебрегайте этим правилом, оно очень простое и логичное, однако в интернете часто встречаются примеры его игнорирования.
Есть хороший прием использования цвета для сравнения показателей текущего года и прошедшего — делать прошедший год более бледным, а текущий более ярким. При этом оба года лучше показывать в оттенках одного цвета, потому что речь идет про один и тот же показатель.
ПРАВИЛО 10. МИНИМУМ ТИПОВ ДИАГРАММ
Используйте один вид диаграммы для однотипных данных.
Избегайте разнообразия ради разнообразия.
Это не всегда красиво, но всегда бесполезно. Для однотипных данных лучше выбирать один вид диаграммы.
Например, когда вы показываете последовательно ответы на вопросы исследования или динамику продаж по нескольким магазинам, не включайте фантазию, используйте графики одного типа. Читателю необходимо время, чтобы привыкнуть к каждому новому виду диаграммы и разобраться, что означает та или иная линия, кружок или столбик.
ПРАВИЛО 11. ЕДИНАЯ ЦВЕТОВАЯ ПАЛИТРА
Придерживайтесь одной цветовой гаммы.
Визуальные элементы (графики, диаграммы, схемы) на протяжении всего исследования или отчета должны быть выполнены в одной цветовой гамме.
Если же вы исследовательская компания, то цветовая палитра должна быть единой и во всех исследованиях, для соблюдения фирменного стиля. Если вы свой отчет дополняете графиками из других исследований, их необходимо перерисовывать, иначе они сильно врезаются в общую картину и портят восприятие. Во-первых, у них наверняка другая цветовая гамма, во-вторых, часто качество картинок не самое лучшее и это сразу бросается в глаза.
Перерисовать график в стиле компании займет всего 10–20 минут, а отчет будет смотреться более целостным и качественным. Таким образом, именно вы интуитивно будете восприниматься создателем информации и экспертом, даже если укажете другой источник данных, что, кстати говоря, также всегда необходимо делать.
Не игнорируйте эти простые, но очень важные правила визуализации. Берегите своих читателей. Никто не любит чувствовать себя глупо, рассматривая непонятные или нагроможденные графики и диаграммы.
А вы сами при виде странных диаграмм на конференциях или совещаниях, не задавались вопросом: «Это я один такой несообразительный, что ничего не понимаю?» Поверьте, вы не одиноки!
Визуализация данных: способы, инструменты, полезные ссылки
Информация усваивается лучше, если подать ее в виде красивых схем, графиков и диаграмм. Это называется визуализация данных — о ней и поговорим.
Сегодня она особенно важна — контента стало слишком много, люди в нем просто тонут. Визуально представленная информация более привычна и понятна человеческому глазу, с помощью нее можно быстро донести любые мысли и идеи.
Зачем визуализировать данные?
Привлекать больше трафика на сайт. Люди лучше воспринимают и запоминают зрительную информацию. К тому же рассматривать картинки и искать взаимосвязи довольно увлекательно, а значит, так вы повысите время нахождения пользователей на сайте, и, следовательно, их вовлеченность и лояльность к вашей компании.
Анализировать большой набор данных и делать статистику/отчеты. Чаще всего визуализацию используют именно здесь. Например, чтобы посчитать прибыль компании за год. Гораздо проще прийти к логичному заключению, глядя на график, где один из столбцов находится выше всех остальных, чем пролистать несколько страниц статистики в Google Sheets или Excel.
Доступно объяснять сложные вещи и явления. С помощью визуализации спокойно заменить целые куски текста и выделять взаимосвязи. А еще это просто красиво, так что какая-нибудь инфографика станет прекрасным дополнением для вашего новостного или аналитического портала или блога.
Базовые принципы визуализации
Чтобы визуализация действительно работала, здесь, как и везде, нужно придерживаться правил.
Предлагаем вам познакомиться с четырьмя основными принципами визуализации, которые сформулировал экономист, специалист по визуализации данных и презентациям Джон Швебиш (Jon Schwabish).
1. Ясность данных
За графиками в отчетах и статьях в блогах людям интересна прежде всего история. В графике она состоит из различных данных — цифр, дат, имен. Но это не значит, что нужно разместить на нем сразу все данные, которые у вас есть. Не стоит перегружать схемы лишней информацией — лучше пусть ее будет меньше, но данные будут проверенными и понятными.
2. Меньше визуального шума
Избегайте визуального шума — темных или тяжелых линий сетки, лишних иконок и меток, большого количества текста, теней и градиентов, чрезмерного объема.
3. График и текст — единое целое
Весьма распространен так называемый «эффект слайд-шоу», когда схема отдельно, текст отдельно. Но это не есть хорошо — надо, чтобы графики и текст дополняли друга друга. Поэтому легенду, поясняющую значение линии, столбика, точки, нужно размещать прямо на графике или в конце линии.
Характеристики, которые можно определить сразу
Информацию о мире мы узнаем и совершенно неосознанно. Чисто на подкорке остаются определенные визуальные характеристики (форма, контраст), которые мы можем заметить и определить сходу, не особо всматриваясь в изображение. Но круг этих характеристик ограничен — сначала наш мозг считывает то, что знает, а только потом достраивает полноценную картину. Это тоже нужно учитывать при работе с визуализацией.
Основные способы визуализации
Перечисляем самые распространенные способы визуализации, с примерами.
Графики
Наверное, самый привычный для нас вид визуализации данных. Именно графики мы видим в учебниках в школе, с ними же первым делом знакомимся, когда начинаем осваивать Excel.
Графики строятся по осям X и Y и показывают зависимость данных друг от друга. Они, в свою очередь, делятся еще на несколько подвидов — подробнее о каждом по ссылкам ниже.
Что такое визуализация данных и как ее применять?
Зачем в современном мире визуализировать данные, какие типы визуализации существуют и где искать работу с навыками анализа данных.
Фотография: Иллюстрация Эмилии Хан
Информация усваивается лучше, если ее подать в виде схем, графиков и диаграмм. Сейчас визуализация данных является одним из важнейших инструментов и упрощает наше понимание объемных данных в век информационных технологий.
Что такое визуализация данных?
Визуализация данных — это то, что превращает большие и маленькие данные в вижуал, который человеческому мозгу легче понять и обработать.
Идея использования изображений для понимания данных существовала давно — от карт и графиков в 17 веке до изобретения круговой диаграммы в начале 1800-х годов.
Один из самых ярких примеров статистической графики —карта вторжения Наполеона в Россию Чарльза Минарда. На ней были показаны размеры армии, а также путь отступления Наполеона из Москвы: эта информация была привязана к температурным и временным шкалам для более глубокого понимания события.
Современные компьютеры обрабатывают большие объемы данных с молниеносной скоростью. Сегодня визуализация данных превратилась в быстро развивающееся сочетание науки и искусства, которое будет в тренде в обозримом будущем.
Зачем визуализировать?
Согласно недавнему исследованию Microsoft, средняя продолжительность концентрации внимания человека 8 секунд, что, кстати, на секунду меньше, чем средняя продолжительность концентрации внимания у рыбы.
Люди реагируют на визуальные эффекты лучше, чем на любой другой тип стимуляции. Человеческий мозг обрабатывает визуальную информацию в 60 тыс. раз быстрее, чем текст. Зрительные данные составляют 90% информации, передаваемой в мозг.
Визуализация данных используется во всех отраслях: она является важным шагом в аналитике данных, дает компаниям возможность критически оценить информацию и запросы аудитории.
Какой бывает визуализация?
Раньше самым простым и распространенным способом создания визуализации данных была информация из электронной таблицы Excel и преобразование ее в гистограмму, круговую диаграмму или таблицу.
Этот метод по-прежнему чрезвычайно эффективен, но искусство визуализации данных также прошло долгий путь за последние 20 с лишним лет. Существует множество инструментов, помогающих c визуализацией данных. Диаграммы и графики упрощают понимание результатов, даже если вы можете определить закономерности без них.
Графики
График показывает изменения во времени. Ось X обычно представляет собой период времени, а ось Y — количество.
Гистограмма
Гистограмма также показывает изменения во времени. Но если существует более одной переменной, гистограмма может упростить сравнение данных для каждой переменной.
Пузырьковая диаграмма
Пузырьковая диаграмма изображается в виде пузырька и является адаптацией точечной диаграммы.
Круговая диаграмма
Круговая диаграмма показывает каждый элемент как часть целого и является лучшим вариантом для иллюстрации процентов.
Карта
Карта помогает понимать локальность предмета исследования. Ведь большинство данных содержат элемент местоположения.
Инфографика
Инфографика требует обширного набора информации и дает исчерпывающее визуальное представление. Она отлично подходит для изучения сложных и очень субъективных тем.
Примеры визуализации данных
Альберто Каиро — один из лучших дата-журналистов — сказал, что визуализация данных является наиболее эффективным способом в предоставлении информации во время пандемии.
Вспомним карту, составленную Университетом Джона Хопкинса про распространение COVID-19.
Пример хорошей инфографики — анализ развития Казахстана с 1991 по 2021 год. Визуализация дает отчетливо понять, в какой сфере наблюдается спад, а в какой — прогресс.
Эта карта мира создана с помощью инструмента Blueshift для визуализации торговли глобальными товарами, такими как продукты питания и одежда. Точки «исходят» из одной страны и переходят в другие, показывая, на каких товарах эта страна специализируется, а что другие страны покупает у нее. При нажатии на отдельные страны отображается их экспорт и импорт.
Гистограммы бывают разные. Один из наглядных примеров —миграция. Мы можем увидеть, что большинство трудовых мигрантов в России родом из Узбекистана. Из Таджикистана приезжает почти в два раза меньше мигрантов, следом за ним — мигранты из Кыргызстана. Меньше всего мигрантов — из Казахстана.
Бесплатные инструменты визуализации данных
Инструменты визуализации данных могут помочь вам превратить данные во что-то мощное и красивое.
Tableau — пользователь легко может загрузить данные, составление карт — одна из самых сильных сторон этого приложения.
Infogram — очень удобный и легкий интерфейс. Он позволяет создать инфографику за считанные минуты. В наличии 31 вид эффектных диаграмм, включая радиальные, точечные, пузырьковые диаграммы и карты.
Plotly — создает графики, диаграммы, презентаций, датасеты и уникальные дашборды. Есть платная и бесплатная версии.
Datawrapper — удобный и быстрый способ визуализировать данные в виде графиков и таблиц.
Google Data Studio — позволяет подключать данные в реальном времени. Бесплатная платформа для визуализации данных.
Существует также еще один инструмент, позволяющий создать визуализацию данных, включая разные виды диаграмм, гисторгамм и таблиц. Этим инструментом пользуются 90% компаний.
Что такое PowerBI и зачем он нам нужен?
PowerBI (Power Business Intelligence) — это программа, с помощью которой можно собрать в одном месте данные из разных источников —Excel, csv, SQL, Google Analytics, а также создать модель данных, проанализировать их и применить интерактивный дашборд из сотен вариантов визуализаций. PowerBI пришел на смену Excel.
Одной из тех, кто основал сообщество BI-аналитиков и регулярно проводит курсы PowerBI является — Екатерина Рехерт. Она основала компанию Databoom. kz и она с командой помогает новичкам освоить сферу анализа данных.
работа ученицы Екатерины Рехерт, Елены Афонины
Зачем нужен PowerBI?
Екатерина рассказывает, что PowerBI делает то же самое, что Excel, но гораздо быстрее в несколько кликов. Любой человек может за короткое время с нуля освоить этот инструмент и приобрести востребованный на рынке навык Business Intelligence-аналитики.
PowerBI состоит из трех компонентов:
1. Редактор PowerQuery — «кухня» PowerBI
2. Модель данных и формулы DAX — data analytics expressions — «сердце» PowerBI
3. Визуализации PowerBI
PowerBI — это не только про то, как строить графики. Ведь 80% времени работы уходит на очистку данных в PowerQuery и моделирование с помощью DAX.
Как можно изучить PowerBI и сколько потом можно на этом заработать?
Можно освоить этот инструмент самостоятельно с помощью бесплатных онлайн курсов и документации или присоединиться к казахстанскому сообществу BI-аналитиков и пройти бесплатные воркшопы, которые проводятся регулярно, а также получить доступ к чату сообщества, где можно задать любой вопрос.
По словам Екатерины, топовые компании во всех сферах — Beeline, Mars, «КазМунайГаз», Toyota, AirAstana, «Евразийский банк», Kimberly Clark, Kolesa Group, Национальный банк Казахстана, «Самрук-Казына» уже внедрили Power BI.
По данным Kolesa Group, средняя зарплата казахстанских специалистов BI-аналитиков 480 тыс. тг.