Визуализация "больших данных" biarmicus's blog / 30.04.2015 Как-то незаметно, но все более очевидно, в образование приходит одно из наиболее мощных информационных движений последних лет - Большие Данные. Строго говоря, Большие Данные (или Big Data) - это побочный продукт информационных систем, поддерживающих функционирование процессов и организаций. Большая информационная система помогает нам осуществлять информационный документооборот, упорядочивает данные в организации или ведет учет того, как наши пользователи используют те или иные сервисы. В ходе работы системы формируется массив записей, счет которых может идти на миллионы и миллиарды. Этот массив записей информационной системы представляет собой ценный материал, на основе которого можно делать далеко идущие выводы о возникающих трендах или рисовать общую картину происходящего. Визуализация “больших данных” - задача непростая. Привычные для нас линейные и круговые диаграммы уже не являются достаточными средствами визуализации. Если же просто попытаться поместить на экран все наши “большие данные”, может получиться картинка, в которой трудно что-либо разобрать. Вот, например, “Волосяной ком”Как видим, просто визуализация всего, что нам дают большие данные, не дает нам ясной картины. Что здесь главное, что второстепенное? Непонятно.КластерграммаПри анализе “больших данных” нас, как правило, интересуют не все записи, которые делает система, а их объединения - кластеры. Поэтому один из самых удобных способов визуализации “больших данных” - это кластерграмма, которая показывает то, в какой степени наши данные “упакованы” в объединения - кластеры.Исторический потокИногда наши данные представляют собой записи о редактировании статей в какой-нибудь большой текстовой системе, например, в Википедии. В этом случае важно показать, как менялся вклад авторов в текст статей. Для этого может быть полезна визуализация “исторический поток”, в которой по оси X располагается время, по оси Y - количество правок, а цветами обозначены конкретные авторы, вносившие изменения. Пространственный потокТакой тип визуализации может пригодиться, если у нас имеет место, например, информационный обмен между различными городами и регионами. На предлагаемом изображении - визуализация объема трафика между Нью-Йорком и другими городами. Чем трафика больше - тем более насыщена линия и наоборот.Как мы видим, новые способы обработки информации рождают и новые способы ее визуального представления. Я думаю, пройдет совсем немного времени - и мы научимся использовать их в учебном процессе. Big Data большие данные визуализация информация массивы