Работаем с текстом Web-сервисы и не только... Путевые заметки Баданова / 23.08.2014 Инструментов для визуализации данных существует великое множество. Среди них есть более простые и более сложные, работающие онлайн и устанавливаемые на компьютер, платные и бесплатные. У всех есть свои плюсы и минусы, специализация и спектр возможностей. Познакомимся с некоторыми инструментами, которые ориентированы на визуализацию текста. О сервисах для создания различных облачных конструкций из слов и вариантах использования таких сервисов много писали в постах на Галактике.1 Интересный сервис Many Eyes для визуализации и анализа пользовательских материалов. На сервис можно загружать цитаты, цифры. Сервис распознаёт данные: текст; проценты; цифры. Затем визуализировать их - создавать словесные облака, схемы, диаграммы, карты, подвижные изображения (интерактивную визуализацию) – и тут же обсуждать их с другими пользователями. Это в некотором роде и социальный сервис. Для начала работы необходимо зарегистрироваться. Сервис поддерживает кириллицу.Все загружаемые данные — становятся доступными для всех, что, возможно, приносит некоторые неудобства для пользователей, предпочитающих иметь к таким данным ограниченную доступность.В 2013 году у сервиса появилась новая версия, которая предлагает без регистрации создавать визуализацию ваших данных. Сервис после обработки материалов (а материалы для загрузки вы можете добавлять в виде текста или смешанных табличных данных) предлагает наилучшие варианты визуализации на основании тех данных, которые вы загрузили.Среди инструментов сервиса три больших блока визуализаций:1. Визуализация частей целого: Heat-карты. Пай-чарты. Tree-maps. Пузырьковая диаграмма. 2. Визуализация изменений во времени: Диаграмма в столбиках. Динамическая линейная диаграмма. Баббл-чарт — диаграмма из кружков. Блок-гистограмма. 3. Сравнение набора значений: Облако слов. Дерево из слов. Сетевые диаграммы, для значений и для слов/фраз. Для просмотра и построения диаграмм сервис предложит установить Java плагин. С этим плагином возникло неожиданно много сложностей. По умолчанию этот плагин блокируется и пришлось добиваться от компьютера начать работать с данными. О том, как включить Java в браузере рекомендации от Java.Порядок работы с сервисом:1. Вы выбираете свой оригинальный текст или используете готовый.2. Грузите данные на сервис. Все тексты, включая данные из таблиц, переносятся на сервис через буфер обмена. Сервис распознает данные и предлагает отредактировать столбцы с данными (сменить тип данных) если по вашему мнению он распознал их неправильно.3. Даете название, источник информации и описание.4. Сервис предлагает построить визуализацию из предложенных типов. Здесь же, на этой страничке, можете просмотреть, как это выглядит.5. Публикуете визуализацию.Инструкция по работе с новой версией сервиса здесь. Пример: 2. TagCrowd - сервис для создания облака тегов. Пригоден для анализа частоты употребления слов в тексте. Сервис бесплатен. Материал для построения облака берётся из обычного текста, URL страницы или загруженного файла. Готовое облако можно редактировать на любом этапе. Можно воспользоваться кодом для встраивания облака на странички ваших сайтов или блогов. Для начала работы не нужно регистрироваться. Сервис весьма прост в работе. Инструкция не требуется. Можно настроить количество слов для визуализации (по умолчанию – 50), возможность преобразования слов написанных заглавными буквами. Ограничить минимальное повторение встречающихся в тексте слов (по умолчанию-1) и объединять в группы устойчивые словосочетания.Ниже облако из стихотворения Роберта Фроста. 3. Сервис Wordle.net предназначен для генерации "облака слов" из текста, которые вы предоставляете сервису. Облако выделяет слова, которые чаще встречаются в исходном тексте. Вы можете настроить различные шрифты, макеты и цветовые схемы вашего облака.Созданные изображения можно добавить сохранить в в Wordle альбом и добавить ссылку на свой сайт, блог или сохранить картинку на жесткий диск компьютера.Видеоинструкция здесь.Пример:4. Сервис WordCloud делает из страницы любого сайта Облако слов, для этого нужно только ввести адрес сайта. Интерфейс на русском языке и не требуется регистрация. Готовое облако можно сохранить на свой компьютер с помощью контрменю. В настройках можно ограничить длину слова, фильтровать заглавные и выбрать цветовую схему.Пример: О визуализации можно почитать: Инфографика вместе с Creatly.com. Слова в облаках. Образовательные запросы сквозь очи ManyEyes. Медленное чтение в эпоху сверхскоростей. Карта свойств в ManyEyes. Как создать мозаику из слов? Many Eyes TagCrowd WordCloud Wordle.net визуализация текста