Тепловые карты: на что обратить внимание biarmicus's blog / 10.02.2016 Январский проект “обогреем Галактику” дал, помимо любопытной итоговой картинки с географическим распределением участников еще и интересный опыт обработки данных. Напомню, что задача состояла в том, чтобы перенести географические данные участников проекта (а их набралось около 350) на карту и представить их в виде тепловой карты. Конечно, 350 участников - это еще не “большие данные”, но порог между ручной обработкой и автоматическим распознаванием геоданных здесь оказывается весьма чувствителен. В этой возможности - автоматическом распознавании адресов и состоит основное преимущество инструмента, который мы использовали - Сводных таблиц. Имея под рукой динамическую таблицу, мы можем отказаться от ручного размещения меток на картах - а ведь в этом и состоит основная слабость многих проектов, связанных с коллективным редактированием карт - у разных людей разные представления о том, как и какие метки нужно ставить на карты. В теории возможность автоматически перенести из таблицы метку на карту кажется прекрасной. Но, признаюсь, когда я получил первый вариант тепловой карты “обогрева Галактики”, мне пришлось испытать разочарование. Вот какая карта у меня получилась, когда я просто экспортировал данные, собранные с помощью формы, в таблицу.Что мы здесь видим? Нечто странное. Область тепловой карты там, где ей положено быть насыщенной (в центральной части РФ) какая-то очень бледная, зато где-то в районе Карибского моря (!) имеется насыщенный сгусток энергии. Причем, если присмотреться, то окажется, что находится он аккурат в районе Бермудского треугольника. Для того, чтобы понять, почему это происходит, посмотрим на то, как выглядят наши данные в Сводной таблице. Что мы здесь видим? Многие строки в столбце с Адресом организации (откуда и берутся геоданные) выделены желтым цветом. Это значит, что система не может их распознать - и тогда метки, связанные с этими данными, отправляются в Бермудский треугольник. Поскольку таких записей достаточно много, этот район тепловой карты с точки зрения сервиса является активным, а все остальные районы, соответственно, показываются как слабо насыщенные.Почему же возникает такая ошибка? Присмотревшись к записям, выделенным желтым, видим, что наши респонденты отвечали на них не совсем так, как нам бы хотелось. Кто-то не посчитал указать населенный пункт, решив, что поскольку он ранее упоминался, второй раз его называть не нужно. Кто-то решил указать только название организации, вообще не указывая его адреса. Кроме того, выяснилось, что сервис распознавания не всегда успевает угнаться за новшествами в наименовании образовательных учреждений. То есть, ул. Зеленая, д. 1 для него - понятный адрес, а МГБОУ №8, ул. Зеленая д. 1 - непонятный. Естественно, во всех этих случаях у сервиса распознавания географического адреса возникли проблемы и адрес не определился. Какой из этого следует вывод? Поскольку фактор человеческой ошибки невозможно полностью исключить, хорошо бы было сформулировать вопросы формы так, чтобы хотя бы свести к минимуму вероятность такой ошибки. Поэтому, если вы хотите построить тепловую карту на основе ответов формы:Разнесите вопросы о названии и адресе организации в два разных вопроса, для того, чтобы не усложнять работу системы по распознаванию адреса.Обязательно дайте пояснение к вопросу об адресе организации, уточнив (в поле Пояснение), что указать нужно населенный пункт, область и уличный адрес.Надеюсь, что эти советы будут полезны тем, кто захочет воспользоваться возможностями автоматического распознавания адресов и построения тепловых карт. карта тепловая