Сетевые отношения в R Блог стайного советника / 21.12.2015 Сетевой анализ - при помощи чего и как он может быть сделан? В прошлом сообщении мы добавили к возможным средствам анализа сетевых отношений среду визуального понимания VUE и рассмотрели, как туда попадают данные и что мы с ними можем делать. А потом мне показалось, что такие же данные мы можем попробовать при помощи мощного современного языка R. Ну, и в связи с предновогодними часами и неделями кода, я попробовал освоить возможности R.Что делаем:1. Берем уже готовые данные, которые мы вытащили из вики и подготовили для представления в VUE. Обычный csv файл. И в этом файле участники и страницы, которые они создают и редактируют, разделены запятыми. School 30,Engels_gorod (Saratovskaya oblast) Evgenij Patarakin,Engels_gorod (Saratovskaya oblast) Ekulik,Engels_gorod (Saratovskaya oblast) Ybikhovs,Sovetskaya Gavan_gorod (Xabarovskij kraj) Tatyana,Sovetskaya Gavan_gorod (Xabarovskij kraj) и так далее - я взял пример давнего проекта Викимании, где было всего 605 строк Теперь мы загрузим эти данные в среду языка Rmydata <- read.csv(file.choose(),header=TRUE) ) Обработаем эти данные при помощи пакета igraph и переведем таблицу в граф.mydata.network<-graph.data.frame(mydata, directed=F)А теперь попросим представить граф на экране.Выглядит пока не особенно привлекательно, но это же результат 3 строчек программирования.Дальнейшие улучшения были связаны с внешним видом - убрать надписи на узле, расположить узлы так, чтобы их удобнее было анализировать.plot(lt.network, edge.arrow.size=.2,vertex.label=NA, vertex.size=8, layout=layout.kamada.kawai)Показать только первые буквы в названиях имен авторов и статей. Сделать узлы авторов и статей отличными не только по цвету, но и по форме.plot(lt.network, edge.arrow.size=.2,vertex.label=substr(V(lt.network)$name, 1, 7), vertex.size=8, layout=layout.kamada.kawai)Теперь в нашем распоряжении очень разные средства сетевого анализа - GraphViz, NetLogo, VUE, R. И мы умеем извлекать данные из разных сред, где участники вовлечены в совместную деятельность - это и вики и GoogleApps, и проекты совместного улучшения документов. Наверное, это и блоги Галактики - тут немножко осталось для счастья. В чём будут проблемы: Так много сред и способов представления данных, что нет общей платформы для обсуждения. Никто не поверит, что у нас есть такие простые способы для исследования совместной деятельности. А как оцениваете вы средства сетевого анализа для ваших проектов? R Летописи большие данные вики учебная аналитика