Облачные сервисы на службе у биохимических наук rat's blog / 10.12.2012 Прочитала интересную статью о том, как учеными всего мира создаются уникальные и общедоступные базы данных по протеинам. Исследователи, обнаружив новый белок, и сравнивая свои данные с данными таблиц в этих базах, которые содержат информацию о белках разных организмов, в том числе, человека, теперь могут понять, - открыли ли они новый белок или обнаружили уже открытый другими учеными. Масштабный проект - Глобальный атлас белков. Его цель – охарактеризовать на основании геномных данных всевозможные белковые молекулы по ряду параметров как то: в какой ткани экспрессируется тот или иной белок, при каком заболевании, в каком окружении и в какой концентрации. Для реализации проекта ученые пользуются данными другого масштабного проекта – Микробиома человека, в работе над которым исследователи установили, что организм человека населяют около 10 тысяч различных видов микробов. Все вместе они экспрессируют около 8 миллионов кодирующих белки генов. Для обработки и хранения этой информации понадобятся облачные хранилища. Ученые считают, что спасение - в облачных технологиях! На вопросы где хранить, как хранить и как обеспечить доступ к данным, которые получает протеомика, геномика, микробиомика, - позволяют ответить биоинформационные технологии. Если эти данные будут храниться в компьютере, к которому нет доступа, то никто не сможет эти данные анализировать. Сейчас условием любого высокоэффективного эксперимента является размещение данных в так называемых общедоступных репозиториях, считают ученые.Компании типа Google, типа Amazon, типа Яндекса, типа китайского поисковика Baidu последнее время стали эффективно использовать облачные технологии. Эти компании умеют анализировать данные, хотя, конечно, биологические данные отличаются огромным разнообразием и их нужно уметь анализировать, ведь это не анализ данных о наших покупках и поездках.Дальнейшее развитие протеомики связывают с совершенствованием методов биоинформатики и развитием кластерных вычислительных систем, на которых будут применяться сложные алгоритмы обработки данных. Однако никакие действия с данными сами по себе не вскроют заложенного в них смысла без участия человека. Идеальная иллюзия: слева стоит хранилище, в котором свалены данные, справа стоит мощный вычислительный кластер, "головастики" загружают туда алгоритмы, которые сначала разрабатывают, кластер берет данные, перерабатывает их, и выдает нам ответы на фундаментальный вопрос: "как организована жизнь". Пока что все не так просто, и человека-ученого из этого процесса ни на одном этапе не исключить.Оригинальная статья здесь. А общедоступная база данных по белкам здесь. Только просматривать базу данных лучше, пользуясь браузером Firefox. анализ базы данных облачные технологии протеины совместный доступ