Обладателями облачных грантов от Microsoft стали представители Лаборатории технологий программирования факультета Вычислительной математики и кибернетики Московского Государственного Университета им. М.В. Ломоносова и научная группа Центра Изучения Интернета и Общества. Каждая из них при работе над проектами использует технологии машинного обучения и создает инновационные решения, которые могут быть использованы в самых разных областях жизни человека и общества.
Группа ученых Центра Изучения Интернета и Общества ставит своей целью изучение социальных сетей, а также поведения различных групп пользователей в онлайн и оффлайн среде. «Поскольку количество пользователей социальных сетей исчисляется миллионами, даже самый простой анализ структуры представляет собой нетривиальную вычислительную задачу, не говоря уже об анализе содержания сообщений, - рассказывает Иван Климов, руководитель Центра. – В нашем проекте мы можем отслеживать распространение социальных сетей в различных городах России и изучать влияние от их распространения на поведение людей в реальной жизни. Например, на их участие в различных сообществах, общественно важных действиях, протестных акциях. В перспективе данные позволят изучить, каким образом структура социальных сетей влияет на распространение информации и на то, как эта информация отражается на поведении людей в оффлайн». Параллельно Центр проводит исследования в области цифровой антропологии, использующие анализ данных фотобанков общественных выступлений и митингов, лозунгов. Это позволяет проанализировать ключевые требования жителей, сравнить их с наиболее острой повесткой онлайн-дискуссий, выявить тенденции. Также проводятся исследования в области филантропии и благотворительности. Например, изучается феномен онлайн-благотворительности, когда люди делают взносы с помощью онлайн-инструментов. «Некоторые наши исследования касаются и прикладных аспектов, таких, как изучение роли мобильных гаджетов в повседневной жизни горожанина, формирование так называемого «планшетного этикета», сетей неэкономического обмена и даже феномена лайка», - говорит Иван Климов.
Все эти и другие проекты предполагают исследование огромного количества данных, их систематизацию, единовременное проведение вычислений. В решении задач молодым ученым помогла платформа Microsoft Azure, предоставленная бесплатно в качестве гранта Microsoft Research. «Цель программы грантовой поддержки – дать ученым различных отраслей, использующим в работе анализ больших данных, возможность расширить зону работы и ускорить получение результата с использованием мощностей Azure, – пояснил Дмитрий Халин, директор департамента технологической политики Microsoft в России. – Таким образом, Microsoft меняет способ взаимодействия человека с технологиями, предлагая смелые и оригинальные подходы к ИТ».
Исследовательская группа МГУ, специализирующаяся на Data Mining - интеллектуальном анализе данных, - собирается использовать облачную инфраструктуру от Microsoft в ряде проектов и направлений своей работы. «Круг интересов нашей лаборатории сосредоточен на применении методов машинного обучения в решении наиболее актуальных сегодня прикладных задач. В качестве примера можно привести широкий спектр задач в области компьютерной безопасности: раннее обнаружение компьютерных вторжений в корпоративную сеть или, к примеру, поведенческая мобильная аутентификация пользователя, предполагающая анализ информации, поступающей с датчиков мобильных устройств (например, акселерометра, гироскопа), вместо привычных, но не всегда надежных и безопасных паролей», - поясняет Сергей Герасимов, сотрудник Лаборатории технологий программирования МГУ.
«Преимущество платформы Microsoft Azure для наших исследований заключается в том, что она позволяет не только хранить большие объемы данных, но и параллельно исполнять сотни процедур обработки информации, что является критически важным для многих задач машинного обучения, например, при оценке характеристик моделей или тонком тьюнинге их параметров, – объясняет Сергей Герасимов. – В настоящее время мы работаем над целым комплексом проектов в области больших данных и машинного обучения, развивать которые стало намного проще благодаря инфраструктуре Microsoft Azure».
Другой сферой интересов лаборатории МГУ в рамках машинного обучения, требующей значительных вычислительных мощностей, является текстовая аналитика (Text Mining). Один из исследовательских проектов был направлен на создание метода объективной оценки качества и профессионального уровня научных материалов (статей, диссертаций и т.д.). Он сочетает глубокий семантический анализ текста, библиографический анализ, проверку на плагиат, возможность интеграции экспертного знания в процесс принятия решения. «На сегодняшний день значительная часть задач Data Mining сопряжена с анализом содержимого (документов, веб-сайтов), либо поведения пользователей и систем. Подобные задачи требуют надежной и производительной системы хранения и параллельной обработки данных», - подытожил Сергей Герасимов.
Программа Azure for Research реализуется с 2013 года. За это время облачные гранты получили 4 группы исследователей из России. Участниками конкурса могут стать ученые, которые работают над социально-значимыми проектами в информатике, физике, химии, медицине, геологии, экологии, геномике и других фундаментальных дисциплинах. Победители получают возможность бесплатно использовать возможности Windows Azure в течение года.