Научно-исследовательский Институт искусственного интеллекта AIRI – созданная в 2021 году автономная некоммерческая организация, объединяющая ученых и дата-инженеров, работающих над прорывными исследованиями в области искусственного интеллекта и машинного обучения. В штате AIRI – более 120 сотрудников, большая часть из которых – эксперты в семнадцати сферах ИТ, математики, физики, химии, биологии. Они вовлечены в научную деятельность по ключевым направлениям отрасли – как фундаментальным, так и прикладным. Институт плодотворно сотрудничает с сообществом разработчиков, вузами и индустриальными партнерами: предоставляет экспертизу, реализует совместные научно-технические проекты.
Важной задачей AIRI является развитие кадрового потенциала отрасли – обучение молодых специалистов, которые смогут продолжить научно-исследовательскую деятельность в области искусственного интеллекта и популяризацию знаний.
Александра Бройтман, директор по маркетингу и коммуникациям Института искусственного интеллекта AIRI
«Школа – часть нашей просветительской миссии. Нам необходимо готовить следующее поколение исследователей, чтобы они могли развиваться в нашей стране, получать новые знания и опору для роста в академическом или околоакадемическом направлениях, в Data Science», – заявила директор по маркетингу и коммуникациям Института искусственного интеллекта AIRI Александра Бройтман.
Дмитрий Юдин, старший научный сотрудник AIRI, заведующий лабораторией интеллектуального транспорта МФТИ
«Искусственный интеллект сегодня – одна из самых воспроизводимых научных областей ИТ. Большинство решений здесь открытые, можно ими пользоваться. Сейчас такое встречается очень редко: во многих областях, как, например, робототехника, код, как правило, является секретным ноу-хау. Но в сфере ИИ исследования, методы разработки – чаще всего открытые. И во многом поэтому за короткое время произошел огромный скачок развития этих технологий. Мы в AIRI стараемся поддерживать этот тренд. Проекты, созданные в AIRI, размещаются в открытом репозитории, где за два года уже была собрана внушительная база. Мы ведем YouTube-канал, где выкладываем образовательный контент: видеозаписи семинаров, воркшопов. Сессии, которые пройдут в рамках Летней школы, тоже будут доступны для всех желающих», – заметил старший научный сотрудник AIRI, заведующий лабораторией интеллектуального транспорта МФТИ, один из соорганизаторов Летней школы AIRI Дмитрий Юдин.
В 2022 году институт в первый раз организовал бесплатную Летнюю школу для 150 слушателей – на площадке сочинского образовательного центра «Сириус». В программу вошли двухнедельное обучение и десятидневная конференция.
В этом году мероприятие проходило в другом месте притяжения инноваций – Университете Иннополис. Сюда из более чем двадцати регионов России на две недели прибыли 80 участников, выдержавшие строгий конкурс. Всего оргкомитет школы получил свыше 700 заявок, включавших в себя резюме, мотивационное письмо и аннотацию реализованного проекта.
Младшему слушателю школы – 18 лет, старшему – 38. Бэкграунд участников разный: это студенты бакалавриата, магистратуры и аспирантуры, некоторые из них уже нашли работу, некоторые только учатся. В то же время каждый из них уже имеет опыт разработок в области искусственного интеллекта.
В 2023 году программа школы «Лето с AIRI» состояла из лекций, практических семинаров, досуговых мероприятий и командной работы над проектами. Лекции и семинары проводили ведущие ученые из AIRI, МФТИ, ВШЭ, Сколтеха и других авторитетных научных организаций.
Выступления преподавателей касались самых перспективных направлений в технологиях искусственного интеллекта: это обучение с подкреплением, генеративное и вероятностное моделирование, ИИ в робототехнике, машинное обучение с учетом физико-математических моделей, 3D компьютерное зрение и другие.
Лекции Дмитрия Ветрова сопровождались аншлагом
Cфера искусственного интеллекта и связанных с ней математических, физических и химических процессов до сих пор больше вызывает у ученых вопросы, чем предоставляет ответы. Это огромное поле для научно-исследовательской деятельности. «Современные специалисты по глубинному обучению напоминают мне естествоиспытателей 18-19 веков, пытающихся разгадать тайны природы с помощью научных методов. Сегодня мы тоже пытаемся разгадать тайны, только в роли природы выступают перепараметризованные математические модели вроде глубинных нейросетей. С одной стороны, они полностью описываются математически. С другой – они настолько сложные, что начинают проявлять свойства, которые никто изначально не закладывал. На первый взгляд они кажутся непонятными и даже иногда контринтуитивными. Нужно пробовать эти свойства разгадать. Ведь, как показывает практика, если ты начинаешь понимать происходящие процессы, то можешь их контролировать и извлекать из этого пользу», – уверен профессор-исследователь ФКН НИУ ВШЭ, ведущий научный сотрудник AIRI Дмитрий Ветров.
Владимир Вановский – об основах машинного обучения в физике и химии
Искусственный интеллект позволяет моделировать сложные природные процессы, для чего ученым необходимо исследовать принципы квантовой физики и химии. «Квантовая физика сегодня является самой точной теорией, описывающей окружающую действительность. Подходы машинного обучения для решения задач квантовой физики активно развиваются. Правда, она сложнее, чем обычная физика, и законы, которые описывают ее, тоже сложнее. Но внедрение этих законов в модели машинного обучения позволяет достичь совершенно нового качества решения квантово-механических задач. Простор для использования ML в квантовой физике и химии очень велик. Это новая отрасль машинного обучения, где есть много неисследованных свойств», – рассказал руководитель исследовательской группы центра прикладного ИИ Сколтеха, доцент кафедры общей физики МФТИ Владимир Вановский.
Семен Буденный – о применении машинного обучения для поиска новых материалов
Нейросетевые модели применяются исследователями, в том числе, для поиска новых материалов. «Это та ниша, которая, на мой взгляд, еще не сильно занята. Ее можно и нужно занимать. Понятно, что порог входа в нее будет чуть выше, но специалисты, которые понимают физику и Data Science в тандеме, – в перспективе станут одними из самых высокооплачиваемых на рынке. Потому что знать одновременно два таких сильных домена и что-то выдавать на интерфейсе – не каждый может. Мы в AIRI также открыты к сотрудничеству с такими специалистами. Надеюсь, мы с вами продолжим взаимодействовать и далее», – вдохновил студентов руководитель научной группы «Дизайн новых материалов» AIRI Семен Буденный.
Вечерние досуговые мероприятия школы были направлены на развитие коммуникативных навыков учащихся: например, питч-сессия, форсайт-сессия, игры «Мафия» и «Что? Где? Когда?».
«Ребята в первый же день перезнакомились, устроили прогулку по городу, играли в пантомиму, в шляпу. Вечером один из студентов, который живет в Иннополисе, принес телескоп, и мы смотрели на Сатурн. Мы организовали для участников турнир по волейболу, форсайт-сессию и другие мероприятия. Играли в спортивную мафию – она развивает умение за короткое время в стрессовой ситуации обосновывать свою позицию. Таким образом мы всячески помогали ребятам тренировать публичные выступления, проведение переговоров, отстаивание своей позиции», – вспоминает Александра Бройтман.
Например, на форсайт-сессии студентам предстояло сформулировать современное понимание искусственного интеллекта и спрогнозировать, каким он будет через пятнадцать лет, придумать перспективные проекты будущего и выбрать ключевые технологии, без которых искусственный интеллект не смог бы существовать. Задания для брейншторма только поначалу казались простыми. В процессе обсуждения выяснилось, что они имеют массу неочевидных решений, которые зависят как от опыта, так и от и креативности.
22 июля на постерной сессии студенты представили проекты, научные исследования, в которых уже успели поучаствовать. Стороннего наблюдателя не могли не поразить разнообразие и практическая ценность этих разработок, особенно с учетом того, что большинство их авторов находятся в самом начале своего пути в науку.
Так, в галерее оказались проекты, посвященные применению технологий искусственного интеллекта в медицине и физиологии (анализ экспрессии скоррелированных групп генов в клетках крови, взаимодействие в функциональных сетях головного мозга при большом депрессивном расстройстве, анализ компьютерной томограммы и т. д.), космической отрасли (моделирование оптических и радиолокационных наблюдений космических аппаратов), речевой аналитике (классификация токсичных комментариев в социальных сетях, автоматизация обработки речи и т. д.), телеком-отрасли, робототехники и многих других.
Были представлены и исследования, имеющие четко выраженную практическую направленность: например, автоматическая система измерения объема сыпучего материала, моделирование геомеханического процесса сейсмогенных разломов, прогнозирование возникновения лесных пожаров, мониторинг температуры тела.
Целевой аудиторией выставки постеров являлись сами участники школы и менторы AIRI: общение по проектам, взаимные презентации и обмен опытом продолжались на протяжении нескольких часов. Вместе с тем, так как мероприятие проходило в стенах университета, оно привлекло внимание других заинтересованных лиц: преподавателей и студентов, в том числе иностранных.
Аким Чепурко, самый юный слушатель школы «Лето с AIRI», представил проект «Телеграм-бот с интеграцией Claude LLM и Kandinsky», над которым работал около двух месяцев. «У нас есть текстовая модель Claude – как ChatGPT, только от других разработчиков. Она может давать только текстовые ответы. И есть Kandinsky для генерации картинок. Он сам идеи не придумывает, а только дословно генерирует то, что задано в промпте. Я решил дать возможность Claude писать запросы для Kandinsky и прикреплять созданные им картинки к текстовому ответу. При этом языковая модель может сама писать промпт, добавляя к общему запросу вроде «Нарисуй кота» множество дополнительных деталей. В школе AIRI я хотел бы получить новые знания в разных сферах, опыт работы над проектом, познакомиться с коллегами для дальнейшего взаимодействия. Например, меня заинтересовала тема RL, обучения с подкреплением», – поделился Аким. Созданный им телеграм-бот «КСД» уже работает, его может протестировать любой желающий: вести диалог, получать ответы на различные вопросы.
Отчетным мероприятием Летней школы AIRI стала защита проектов, над которыми ребята трудились на протяжение двух недель в свободное от учебы время. Темы 32 проектов, которые были распределены между участниками, сформировал научный комитет школы: Евгений Бурнаев (директор школы), Иван Оселедец (генеральный директор AIRI), Дмитрий Ветров, Александр Панов и Илья Макаров.
Студенты получили задания в наиболее востребованных направлениях искусственного интеллекта: обучение с подкреплением, робототехнические методы (компьютерное зрение в робототехнике, планирование движений роботов и т. д.), физически правдоподобные модели, большие языковые модели, 3D компьютерное зрение, генеративные модели, графовые нейронные сети, применение методов ИИ в конкретных областях промышленности, нейробиология. Выбирая задачи для проектов, каждый из кураторов школы проанализировал ведущие исследования в своей области за последние 2-3 года, тематику отраслевых конференций.
«Поскольку AIRI – исследовательская организация, для проектов мы подбирали наиболее острые темы, которыми сегодня занимаются ученые. Большая часть проектов носят фундаментальный характер и нацелена на далекую перспективу. Ведь, чтобы конкурировать с бизнесом, исследовательским организациям нужно заниматься не только конкретными прикладными проектами, которые дадут результат здесь и сейчас, но и теми технологиями, которые начнут внедряться в ближайшие годы – то есть создавать фундаментальный теоретический и практический задел», – прокомментировал Дмитрий Юдин.
Над 32 проектами трудились команды учащихся, состоящие из 1-4 человек, а координировали их работу опытные менторы.
«Все поставленные нами задачи имеют открытое решение – то есть не существует готового, идеального решения той или иной задачи. Есть только базовые подходы. Наша основная цель – развивать в ребятах исследовательские навыки, способность превращать знания в код, в научные продукты – например, публикацию. И только потом появятся команды из индустрии, которые это попытаются оптимизировать, имплементировать, написать серверную обвязку, веб-интерфейс. Мы делаем важнейший первый шаг, задел для этих инженерных команд», – добавил Дмитрий Юдин.
Проекты в области искусственного интеллекта связаны с программированием и обучением ML-моделей – для этого требуются большие вычислительные ресурсы. Технологическую поддержку Летней школе AIRI оказал провайдер облачных и AI-технологий Cloud.ru. Компания предоставила студентам и менторам школы виртуальные серверы на суперкомпьютере, а также платформу ML Space для обучения ML-моделей и совместной работы команд Data Science.
Во многих компаниях сегодня есть потребность в машинном обучении. Они обращаются для решения своих задач к отечественным облачным провайдерам, чтобы те предоставили им необходимые мощности. Таким образом, благодаря сотрудничеству с Cloud.ru AIRI может предложить студентам актуальный индустриальный опыт. Подробнее о партнерстве AIRI и Cloud.ru – в отдельном материале ICT-Online.ru.
29 июля все 32 команды успешно защитили проекты и получили сертификаты об окончании школы. Теперь у ребят есть большие шансы попасть на стажировку в AIRI или другую организацию, заинтересованную в развитии технологий искусственного интеллекта.
Евгений Бурнаев, директор школы «Лето с AIRI», д.ф.-м.н., ведущий научный сотрудник AIRI, руководитель Центра прикладного искусственного интеллекта Сколтеха:
«Искусственный интеллект – одно из самых динамично развивающихся направлений в компьютерных науках. Школа «Лето с AIRI» позволяет студентам увидеть способы применения фундаментальных знаний на практике, познакомиться с различными специализациями и понять, как строить карьеру в науке. Возможность поработать с серьезными коллективами – это реальный двигатель к подготовке высококлассных кадров, ведь в науке важна преемственность. Мы надеемся, что каждый учащийся найдет на программе перспективные контакты и вдохновляющие идеи.»