Конференцию открыл президент МТС Вячеслав Николаев. Следом выступил первый вице-президент МТС по технологиям Павел Воронин – руководитель, курирующий процесс трансформации компании из телеком-оператора в цифровую экосистему и технологического лидера. По его словам, информационные технологии имеют собственный «исходный код», который лежит в области фундаментальных наук: дискретной математики, логики, алгебры, математического анализа, электродинамики и многих других.
Павел Воронин, первый вице-президент МТС по технологиям. Фото автора
«Наука и технологии – тесно связаны. Современные алгоритмы – это во многом Эйлер и его теория графов. Компьютерная архитектура – это математическая логика, которую сформулировал Джордж Буль еще в 19 веке. В честь него названа булева алгебра, на которой построены микропроцессоры – компьютеры, которые обрабатывают информацию. Соответственно, она же наследуется на более высоких уровнях – в языках программирования и т. д. Теорема Гёделя о неполноте породила теорию вычислимости. После Гёделя работал Тьюринг, который во время Второй мировой войны дешифровал немецкие шифры, а впоследствии сформулировал понятие абстрактной вычислительной машины и создал машину Тьюринга – прообраз современных компьютеров. Электродинамика – это уравнение Максвелла, которое описывает принципы распространения электромагнитных волн – на их основе построена вся передача данных. Открытие полупроводников, в особенности транзисторов, в лаборатории Белла в 20 веке – это революция в вычислительной технике. Мы видим, что практически ни одно крупное достижение в ИТ не было бы возможным без фундаментальной науки. И, что еще более важно, – в будущем достижения в ИТ тоже будут связаны с фундаментальной наукой. Сейчас в авангарде квантовые вычисления, искусственный интеллект. Одни из прародителей теории квантов – нобелевский лауреат, физик Ричард Фейнман, математик Питер Шор. Искусственный интеллект тоже существенным образом опирается на матаппарат», – объяснил спикер.
Наряду с другими технологическими компаниями, в МТС считают формирование кадрового потенциала отрасли своей приоритетной задачей. Среди спикеров True Tech Day оказались представители НИУ «Высшая школа экономики» (ВШЭ), МФТИ, МИСИС, МГУ, департамента по науке, технологиям и образованию Фонда «Сколково», Сколтеха, школы AIRI. Большинство посетителей мероприятия – студенты профильных специальностей, которые могли не только получить экспертные советы по нюансам будущей профессии, но и проявить себя в различных активностях, получив за свои старания мерч от МТС.
В одном из выступлений секции «AI+ML» директор Центра Big Data МТС Виктор Кантор рассказал о возможностях построения карьеры в сфере AI/ML: сделал обзор карьерных треков и дал общие рекомендации по развитию молодых специалистов.
Виктор Кантор, директор Центра Big Data МТС. Фото автора
«В ML нужно выбирать, будете ли вы индустриальным экспертом, исследователем или предпринимателем-менеджером. Индустриальные эксперты сейчас в основном представлены дата-сайентистами, дата-аналитиками, дата-инженерами и ML-инженерами. Если мы говорим про карьеру в R&D, то здесь тоже есть Junior, Middle и т. д. – просто вы занимаетесь исследованиями, публикуете статьи. Раньше, 5-10 лет назад, люди часто не шли в науку из-за того, что в ней временами было голодно. Сейчас есть возможность прийти в большую компанию: например, у нас в МТС AI много людей занимается наукой, исследованиями, чувствуют себя отлично. И самое прекрасное в нашей области – если вы получили хорошее математическое или физмат-образование, то можете работать по специальности», – указал спикер.
По словам Виктора Кантора, на старте карьеры исследователя специалисту могут помочь знание базового курса высшей математики, отсутствие страха перед «сложными» математическими предметами (продвинутыми частями абстрактной алгебры, тензорным анализом, топологией, дифференциальной геометрией и т. д.), профильная кафедра в магистратуре, трудоустройство в R&D-отдел компании или исследовательский институт, моральная устойчивость к долгой работе с отрицательными результатами. При этом во избежание выгорания важно сочетать и чередовать дополняющие друг друга сферы работы (например, Data Science и преподавание), делать заметные вещи в обществе, приобретать полезные знакомства, и не ожидать, что труды вознаградятся сразу.
Также в ходе True Tech Day компания МТС анонсировала два масштабных проекта, запущенных совместно с Высшей школой экономики. Первый – открытие магистратуры по направлению «Исследования и предпринимательство в искусственном интеллекте» на факультете компьютерных наук в ВШЭ. Первый поток из 30 студентов начнет обучение на кафедре уже с наступающего учебного года, а с 19 июня по 25 июля 2024 года начнется прием документов. Отбор из подавших заявки кандидатов будет происходить в формате собеседования. Важно, что компания МТС целиком покроет стоимость обучения.
«МТС как один из технологических лидеров страны активно вкладывает в науку, образование, в рост собственных кадров и кадров для страны», – подтвердил на пресс-подходе Павел Воронин.
На True Tech Day царила атмосфера инноваций и креатива. Фото автора
Второй проект – исследование инновационной зрелости компаний, в рамках которого партнеры планируют разработать уникальную методологию оценки компаний по десяткам объективных показателей и на этой основе определять агрегированный индекс инновационности. Методология будет включать широкий спектр количественных и качественных параметров. Первая группа – это, например, активность компании с точки зрения производства инновационной продукции, затраты на исследования и разработку, затраты на интеллектуальную собственность и т. д. Вторая группа – качество корпоративного управления, инновационная культура в компании и т. д.
«Это наша собственная инициатива. В научном сообществе должны понимать, что нас ждет впереди. Также мы надеемся что исследование будет полезно правительству и соответствующим ведомствам, которые занимаются научной политикой», – прокомментировал первый проректор НИУ ВШЭ Леонид Гохберг на пресс-подходе. Отметим, что он также выступил в качестве спикера в основной секции конференции с докладом «Будущее мировой науки»,
В целом программа официальной части конференции True Tech Day состояла из пяти параллельных секций (треков): Main, Development, AI/ML, Cloud, Science. Помимо экспертов МТС (в том числе подразделений – KION, МТС Exolve, MTS Web Services и др.) и руководителей вузов, в них приняли участие представители ведущих ИТ-компаний страны, таких, как Positive Technologies, Тинькофф, Postgres Professional, Ozon, Яндекс, VK, Авито, СберТех и другие.
В основном треке обсуждались главные глобальные тренды: кибербезопасность в разработке, микросервисы, инцидент-менеджмент, измерение инженерной продуктивности. В треке для разработчиков акцент делался на таких узкоспециализированных вещах, как JIT в Python, компилятор LuaJIT, инструменты программирования для открытой архитектуры RISC-V, паттерны управления базами данных в Kubernetes. Молодые ученые-исследователи сосредоточились на квантовых технологиях, робототехнике, ИИ в дизайне новых материалов. Кроме того, в рамках этого трека прошел финальный питчинг проектов конкурса True Tech Hack. А названия секций «AI/ML» и «Cloud» говорят сами за себя.
Основу теории больших языковых моделей представил в рамках трека «AI/ML» руководитель центра R&D и CDO МТС Михаил Степнов. Настоящее и будущее таких проектов он рассмотрел на примере GPT-4, Claud и Llama.
Михаил Степнов, руководитель центра R&D, CDO МТС. Фото автора
Спикер отметил, что разработать и запустить большую языковую модель – не так сложно. Например, для запуска Llama фактически понадобилось два файла. Первый на 140 ГБ – содержит параметры этой нейросети. Второй – это небольшой фрагмент кода на 500 строк, который может быть написан на Python, C и других языках. «Чтобы запустить этот код, вам нужен только ноутбук, даже без подключения к интернету. За пару минут доступ к большой языковой модели у вас есть, она работает. Никакой сложности у пользователя более-менее продвинутого уровня при работе с моделью нет. Гораздо интереснее всё начинается, когда мы хотим эту модель обучить. Метафорически – мы должны сжать всю информацию из интернета в тот самый файл в 140 ГБ, который содержит, по сути, вероятности соиспользования тех или иных слов между собой. И, если бы трансформенная архитектура не обеспечивала нам возможность параллельного обучения на большом количестве видеокарт, одна модель училась бы более 6000 дней. Сегодня обучить большую языковую модель «с нуля» стоит 2 млн долларов. Далеко не у всех есть такие деньги», – сказал он.
При этом для «тренировки» собственного ChatGPT компании потребуется не только предварительная подготовка – загрузить около 10 ТБ текста, получить кластер из примерно 6000 графических процессоров, «сжать» текст в нейросеть и получить базовую модель. Необходим еще и второй этап – файнтюнинг, или тонкая настройка (fine-tuning).
За первые часы работы конференцию True Tech Day посетили более 3500 человек, еще около 60000 человек подключились к трансляции.