Виктор Кантор – эксперт, который прошел путь от junior-разработчика до топ-менеджера, долгое время совмещая роли руководителя и преподавателя-наставника. Для выступления на МТС True Tech Day спикер подготовил инструкцию о том, какие возможности карьерного роста существуют в сфере ML.
Первая, основополагающая «развилка» на этом пути – выбор между индустриальным экспертом, исследователем и менеджером. У каждого из этих «персонажей» свой перечень необходимых скиллов и обязанностей, а также разные перспективы построения карьеры.
Индустриальные эксперты – специалисты, которые работают непосредственно в определенных коммерческих проектах сферы ML. Среди них наиболее распространены четыре профессии, которые, на первый взгляд, очень похожи: дата-сайентист (Data Scientist), дата-аналитик (Data Analyst), дата-инженер (Data Engineer) и ML-инженер (ML Engineer).
Виктор Кантор, директор Центра Big Data МТС.
Скрин из трансляции МТС True Tech Day
«Еще около десяти лет назад у работодателей не было такой узкой специализации, даже дата-сайентистом было не устроиться – только разработчиком, который «умеет в Machine Learning». Правда, аналитики были всегда, просто они назывались по-разному. В какой-то момент возникла профессия дата-сайентиста, появились люди с более узкой подготовкой. Далее начался холивар на тему того, нужны ли вообще дата-инженеры, нужно ли разделять эти роли, или дата-сайентист должен сам себе данные готовить. В итоге произошло еще одно разделение. Сейчас такие позиции есть почти в каждой ИТ-компании», – начал Виктор Кантор.
Data Scientist – специалист, который непосредственно занимается разработкой моделей машинного обучения. Он должен уметь на базовом уровне оперировать данными, но это не является его основной функцией. Он выстраивает модель на всех этапах ее жизненного цикла: от оценки потребностей бизнеса и разработки механизмов встраивания модели в бизнес-процесс до выхода продукта в продуктивную эксплуатацию.
Data Analyst – аналитик данных. Ему не обязательно быть мастером построения ML-моделей, хотя рано или поздно это делать все-таки придется. В основном акцент в этой профессии делается на исследовании данных, построении графиков и других форм визуализации в различных срезах, написании SQL-запросов.
Data Engineer – специалист, отвечающий за то, чтобы данные правильно собирались, перекладывались, готовились нужные базы, с которыми работают дата-аналитики и дата-сайентисты. В этой области тоже много интересных вызовов. «Когда вы начинаете думать не только о том, как все эти перекладывания данных настроить, но и о том, как вообще валидировать качество, какими должны быть в итоге таблички, чтобы они могли максимально переиспользоваться большим количеством дата-сайентистов. – тут начинается настоящее инженерное творчество», – заметил спикер.
Карьерные треки и скиллы индустриальных экспертов ML.
Компиляция слайдов из презентации Виктора Кантора на МТС True Tech Day
ML Engineer – специалист, занимающийся подготовкой и масштабированием ML-модели для ее внедрения в производство. Это не такая распространенная должность, как первые три. «Этот вопрос возникает только в тех компаниях, где есть суровый продакшн, где делают высоконагруженные сервисы. Потому что дата-сайентисты обычно хорошо разбираются в математике, но не всегда могут писать нормальный код. ML-инженер, по крайней мере в российских компаниях, чуть ближе к разработчикам. Допустим, дата-сайентисты сделали хорошую модель рекомендательного сервиса, но в момент, когда ее выкатили в продакшн, отсортировали товары не по релевантности, а по ID, и вся система перестала работать. Таких примеров много. Поэтому, чтобы запускать модели в производство, нужно разбираться в ML», – пояснил Виктор Кантор.
Карьерный трек у всех специализаций похожий: Junior, Middle, Senior, Lead. Chief. Что касается Hard Skills, необходимого стека технологий, – сейчас практически всё в ML делается на языке Python (иногда пригодится C++ и R). В остальном требуемые навыки различаются: например, для Data Scientist важны знания в области SQL, статистики, алгоритмов, работы с большими данными, инструментов визуализации. ML-инженеру должны быть знакомы библиотеки машинного обучения (TensorFlow, PyTorch, Scikit-Learn), инструменты контейнеризации (Docker, Kubernetes).
В направлении ML-research можно выделить две большие ветки: академическую карьеру и карьеру в R&D-отделах компаний.
Академическая карьера начинается с должности аспиранта в профильном вузе и продолжается по стандартным уровням: в западной классификации это постдокторант (Postdoc), ассистент-профессор, ассоциированный профессор и, наконец, профессор. В России отношение к этому ранжированию не такое жесткое, и специалист при определенных условиях может преподавать в статусе профессора, даже не обладая всем набором формальных регалий. На сегодняшний день ML считается новой областью знаний, поэтому построить академическую карьеру здесь пока относительно просто.
Академическая карьера в ML.
Слайд из презентации Виктора Кантора на МТС True Tech Day
Научная карьера в R&D отделе напоминает трек индустриального эксперта (Junior, Middle, Senior и т. д.), но с той оговоркой, что сотрудник занимается исследованиями, публикует статьи и т. д. «Раньше люди часто не шли в науку по той причине, что в ней временами было голодно. Сейчас у них есть возможность прийти в большую компанию. Например, в МТС AI много специалистов занимаются наукой, исследованиями, публикациями. Даже в Центре Big Data МТС, который больше ориентирован на создание экономического эффекта для бизнеса, тоже ведется научная деятельность. Поэтому сегодня можно заниматься наукой, не бедствовать и заниматься любимым делом. Самое прекрасное в нашей области – это то, что если вы получили математическое или физико-математическое образование, то можете работать по специальности, и всё, что вы учили, окажется вам полезным», – резюмировал Виктор Кантор.
Начать профессиональный путь в ML можно, пройдя полноценное обучение в профильном вузе либо, уже имея высшее образование, – на специализированных кафедрах компаний, занимающихся AI и реализующих программы для магистров. Такие кафедры уже существуют на базе МФТИ, ВШЭ, ИТМО и других образовательных учреждений. Также внутри многих компаний есть собственные образовательные проекты – такие, как школа МТС Тета, где есть трек для аналитиков данных.
«Сейчас многие вкладываются в развитие новых кадров, и это можно успешно использовать. Как правило, если это какая-то кафедра от ИТ-компании, на ней вы будете выполнять приближенные к реальности задачи. Например, мы даем нашим студентам на курсе рекомендательных систем в ИТМО задачу сделать инструмент для поиска фильма по его описанию. То есть люди фактически впервые знакомятся с рекомендательными системами, и буквально через несколько недель курса у них уже что-то полезное получается сделать. Я не хочу сказать, что можно стать дата-сайентистом за три месяца, но первых успехов можно достичь действительно очень быстро. Поэтому в эту область в целом «вкатываться» очень приятно», – рассказал эксперт.
От Junior к Middle.
Слайд из презентации Виктора Кантора на МТС True Tech Day
Отдельная тема – переход специалистов между уровнями, где каждый шаг сопряжен с проблемами различной тяжести. Если вырасти из Junior в Middle можно достаточно быстро и безболезненно (как правило, это занимает от трех месяцев до года), то этап становления из Middle в Senior может занять более двух лет: нужно значительное время для набора опыта.
Разница между Junior в Middle – в первую очередь, в уровне технических навыков и надежности работы, а также в способности последних более активно (и проактивно) участвовать в проектах. «Я не просто жду, когда ко мне придут с задачами, а проявляю инициативу. Специалист Middle более самостоятелен, реже ошибается – это результат углубления навыков и наработки опыта. Очень важно получать обратную связь, спрашивать у старших товарищей о том, как вы работаете, получается или нет. Еще один интересный пункт – про менторство и наставничество. Будучи в роли Junior, очень важно найти ментора, который будет вам помогать. Бывает, что им становится не ваш непосредственный руководитель, а кто-то другой», – дал совет Виктор Кантор.
Основное необходимое условие перехода из Middle в Senior – начало наставничества, проявление лидерских качеств, более смелое общение с бизнесом. Эти лидерские качества еще сильнее нужны в роли Lead: здесь нужно уметь организовывать людей вокруг себя для реализации задуманных инициатив. Нормально, если специалист решит, что его приоритет – не в руководстве другими людьми, а в развитии собственной экспертизы. Быть крутым Senior – тоже вполне достойный выбор.
«Как правило, сначала вы начинаете соответствовать следующему уровню, а потом уже на него формально переходите. Очень редко бывает так, что вас повысили, и вам нужно самому дотягивать. К сожалению, мы не всегда выбираем, какие задачи выполнять. Но тот специалист, который внес большой вклад в развитие компании, получил больше ценных для компании навыков, – в большей степени ей интересен. Поэтому, если мы говорим про индустриальную карьеру, значимый результат привлекает больше внимания. Поэтому нужно пытаться попасть в наиболее важные для бизнеса проекты», – указал спикер.
В исследовательской карьере главное отличие состоит в большем внимании к научным знаниям. Специалисту придут на помощь знания базового курса математики и отсутствие страха перед сложными областями. Большим преимуществом станет профильная кафедра в магистратуре с сильной научной группой и уже на этапе обучения трудоустройство в R&D-отдел или исследовательский институт. Самое главное качество исследователя в ML – готовность долго получать негативный результат и не демотивироваться, сохранять моральную устойчивость.
«Как понять в кого развиваться? Ответ простой: нужно пробовать. При этом обратите внимание, что когда мы начинаем заниматься какой-то областью, то сначала очень быстро набираем производительность, у нас начинает что-то получаться. Но потом наступает момент, когда нам уже тяжело учиться, потому что мы накопили основной базис. Если этот момент не пережить, любая сфера окажется не особо интересной», – резюмировал спикер.
Пример разработки на основе ML.
Слайд из презентации Виктора Кантора на МТС True Tech Day
Добавим, что в Центре Big Data МТС работает около 650 специалистов, среди которых есть дата-сайентисты, дата-инженеры, ML-инженеры и аналитики. Команда реализует множество проектов, связанных с аналитикой больших данных и машинным обучением. Эти технологии применяются, например, для планирования развития сети и размещения базовых станций, для совершенствования системы блокировки спама, для создания рекомендательных систем в различных приложениях – в онлайн-кинотеатре KION, в сервисе Строки, в МТС Банке. Реализуются и проекты для внешних заказчиков: например, системы банковского и антифрод-скоринга, решения для развития городской инфраструктуры.