Аналитический обзор текущего состояния российского рынка больших данных и барьеров для его развития представил Карен Казарян, АНО «Цифровая экономика», уделив особое внимание проблемам обезличивания персональных данных, вопросам создания дата-посредников и новых моделей обмена данными, а также использованию синтетических данных при обучении искусственного интеллекта.
Синтезу данных, призванному решить проблему доступности качественных данных для задач искусственного интеллекта и машинного обучения, полностью посвятил свое выступление Борис Рабинович, «Сбер».
О государственном управлении на основе данных, технологическом суверенитете и мерах господдержки подготовки кадров для работы с данными и ИИ рассказала Надежда Сурова, Совет по цифровой экономике Совета Федерации ФС РФ. «За» и «против» применения генеративного искусственного интеллекта в образовании рассмотрел Андрей Комиссаров, Университет 20.35, поделившись отечественными и зарубежными практиками применения алгоритмов на основе ИИ для обучения специалистов, новейшими разработками в этой области и кейсами из собственного опыта. Трансформации профессий посредством ChatGPT и применению ИИ для решения базовых творческих задач был посвящен доклад Артема Семенихина, «Технологии доверия».
Сквозной темой форума стало решение проблем, связанных с импортозамещением, в том числе систем бизнес-аналитики, на которых сфокусировалась компания Axenix.
«Острота ситуации с заменой иностранных решений, ставших недоступными, несколько снизилась, но проблема не исчезла, — отметила Ирина Шеян, руководитель программного комитета форума BIG DATA & AI 2023. — За прошедший год была проведена ревизия как используемых платформ и инструментов, так и поставщиков и партнеров. Формирование импортонезависимой инфраструктуры для работы с данными остается в числе наиболее актуальных вопросов для профсообщества».
Тигран Саркисов, X5 Group, рассказал об актуальных бизнес-задачах в области управления данными и о том, как его команда адаптировалась для их решения без «вендоров из трех букв». Уверенной миграции с западного ПО посвятил свой доклад Сергей Золотарев, Arenadata.
Андрей Евтихов, SberDevices, представил опыт производителя «умных» устройств не только по созданию новых возможностей для бизнеса за счет внедрения собственной платформы данных, но и по достижению технологической независимости в экстремальных внешних условиях. В совместном докладе Дмитрий Инокентьев и Марк Лебедев из компании «Дата Сапиенс» рассказали о развитии прикладных open-source-решений Greenplum и о важности мониторинга кластеров и активных запросов. А Антон Гельмут, Sapiens solutions, описал, как с помощью импортозамещающих технологий снизить нагрузку на SAP HANA.
Важное место в программе форума традиционно занимает бизнес-аналитика. Так, Мария Курдина, Axenix, рассмотрела актуальные аналитические задачи бизнеса в сегодняшних реалиях и подходы к их решению. А Анастасия Остапенко, Axenix, привела в своем докладе сравнительный анализ доступных BI-решений и поделилась находками действительно достойных отечественных BI-платформ, функционал которых сопоставим с возможностями зарубежных решений, а в некоторых случаях даже превосходит их. Александр Бочкин, «Инфомаксимум», рассказал, как работает с большими данными система активной бизнес-аналитики Proceset, помогая бизнесу искать пути повышения эффективности и принимать правильные управленческие решения.
Семен Борисов, Luxms, представил новый релиз платформы Luxms BI, рассмотрев основные новшества и улучшения Luxms BI v9. Максим Озеров, Navicon, на примере проектов миграции компаний из различных отраслей на «Дельта BI» рассмотрел сильные и слабые стороны этой системы. Как BI в чате позволяет решать ключевые проблемы бизнеса, рассказал Юрий Ефаров, Sapiens solutions.
Живой интерес слушателей вызвала интерактивная часть форума, включавшая два мастер-класса. Ведущие мастер-класса для аналитиков — Виталий Чугунов и Алексей Шабалин, «ЕСЛ-Софт», — показали, как совместить в работе приятное с полезным, на примере процесса выслеживания финансовых мошенников с помощью Peraspera Data Hunter. В свою очередь, Александр Брежнев и Сергей Чернышков, GlowByte, на примере FineBI продемонстрировали «восточный подход» к «приручению дракона» в работе с данными, поделились обратной связью от пользователей этого продукта и опытом миграции.
На BIG DATA & AI 2023 был представлен полноценный набор решений российских поставщиков для работы с данными: от систем хранения до облачных платформ управления данными.
Так, Алексей Казаков, «Рэйдикс», рассказал о возможностях продуктов RAIDIX 5, RAIDIX ERA и RAIDIX Hydra в области задач, требующих высокой скорости обработки данных, а также описал особенности работы систем хранения данных на базе продуктов RAIDIX. Зачем нужно разнообразие баз данных? Как контролировать стоки и функциональность выгрузок в другие БД? Как «поженить» Highload OLTP с Highload OLAP? Ответы на эти вопросы прозвучали в выступлении Евгения Афанасьева, VK Tech, который рассмотрел кейс федерального ретейлера.
Владимир Озеров, Querify Labs, разъяснил, как внутренняя архитектура платформы CedrusData позволяет компаниям анализировать большие объемы данных из разных систем в облаке или on‑premise, обеспечивая при этом высокую скорость внесения изменений и значительно уменьшая затраты на инфраструктуру. Алексей Пятов, VK Cloud, на примерах рассмотрел, как меняются метрики TTM, TCO и ROI в облачных проектах на горизонте трех и пяти лет, а также факторы, которые оказывают влияние на рост или снижение эффективности реализации BigData-проектов. Олег Гиацинтов, DIS Group, сфокусировался на инструментах и подходах к монетизации больших данных.
Пример использования облачного подхода на одном из проектов внедрения платформы технологических данных привели в совместном докладе Станислав Шлишевский и Максим Серпухов, «Инфосистемы Джет», и Александр Машика, Yandex Cloud, указав, с какими сложностями можно столкнуться при реализации подобного проекта и какие преимущества получить в результате.
Слушатели познакомились с опытом лидеров, применяющих современные технологии работы с данными для трансформации бизнеса и общества: спикерами форума стали номинанты премии DataAward 2023 и другие специалисты, использующие лучшие практики в промышленности, финансах, ретейле, телекоме, сельском хозяйстве, строительстве и здравоохранении.
Например, Артем Селезнев, «Магнит», представил реализованный ретейлером проект, который позволил систематизировать поиск поведенческих инсайтов в клиентских данных.
Впечатляющий опыт сконцентрировала сессия, посвященная практике применения искусственного интеллекта. В совместном докладе компании «Дататех» Александр Чулапов и Сергей Громов раскрыли возможности синергии имитационного моделирования, больших данных и искусственного интеллекта, привели примеры практических кейсов и дорожную карту применения ИИ в имитационном моделировании. Сергей Карпович, ВТБ, поделился опытом использования моделей в маркетинговых процессах и рассказал, как добиться максимальной эффективности c их помощью, а также привел краткий обзор решений, позволяющих объединять данные от разных поставщиков и строить модели на них. Артем Глазков, «Полиматика», посвятил свое выступление диагностике моделей машинного обучения, призванной обеспечить стабильно высокое качество работы моделей в условиях нестабильного окружения. О становлении процессов создания и поддержки ML-алгоритмов в команде аудиоаналитики рассказал Олег Конорев, билайн, на примере продемонстрировав подход к организации процессов от постановки эксперимента и версионирования моделей до промышленной эксплуатации и непрерывного обновления моделей.
Глеб Данилов из НМИЦ нейрохирургии им. Н.Н. Бурденко раскрыл потенциал применения технологий искусственного интеллекта в этой высокотехнологичной области медицины, представил основные направления развития ИИ применительно к исследованиям нервной системы, а также наиболее интересные практические результаты исследований. Андрей Голов, «Северсталь Диджитал», познакомил слушателей с опытом применения технологий машинного обучения в металлургическом производстве, представив обзор реализованных за последний год проектов с подробностями об инфраструктуре и конкретных инструментах для работы с данными. Опыт цифровизации производственных процессов в агропроме, перспективы использования беспилотных летательных аппаратов в полях компании и направления использования искусственного интеллекта в производстве сельскохозяйственной продукции представил Сергей Косогор из агрохолдинга «СТЕПЬ». А Константин Панфилов из группы компаний «Самолет» рассказал о применении технологий компьютерного зрения для повышения эффективности строительства, ускорения темпов и сокращения количества инцидентов.
Таким образом, в течение одного дня форум позволил сформировать целостную картину происходящего в такой важной области, как большие данные и искусственный интеллект, и оценить технологические возможности, которые в ней открыты уже сегодня и которые откроются в ближайшее время. Именно это участники BIG DATA & AI 2023 и ценят больше всего.