Заказчиком проекта выступило предприятие, работающее в области создания и обработки видеоконтента, производящее оборудование, программное обеспечение и программно-аппаратные комплексы и не только
ICL Services – российская ИТ-сервисная компания (входит в группу компаний ICL), работающая на отечественном и международном рынках. В штате компании работает 2000 сотрудников, в портфолио – проекты для более 80 клиентов из разных стран мира.
ICL Services оказывает экспертные услуги по миграции и поддержке ИТ-инфраструктур, разработке, интеграции и тестированию ПО, аудиту ИБ, разработке и поддержке приложений, внедрению решений на базе ИИ, разрабатывает собственные ИТ-продукты.
Заказчик понимал, что оставаться конкурентным на рынке создания и обработки видеоконтента без прорывных продуктов с настоящим вау-эффектом невозможно, поэтому постоянно искал способы отстроиться от конкурентов.
К моменту начала сотрудничества с ICL Services в компании уже существовала уникальная концепция видеостудии, где съемка происходит с трех ракурсов, а также ПО, которое позволяет обрабатывать полученные видеопотоки. Компания предоставляла программно-аппаратный комплекс с пакетом сервисного обслуживания своим корпоративным клиентам, а также оказывала сервисы на базе комплекса широкой публике, размещая их в торговых центрах и иных публичных местах.
А потому исполнителю предстояло совместно с экспертами заказчика продумать концепцию уникального нового продукта для автоматического монтажа видео на базе искусственного интеллекта, закрепить эту концепцию в виде карты развития продукта на ближайший год.
В первую очередь, перед началом проекта команда была ознакомлена со следующими обязательными условиями разработки продукта:
Чтобы продукт получился максимально функциональным, потребовалась тесная совместная работа экспертов заказчика и команды ICL Services, которые по методологии Agile вели разработку продукта. При этом важно, что продукт до сих пор развивается и улучшается, но за время разработки уже реализовали, протестировали и выпустили ключевой функционал, вокруг которого строится все остальное – событийно-временная модель.
Ее строит искусственный интеллект, определяя важные события в кадре, эмоции людей, неудачные дубли и т.д., наносит их на шкалу времени. Далее же ИИ, совместно со слоем гибкой бизнес-логики, определяет, как наилучшим образом обработать и собрать наилучший результат в единую видеодорожку – что ускорить, когда переключить камеру, что вырезать, а что показать крупным планом.
Изначально планировалось реализовать необходимый функционал за 2 этапа, но, по мере реализации этих функций, объединенная команда и руководство компании заказчика делились новыми идеями функций, находили новые категории потребителей такого продукта. На сегодняшний день уже три этапа работ позади, а четвертый планируется для дальнейшего расширения функциональности.
Благодаря применению микросервисной архитектуры продукт получился универсальным в плане инфраструктуры – его можно установить на сервер внутри корпоративной сети для корпоративных клиентов, а также он доступен как публичный сервис по подписке.
В рамках проекта команда тесно работала с технологиями видеоаналитики, а именно распознаванием лиц и эмоций, трекингом объектов, технологиями работы со звуком – синхронизацией фрагментов по звуку (быстрое преобразование Фурье), диаризацией и транскрибацией. Также на проекте были использованы технологии REST API и REDDIS.
На выходе проекта заказчик получил новый продукт в своем портфеле и уникальное предложение рынку, полностью отсутствующее у конкурентов. Продажи нового решения сгенерировали заказчику выручку на более чем 10 млн рублей всего лишь за несколько месяцев.
Изображение к лиду - freepik.com