Видеоконтент поколения Альфа: ИИ-базированное ПО для производителя интерактивного оборудования

01.03.2024 |

Александр Абрамов

Видеоконтент поколения Альфа: ИИ-базированное ПО для производителя интерактивного оборудования

Искать и совершенствовать конкурентное преимущество – одна из заповедей любого бизнеса. Особенно это важно в жестких условиях мультимедиа-рынка: так одна из российских компаний в сфере создания и обработки видеоконтента решила создать собственный передовой продукт с уникальным функционалом, отсутствующим у других организаций. О том, как ИТ-сервисная компания ICL Services разработала ПО на базе ИИ для генерации новых продуктов и сервисов, благодаря чему новые продажи заказчика сгенерировали более 10 млн выручки за несколько месяцев, рассказываем далее.

О заказчике

Заказчиком проекта выступило предприятие, работающее в области создания и обработки видеоконтента, производящее оборудование, программное обеспечение и программно-аппаратные комплексы и не только

Об исполнителе

ICL Services – российская ИТ-сервисная компания (входит в группу компаний ICL), работающая на отечественном и международном рынках. В штате компании работает 2000 сотрудников, в портфолио – проекты для более 80 клиентов из разных стран мира.

ICL Services оказывает экспертные услуги по миграции и поддержке ИТ-инфраструктур, разработке, интеграции и тестированию ПО, аудиту ИБ, разработке и поддержке приложений, внедрению решений на базе ИИ, разрабатывает собственные ИТ-продукты.

Предпосылки проекта

Заказчик понимал, что оставаться конкурентным на рынке создания и обработки видеоконтента без прорывных продуктов с настоящим вау-эффектом невозможно, поэтому постоянно искал способы отстроиться от конкурентов.

К моменту начала сотрудничества с ICL Services в компании уже существовала уникальная концепция видеостудии, где съемка происходит с трех ракурсов, а также ПО, которое позволяет обрабатывать полученные видеопотоки. Компания предоставляла программно-аппаратный комплекс с пакетом сервисного обслуживания своим корпоративным клиентам, а также оказывала сервисы на базе комплекса широкой публике, размещая их в торговых центрах и иных публичных местах.

А потому исполнителю предстояло совместно с экспертами заказчика продумать концепцию уникального нового продукта для автоматического монтажа видео на базе искусственного интеллекта, закрепить эту концепцию в виде карты развития продукта на ближайший год.

Ход проекта

В первую очередь, перед началом проекта команда была ознакомлена со следующими обязательными условиями разработки продукта:

продукт должен работать в публично доступном облаке, а также в составе программно-аппаратных комплексов, поставляемых корпоративным клиентам;
продукт должен из исходных видео делать более динамичный, захватывающий внимание аудитории контент, сокращать общую продолжительность итогового видео при этом не исключать ключевые события и реплики исходного контента;
продукт должен уметь работать с различными сценариями исходного материала – однокамерными презентациями или многокамерными интервью.

Чтобы продукт получился максимально функциональным, потребовалась тесная совместная работа экспертов заказчика и команды ICL Services, которые по методологии Agile вели разработку продукта. При этом важно, что продукт до сих пор развивается и улучшается, но за время разработки уже реализовали, протестировали и выпустили ключевой функционал, вокруг которого строится все остальное – событийно-временная модель.

Ее строит искусственный интеллект, определяя важные события в кадре, эмоции людей, неудачные дубли и т.д., наносит их на шкалу времени. Далее же ИИ, совместно со слоем гибкой бизнес-логики, определяет, как наилучшим образом обработать и собрать наилучший результат в единую видеодорожку – что ускорить, когда переключить камеру, что вырезать, а что показать крупным планом.

Изначально планировалось реализовать необходимый функционал за 2 этапа, но, по мере реализации этих функций, объединенная команда и руководство компании заказчика делились новыми идеями функций, находили новые категории потребителей такого продукта. На сегодняшний день уже три этапа работ позади, а четвертый планируется для дальнейшего расширения функциональности.

Благодаря применению микросервисной архитектуры продукт получился универсальным в плане инфраструктуры – его можно установить на сервер внутри корпоративной сети для корпоративных клиентов, а также он доступен как публичный сервис по подписке.

Технологии проекта

В рамках проекта команда тесно работала с технологиями видеоаналитики, а именно распознаванием лиц и эмоций, трекингом объектов, технологиями работы со звуком – синхронизацией фрагментов по звуку (быстрое преобразование Фурье), диаризацией и транскрибацией. Также на проекте были использованы технологии REST API и REDDIS.

Результаты

На выходе проекта заказчик получил новый продукт в своем портфеле и уникальное предложение рынку, полностью отсутствующее у конкурентов. Продажи нового решения сгенерировали заказчику выручку на более чем 10 млн рублей всего лишь за несколько месяцев.

Изображение к лиду - freepik.com