ChatGPT научился создавать вирусные изображения — и чуть не «расплавил» серверы OpenAI

31.03.2025 |

Владимир Кораблёв

Изображение с сайта openai.com

OpenAI столкнулась с неожиданно высоким спросом на новый функционал генерации изображений в ChatGPT на базе модели GPT-4o. Вирусный тренд на создание аниме-стилизованных картинок, включая имитации работ Studio Ghibli, привёл к перегрузке графических процессоров (GPU).

Генеральный директор OpenAI Сэм Альтман заявил, что серверы компании испытывают серьёзные нагрузки, и временные ограничения на использование функции уже введены.

На этой неделе OpenAI представила новый функционал в GPT-4o — генерацию изображений прямо в чате ChatGPT. Пользователи могут создавать картинки по описанию, редактировать загруженные изображения, а также комбинировать текст и визуальные элементы в одном запросе. Технология позволяет точно воспроизводить текст в кадре, соблюдать стилистику и сохранять визуальную целостность при многократных уточнениях — например, при создании персонажа для игры.

Ключевые возможности GPT-4o для создания изображений:

Точное следование инструкциям. Модель корректно обрабатывает сложные запросы, включая до 10–20 объектов в одной сцене.
Работа с текстом. Улучшена генерация изображений с текстовыми элементами — это особенно полезно для инфографики, логотипов и диаграмм.
Мультимодальность. Модель учитывает контекст диалога и загруженные пользователем изображения, позволяя дорабатывать их в процессе общения.
Стилизация. Пользователи могут преобразовывать фотографии в разные художественные стили, включая аниме.

Технические ограничения

Генерация изображения в среднем занимает около одной минуты — за счёт большей детализации увеличилось время обработки. Это повышает нагрузку на вычислительные ресурсы, особенно при массовом использовании.

Функция быстро привлекла внимание: соцсети заполнились аниме-стилем, фан-артом, мемами и персонализированными аватарками. По словам Сэма Альтмана, «GPU буквально плавятся» — настолько велика нагрузка на инфраструктуру. В результате OpenAI пришлось временно ограничить доступ к функции для некоторых категорий пользователей и отложить запуск для бесплатного тарифа. Сейчас приоритетный доступ открыт для пользователей ChatGPT Plus, Pro и Team.

Юридические аспекты

Помимо технических вызовов, новый функционал спровоцировал юридические дискуссии. Пользователи начали массово стилизовать известные изображения и мемы под узнаваемый стиль Studio Ghibli, не всегда учитывая возможные правовые последствия.

Хотя OpenAI утверждает, что модель отказывается имитировать стиль конкретных живых художников, студийные стили — такие как у Ghibli — доступны для генерации. Это вызвало волну критики со стороны художников и юристов в сфере авторского права. Один из ключевых вопросов — использовались ли в обучении модели защищённые авторским правом изображения и были ли на это получены соответствующие лицензии.

OpenAI подчёркивает, что работает над прозрачностью: каждое изображение снабжается метаданными C2PA, указывающими на его происхождение.

Также внедрены фильтры, ограничивающие генерацию недопустимого контента. Компания продолжает мониторить ситуацию, стараясь соблюсти баланс между творческой свободой пользователей и правовыми ограничениями.