GigaChat 2.0 - новая русскоязычная нейросетевая модель от Сбера

GigaChat 2.0 - новая русскоязычная нейросетевая модель от Сбера
Согласно оценкам бенчмарка MERA, на которые ссылаетсяСбер в своем пресс-релизе, для русского языка, модель GigaChat 2 MAX от Сбера заняла первое место среди искусственных интеллектов. В международных бенчмарках обновленная линейка моделей во многих аспектах превосходит такие решения, как GPT4o, DeepSeek-V3, LLaMA 70B и Qwen2.5.

Вся линейка GigaChat 2.0 прошла существенную модернизацию, что дает возможность корпоративным клиентам эффективнее и быстрее справляться с текущими задачами и внедрять масштабные проекты.

  • GigaChat 2 MAX стал еще производительнее и значительно опережает многие иностранные аналоги при работе с русским языком.
  • GigaChat 2 Pro показывает качество на уровне предыдущей версии MAX и отлично справляется с заданиями, требующими креативности и точности, при этом потребляя меньше вычислительных ресурсов.
  • GigaChat 2 Lite — начальная модель для решения несложных задач, теперь по качеству соответствует предыдущей версии Pro, что позволяет более экономично и быстро справляться со сложными вопросами.

Пользователям доступны как модели первого поколения, так и новые версии GigaChat 2.0, которые можно протестировать перед окончательным переходом. Для выбора оптимальной для бизнеса версии GigaChat и подходящих промптов не требуются навыки программирования. Все модели доступны бизнесу через API в облаке или могут быть развернуты локально в инфраструктуре компании.

Андрей Белевцев, старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка: «GigaChat 2.0 — это не просто улучшение показателей и технических характеристик, а значительный прогресс в развитии русскоязычных больших языковых моделей (LLM). Мы разработали решение уровня лучших мировых образцов, а в работе с русским языком наша модель превосходит большинство из них. Мощные отечественные нейросети имеют стратегическое значение для любого бизнеса, работающего в России. Уже 15 тысяч внешних клиентов используют GigaChat, и существенное обновление нашей линейки позволит еще большему числу клиентов эффективнее решать широкий спектр задач. Совершенствуя процессы с помощью искусственного интеллекта, компании получат уникальную возможность обойти конкурентов, увеличить доходы и повысить лояльность клиентов».

Возможность создания более эффективных AI-агентов

С использованием GigaChat 2.0 компании смогут разрабатывать более продуктивных автономных помощников (AI-агентов), способных анализировать информацию и самостоятельно решать сложные многоуровневые задачи. Это стало доступно благодаря расширению знаний моделей в области математики, естественных и гуманитарных наук, улучшению навыков программирования и написания качественного кода. Для создания агентов на Python и JS можно использовать популярный SDK LangChain, с которым GigaChat полностью совместим. Пакеты совместимости доступны в публичном репозитории GigaChain.

Обработка в 4 раза большего объема контекста

Модели нового поколения значительно дольше сохраняют контекст разговора, отвечают на сложные объемные вопросы и анализируют больше текста. Если раньше в один запрос можно было включить около 48 страниц А4 с текстом (шрифт 14 pt), то теперь максимальный объем запроса увеличился почти до 200 страниц. Это делает GigaChat 2.0 более удобным для создания чат-ботов.

Повышение эффективности решения рабочих задач в 2 раза

Новые модели вдвое точнее выполняют инструкции пользователя и на 25% лучше отвечают на вопросы: соблюдают заданные форматы и условия, формируют ответы в определенном стиле, что способствует более эффективному решению рабочих задач: подготовке сопроводительной юридической документации, анализу обращений клиентов и так далее.

В ряду мировых лидеров

По данным независимого бенчмарка MERA для русского языка, GigaChat 2 MAX занимает первое место среди AI-моделей. А по результатам бенчмарков формата MMLU на русском и английском языках, новая линейка моделей не уступает показателям мировых лидеров или даже превосходит их. Наиболее впечатляющие результаты продемонстрировала флагманская модель линейки. По сравнению с DeepSeek-V3, Qwen2.5 (версия Qwen-2.5-75b), GPT4o и LLaMA 70B, GigaChat 2 MAX лучше отвечает на фактологические вопросы на русском языке и точнее следует заданному формату. Модель также опережает зарубежные аналоги на бенчмарке для оценки навыков программирования HumanEval и обладает более глубокими знаниями в точных науках.

Автор: Александр Абрамов.

Тематики: ПО

Ключевые слова: Сбербанк, Искусственный интеллект, Нейросети