Облачная платформа Alibaba Cloud выпустила усовершенствованную версию своей крупной языковой модели под названием Qwen2.5-Max. Основой этой модели является архитектура Mixture-of-Experts (MoE), а обучение проходило на базе более чем 20 триллионов токенов. Разработчики подчеркнули, что модель значительно улучшила свои интеллектуальные способности и уже готова к использованию.
По сравнению с предыдущими версиями, новая модель обладает повышенной скоростью работы и точностью, что позволяет ей эффективнее решать задачи, требующие глубокого анализа текстов, перевода и создания контента. Как отмечает сама компания, «Qwen2.5-Max демонстрирует значительные улучшения при работе со сложными запросами и предоставляет более точные ответы».
Модель прошла тестирование на нескольких популярных бенчмарках, среди которых MMLU-Pro, LiveCodeBench, LiveBench и Arena-Hard. В ходе тестов она превзошла DeepSeek V3 на площадках Arena-Hard, LiveBench и LiveCodeBench, а также показала хорошие результаты в MMLU-Pro. Кроме того, Qwen2.5-Max смогла конкурировать с такими известными моделями, как GPT-4o и Claude-3.5-Sonnet.
В планах Alibaba Cloud интеграция новой версии Qwen2.5-Max в свои облачные сервисы, чтобы клиенты могли применять эту технологию для автоматизации обработки данных, улучшения клиентского сервиса посредством чат-ботов и оптимизации рабочих процессов.
Пользователи уже могут получить доступ к Qwen2.5-Max через сервис Qwen Chat, где они смогут оценить работу модели и воспользоваться ее возможностями. Также разработчики могут подключиться к ней через API после регистрации в Alibaba Cloud, активации сервиса Model Studio и получения API-ключа.
Напомним, что накануне китайские разработчики сделали общедоступной нейросеть DeepSeek, которую назвали "убийцей GPT". Стоит отметить, что создание этого проекта обошлось инвесторам на порядок дешевле, чем было вложено в развитие ChatGPT. Появление данного продукт в области искусственного интеллекта моментально обрушило котировки акций крупнейших мировых ИТ-компаний. В совокупности капитализация компаний из индекса Nasdaq 100 сократилась на 1 трлн долларов из-за успеха DeepSeek. Однако на второй день после публикации китайской нейросети для широкой публики регистрация на платформе была приостановлена из-за многочисленных попыток вредоносных атак на нейросеть.