DeepSeek R1: цунами или легкое волнение

Новость о DeepSeek R1 вызвала волну обсуждений в технологическом сообществе, волнение на фондовых рынках и потерю денег у владельцев бигтеха.

Китайский стартап DeepSeek представил свою LLM-модель R1, которая, согласно заявлениям компании, была разработана с использованием ограниченного оборудования, включая чипы Nvidia H800, которые были специально разработаны для соответствия экспортным ограничениям США.

Несмотря на эти ограничения, DeepSeek утверждает, что их модель способна конкурировать с ведущими мировыми аналогами, такими как OpenAI и Meta (признана экстремистской и щзапрещена в России), по производительности, при этом стоимость разработки составила всего около 5,6 млн. долларов.

Такие заявления вызвали значительное волнение среди инвесторов и аналитиков, которые ставят под сомнение эффективность текущих санкций США против Китая в области высоких технологий. Некоторые эксперты считают, что этот успех может быть связан с тем, что китайские исследователи действительно нашли способы эффективного использования ограниченных ресурсов, что позволило им достичь значительных результатов.

Фондовые рынки забеспокоились

Инвесторы начали задаваться вопросом о том, насколько оправданы огромные инвестиции в развитие искусственного интеллекта, если небольшие компании могут достигать аналогичных результатов за гораздо меньшие деньги.

Новость о DeepSeek R1 оказала влияние на акции компаний, занимающихся производством полупроводников и искусственным интеллектом. Акции таких компаний, как Nvidia, Alphabet, упали после объявления о запуске DeepSeek R1 — акции Nvidia потеряли почти 17% своей стоимости, что привело к утрате компанией рыночной капитализации на сумму свыше почти 600 млрд. долл.Убытки понесли также Oracle и Dell.

Как сообщают СМИ, состояние 500 самых богатых людей мира снизилось в общей сложности на 108 млрд. долл из-за падения акций технологических компаний на фоне успеха DeepSeek-R1. Индекс NASDAQ Composite упал на 3,1%, а S&P 500 — на 1,5%.

В понедельник, 27 января, DeepSeek R1 стал самым популярным бесплатным приложением в App Store. Вскоре после этого компания столкнулась со сбоями в работе своего веб-сайта. Стартап заявил, что оказался жертвой масштабной кибератаки, из-за чего ввел временные ограничения на регистрацию пользователей.

Эксперты засомневались

Если заявленные показатели подтвердятся, то DeepSeek R1 может оказаться технологическим прорывом и вызовомустоявшимся подходам к разработке AI. Но, хотя успехи DeepSeek выглядят очень яркими, многие эксперты выражают сомнения относительно реальности заявлений компании. Они указывают на то, что разработка столь мощных моделей требует значительных предварительных исследований и инвестиций, которые могли быть не полностью учтены в указанной DeepSeek стоимости разработки.

Некоторые пользователи DeepSeek сообщают о базовых ошибках модели, которые напоминают проблемы, с которыми сталкивался ChatGPT на ранних этапах своего существования.

DeepSeek иногда выдает неточные или неправильные ответы на простые вопросы, что было характерно для ChatGPT в его начальной версии. Например, модель может неправильно интерпретировать математические задачи или давать неверные факты.

Эксперты увидели, что модель ограничена в своих ответах, в контексте чувствительных тем, таких как история и политика. Также пользователи также сообщают о том, что DeepSeek иногда не справляется с поддержанием контекста в длинных беседах, что приводит к нерелевантным ответам.У экспертов также остаются опасения по поводу безопасности данных.

Эти комментарии подчеркивают, что хотя DeepSeek анонсирует значительные достижения в производительности и стоимости, она сталкивается с типичными для ранних LLM-моделей yедостатками.

Несмотря на «мгновенный» рост популярности DeepSeek R1, остается неясным, сможет ли эта модель действительно изменить ландшафт рынка больших языковых моделей (LLM).

Ведущие игроки отрасли продолжают инвестировать миллиарды долларов в разработку новых технологий и совершенствование существующих решений, в борьбе за лидерство на рынке.

Ситуация вокруг DeepSeek R1 демонстрирует сложность и динамичность современного рынка искусственного интеллекта. Хотя китайская компания смогла привлечь внимание своими достижениями, окончательные выводы о влиянии этой модели на индустрию можно будет сделать лишь спустя некоторое время.

Автор: Владимир Кораблёв.

Тематики: ПО, Инновации

Ключевые слова: Искусственный интеллект, чат-боты, Нейросети