DeepSeek выпустила обновление ИИ-модели V3

DeepSeek представила обновлённую версию своей ИИ-модели V3 под названием V3-0324, которая, по данным Bloomberg, значительно улучшает возможности программирования и устанавливает новые стандарты точности и эффективности. Релиз обновления состоялся без официального анонса и был опубликован на платформе Hugging Face.

DeepSeek V3, открытая ИИ-модель, представленная в конце прошлого года, построена на архитектуре Mixture of Experts (MoE) и обладает 671 миллиардом параметров, из которых 37 миллиардов активируются на каждый токен.

Тогда компания сообщила, что обучение модели обошлось в 5,5 миллионов долларов, что значительно меньше, чем затраты других технологических гигантов, таких как OpenAI, на создание сопоставимых моделей. Более того, спустя всего несколько недель DeepSeek выпустила рассуждающую модель R1 с открытым исходным кодом, которая, несмотря на скромный бюджет, превзошла ИИ-модель o1 от OpenAI в ряде ключевых бенчмарков.