Година след като DeepSeek изненада индустрията със своя първи модел с отворен код, компанията вече предлага система, която е над два пъти по-интелигентна, но и драстично по-евтина за използване. Новата версия V3.2 остава малко зад моделите на Google, Anthropic и OpenAI по обща производителност, но изпълнява същите задачи поне 22 пъти по-евтино, превръщайки се в сериозно икономическо предизвикателство за водещите американски корпорации.
Глобалната криза на токен цените: къде стои DeepSeek
Независимата компания Artificial Analysis класира най-мощните ИИ модели на пазара според комбиниран индекс от сложни бенчмаркове.
Текущата класация изглежда така:
-
Gemini 3 Pro (Google, САЩ) – 73%
-
Claude Opus 4.5 (Anthropic, САЩ) – 70%
-
GPT-5.1 (OpenAI, САЩ) – 70%
-
Kimi K2 Thinking (Moonshot AI, Китай) – 67%
-
DeepSeek V3.2 (Китай) – 66%
-
Grok 4 (xAI, САЩ) – 65%
-
MiniMax-M2 (Китай) – 61%
-
Qwen3 235B (Alibaba Cloud, Китай) – 57%
-
GLM-4.6 (Z.ai, Китай) – 56%
-
Mistral Medium 1.2 (Франция) – 52%
Meta и нейната серия Llama вече не попадат в топ 10.
Но производителността не е единственият критерий. В реалния бизнес ключовият въпрос е колко струва изпълнението на една и съща задача. Тук китайските модели доминират.
Цената за изпълнение е новото бойно поле
DeepSeek буквално разгромява конкуренцията по цена за изпълнение на набор от стандартни оценки:
-
54 долара – DeepSeek V3.2
-
159 долара – MiniMax-M2
-
226 долара – GLM-4.6
-
380 долара – Kimi K2 Thinking
-
497 долара – Mistral Medium 1.2
-
859 долара – GPT-5.1
-
934 долара – Qwen3 235B
-
1 201 долара – Gemini 3 Pro
-
1 498 долара – Claude Opus 4.5
-
1 888 долара – Grok 4
Разлика от почти 35 пъти между DeepSeek и Grok 4.
Този ценови срив оказва натиск върху целия сектор и директно застрашава бизнес моделите на компаниите, инвестиращи трилиони в инфраструктура за ИИ.
Как DeepSeek става толкова евтин: технологичният трик
Новият модел запазва същия мащаб като предшественика си –
671 милиарда общи параметъра и 37 милиарда активни – но представянето и ефективността са драматично подобрени. Ключовите разлики идват от три собствено разработени технологични системи:
1. DeepSeek Sparse Attention (DSA) – олекотено внимание
Механизъм, който намалява изчислителната сложност, без да намалява интелигентността в дългите контексти.
2. Scalable Reinforcement Learning Framework
Оптимизирана среда за RL посттренировка, която дава по-добра производителност при същата цена.
3. Large-Scale Agentic Task Synthesis Pipeline
Платформа за масово генериране на синтетични задачи и данни, особено ценна за модели за разсъждение.
Благодарение на тези оптимизации DeepSeek намали наполовина цената за input токени и със 75% за output токени в своя API.
Вариации в новата серия: за инструменти и за разсъждение
DeepSeek пусна две версии на V3.2:
-
V3.2-Tool – оптимизиран за използване на инструменти и външни API
-
V3.2-Speciale – насочен към дълбоко разсъждение, но без инструментална поддръжка
Тази стратегия директно таргетира потребителите на Gemini и GPT, които плащат високи цени за reasoning задачи.
Големият проблем: доверие, регулации и геополитика
Въпреки технологичните успехи, много експерти в Y Combinator и Hacker News посочват липса на доверие, произтичаща от:
-
геополитическото напрежение
-
законовата рамка в Китай
-
опасения за корпоративна и национална сигурност
Тези фактори ограничават масовото приемане в САЩ и Европа, независимо от ниската цена.
Ще изпревари ли DeepSeek Gemini 3?
Според самото студио има три критични бариери:
1. По-малко общ обучителен ресурс
DeepSeek има по-малко FLOPs по време на предварително обучение, което означава по-ограничени общи знания.
2. По-ниска токен ефективност
Моделът често използва повече токени, за да постигне сходно качество на отговора.
3. Справяне със сложни задачи
Моделът изостава при многостъпкови и нестандартни задачи, при които Gemini 3 и Claude Opus доминират.
Компанията твърди, че ще адресира тези ограничения с по-големи изчислителни ресурси и нови оптимизации.
DeepSeek V3.2 не е най-мощният модел в света – но е моделът, който най-силно променя икономиката на ИИ. Ако тенденцията се запази, китайските модели с отворени кодове могат да поставят под съмнение устойчивостта на скъпите проприетарни решения на водещите западни компании.









