DeepSeek представя модел за дълги текстови секвенции

Китайската компания за изкуствен интелект DeepSeek обяви пускането на новия експериментален модел DeepSeek-V3.2-Exp, който според разработчиците е по-евтин за обучение и по-ефективен при обработка на дълги текстови последователности.

Компанията представи модела на форума Hugging Face, описвайки го като „промеждно стъпало към следващото поколение архитектури“ и част от текущите си изследвания за по-ефективни трансформър архитектури.

Технологията зад модела

DeepSeek-V3.2-Exp се базира на предишната версия V3.1-Terminus, като въвежда Sparse Attention – техника, която позволява на модела да фокусира вниманието си върху най-важните части от текста. Това води до значително по-бързо обучение и изпълнение, без да се компрометира качеството на генерирания резултат.

Компанията посочва, че новият подход намалява използването на изчислителни ресурси, тъй като моделът не „чете“ всяка дума с еднаква тежест, а се концентрира върху ключовите сегменти на текста.

Очаквания и предимства

DeepSeek обяви, че новият модел ще позволи намаляване на цените на API услугите с над 50%, което го прави по-достъпен за разработчици и компании. Според медийни източници, DeepSeek-V3.2-Exp е най-голямото пускане на компанията след моделите V3 и R1, които предизвикаха интерес сред инвеститори в Силициевата долина и по света.

Компанията продължава да експериментира с нови механизми за оптимизация, за да предоставя по-мощни и по-евтини AI модели в бъдеще. За справка, R1 моделът с фокус върху reasoning задачи е трениран за около $294,000, което е значително по-ниска цена в сравнение със стотици милиони долари за подобни западни модели.

DeepSeek-V3.2-Exp демонстрира тенденцията за оптимизация на трансформър моделите чрез Sparse Attention и други техники, които позволяват обработка на дълги текстови секвенции с по-ниски разходи. Това може да ускори достъпа до високо производителни AI услуги и да стимулира иновации в индустрията за изкуствен интелект.

e-security.bg

Подобни

23- ма спасени от дигитално робство
13.02.2026
redleaf_lodi-power-5508644_640
Ransomware атака срещу A1 Capital в Турция
13.02.2026
nuevo-ransomware
Руски биодронове?
13.02.2026
sandeephanda-homing-pigeon-2727563_640
Anna’s Archive пуска милиони песни от Spotify въпреки иск за $13 трлн.
13.02.2026
pirate-flag-7541041_640
Вълна от напускания разклаща ИИ индустрията
13.02.2026
mohamed_hassan-resignation-6784035_640
Бумът на prediction пазарите носи милиарди
13.02.2026
myshoun-crystal-ball-8392380_640

Споделете

Facebook
LinkedIn

Бюлетин

С нашия бюлетин ще бъдеш сред първите, които научават за нови заплахи, практични решения и добри практики. Напълно безплатно и с грижа за твоята сигурност.

Популярни

Изземване на Zamunda, Arena и други торент сайтове
30.01.2026
seizure
Измамническите сайтове в България: как да ги разпознаем, проверим и защитим себе си
6.10.2025
bulgaria3
Вишинг измами срещу потребители на Revolut
11.12.2025
revolut
Социалните мрежи и младите - между канализиране на общественото мнение и манипулация
7.12.2025
spasov

Бъди в крак с киберсигурността

Абонирай се за нашия бюлетин и получавай директно в пощата си най-важните новини, експертни съвети и практически насоки за киберхигиена и защита онлайн. Кратко, полезно и без спам.