Anthropic обяви значително надграждане на модела Claude Sonnet 4, който вече може да работи с до 1 милион токена контекст, но засега тази функционалност е налична единствено чрез API. Това представлява петкратно увеличение спрямо предишния лимит и позволява запазване на много по-големи обеми от информация в рамките на една сесия – еквивалент на над 75 000 реда код или стотици документи.
Преди това разработчиците трябваше да подават информация към Claude на малки части, което често водеше до загуба на контекст при достигане на лимита. Сега, с капацитет от 1 милион токена, моделът може да обработва цели програмни кодове с всички зависимости, да анализира стотици документи едновременно и да поддържа контекст между стотици извиквания на инструменти. Това открива възможности за изграждане на по-мощни приложения и интелигентни агенти, които не губят важна информация по време на работа.
Ограничения и достъп
Важно е да се отбележи, че новият лимит важи само за Claude Sonnet 4. По-мощният, но и по-скъп модел Opus 4.1 остава с досегашните ограничения. Разширеният контекст се предлага чрез Anthropic API за клиенти с Tier 4 и персонализирани лимити, като по-широкото разпространение се очаква в следващите седмици.
Anthropic потвърждава, че поддръжката за дълъг контекст вече е налична и в Amazon Bedrock, а скоро ще бъде достъпна и в Google Cloud Vertex AI. При заявки, които надхвърлят 200 000 токена, цената се коригира, но използването на кеширане на заявки може значително да намали разходите и латентността.
Какво следва
Въпреки че засега новият лимит е наличен само през API, Anthropic планира да го интегрира и в уеб и мобилните версии на Claude в бъдеще. Това би направило работата с големи обеми данни и дълготраен контекст още по-достъпна за крайните потребители.









