Популярни големи езикови модели (LLM) показаха неочаквана слабост, когато бяха изправени пред на пръв поглед тривиален казус:
„Автомивката е на 40 метра от дома ми. Искам да измия колата си. Да отида ли пеша или с кола?“
Социалните мрежи бързо се изпълниха със скрийншоти от отговори на чатботове като ChatGPT, Claude и Grok, които уверено съветват потребителя да върви пеша, защото разстоянието е кратко, по-екологично и по-здравословно.
„Логични“ аргументи, които пропускат очевидното
Аргументите звучат разумно:
-
Шофирането на толкова късо разстояние е неефективно.
-
Придвижването пеша е по-евтино и щадящо околната среда.
-
Дори има иронични забележки от типа: „Да караш колата, за да я измиеш, означава да я изцапаш още веднъж.“
Проблемът обаче е очевиден за всеки човек: ако колата остане у дома, няма как да бъде измита от 40 метра разстояние. Именно този базов контекст масово е бил пренебрегнат от моделите.
Когато ИИ „задълбава“, но пак греши
Някои системи дори навлизат в технически детайли, без да адресират същината. Например модел на Gemini обяснява рисковете от „студен старт“ на двигателя и факта, че краткото шофиране не позволява на маслото да достигне оптимална температура – аргумент верен сам по себе си, но напълно нерелевантен за основния логически проблем.
Малък експеримент, показателни резултати
Един потребител тества въпроса върху 12 различни модела.
-
При включено търсене в уеб – само три модела „преминават теста“.
-
При изключено търсене – пет дават коректен отговор.
Сред най-надеждните по логика са посочени Gemini 3 Flash Thinking и GPT-5.2 Thinking.
Въпросът ли е проблемът, или моделите?
Част от коментаторите защитават ИИ, като твърдят, че вината е в умишлено непълния контекст на въпроса. И наистина – хората често задават неясни или подвеждащи запитвания.
Въпреки това, подобни масови грешки рязко контрастират с уверенията на разработчиците, че човекоподобен ИИ ще бъде създаден в рамките на следващото десетилетие – или дори по-рано.
По-широките последици: автоматизацията под въпрос
Случаят повдига и по-сериозен въпрос: доколко ИИ е готов да замества човешкия труд.
Предприемачът Мат Шумър наскоро предизвика вълна от реакции с публикация в X, в която твърди, че ИИ вече е изместил разработчици и скоро ще засегне и други професии.
Реалността обаче изглежда по-умерена. Скорошно изследване, анализиращо ИИ агенти при реални задачи на „бели якички“ – корпоративни юристи и банкови анализатори – показва, че най-добре представилият се модел постига едва 24% точност.
Малкият тест с голямо значение
Казусът с автомивката е дребен, почти комичен. Но именно такива примери ясно показват разликата между генериране на правдоподобен текст и истинско разбиране на контекста.
Докато ИИ продължава да се развива, подобни „елементарни“ грешки напомнят, че критичното мислене все още остава човешка територия.









