Чатботи и измами

Тест между водещи модели показва различия в защитните механизми

Експеримент с три популярни чатбота – ChatGPT, Gemini и DeepSeek – разкрива съществени разлики в начина, по който те реагират на опити за генериране на съдържание, свързано с измами.

Целта е била да се създадат три типа фишинг съобщения – класическа измама с награда, по-фин имейл от „HR отдел“ и крайна форма като sextortion. Под претекст „за обучителни цели“ се тества дали защитните механизми могат да бъдат заобиколени.

ChatGPT: твърда линия и контролирани отклонения

При ChatGPT поведението остава последователно предпазливо. Моделът:

  • отказва директно генериране на фишинг съдържание
  • пренасочва заявките към по-безопасни формати (например творческо писане)
  • допуска единствено общи и неутрални примери, без конкретни злоупотреби

При опити за ескалация към по-сериозни измами като sextortion, отговорите остават ограничени и избягват съдържание с реален потенциал за злоупотреба.

Gemini: трансформация към обучение вместо злоупотреба

Gemini показва различен подход. Вместо директен отказ, моделът:

  • влиза в контекста на „обучение“
  • създава примерни сценарии, но ги насочва към киберсигурност и превенция
  • дори генерира цели обучителни материали и казуси

Този подход е интересен, защото не просто блокира заявката, а я преобразува в защитен контекст, който може да бъде полезен за обучение.

DeepSeek: непоследователност и риск

Най-проблематично поведение демонстрира DeepSeek. В рамките на теста:

  • първоначално генерира стандартни измамни имейли
  • при по-рискови заявки създава съдържание, което след това изтрива
  • при повторен опит предоставя по-завършени и опасни примери

Тази непоследователност в защитните механизми е ключов риск, тъй като показва, че при определени условия ограниченията могат да бъдат заобиколени.

Основният проблем: „за обучителни цели“ като вратичка

Един от най-важните изводи от експеримента е, че фразата „за обучителни цели“ често се използва като:

  • социално-инженерен трик срещу самите ИИ системи
  • начин за заобикаляне на защитни политики
  • оправдание за генериране на потенциално опасно съдържание

Това поставя въпроса доколко ИИ може надеждно да различава легитимно обучение от злонамерена употреба.

 ИИ като инструмент и риск

Случаят подчертава по-голям проблем в киберсигурността:

  • ИИ може да бъде използван както за защита, така и за атаки
  • качеството на „guardrails“ варира между различните модели
  • дори малки пропуски могат да бъдат експлоатирани

Важно е да се отбележи, че водещите платформи активно подобряват защитите си, но:

състезанието между защита и заобикаляне продължава

Hе кой е „най-опасен“, а колко устойчиви са системите

Въпросът не е просто кой чатбот е най-склонен да съдейства за измами, а:

  • колко стабилни са защитните механизми
  • как реагират при продължителен диалог
  • дали могат да устоят на контекстна манипулация

Докато ChatGPT и Gemini показват по-зрели защитни стратегии, случаи като този с DeepSeek напомнят, че рисковете остават реални.

e-security.bg

Подобни

Как ИИ променя умните домове
15.06.2026
smart-home-2769210_640
Eксперимент разкри критични слабости в OpenClaw
10.06.2026
irenna-boiled-crayfish-4028132_640
Масова smishing кампания използва емоционален натиск
7.06.2026
bulgaria
Почти половината европейци се сблъскват с враждебно съдържание онлайн
1.06.2026
Europäische Flaggen im Wind, Louise-Weiss-Gebäude, Sitz des Europäischen Parlaments in Straßburg, Frankreich, Europa
Microsoft: Windows компютрите може да се рестартират многократно при обновяване на Secure Boot
28.05.2026
windows-6281710_1280
ИИ променя пазара на труда
27.05.2026
ai-generated-8706749_640

Споделете

Facebook
LinkedIn

Бюлетин

С нашия бюлетин ще бъдеш сред първите, които научават за нови заплахи, практични решения и добри практики. Напълно безплатно и с грижа за твоята сигурност.

Популярни

Българските торент сайтове продължават да изчезват
27.02.2026
pirate-flag-7541041_640
Изземване на Zamunda, Arena и други торент сайтове
30.01.2026
seizure
Измамническите сайтове в България: как да ги разпознаем, проверим и защитим себе си
6.10.2025
bulgaria3
Bitdefender пусна безплатен инструмент за проверка на телефонни номера
12.12.2025
telephoneAlamy