Фирмата за киберсигурност Cato Networks е открила нова техника за джейлбрейк, която разчита на повествователно инженерство, за да убеди модел на gen-AI да се отклони от нормализираните ограничени операции.

Техниката, наречена Immersive World (Потапящ свят), е проста: в подробен виртуален свят, където хакерството е норма, LLM е убеден да помогне на човек да създаде зловреден софтуер, който може да извлича пароли от браузър.

Подходът, казва Cato в последния си доклад за заплахите, е довел до успешен джейлбрейк на DeepSeek, Microsoft Copilot и ChatGPT на OpenAI, както и до създаването на Chrome infostealer, който се оказа ефективен срещу Chrome 133.

Cato осъществи jailbreak в контролирана тестова среда, създавайки специализиран виртуален свят на име Velora, където разработването на зловреден софтуер се счита за дисциплина, а „напредналите концепции за програмиране и сигурност се считат за основни умения“.

В рамките на Velora са дефинирани три основни субекта, включително системен администратор, считан за противник, елитен разработчик на зловреден софтуер (LLM) и изследовател по сигурността, който предоставя технически насоки.

Според Cato опитът за джейлбрейк е извършен от изследовател без предишен опит в кодирането на зловреден софтуер, което доказва, че изкуственият интелект може да превърне начинаещите нападатели в опитни участници в заплахи. На LLM не е предоставена информация за това как могат да бъдат извлечени или декриптирани паролите.

След като установил ясни правила и контекст в съответствие с целите на операцията, изследователят установил мотивацията на героя в нова сесия на LLM, насочил разказа към целта и чрез предоставяне на непрекъсната обратна връзка и формулиране на различни предизвикателства, като същевременно запазил последователността на героя, убедил модела да създаде инфо крадеца.

„Както при всеки процес на разработка, изработването на зловреден софтуер с помощта на LLM изисква сътрудничество между хора и машини. Ние предлагахме предложения, обратна връзка и насоки. Макар че нашият изследовател на заплахите CTRL не е разработчик на зловреден софтуер, този човек успешно генерира напълно функционален код“, отбелязва Cato.

След създаването на зловредния софтуер Cato се свърза с DeepSeek, Microsoft, OpenAI и Google. Докато DeepSeek не отговори, останалите три потвърдиха получаването. Google отказа да прегледа зловредния код, казва фирмата за киберсигурност.

„Киберпрестъпленията вече не се ограничават само до опитни  заплахи. С основни инструменти всеки може да извърши атака. За ИТ директорите, CISO и ИТ лидерите това означава повече заплахи, по-големи рискове и необходимост от по-силни стратегии за сигурност с изкуствен интелект“, отбелязва Cato.

Източник: По материали от Интернет

Подобни публикации

22 април 2025

3дравни организации станаха жертва на мащабни п...

Две здравни организации в САЩ потвърдиха, че са станали обект на се...
22 април 2025

Културата – почвата на киберсигурността, а не о...

Когато става въпрос за киберсигурност, хората често си представят с...
22 април 2025

Microsoft извършва най-мащабната реформа в кибе...

Microsoft обяви, че е завършила „най-големия проект за инжене...
22 април 2025

Севернокорейски хакери използват Zoom за кражба...

Севернокорейски киберпрестъпници са усъвършенствали тактиките си за...
22 април 2025

Exaforce с амбиция да преосмисли SOC: 75 милион...

Сан Франсиско се превръща във все по-важен хъб за иновации в киберс...
21 април 2025

Kenzo Security: Иновативна платформа за киберси...

Стартъпът Kenzo Security обяви излизането си от скрит режим, съобща...
21 април 2025

Нарастващата заплаха от злонамерени ботове с ИИ

Интернет вече не е предимно човешко пространство. През 2024 г. авто...
Бъдете социални
Още по темата
22/04/2025

Exaforce с амбиция да преос...

Сан Франсиско се превръща във все...
21/04/2025

Kenzo Security: Иновативна ...

Стартъпът Kenzo Security обяви излизането си...
21/04/2025

Нарастващата заплаха от зло...

Интернет вече не е предимно човешко...
Последно добавени
22/04/2025

3дравни организации станаха...

Две здравни организации в САЩ потвърдиха,...
22/04/2025

Културата – почвата на кибе...

Когато става въпрос за киберсигурност, хората...
22/04/2025

Microsoft извършва най-маща...

Microsoft обяви, че е завършила „най-големия проект...
Ключови думи

Абонамента е почти завършен.

На посоченият от Вас e-mail е изпратено съобщение за потвърждаване на абонамента.

Моля, проверете електронната си поща за да потвърдите.

Благодарим за доверието!