Новость:
Опубликован BoN, метод обхода фильтров больших языковых моделей
Дата:
2024-12-19
Выявлен новый метод атаки, позволяющий обойти механизмы противодействия генерации опасного контента, применяемые в AI-сервисах на основе больших языковых моделей. Метод, который получил кодовое имя BoN (Best-of-N), при тестировании на 10 тысячах запросов позволил обойти ограничения модели GPT-4o в 89% случаев, модели Claude 3.5 Sonnet - в 78%, а Gemini Pro - в 50%. Инструментарий для проведения атаки опубликован под лицензией MIT. Источник: opennet.ru
Последние новости:
- Выпуск EasyOS 6.5, самобытного дистрибутива от создателя Puppy Linux 2024-12-04
- Выпуск среды разработки Qt Creator 15 2024-12-04
- Релиз FreeBSD 14.2 2024-12-04
- Седьмая бета-версия OrioleDB, высокопроизводительного движка хранения для PostgreSQL 2024-12-04
- Сторонняя организация пытается зарегистрировать торговую марку PostgreSQL в Европе и США 2021-09-14