Новость:
В БД для обучения AI-моделей Common Crawl выявлено около 12 тысяч API-ключей и паролей
Дата:
2025-03-04
Исследователи из компании Truffle Security опубликовали результаты анализа публичного набора данных Common Crawl, используемого при обучении больших языковых моделей (например, DeepSeek и ChatGPT). В исследовании использован декабрьский архив Common Crawl, включающий 400 терабайтов данных с содержимым 2.67 миллиардов web-страниц. Источник: opennet.ru
Последние новости:
- Выпуск EasyOS 6.5, самобытного дистрибутива от создателя Puppy Linux 2024-12-04
- Выпуск среды разработки Qt Creator 15 2024-12-04
- Релиз FreeBSD 14.2 2024-12-04
- Седьмая бета-версия OrioleDB, высокопроизводительного движка хранения для PostgreSQL 2024-12-04
- Сторонняя организация пытается зарегистрировать торговую марку PostgreSQL в Европе и США 2021-09-14