ИИ-модель DarkBERT обучили на просторах даркнета, но предназначена она для науки

Андрей Гриневский
19 Май 2023, 07:00

Исследователями из Корейского института науки и технологий (KAIST) создана ИИ-модель DarkBERT. Ее предназначение: поиск «ценных научных сведений» в даркнете. Нейросеть снабжена особыми фильтрами, способными помочь оградить пользователей от негативной информации.

Как сообщает ресурс tomshardware.com, создали DarkBERT на базе архитектуры RoBERTa, что была разработана в 2019 году. Ее обновили, и оказалось, что на деле данная архитектура имеет большую производительность, нежели из нее извлекали ранее.

Для обучения ИИ-модели исследователями было проведено сканирование даркнета через анонимный брандмауэр сети Tor. Далее экспериментаторы осуществили фильтровку необработанных данных с применением методов дедупликации, балансировки категорий и пр. Так был создан необходимый для обучения массив информации.

В итоге и появился DarkBERT, получивший способность анализа фрагментов контента из даркнета для извлечения из него полезной информации.

Важным преимуществом больших языковых моделей (LLM) остается понимание языка. В даркнете применяют особую смесь языков, и DarkBERT успешно обучили для ее восприятия. Исследователи уверены, что он сможет глубоко изучать это пространство. Тем не менее, разработчики будут продолжать усовершенствование DarkBERT для улучшения работы модели.

Теги: Новости