ИИ-модель DarkBERT обучили на просторах даркнета, но предназначена она для науки

ИИ-модель DarkBERT обучили на просторах даркнета, но предназначена она для науки

Исследователями из Корейского института науки и технологий (KAIST) создана ИИ-модель DarkBERT. Ее предназначение: поиск «ценных научных сведений» в даркнете. Нейросеть снабжена особыми фильтрами, способными помочь оградить пользователей от негативной информации.

 

Как сообщает ресурс tomshardware.com, создали DarkBERT на базе архитектуры RoBERTa, что была разработана в 2019 году. Ее обновили, и оказалось, что на деле данная архитектура имеет большую производительность, нежели из нее извлекали ранее.

 

Для обучения ИИ-модели исследователями было проведено сканирование даркнета через анонимный брандмауэр сети Tor. Далее экспериментаторы осуществили фильтровку необработанных данных с применением методов дедупликации, балансировки категорий и пр. Так был создан необходимый для обучения массив информации.

 

В итоге и появился DarkBERT, получивший способность анализа фрагментов контента из даркнета для извлечения из него полезной информации.

 

Важным преимуществом больших языковых моделей (LLM) остается понимание языка. В даркнете применяют особую смесь языков, и DarkBERT успешно обучили для ее восприятия. Исследователи уверены, что он сможет глубоко изучать это пространство.  Тем не менее, разработчики будут продолжать усовершенствование DarkBERT для улучшения работы модели.

 
 

 

   

Комментарии 0

Оставить комментарий

Ваш email не будет опубликован.