Logo BSU

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ: https://elib.bsu.by/handle/123456789/338573
Заглавие документа: RLD -YOLO: новый метод обнаружения объектов на изображениях беспилотных летательных аппаратов с использованием модели нейронной сети YOLOv11
Другое заглавие: RLD -YOLO: new method for object detection in unmanned aerial vehicle images using YOLOv11 neural network / Wu Xianyi, S. V. Ablameyko
Авторы: Ву Сяньи
Абламейко, С. В.
Тема: ЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Информатика
ЭБ БГУ::ТЕХНИЧЕСКИЕ И ПРИКЛАДНЫЕ НАУКИ. ОТРАСЛИ ЭКОНОМИКИ::Автоматика. Вычислительная техника
Дата публикации: 2025
Издатель: Минск : БГУ
Библиографическое описание источника: Журнал Белорусского государственного университета. Математика. Информатика = Journal of the Belarusian State University. Mathematics and Informatics. – 2025. – № 2. – С. 105-117
Аннотация: Изображения, получаемые с беспилотных летательных аппаратов, в настоящее время широко используются во многих приложениях. Однако эти изображения сталкиваются с рядом проблем (плотное распределение мелких объектов, переменные масштабы объектов и незаметные контурные особенности), которые приводят к пропускам объектов и ложному обнаружению объектов. Для решения этих проблем в данной статье предлагается улучшенный алгоритм обнаружения объектов RLD-YOLO, разработанный на основе версии YOLOv11n семейства алгоритмов YOLO. Алгоритм RLD-YOLO включает технологию структурной репараметризации RepConv, сохраняющую способность к многоветочной экспрессии признаков во время обучения и автоматически преобразующуюся в эффективную одноветвевую структуру во время вывода. Этот алгоритм разрабатывает модуль большого ядерного внимания LKAConv для улучшения способности к захвату признаков мелких целей с помощью глубокой разделяемой свертки размера 7 × 7 и механизма пространственного внимания. Алгоритм RLD-YOLO вводит динамический адаптивный модуль слияния DASI для оптимизации многоуровневого взаимодействия признаков с помощью обучаемого распределения весов. Экспериментальные результаты показывают, что улучшенный алгоритм обнаружения объектов RLD-YOLO, который объединяет модули LKAConv, RepConv и DASI, увеличивает на наборе данных VisDrone2019-DET значения mAP50 и mAP50-95 на 2,02 и 1,17 % соответственно. Скорость постобработки оптимизирована на 9,09 %. Хотя время предварительной обработки увеличивается из-за операций по улучшению признаков, критический этап вывода все еще поддерживает реальное время выполнения 1,7 мс/кадр. Алгоритм RLD-YOLO, интегрированный с модулями LKAConv, RepConv и DASI, очень подходит для задачи обнаружения мелких объектов на изображениях беспилотных летательных объектов.
Аннотация (на другом языке): Unmanned aerial vehicle images are widely used now in many applications. However, these images face many challenges such as dense distribution of small objects, variable object scales, and inconspicuous edge features, leading to missed and false object detection. To address these issues, this paper proposes a lightweight enhanced solution based on the improved YOLOv11n model RLD-YOLO. The algorithm combines RepConv structural reparameterisation technology, retaining multi-branch feature expression capabilities during training and automatically converting to an efficient single-branch structure during inference. It designs the LKAConv large kernel attention module to enhance the feature capture ability of small targets through 7 × 7 depthwise separable convolution and spatial attention mechanism. It introduces the DASI dynamic adaptive fusion module to optimise multi-scale feature interaction through learnable weight allocation. Experimental results show that the improved RLD-YOLO object detection algorithm, which integrates LKAConv, RepConv, and DASI, increases mAP50 and mAP50-95 by 2.02 and 1.17 % respectively on the VisDrone2019-DET dataset. The postprocessing speed is optimised by 9.09 %. Although the pre-processing time increases due to feature enhancement operations, the critical inference stage still maintains a real-time performance of 1.7 ms/frame. The RLD-YOLO model, fused with LKAConv, RepConv, and DASI, is very suitable for the task of small object target detection in unmanned aerial vehicle images.
URI документа: https://elib.bsu.by/handle/123456789/338573
ISSN: 2520-6508
Лицензия: info:eu-repo/semantics/openAccess
Располагается в коллекциях:2025, №2

Полный текст документа:
Файл Описание РазмерФормат 
105-117.pdf2,57 MBAdobe PDFОткрыть
Показать полное описание документа Статистика Google Scholar



Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.