Please use this identifier to cite or link to this item:
https://elib.bsu.by/handle/123456789/338573| Title: | RLD -YOLO: новый метод обнаружения объектов на изображениях беспилотных летательных аппаратов с использованием модели нейронной сети YOLOv11 |
| Other Titles: | RLD -YOLO: new method for object detection in unmanned aerial vehicle images using YOLOv11 neural network / Wu Xianyi, S. V. Ablameyko |
| Authors: | Ву Сяньи Абламейко, С. В. |
| Keywords: | ЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Информатика ЭБ БГУ::ТЕХНИЧЕСКИЕ И ПРИКЛАДНЫЕ НАУКИ. ОТРАСЛИ ЭКОНОМИКИ::Автоматика. Вычислительная техника |
| Issue Date: | 2025 |
| Publisher: | Минск : БГУ |
| Citation: | Журнал Белорусского государственного университета. Математика. Информатика = Journal of the Belarusian State University. Mathematics and Informatics. – 2025. – № 2. – С. 105-117 |
| Abstract: | Изображения, получаемые с беспилотных летательных аппаратов, в настоящее время широко используются во многих приложениях. Однако эти изображения сталкиваются с рядом проблем (плотное распределение мелких объектов, переменные масштабы объектов и незаметные контурные особенности), которые приводят к пропускам объектов и ложному обнаружению объектов. Для решения этих проблем в данной статье предлагается улучшенный алгоритм обнаружения объектов RLD-YOLO, разработанный на основе версии YOLOv11n семейства алгоритмов YOLO. Алгоритм RLD-YOLO включает технологию структурной репараметризации RepConv, сохраняющую способность к многоветочной экспрессии признаков во время обучения и автоматически преобразующуюся в эффективную одноветвевую структуру во время вывода. Этот алгоритм разрабатывает модуль большого ядерного внимания LKAConv для улучшения способности к захвату признаков мелких целей с помощью глубокой разделяемой свертки размера 7 × 7 и механизма пространственного внимания. Алгоритм RLD-YOLO вводит динамический адаптивный модуль слияния DASI для оптимизации многоуровневого взаимодействия признаков с помощью обучаемого распределения весов. Экспериментальные результаты показывают, что улучшенный алгоритм обнаружения объектов RLD-YOLO, который объединяет модули LKAConv, RepConv и DASI, увеличивает на наборе данных VisDrone2019-DET значения mAP50 и mAP50-95 на 2,02 и 1,17 % соответственно. Скорость постобработки оптимизирована на 9,09 %. Хотя время предварительной обработки увеличивается из-за операций по улучшению признаков, критический этап вывода все еще поддерживает реальное время выполнения 1,7 мс/кадр. Алгоритм RLD-YOLO, интегрированный с модулями LKAConv, RepConv и DASI, очень подходит для задачи обнаружения мелких объектов на изображениях беспилотных летательных объектов. |
| Abstract (in another language): | Unmanned aerial vehicle images are widely used now in many applications. However, these images face many challenges such as dense distribution of small objects, variable object scales, and inconspicuous edge features, leading to missed and false object detection. To address these issues, this paper proposes a lightweight enhanced solution based on the improved YOLOv11n model RLD-YOLO. The algorithm combines RepConv structural reparameterisation technology, retaining multi-branch feature expression capabilities during training and automatically converting to an efficient single-branch structure during inference. It designs the LKAConv large kernel attention module to enhance the feature capture ability of small targets through 7 × 7 depthwise separable convolution and spatial attention mechanism. It introduces the DASI dynamic adaptive fusion module to optimise multi-scale feature interaction through learnable weight allocation. Experimental results show that the improved RLD-YOLO object detection algorithm, which integrates LKAConv, RepConv, and DASI, increases mAP50 and mAP50-95 by 2.02 and 1.17 % respectively on the VisDrone2019-DET dataset. The postprocessing speed is optimised by 9.09 %. Although the pre-processing time increases due to feature enhancement operations, the critical inference stage still maintains a real-time performance of 1.7 ms/frame. The RLD-YOLO model, fused with LKAConv, RepConv, and DASI, is very suitable for the task of small object target detection in unmanned aerial vehicle images. |
| URI: | https://elib.bsu.by/handle/123456789/338573 |
| ISSN: | 2520-6508 |
| Licence: | info:eu-repo/semantics/openAccess |
| Appears in Collections: | 2025, №2 |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| 105-117.pdf | 2,57 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

