Статья “Алгоритмы распознавания маркеров для дополненной реальности на основе глубокого обучения”
Автор (ы)
Аффилиация
Северо-Кавказский федеральный университет, г. Ставрополь, студент
Научный руководитель
Аннотация
Развитие дополненной реальности (AR) открывает широкие возможности для применения в образовании, медицине, играх и промышленности. Однако эффективность AR-приложений во многом зависит от точности распознавания маркеров, которые служат основой для позиционирования виртуальных объектов. Существующие алгоритмы распознавания, такие как ARToolKit и ArUco, ограничены в условиях сложного освещения и шума. Для преодоления этих ограничений важно внедрение современных подходов, использующих методы глубокого обучения.
Цель работы: разработка алгоритма распознавания маркеров для AR-приложений с использованием сверточных нейронных сетей (CNN) и предсказанием субпиксельных координат углов маркера для повышения точности и устойчивости алгоритма.
Задачи:
- Провести анализ существующих методов распознавания маркеров.
- Разработать архитектуру CNN с учётом субпиксельного предсказания.
- Обучить и протестировать предложенную модель на синтетических и реальных данных.
- Сравнить предложенный метод с традиционными подходами.
Предмет исследования: методы компьютерного зрения и алгоритмы глубокого обучения для распознавания маркеров.
Объект исследования: маркеры для AR-приложений, представленные в виде изображений, содержащих шум, перспективные искажения и другие дефекты.
Гипотеза исследования: использование модифицированной архитектуры CNN с функцией потерь, учитывающей субпиксельное предсказание углов, позволяет повысить точность и надёжность распознавания маркеров в сложных условиях съёмки.
Основные результаты. Разработана и протестирована модель на основе архитектуры U-Net с механизмами atrous convolution и attention. Модель показала значительное превосходство по точности над традиционными методами, снижая среднюю ошибку позиционирования углов маркеров до 0.45 пикселя на реальных данных.
Содержание работы
Конкурс, в котором автор работы принял участие:
Международная научно-практическая конференция “Наука и технологии” 24/25
Отрасль наук
Форма представления работы
Дата публикации работы: 12.01.2025
Добавить комментарий