YOLO26: быстрая vision-модель с концом эпохи NMS и поддержкой edge-девайсов

YOLO26, это обновленное семейство реал-тайм vision-моделей от Ultralytics, выпущенное в январе 2026. Модель поддерживает пять задач: object detection, instance segmentation, pose estimation, oriented object detection (OBB) и image classification, с пятью вариантами размеров (Nano до Extra Large). Ключевые улучшения: удаление NMS как постобработки (end-to-end predictions, меньше латентности), упразднение Distribution Focal Loss (упростило поддержку edge-девайсов), использование новых loss-функций (ProgLoss, STAL для мелких объектов), новый оптимизатор MuSGD (гибрид SGD и Muon, вдохновлено прорывами в LLM).

Архитектура оптимизирована для CPU: YOLO26-Nano работает на 43% быстрее, чем YOLO11-Nano. Модель совместима с TFLite, CoreML, OpenVINO, TensorRT, ONNX. На бенчмарках COCO работает лучше предыдущих поколений. В блоге Roboflow приведены сравнения с RF-DETR, LW-DETR, D-FINE; YOLO26 выигрывает по скорости и компактности.

Ключевые факты

End-to-end predictions: убрали NMS как отдельный шаг постобработки, прямые предсказания сокращают латентность
CPU-оптимизация: YOLO26-N работает на 43% быстрее, чем YOLO11-N на CPU (критично для edge)
Упрощённая архитектура (без DFL) расширила совместимость с TFLite, CoreML, OpenVINO, TensorRT, ONNX
Новый оптимизатор MuSGD (Muon + SGD, вдохновлено LLM-прорывами): стабильное обучение, быстрая сходимость
Пять вариантов: Nano, Small, Medium, Large, Extra Large; пять задач в одном семействе (детекция, сегментация, pose, OBB, классификация)

Ред. Ред.: Очередной YOLO, который на 43% быстрее предыдущего YOLO, и так уже больше десяти лет подряд.

Почему это важно

YOLO26 означает следующий шаг демократизации computer vision: быстрый edge-модель, которая работает без GPU, на маломощном железе (IoT, мобильные, дроны). Удаление NMS ускоряет вывод и упрощает экспорт на edge-форматы. Использование LLM-инноваций (MuSGD) в vision-моделях сигнализирует о конвергенции техник между доменами.

Ред. Ред.: «Конвергенция техник между доменами» это вежливый способ сказать, что взяли удачный трюк из LLM и приклеили к детектору.

Кому это важно

Разработчикам embedded-систем, IoT-проектов, мобильных приложений, всем, кто работает на железе без GPU. Компаниям, развёртывающим vision-системы на edge (роботика, дроны, surveillance). Исследователям, которые пытаются выжать максимум из edge-hardware. Компаниям, работающим с мелкими объектами (спутниковые снимки, видеонаблюдение с высока).

Ред. Ред.: Список «кому важно» охватывает почти всех, кто хоть раз видел камеру, что обычно признак хорошего маркетинга, а не хорошей модели.

Как это применить

Скачать модель из Ultralytics (GitHub, HF), загрузить через PyTorch/TensorFlow, трассировать для целевого экспорта (TFLite для мобильных, CoreML для iOS, OpenVINO для Intel CPU). Обучить на своём датасете через Ultralytics trainer или использовать fine-tuning предтренированных весов. Сравнить с RF-DETR/LW-DETR на бенчмарках, если точность критична.

Ред. Ред.: Финал инструкции, «потребуется переобучение на своих данных», как всегда переносит всю реальную работу на читателя.

Можно ли доверять

Roboflow (авторы блога), лидер в инструментах разметки и deployment для vision; YOLO26 создана Ultralytics (автор YOLO). Ultralytics не опубликовали официальный пейпер, но исследователи из Cornell и Kansas State написали независимый пейпер YOLO26: Key Architectural Enhancements. Бенчмарки COCO подтверждены в сообществе. На HN 27 баллов, 7 комментариев (молодая новость).

Ред. Ред.: Официального пейпера от авторов нет, зато есть независимый от сторонних университетов, что говорит о приоритетах Ultralytics красноречивее любого README.

Риски и подводные камни

YOLO26 всё ещё новая (январь 2026), крупномасштабное использование могло не начаться. End-to-end predictions (без NMS) могут дать проблемы с overlapping объектами в нише-задачах. Упрощение архитектуры (отсутствие DFL) может означать потерю точности на некоторых датасетах (хотя заявляется улучшение). CPU-оптимизация может уменьшить GPU-перфоманс относительно YOLO11. Требуется переобучение на собственных данных для лучших результатов.

Ред. Ред.: Убрали NMS ради скорости, а проблемы с пересекающимися объектами скромно оставили «нишевым задачам».

«YOLO26 is an end-to-end, edge-optimized model that supports five core computer vision tasks... standing out for its efficient use of parameters and fast inference speed.»

— Roboflow Blog