Зачем это нужно
Сортировка на производстве — это не про «отделить белое от чёрного». В реальности продукция отличается по микротрещинам, оттенку, составу материала, форме, толщине покрытия. И отличаться должна со скоростью конвейера — сотни объектов в минуту, без остановки.
Ручная сортировка на таком темпе даёт ошибку 3–8% даже после обучения, а на упаковке крепежа или пищевых продуктов это прямые рекламации. Механические сортировщики (сита, вибробункера) работают только по размеру и форме. Оптические фотосепараторы с пороговыми алгоритмами — по цвету, но не видят состав материала и микротрещины.
Нейросетевая сортировка закрывает все эти случаи: один проход конвейера, одна камера (или набор камер), одна модель — и продукция делится на сорта не по одному признаку, а по десяткам.
Кому нужна интеллектуальная сортировка
- Пищевое производство: орехи, кофе, крупы, сухофрукты — отделение заплесневелых, битых, недозревших единиц.
- Метизное производство: винты, гайки, шайбы — контроль трещин после термообработки, сортировка по типоразмеру в смешанной упаковке.
- Переработка вторсырья: разделение ПЭТ, ПВХ, полипропилена, металла, картона по типам материала.
- Стройматериалы: керамическая плитка, кирпич, древесные плиты — сортировка по дефектам поверхности и геометрии.
- Фармацевтика: таблетки, капсулы, ампулы — контроль целостности, цвета, маркировки.
Во всех этих случаях требования одни: высокая скорость, стабильная точность смену за сменой, минимальный ложный выброс годного (false reject).
Архитектура системы сортировки
Любая система машинного зрения для сортировки состоит из четырёх уровней:
1. Захват изображения
Одна камера или набор камер над конвейером. Базовый выбор:
- Монохромная камера с глобальным затвором — для контрастных объектов: трещины на металле, чёрная маркировка на белом.
- Цветная RGB-камера — когда важны оттенки: степень обжарки кофе, цвет керамической плитки, зрелость фруктов.
- NIR-камера (ближний ИК, 900–1700 нм) — «видит» химический состав: отличает ПЭТ от ПВХ, определяет влажность, скрытые повреждения под поверхностью.
- Гиперспектральная камера — десятки узких спектральных каналов: используется в фармацевтике и контроле пищевых продуктов для детекции контаминации.
Освещение — строго строб-лампы, синхронизированные с затвором камеры и скоростью конвейера. Без строба объект на скорости 1–2 м/с размазывается на кадре.
2. Модель
Нейросеть, которая классифицирует каждый объект. В 2026 году стандарт — модели семейства YOLO и архитектуры на базе Transformer.
YOLO26 (Ultralytics, январь 2026) — последнее поколение:
- End-to-end: убрана стадия NMS (non-maximum suppression), предсказания выходят напрямую — меньше latency.
- Edge-оптимизация: YOLO26n на CPU работает до 43% быстрее YOLO11n — можно ставить без GPU.
- Улучшенная детекция мелких объектов: loss-функции ProgLoss и STAL — важны для микротрещин и мелкого крепежа.
- Поддержка экспорта: TensorRT, OpenVINO, TFLite, CoreML, ONNX.
RF-DETR (Roboflow, 2025) — альтернатива на трансформерах, по бенчмаркам обгоняет YOLO26 на некоторых датасетах.
Для мультиспектральных задач обычно комбинируют две модели: RGB-детектор и NIR-классификатор, результат склеивается на уровне координат объекта.
3. Принятие решения и исполнительные механизмы
Модель выдаёт класс объекта и confidence. Порог confidence — главный инженерный параметр:
- Высокий порог (0.95+) — минимум ложных выбросов, но возможны пропуски дефекта.
- Низкий порог (0.7–0.8) — ловим почти все дефекты, но часть годного уходит в брак.
Исполнители — пневматические форсунки (отстрел бракованных единиц) или сервоприводы (сдвиг в разные лотки). Управление через PLC по OPC UA или дискретным сигналам. Задержка от кадра до форсунки — ключевой параметр синхронизации. Объект движется, и форсунка должна сработать, когда он ровно над ней. Смещение на 10 мс при скорости 1 м/с — промах на 1 см.
4. Интеграция
Система сортировки — не изолированный блок. Она должна отдавать статистику в MES/SCADA: сколько отсортировано, какой процент брака, по каким классам. И получать команды: сменить рецепт сортировки для другой партии.
Практические сценарии
Сортировка крепежа
На линии после термообработки винты движутся россыпью. Задача: отсеять трещиноватые (YOLOv4-tiny, U-Net-Light) и рассортировать смешанный ассортимент (Siamese network). Темп — до 200 шт/мин. Человек на такой скорости пропускает каждый 10–15 дефект. Нейросеть — 1 пропуск на 500–1000.
Переработка ПЭТ-флекса
Поток измельчённого пластика. RGB+NIR: RGB видит цвет, NIR определяет тип полимера. Точность сортировки — до 99.7% при чистоте исходного сырья. Без NIR ПЭТ и ПВХ неразличимы — внешне одинаковые бутылки.
Контроль обжарки кофе
Зерна движутся однослойным потоком. Каждый кадр — 50–100 зёрен. Задача: отсеять недожаренные (светлые), пережжённые (тёмные), битые. RGB-камера + YOLO26n на Jetson Orin — до 5000 объектов/с.
Риски и ошибки внедрения
Размер датасета. Для устойчивой сортировки нужно не 100, а 5000+ изображений каждого класса дефекта в разных условиях освещения. Особенно трудно собирать редкие дефекты — их в production единицы. Помогает синтетическая генерация: наложение дефекта на фон годного объекта.
Баланс классов. Если дефект встречается в 0.5% случаев, модель «выучит» говорить «годное» и иметь accuracy 99.5%. Решается взвешенной loss-функцией и oversampling редкого класса.
Дрейф данных (data drift). Через месяц работы изменилось сырьё, освещение, износ камеры — и точность падает. Нужен pipeline MLOps: мониторинг метрик, автоматическое переобучение, роллбек модели.
Скорость конвейера. Модель должна уложиться в такт между появлением объекта и точкой отстрела. YOLO26n на Jetson Orin — ~2–3 мс на кадр. RF-DETR Base — ~4–5 мс. При скорости 200 объектов/мин запас есть. При 600+ объектов/мин — уже нужно считать latency конвейерной ленты.
Метрики успеха
Метрики сортировки отличаются от «классического» object detection:
- Precision по классам — сколько из отобранных как «брак» действительно брак.
- False reject rate — сколько годного ушло в брак. Критично: каждый ложный выброс = потеря денег.
- Throughput — объектов в минуту, с учётом времени на фотографирование + инференс + пневматику.
- Latency кадр → форсунка — полное время от захвата до механического отделения.
- Stability @ 24/7 — не падает ли точность к концу смены из-за нагрева камеры или дрейфа.
Как Smart Video делает пилот
1. Аудит сортировочной линии. Приезжаем на производство, смотрим: какие объекты, скорость, освещение, существующие механизмы. Забираем образцы каждого класса.
2. Прототип на стенде. Снимаем датасет на нашей оптической скамье, подбираем камеру и свет, обучаем базовую модель. Замеряем точность и throughput.
3. Полный цикл на линии. Ставим прототип на конвейер, интегрируем с PLC, запускаем в теневом режиме (без отстрела). Сравниваем решения модели с реальным браком.
4. Внедрение. Настраиваем пороги confidence, подключаем пневматику, отдаём статистику в MES. Обучаем операторов.
5. Мониторинг и MLOps. Модель работает 24/7. При дрейфе данных — дообучение. При смене номенклатуры — новый рецепт сортировки без остановки линии.
Мы не обещаем «100% точность» — мы обещаем измеримую, стабильную сортировку с известным уровнем false reject и контролируемыми рисками.
Если на вашем производстве сортировка — узкое место или причина рекламаций, пришлите образцы. Мы снимем датасет, покажем, что реально сделать, и назовём сроки пилота.