NVIDIA развивает сразу несколько классов GPU для AI-инференса. RTX PRO 6000 Blackwell Server Edition (GB202, 5 нм, 92 млрд транзисторов) дает 96 GB GDDR7 и современные NVENC/NVDEC - оптимально для смешанных нагрузок: computer vision, декодирование видео, графика и LLM-инференс на одной платформе. H200 (141 GB HBM3e, 4.8 TB/s пропускная способность) остается сильным выбором для тяжелых моделей. B200 (192 GB HBM3e, ~8 TB/s) выходит на уровень AI Factory, но для обычной видеоаналитики его нужно обосновывать.
AMD продолжает конкурировать в сегменте high-memory: MI300X (192 GB HBM3), а анонсированный MI350X (288 GB HBM3E) обещает до 4x прироста AI-производительности. Реальные показатели зависят от software maturity: NVIDIA достигает 50-55% Model FLOPS Utilization на成熟ом стеке TensorRT/Triton, AMD - около 45% на ROCm. Для видеоаналитики это означает что выбор GPU должен подтверждаться не паспортными TFLOPS, а тестом на конкретном pipeline.
На edge-уровне NVIDIA Jetson Thor (JetPack 7, CUDA 13, TensorRT 10) поддерживает multi-camera 3D perception и 8K-декодирование. При $3,499 и 130W это платформа для локального inference рядом с оборудованием. Jetson Orin ($1,999, 64GB) остается рабочим выбором для камер с простыми моделями детекции.