Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Nemotron 3 Ultra 550b A55b

Сводка

Сравнение benchmark DeepSeek V4 Flash vs Nemotron 3 Ultra 550b A55b: Nemotron 3 Ultra 550b A55b лидирует по среднему баллу: 6.1 vs 5.5. DeepSeek V4 Flash имеет более низкую стоимость benchmark: $0.007 vs $0.027. Nemotron 3 Ultra 550b A55b быстрее: 2.27s vs 26.75s, с долей успешных попыток 30.2% vs 44.4%.

Рекомендуемая модель: Nemotron 3 Ultra 550b A55b - Здесь у него лучший балл (6.1), и он отвечает примерно в 11.8 раза быстрее, чем DeepSeek V4 Flash.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-18

Метрика DeepSeek V4 Flash DeepSeek V4 Flash none Релиз: 2026-04-24 Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b none Релиз: 2026-06-04 Бесплатно доступно
Оценка 5.5 6.1
Ранг #117 #99
Надежность 10.0 10.0
Стабильность 8.9 9.2
Тестов верно
Доля успешных попыток 30.2% 44.4%
Нестабильные тесты 3 2
Всего запусков 63 63
Стоимость за результат 0.203 0.000
Общая стоимость $0.007 $0.027
Цена входа $0.090 / 1M $0.500 / 1M
Цена выхода $0.180 / 1M $2.200 / 1M
Общее число входных токенов 50,127 43,326
Выходные токены 13,710 2,138
Токены рассуждений 0 0
Время ответа (среднее) 26.75s 2.27s
Время ответа (макс.) 111.96s 13.49s
Время ответа (суммарно) 561.82s 47.65s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 DeepSeek V4 Flash

none
Стоимость
$0.004
Время
157.6s
Токены
11,297 tok

#99 Nemotron 3 Ultra 550b A55b

none
Стоимость
$0.000
Время
149.6s
Токены
3,405 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 3.0 10.0 0.0% 0 20.18s 540 174 0
Nemotron 3 Ultra 550b A55b 3.5 8.0 16.7% 1 2.35s 696 239 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 4.2 7.4 11.1% 1 17.13s 7,279 9,717 0
Nemotron 3 Ultra 550b A55b 5.5 10.0 33.3% 0 1.02s 7,623 369 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 4.5 2.1 66.7% 1 111.96s 24,398 2,664 0
Nemotron 3 Ultra 550b A55b 3.0 10.0 0.0% 0 4.79s 15,558 357 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 10.0 10.0 100.0% 0 23.79s 7,290 195 0
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 1.94s 7,944 249 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 5.3 10.0 33.3% 0 19.73s 666 18 0
Nemotron 3 Ultra 550b A55b 5.3 10.0 33.3% 0 698ms 789 27 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 4.2 9.9 0.0% 0 23.74s 471 67 0
Nemotron 3 Ultra 550b A55b 5.0 10.0 0.0% 0 13.49s 516 101 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 6.5 10.0 50.0% 0 17.54s 627 321 0
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 1.46s 723 69 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 3.1 7.3 11.1% 1 23.72s 594 207 0
Nemotron 3 Ultra 550b A55b 5.9 7.2 55.6% 1 1.06s 726 352 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 10.0 10.0 100.0% 0 77.93s 8,079 327 0
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 2.99s 8,544 264 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
DeepSeek V4 Flash 3.0 10.0 0.0% 0 3.07s 183 20 0
Nemotron 3 Ultra 550b A55b 3.0 10.0 0.0% 0 1.83s 207 111 0

Быстрое сравнение

Сменить пару сравнения