Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Mistral: Mistral Small 4 vs Nemotron 3 Ultra 550b A55b

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-04

Метрика Mistral Small 4 Mistral Small 4 medium Релиз: 2026-03-16 Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b none Релиз: 2026-06-04 Бесплатно доступно
Оценка 5.3 6.0
Ранг #132 #104
Надежность 10.0 10.0
Стабильность 6.9 9.2
Тестов верно
Доля успешных попыток 44.4% 44.4%
Нестабильные тесты 8 2
Всего запусков 63 63
Стоимость за результат 1.344 0.000
Общая стоимость $0.068 $0.000
Цена входа $0.150 / 1M $0.000 / 1M
Цена выхода $0.600 / 1M $0.000 / 1M
Общее число входных токенов 42,576 43,326
Выходные токены 24,184 2,138
Токены рассуждений 84,678 0
Время ответа (среднее) 9.40s 2.27s
Время ответа (макс.) 59.15s 13.49s
Время ответа (суммарно) 197.39s 47.65s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 708 4,055 4,778
Nemotron 3 Ultra 550b A55b 3.5 8.0 16.7% 1 2.35s 696 239 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 4.4 5.1 33.3% 2 39.98s 7,636 11,635 54,715
Nemotron 3 Ultra 550b A55b 5.5 10.0 33.3% 0 1.02s 7,623 369 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 18,706 2,612 10,700
Nemotron 3 Ultra 550b A55b 3.0 10.0 0.0% 0 4.79s 15,558 357 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 6,171 335 723
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 1.94s 7,944 249 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 742 2,621 6,904
Nemotron 3 Ultra 550b A55b 5.3 10.0 33.3% 0 698ms 789 27 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 519 821 828
Nemotron 3 Ultra 550b A55b 5.0 10.0 0.0% 0 13.49s 516 101 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 729 540 1,031
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 1.46s 723 69 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 3.4 9.7 0.0% 0 2.17s 735 1,226 2,632
Nemotron 3 Ultra 550b A55b 5.9 7.2 55.6% 1 1.06s 726 352 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 6,420 321 810
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 2.99s 8,544 264 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mistral Small 4 3.0 10.0 0.0% 0 5.92s 210 18 1,557
Nemotron 3 Ultra 550b A55b 3.0 10.0 0.0% 0 1.83s 207 111 0

Быстрое сравнение

Сменить пару сравнения