Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs NVIDIA: Nemotron 3 Super

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite none Релиз: 2026-05-08 Nemotron 3 Super Nemotron 3 Super medium Релиз: 2026-03-11 Бесплатно доступно
Оценка 6.6 5.9
Ранг #85 #96
Надежность 10.0 10.0
Стабильность 8.5 8.8
Тестов верно
Доля успешных попыток 55.0% 45.0%
Нестабильные тесты 4 3
Всего запусков 60 60
Стоимость за результат 0.135 0.004
Общая стоимость $0.013 $0.001
???? ????? $0.250 / 1M $0.090 / 1M
???? ?????? $1.500 / 1M $0.450 / 1M
Выходные токены 2,478 14,550
Токены рассуждений 0 30,428
Время ответа (среднее) 1.09s 21.15s
Время ответа (макс.) 2.97s 87.80s
Время ответа (суммарно) 21.79s 380.67s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 7.5 8.4 66.7% 1 1.07s 639 0
Nemotron 3 Super 8.3 10.0 75.0% 0 7.85s 748 1,305
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 6.8 10.0 50.0% 0 1.13s 660 0
Nemotron 3 Super 3.1 9.9 0.0% 0 62.38s 452 848
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.73s 357 0
Nemotron 3 Super 10.0 10.0 100.0% 0 87.80s 2,021 9,996
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 843ms 279 0
Nemotron 3 Super 10.0 10.0 100.0% 0 18.16s 877 2,607
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 762ms 15 0
Nemotron 3 Super 2.9 4.4 22.2% 2 16.19s 5,255 6,072
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 992ms 63 0
Nemotron 3 Super 4.1 10.0 0.0% 0 6.91s 105 363
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 859ms 72 0
Nemotron 3 Super 7.2 6.6 66.7% 1 7.72s 1,042 2,479
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 6.3 4.8 66.7% 2 720ms 150 0
Nemotron 3 Super 3.1 10.0 0.0% 0 4.32s 529 1,476
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 2.97s 234 0
Nemotron 3 Super 10.0 10.0 100.0% 0 39.75s 270 1,969
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 733ms 9 0
Nemotron 3 Super 3.0 10.0 0.0% 0 55.32s 3,251 3,313

Быстрое сравнение

Сменить пару сравнения