Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

NVIDIA: Nemotron 3 Super vs Z.ai: GLM 5.1

Сводка

Сравнение benchmark Nemotron 3 Super vs GLM 5.1: GLM 5.1 лидирует по среднему баллу: 5.7 vs 4.9. Nemotron 3 Super имеет более низкую стоимость benchmark: $0.007 vs $0.058. GLM 5.1 быстрее: 4.10s vs 5.30s, с долей успешных попыток 31.8% vs 41.3%.

Рекомендуемая модель: Nemotron 3 Super - Его балл близок к лучшему здесь (4.9 против 5.7), при этом он примерно в 9.5 раза дешевле, чем GLM 5.1.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-10

Метрика Nemotron 3 Super Nemotron 3 Super none Релиз: 2026-03-11 Бесплатно доступно GLM 5.1 GLM 5.1 none Релиз: 2026-04-07
Оценка 4.9 5.7
Ранг #142 #113
Надежность 10.0 10.0
Стабильность 8.8 8.5
Тестов верно
Доля успешных попыток 31.8% 41.3%
Нестабильные тесты 3 4
Всего запусков 63 63
Стоимость за результат 0.034 0.843
Общая стоимость $0.007 $0.058
Цена входа $0.090 / 1M $0.980 / 1M
Цена выхода $0.450 / 1M $3.080 / 1M
Общее число входных токенов 36,456 47,133
Выходные токены 6,195 3,754
Токены рассуждений 0 0
Время ответа (среднее) 5.30s 4.10s
Время ответа (макс.) 16.45s 32.57s
Время ответа (суммарно) 111.31s 86.18s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#142 Nemotron 3 Super

none
No showcase result has been generated for this model yet.
Cost
$0.000
Time
-
Tokens
0 tok

#113 GLM 5.1

none
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Nemotron 3 Super 4.8 10.0 25.0% 0 4.46s 671 2,322 0
GLM 5.1 4.0 6.3 25.0% 2 2.11s 555 305 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Nemotron 3 Super 3.3 7.2 11.1% 1 2.64s 7,627 571 0
GLM 5.1 3.9 9.7 0.0% 0 4.96s 7,256 525 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Nemotron 3 Super 3.0 10.0 0.0% 0 16.45s 8,740 617 0
GLM 5.1 2.8 2.1 33.3% 1 32.57s 22,831 2,129 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Nemotron 3 Super 10.0 10.0 100.0% 0 7.92s 7,944 249 0
GLM 5.1 10.0 10.0 100.0% 0 1.08s 7,107 204 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Nemotron 3 Super 3.6 7.2 22.2% 1 6.23s 789 26 0
GLM 5.1 2.9 7.2 11.1% 1 1.99s 687 24 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Nemotron 3 Super 4.6 10.0 0.0% 0 950ms 500 134 0
GLM 5.1 5.0 10.0 0.0% 0 790ms 477 39 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Nemotron 3 Super 6.3 10.0 50.0% 0 804ms 723 66 0
GLM 5.1 9.8 10.0 100.0% 0 1.98s 636 66 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Nemotron 3 Super 5.5 10.0 33.3% 0 2.36s 714 1,125 0
GLM 5.1 7.7 10.0 66.7% 0 1.45s 609 151 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Nemotron 3 Super 4.7 1.6 66.7% 1 16.00s 8,541 281 0
GLM 5.1 10.0 10.0 100.0% 0 10.68s 6,789 300 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Nemotron 3 Super 3.0 10.0 0.0% 0 8.94s 207 804 0
GLM 5.1 3.0 10.0 0.0% 0 2.34s 186 11 0

Быстрое сравнение

Сменить пару сравнения