AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs IBM: Granite 4.1 8B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-01

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	Granite 4.1 8B Granite 4.1 8B none Релиз: 2026-05-01

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	Granite 4.1 8B Granite 4.1 8B none Релиз: 2026-05-01
Оценка	9.6	4.3
Ранг	#2	#135
Надежность	Н/Д	10.0
Стабильность	10.0	10.0
Тестов верно
Доля успешных попыток	94.4%	11.1%
Нестабильные тесты	0	0
Всего запусков	54	54
Стоимость за результат	3.400	0.110
Общая стоимость	$0.578	$0.003
???? ?????	$2.000 / 1M	$0.050 / 1M
???? ??????	$12.000 / 1M	$0.100 / 1M
Выходные токены	1,932	2,712
Токены рассуждений	40,542	0
Время ответа (среднее)	15.96s	767ms
Время ответа (макс.)	40.61s	2.17s
Время ответа (суммарно)	175.52s	13.81s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	112	3,218
Granite 4.1 8B	4.9	10.0	25.0%	0		844ms	903	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		19.88s	405	4,201
Granite 4.1 8B	6.9	10.0	0.0%	0		1.07s	339	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	432	9,281
Granite 4.1 8B	3.0	10.0	0.0%	0		1.88s	396	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	279	3,904
Granite 4.1 8B	3.0	10.0	0.0%	0		575ms	195	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	18	12,424
Granite 4.1 8B	3.0	10.0	0.0%	0		357ms	24	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179
Granite 4.1 8B	4.0	10.0	0.0%	0		499ms	115	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236
Granite 4.1 8B	3.6	9.9	0.0%	0		344ms	66	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117
Granite 4.1 8B	3.7	10.0	0.0%	0		635ms	431	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982
Granite 4.1 8B	10.0	10.0	100.0%	0		2.17s	243	0

Быстрое сравнение

Сменить пару сравнения

Granite 4.1 8BnonevsQwen3.5-9Bmedium Granite 4.1 8BnonevsGLM 4.7 Flashmedium Claude Opus 4.7nonevsGemini 3.1 Pro Previewmedium Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Granite 4.1 8BnonevsQwen3 Coder Nextmedium Gemini 3.1 Pro PreviewmediumvsHY3 PreviewhighБесплатно доступно Granite 4.1 8BnonevsNemotron 3 Nano Omni 30b A3b ReasoningmediumБесплатно доступно Granite 4.1 8BnonevsElephant Alphamedium Granite 4.1 8BnonevsMiniMax M2.7medium Granite 4.1 8BnonevsMiniMax M2.5mediumБесплатно доступно Granite 4.1 8BnonevsMistral Small 4medium Gemini 3.1 Pro PreviewmediumvsHY3 PreviewlowБесплатно доступно