AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Mistral: Mistral Small 4

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-01

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	Mistral Small 4 Mistral Small 4 none Релиз: 2026-03-16

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	Mistral Small 4 Mistral Small 4 none Релиз: 2026-03-16
Оценка	9.6	5.2
Ранг	#2	#115
Надежность	Н/Д	Н/Д
Стабильность	10.0	9.5
Тестов верно
Доля успешных попыток	94.4%	31.5%
Нестабильные тесты	0	1
Всего запусков	54	54
Стоимость за результат	3.400	0.118
Общая стоимость	$0.578	$0.006
???? ?????	$2.000 / 1M	$0.150 / 1M
???? ??????	$12.000 / 1M	$0.600 / 1M
Выходные токены	1,932	2,207
Токены рассуждений	40,542	0
Время ответа (среднее)	15.96s	665ms
Время ответа (макс.)	40.61s	1.72s
Время ответа (суммарно)	175.52s	11.97s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	112	3,218
Mistral Small 4	3.4	7.9	16.7%	1		395ms	182	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		19.88s	405	4,201
Mistral Small 4	4.5	9.0	0.0%	0		1.28s	583	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	432	9,281
Mistral Small 4	3.0	10.0	0.0%	0		1.72s	496	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	279	3,904
Mistral Small 4	10.0	10.0	100.0%	0		822ms	261	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	18	12,424
Mistral Small 4	5.3	10.0	33.3%	0		367ms	28	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179
Mistral Small 4	4.0	10.0	0.0%	0		729ms	205	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236
Mistral Small 4	6.5	10.0	50.0%	0		380ms	69	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117
Mistral Small 4	3.1	9.9	0.0%	0		589ms	170	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982
Mistral Small 4	10.0	10.0	100.0%	0		1.40s	213	0

Быстрое сравнение

Сменить пару сравнения

Mistral Small 4nonevsNemotron 3 Nano Omni 30b A3b ReasoningmediumБесплатно доступно Mistral Small 4nonevsElephant Alphamedium MiniMax M2.7mediumvsMistral Small 4none Mistral Small 4nonevsQwen3 Coder Nextmedium Claude Opus 4.7nonevsGemini 3.1 Pro Previewmedium MiniMax M2.5mediumБесплатно доступноvsMistral Small 4none Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Mistral Small 4nonevsGLM 4.7 Flashmedium Mistral Small 4nonevsOwl Alphamedium Mistral Small 4nonevsgpt-oss-120bmediumБесплатно доступно Mistral Small 4nonevsQwen3.5-9Bmedium Gemini 3.1 Pro PreviewmediumvsHY3 PreviewhighБесплатно доступно