AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Laguna M.1

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-29

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	Laguna M.1 Laguna M.1 none Релиз: 2026-04-28 Бесплатно доступно

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	Laguna M.1 Laguna M.1 none Релиз: 2026-04-28 Бесплатно доступно
Оценка	9.6	5.1
Ранг	#2	#117
Надежность	Н/Д	9.9
Стабильность	10.0	8.7
Тестов верно
Доля успешных попыток	94.4%	33.3%
Нестабильные тесты	0	3
Всего запусков	54	54
Стоимость за результат	3.400	0.000
Общая стоимость	$0.578	$0.000
???? ?????	$2.000 / 1M	$0.000 / 1M
???? ??????	$12.000 / 1M	$0.000 / 1M
Выходные токены	1,932	2,870
Токены рассуждений	40,542	0
Время ответа (среднее)	15.96s	2.79s
Время ответа (макс.)	40.61s	15.42s
Время ответа (суммарно)	175.52s	50.24s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	112	3,218
Laguna M.1	3.4	7.9	16.7%	1		1.23s	485	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		19.88s	405	4,201
Laguna M.1	7.5	3.8	66.7%	1		2.93s	543	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	432	9,281
Laguna M.1	3.0	10.0	0.0%	0		4.32s	622	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	279	3,904
Laguna M.1	10.0	10.0	100.0%	0		3.37s	246	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	18	12,424
Laguna M.1	3.6	7.2	22.2%	1		5.50s	33	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179
Laguna M.1	4.0	10.0	0.0%	0		3.08s	212	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236
Laguna M.1	6.3	10.0	50.0%	0		683ms	80	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117
Laguna M.1	3.2	10.0	0.0%	0		951ms	340	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982
Laguna M.1	10.0	10.0	100.0%	0		7.54s	309	0

Быстрое сравнение

Сменить пару сравнения

Nemotron 3 Nano Omni 30b A3b ReasoningmediumБесплатно доступноvsLaguna M.1noneБесплатно доступно Elephant AlphamediumvsLaguna M.1noneБесплатно доступно MiniMax M2.7mediumvsLaguna M.1noneБесплатно доступно Laguna M.1noneБесплатно доступноvsQwen3 Coder Nextmedium Claude Opus 4.7nonevsGemini 3.1 Pro Previewmedium Laguna M.1noneБесплатно доступноvsGLM 4.7 Flashmedium Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Mistral Small 4mediumvsLaguna M.1noneБесплатно доступно MiniMax M2.5mediumБесплатно доступноvsLaguna M.1noneБесплатно доступно Laguna M.1noneБесплатно доступноvsQwen3.5-9Bmedium gpt-oss-120bmediumБесплатно доступноvsLaguna M.1noneБесплатно доступно Gemini 3.1 Pro PreviewmediumvsHY3 PreviewhighБесплатно доступно