AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Laguna Xs.2

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-29

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	Laguna Xs.2 Laguna Xs.2 none Релиз: 2026-04-28 Бесплатно доступно

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	Laguna Xs.2 Laguna Xs.2 none Релиз: 2026-04-28 Бесплатно доступно
Оценка	9.6	5.0
Ранг	#2	#118
Надежность	Н/Д	9.9
Стабильность	10.0	10.0
Тестов верно
Доля успешных попыток	94.4%	27.8%
Нестабильные тесты	0	0
Всего запусков	54	54
Стоимость за результат	3.400	0.000
Общая стоимость	$0.578	$0.000
???? ?????	$2.000 / 1M	$0.000 / 1M
???? ??????	$12.000 / 1M	$0.000 / 1M
Выходные токены	1,932	3,824
Токены рассуждений	40,542	0
Время ответа (среднее)	15.96s	1.68s
Время ответа (макс.)	40.61s	16.04s
Время ответа (суммарно)	175.52s	30.26s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	112	3,218
Laguna Xs.2	3.2	10.0	0.0%	0		743ms	933	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		19.88s	405	4,201
Laguna Xs.2	2.5	10.0	0.0%	0		1.96s	866	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	432	9,281
Laguna Xs.2	3.0	10.0	0.0%	0		2.01s	521	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	279	3,904
Laguna Xs.2	10.0	10.0	100.0%	0		646ms	246	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	18	12,424
Laguna Xs.2	5.3	10.0	33.3%	0		371ms	33	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179
Laguna Xs.2	5.0	10.0	0.0%	0		16.04s	200	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236
Laguna Xs.2	6.5	10.0	50.0%	0		439ms	81	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117
Laguna Xs.2	5.4	10.0	33.3%	0		688ms	552	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982
Laguna Xs.2	3.0	10.0	0.0%	0		1.93s	392	0

Быстрое сравнение

Сменить пару сравнения

Nemotron 3 Nano Omni 30b A3b ReasoningmediumБесплатно доступноvsLaguna Xs.2noneБесплатно доступно Elephant AlphamediumvsLaguna Xs.2noneБесплатно доступно MiniMax M2.7mediumvsLaguna Xs.2noneБесплатно доступно Laguna Xs.2noneБесплатно доступноvsQwen3 Coder Nextmedium Claude Opus 4.7nonevsGemini 3.1 Pro Previewmedium Laguna Xs.2noneБесплатно доступноvsGLM 4.7 Flashmedium Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Mistral Small 4mediumvsLaguna Xs.2noneБесплатно доступно MiniMax M2.5mediumБесплатно доступноvsLaguna Xs.2noneБесплатно доступно Laguna Xs.2noneБесплатно доступноvsQwen3.5-9Bmedium gpt-oss-120bmediumБесплатно доступноvsLaguna Xs.2noneБесплатно доступно Gemini 3.1 Pro PreviewmediumvsHY3 PreviewhighБесплатно доступно