AI BENCHY
Сравнить
❤️ Made by XCS

Название модели

Google: Gemini 3.1 Pro Preview

Бенчмарки сгенерированы из тестовых наборов Aibenchy в : 19 февр. 2026 г.

Метрика Google: Gemini 3.1 Pro Preview
Ранг#2
КомпанияGoogle
Score 9.25
Стабильность 10.00
Стоимость за результат 2.5543
Общая стоимость $0.28097
Тестов верно 11/12
Доля успешных попыток 91.7%
Нестабильные тесты 0
Выходные токены 632
Токены рассуждений 21,277

Разбивка по категориям

Категория Полностью пройденные тесты Score Стабильность Доля успешных попыток Нестабильные тесты Оценка рассуждения Стоимость
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 5.75 $0.02289
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.50 $0.05541
Domain specific 2/3 7.00 10.00 66.7% 0 5.63 $0.12975
Instructions following 2/2 10.00 10.00 100.0% 0 5.67 $0.03134
Puzzle Solving 3/3 10.00 10.00 100.0% 0 8.89 $0.04159

Сравниваемые модели

Сравнить Google: Gemini 3.1 Pro Preview с...

#1 · Google

Google: Gemini 3 Flash Preview

Рассуждение (medium)

Score: 9.92

Стабильность: 10.00

Доля успешных попыток: 100.0%

Нестабильные тесты: 0

Стоимость за результат: 0.8502

Тестов верно: 12/12

Общая стоимость: $0.10203

Сравнить

#3 · Google

Google: Gemini 3 Pro Preview

Рассуждение (medium)

Score: 8.42

Стабильность: 10.00

Доля успешных попыток: 83.3%

Нестабильные тесты: 0

Стоимость за результат: 0.8028

Тестов верно: 10/12

Общая стоимость: $0.08029

Сравнить

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Рассуждение (medium)

Score: 8.42

Стабильность: 9.30

Доля успешных попыток: 86.1%

Нестабильные тесты: 1

Стоимость за результат: 2.3151

Тестов верно: 10/12

Общая стоимость: $0.23151

Сравнить

Быстрое сравнение

Сравнить Google: Gemini 3.1 Pro Preview с...