AI BENCHY
Сравнить
❤️ Made by XCS

Название модели

Google: Gemini 3 Flash Preview

Бенчмарки сгенерированы из тестовых наборов Aibenchy в : 19 февр. 2026 г.

Метрика Google: Gemini 3 Flash Preview
Ранг#1
КомпанияGoogle
Score 9.92
Стабильность 10.00
Стоимость за результат 0.8502
Общая стоимость $0.10203
Тестов верно 12/12
Доля успешных попыток 100.0%
Нестабильные тесты 0
Выходные токены 590
Токены рассуждений 31,913

Разбивка по категориям

Категория Полностью пройденные тесты Score Стабильность Доля успешных попыток Нестабильные тесты Оценка рассуждения Стоимость
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 7.17 $0.00544
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.17 $0.02077
Domain specific 3/3 10.00 10.00 100.0% 0 5.56 $0.04625
Instructions following 2/2 10.00 10.00 100.0% 0 5.50 $0.01281
Puzzle Solving 3/3 9.67 10.00 100.0% 0 6.50 $0.01679

Сравниваемые модели

Сравнить Google: Gemini 3 Flash Preview с...

#2 · Google

Google: Gemini 3.1 Pro Preview

Рассуждение (medium)

Score: 9.25

Стабильность: 10.00

Доля успешных попыток: 91.7%

Нестабильные тесты: 0

Стоимость за результат: 2.5543

Тестов верно: 11/12

Общая стоимость: $0.28097

Сравнить

#3 · Google

Google: Gemini 3 Pro Preview

Рассуждение (medium)

Score: 8.42

Стабильность: 10.00

Доля успешных попыток: 83.3%

Нестабильные тесты: 0

Стоимость за результат: 0.8028

Тестов верно: 10/12

Общая стоимость: $0.08029

Сравнить

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Рассуждение (medium)

Score: 8.42

Стабильность: 9.30

Доля успешных попыток: 86.1%

Нестабильные тесты: 1

Стоимость за результат: 2.3151

Тестов верно: 10/12

Общая стоимость: $0.23151

Сравнить

Быстрое сравнение

Сравнить Google: Gemini 3 Flash Preview с...