AI BENCHY
Сравнить
❤️ Made by XCS

Название модели

Google: Gemini 3 Flash Preview

Бенчмарки сгенерированы из тестовых наборов Aibenchy в : 19 февр. 2026 г.

Метрика Google: Gemini 3 Flash Preview
Ранг#10
КомпанияGoogle
Score 6.25
Стабильность 8.60
Стоимость за результат 0.0754
Общая стоимость $0.00528
Тестов верно 7/12
Доля успешных попыток 66.7%
Нестабильные тесты 2
Выходные токены 485
Токены рассуждений 0

Разбивка по категориям

Категория Полностью пройденные тесты Score Стабильность Доля успешных попыток Нестабильные тесты Оценка рассуждения Стоимость
Anti-AI Tricks 1/2 5.50 10.00 50.0% 0 - $0.00016
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 - $0.00357
Domain specific 2/3 7.00 10.00 66.7% 0 - $0.00038
Instructions following 1/2 5.50 5.81 66.7% 1 - $0.00054
Puzzle Solving 2/3 7.00 10.00 66.7% 0 - $0.00066

Сравниваемые модели

Сравнить Google: Gemini 3 Flash Preview с...

#9 · MoonshotAI

MoonshotAI: Kimi K2.5

Рассуждение (medium)

Score: 6.42

Стабильность: 8.00

Доля успешных попыток: 72.2%

Нестабильные тесты: 3

Стоимость за результат: 2.4097

Тестов верно: 7/12

Общая стоимость: $0.16868

Сравнить

#11 · OpenAI

OpenAI: GPT-5 Nano

Рассуждение (medium)

Score: 5.92

Стабильность: 6.03

Доля успешных попыток: 72.2%

Нестабильные тесты: 6

Стоимость за результат: 0.4675

Тестов верно: 6/12

Общая стоимость: $0.02806

Сравнить

#8 · X Ai

xAI: Grok 4.1 Fast

Рассуждение (medium)

Score: 6.42

Стабильность: 8.60

Доля успешных попыток: 66.7%

Нестабильные тесты: 2

Стоимость за результат: 0.4800

Тестов верно: 7/12

Общая стоимость: $0.03360

Сравнить

Быстрое сравнение

Сравнить Google: Gemini 3 Flash Preview с...