AI BENCHY
Сравнить
❤️ Made by XCS
Your ad here

Название модели

Google: Gemini 3 Flash Preview

Рассуждение (low)

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в : 24 февр. 2026 г.

Метрика Google: Gemini 3 Flash Preview
Ранг#5
КомпанияGoogle
Score 8.23
Стабильность 8.71
Стоимость за результат 0.6173
Общая стоимость $0.06174
Тестов верно
Доля успешных попыток 82.0%
Нестабильные тесты 2
Выходные токены 936
Токены рассуждений 18,071
Время ответа (среднее)6746ms
Время ответа (суммарно)87697ms
Время ответа (макс.)14717ms

Разбивка по категориям

Категория Полностью пройденные тесты Score Стабильность Доля успешных попыток Нестабильные тесты Оценка рассуждения Время ответа (среднее) Стоимость
Анти-ИИ уловки 10.00 10.00 100.0% 0 6.23 3496ms $0.00844
Парсинг и извлечение данных 10.00 10.00 100.0% 0 4.73 9460ms $0.01354
Предметно-ориентированное 4.00 4.41 55.5% 2 1.83 8314ms $0.01993
Следование инструкциям 7.50 9.99 50.0% 0 5.00 7016ms $0.00878
Puzzle Solving 10.00 10.00 100.0% 0 7.50 6440ms $0.01105

Сравниваемые модели

Сравнить Google: Gemini 3 Flash Preview с...

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Рассуждение (medium)

Score: 8.54

Стабильность: 9.35

Доля успешных попыток: 87.2%

Нестабильные тесты: 1

Стоимость за результат: 2.1621

Тестов верно:

Общая стоимость: $0.23784

Сравнить

#6 · OpenAI

OpenAI: GPT-5.3-Codex

Рассуждение (medium)

Score: 7.77

Стабильность: 8.75

Доля успешных попыток: 76.9%

Нестабильные тесты: 2

Стоимость за результат: 4.9342

Тестов верно:

Общая стоимость: $0.44408

Сравнить

#3 · Google

Google: Gemini 3 Pro Preview

Рассуждение (medium)

Score: 8.54

Стабильность: 10.00

Доля успешных попыток: 84.6%

Нестабильные тесты: 0

Стоимость за результат: 0.7901

Тестов верно:

Общая стоимость: $0.08692

Сравнить

Быстрое сравнение

Сравнить Google: Gemini 3 Flash Preview с...