AI BENCHY
Сравнить
❤️ Made by XCS

Название модели

OpenAI: GPT-5.2

Бенчмарки сгенерированы из тестовых наборов Aibenchy в : 19 февр. 2026 г.

Метрика OpenAI: GPT-5.2
Ранг#5
КомпанияOpenAI
Score 7.92
Стабильность 9.30
Стоимость за результат 2.2838
Общая стоимость $0.20554
Тестов верно 9/12
Доля успешных попыток 80.6%
Нестабильные тесты 1
Выходные токены 1,123
Токены рассуждений 12,448

Разбивка по категориям

Категория Полностью пройденные тесты Score Стабильность Доля успешных попыток Нестабильные тесты Оценка рассуждения Стоимость
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 8.25 $0.01131
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.50 $0.02230
Domain specific 1/3 4.00 7.21 55.6% 1 3.17 $0.13697
Instructions following 2/2 9.50 10.00 100.0% 0 8.00 $0.01071
Puzzle Solving 2/3 8.00 10.00 66.7% 0 8.83 $0.02427

Сравниваемые модели

Сравнить OpenAI: GPT-5.2 с...

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Рассуждение (medium)

Score: 8.42

Стабильность: 9.30

Доля успешных попыток: 86.1%

Нестабильные тесты: 1

Стоимость за результат: 2.3151

Тестов верно: 10/12

Общая стоимость: $0.23151

Сравнить

#6 · Anthropic

Anthropic: Claude Sonnet 4.6

Рассуждение (medium)

Score: 7.00

Стабильность: 9.30

Доля успешных попыток: 69.4%

Нестабильные тесты: 1

Стоимость за результат: 9.3797

Тестов верно: 8/12

Общая стоимость: $0.75038

Сравнить

#3 · Google

Google: Gemini 3 Pro Preview

Рассуждение (medium)

Score: 8.42

Стабильность: 10.00

Доля успешных попыток: 83.3%

Нестабильные тесты: 0

Стоимость за результат: 0.8028

Тестов верно: 10/12

Общая стоимость: $0.08029

Сравнить

Быстрое сравнение

Сравнить OpenAI: GPT-5.2 с...