AI BENCHY
Сравнить
❤️ Made by XCS
Your ad here

Название модели

OpenAI: GPT-5.3-Codex

Рассуждение (medium)

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в : 24 февр. 2026 г.

Метрика OpenAI: GPT-5.3-Codex
Ранг#6
КомпанияOpenAI
Score 7.77
Стабильность 8.75
Стоимость за результат 4.9342
Общая стоимость $0.44408
Тестов верно
Доля успешных попыток 76.9%
Нестабильные тесты 2
Выходные токены 947
Токены рассуждений 29,564
Время ответа (среднее)17944ms
Время ответа (суммарно)233267ms
Время ответа (макс.)100927ms

Разбивка по категориям

Категория Полностью пройденные тесты Score Стабильность Доля успешных попыток Нестабильные тесты Оценка рассуждения Время ответа (среднее) Стоимость
Анти-ИИ уловки 10.00 10.00 100.0% 0 6.00 4687ms $0.02371
Парсинг и извлечение данных 10.00 10.00 100.0% 0 1.25 3180ms $0.02600
Предметно-ориентированное 4.00 7.21 55.6% 1 1.00 64314ms $0.35664
Следование инструкциям 9.00 10.00 50.0% 0 1.00 3037ms $0.01216
Puzzle Solving 7.00 7.38 77.8% 1 6.00 4610ms $0.02559

Сравниваемые модели

Сравнить OpenAI: GPT-5.3-Codex с...

#5 · Google

Google: Gemini 3 Flash Preview

Рассуждение (low)

Score: 8.23

Стабильность: 8.71

Доля успешных попыток: 82.0%

Нестабильные тесты: 2

Стоимость за результат: 0.6173

Тестов верно:

Общая стоимость: $0.06174

Сравнить

#7 · OpenAI

OpenAI: GPT-5.2

Рассуждение (medium)

Score: 7.38

Стабильность: 8.73

Доля успешных попыток: 76.9%

Нестабильные тесты: 2

Стоимость за результат: 2.5637

Тестов верно:

Общая стоимость: $0.23074

Сравнить

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Рассуждение (medium)

Score: 8.54

Стабильность: 9.35

Доля успешных попыток: 87.2%

Нестабильные тесты: 1

Стоимость за результат: 2.1621

Тестов верно:

Общая стоимость: $0.23784

Сравнить

Быстрое сравнение

Сравнить OpenAI: GPT-5.3-Codex с...