AI BENCHY
Сравнить
❤️ Made by XCS

Название модели

OpenAI: GPT-4o-mini

Бенчмарки сгенерированы из тестовых наборов Aibenchy в : 19 февр. 2026 г.

Метрика OpenAI: GPT-4o-mini
Ранг#19
КомпанияOpenAI
Score 4.00
Стабильность 9.98
Стоимость за результат 0.0576
Общая стоимость $0.00173
Тестов верно 3/12
Доля успешных попыток 25.0%
Нестабильные тесты 0
Выходные токены 570
Токены рассуждений 0

Разбивка по категориям

Категория Полностью пройденные тесты Score Стабильность Доля успешных попыток Нестабильные тесты Оценка рассуждения Стоимость
Anti-AI Tricks 0/2 1.00 10.00 0.0% 0 - $0.00005
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 - $0.00115
Domain specific 0/3 1.00 10.00 0.0% 0 - $0.00012
Instructions following 1/2 5.50 10.00 50.0% 0 - $0.00015
Puzzle Solving 0/3 4.00 9.92 0.0% 0 - $0.00028

Сравниваемые модели

Сравнить OpenAI: GPT-4o-mini с...

#18 · Stepfun

StepFun: Step 3.5 Flash

Рассуждение (medium)

Score: 4.92

Стабильность: 7.34

Доля успешных попыток: 58.3%

Нестабильные тесты: 4

Стоимость за результат: 0.0000

Тестов верно: 5/12

Общая стоимость: $0.00000

Сравнить

#20 · Z.ai

Z.ai: GLM 4.7 Flash

Рассуждение (medium)

Score: 3.92

Стабильность: 6.51

Доля успешных попыток: 50.0%

Нестабильные тесты: 5

Стоимость за результат: 0.2253

Тестов верно: 4/12

Общая стоимость: $0.00902

Сравнить

#17 · MiniMax

MiniMax: MiniMax M2.5

Рассуждение (medium)

Score: 5.08

Стабильность: 6.00

Доля успешных попыток: 61.1%

Нестабильные тесты: 6

Стоимость за результат: 4.0276

Тестов верно: 5/12

Общая стоимость: $0.20138

Сравнить

Быстрое сравнение

Сравнить OpenAI: GPT-4o-mini с...