AI BENCHY
Сравнить
❤️ Made by XCS

Название модели

MiniMax: MiniMax M2.5

Бенчмарки сгенерированы из тестовых наборов Aibenchy в : 19 февр. 2026 г.

Метрика MiniMax: MiniMax M2.5
Ранг#17
КомпанияMiniMax
Score 5.08
Стабильность 6.00
Стоимость за результат 4.0276
Общая стоимость $0.20138
Тестов верно 5/12
Доля успешных попыток 61.1%
Нестабильные тесты 6
Выходные токены 121,028
Токены рассуждений 165,110

Разбивка по категориям

Категория Полностью пройденные тесты Score Стабильность Доля успешных попыток Нестабильные тесты Оценка рассуждения Стоимость
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 7.58 $0.00902
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 9.45 $0.00774
Domain specific 0/3 1.00 4.41 22.2% 2 6.06 $0.16952
Instructions following 1/2 7.00 6.41 66.7% 1 8.33 $0.00307
Puzzle Solving 1/3 4.33 4.79 55.5% 2 8.28 $0.01205

Сравниваемые модели

Сравнить MiniMax: MiniMax M2.5 с...

#16 · Anthropic

Anthropic: Claude Opus 4.6

Рассуждение (medium)

Score: 5.42

Стабильность: 8.60

Доля успешных попыток: 55.5%

Нестабильные тесты: 2

Стоимость за результат: 12.8695

Тестов верно: 6/12

Общая стоимость: $0.77217

Сравнить

#18 · Stepfun

StepFun: Step 3.5 Flash

Рассуждение (medium)

Score: 4.92

Стабильность: 7.34

Доля успешных попыток: 58.3%

Нестабильные тесты: 4

Стоимость за результат: 0.0000

Тестов верно: 5/12

Общая стоимость: $0.00000

Сравнить

#15 · Z.ai

Z.ai: GLM 5

Без рассуждения

Score: 5.42

Стабильность: 10.00

Доля успешных попыток: 50.0%

Нестабильные тесты: 0

Стоимость за результат: 0.0704

Тестов верно: 6/12

Общая стоимость: $0.00423

Сравнить

Быстрое сравнение

Сравнить MiniMax: MiniMax M2.5 с...