Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs MiniMax: MiniMax M2.7

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-03

Метрика Mercury 2 Mercury 2 none Релиз: 2026-02-24 MiniMax M2.7 MiniMax M2.7 medium Релиз: 2026-03-18
Оценка 4.6 5.4
Ранг #153 #128
Надежность 10.0 10.0
Стабильность 9.1 6.8
Тестов верно
Доля успешных попыток 25.0% 48.3%
Нестабильные тесты 2 8
Всего запусков 60 60
Стоимость за результат 0.216 2.076
Общая стоимость $0.009 $0.104
Цена входа $0.250 / 1M $0.279 / 1M
Цена выхода $0.750 / 1M $1.200 / 1M
Общее число входных токенов 25,515 33,493
Выходные токены 3,001 8,224
Токены рассуждений 0 73,373
Время ответа (среднее) 614ms 29.86s
Время ответа (макс.) 1.27s 117.04s
Время ответа (суммарно) 12.28s 567.39s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
MiniMax M2.7 7.9 6.3 83.3% 2 40.32s 654 3,010 17,716
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 3.5 9.4 0.0% 0 831ms 4,631 1,650 0
MiniMax M2.7 6.7 9.7 50.0% 0 54.73s 2,083 474 22,402
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
MiniMax M2.7 4.7 1.6 66.7% 1 41.03s 14,233 369 4,480
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
MiniMax M2.7 6.3 5.8 66.7% 1 21.95s 7,152 187 5,882
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
MiniMax M2.7 3.0 10.0 0.0% 0 19.00s 245 8 2,796
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
MiniMax M2.7 3.9 2.5 33.3% 1 38.70s 486 92 5,204
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
MiniMax M2.7 3.8 5.8 33.3% 1 12.80s 687 350 2,600
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
MiniMax M2.7 5.9 7.2 55.6% 1 24.87s 675 362 7,840
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
MiniMax M2.7 4.7 1.6 66.7% 1 12.05s 7,067 304 1,001
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0
MiniMax M2.7 3.0 10.0 0.0% 0 22.77s 211 3,068 3,452

Быстрое сравнение

Сменить пару сравнения