AI BENCHY Compare
Inception: Mercury 2 vs xAI: Grok 4.20
Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-16
| Метрика | Mercury 2 Mercury 2 none | Grok 4.20 Grok 4.20 none |
|---|---|---|
| Оценка | 4.8 | 5.2 |
| Ранг | #89 | #80 |
| Стабильность | 9.0 | 9.5 |
| Тестов верно | ||
| Доля успешных попыток | 27.8% | 29.6% |
| Нестабильные тесты | 2 | 1 |
| Всего запусков | 54 | 54 |
| Стоимость за результат | 0.165 | 1.889 |
| Общая стоимость | $0.007 | $0.095 |
| ???? ????? | $0.250 / 1M | $2.000 / 1M |
| ???? ?????? | $0.750 / 1M | $6.000 / 1M |
| Выходные токены | 1,625 | 1,967 |
| Токены рассуждений | 0 | 0 |
| Время ответа (среднее) | 613ms | 1.11s |
| Время ответа (макс.) | 1.27s | 6.04s |
| Время ответа (суммарно) | 11.04s | 20.02s |
Оценка vs общая стоимость
Время ответа (среднее)
Оценка vs Время ответа (среднее)
Общее число выходных токенов
Оценка vs Общее число выходных токенов
Разбивка по категориям
Быстрое сравнение
Сменить пару сравнения
ElephantmediumvsGrok 4.20noneMiniMax M2.7mediumvsGrok 4.20noneMercury 2nonevsQwen3 Coder NextmediumMercury 2nonevsGLM 4.7 FlashmediumMercury 2nonevsQwen3.5-9BmediumMistral Small 4mediumvsGrok 4.20noneMercury 2nonevsElephantmediumMiniMax M2.5mediumБесплатно доступноvsGrok 4.20noneMercury 2nonevsMiniMax M2.7mediumQwen3 Coder NextmediumvsGrok 4.20noneGrok 4.20nonevsGLM 4.7 Flashmediumgpt-oss-120bmediumБесплатно доступноvsGrok 4.20none