AI BENCHY Compare
Inception: Mercury 2 vs xAI: Grok 4.20
Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-02
| Метрика | Mercury 2 Mercury 2 medium | Grok 4.20 Grok 4.20 none |
|---|---|---|
| Оценка | 6.3 | 5.4 |
| Ранг | #51 | #69 |
| Стабильность | 8.5 | 9.5 |
| Тестов верно | ||
| Доля успешных попыток | 51.0% | 31.4% |
| Нестабильные тесты | 3 | 1 |
| Всего запусков | 51 | 51 |
| Стоимость за результат | 0.634 | 1.809 |
| Общая стоимость | $0.045 | $0.091 |
| ???? ????? | $0.250 / 1M | $2.000 / 1M |
| ???? ?????? | $0.750 / 1M | $6.000 / 1M |
| Выходные токены | 3,723 | 1,655 |
| Токены рассуждений | 46,120 | 0 |
| Время ответа (среднее) | 2.25s | 1.11s |
| Время ответа (макс.) | 14.63s | 6.04s |
| Время ответа (суммарно) | 35.99s | 18.80s |
Оценка vs общая стоимость
Время ответа (среднее)
Оценка vs Время ответа (среднее)
Общее число выходных токенов
Оценка vs Общее число выходных токенов
Разбивка по категориям
Быстрое сравнение
Сменить пару сравнения
DeepSeek V3.2nonevsMercury 2mediumMercury 2mediumvsMiMo-V2-OmninoneMistral Small 4mediumvsGrok 4.20noneMercury 2mediumvsQwen3.5-FlashnoneMercury 2mediumvsGLM 5V TurbononeSeed-2.0-LitenonevsMercury 2mediumMiniMax M2.7mediumvsGrok 4.20noneGemini 2.5 FlashnonevsMercury 2mediumMercury 2mediumvsQwen3.5-35B-A3BnoneMercury 2mediumvsGLM 5noneGemma 4 31BnonevsMercury 2mediumMercury 2mediumvsHunter Alphanone