AI BENCHY Compare
Inception: Mercury 2 vs xAI: Grok 4.20
Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-10
| Метрика | Mercury 2 Mercury 2 medium | Grok 4.20 Grok 4.20 none |
|---|---|---|
| Оценка | 6.3 | 5.4 |
| Ранг | #82 | #115 |
| Надежность | 10.0 | Н/Д |
| Стабильность | 8.7 | 9.5 |
| Тестов верно | ||
| Доля успешных попыток | 50.9% | 35.2% |
| Нестабильные тесты | 3 | 1 |
| Всего запусков | 57 | 54 |
| Стоимость за результат | 0.616 | 1.574 |
| Общая стоимость | $0.050 | $0.095 |
| ???? ????? | $0.250 / 1M | $1.250 / 1M |
| ???? ?????? | $0.750 / 1M | $2.500 / 1M |
| Выходные токены | 3,994 | 1,967 |
| Токены рассуждений | 52,081 | 0 |
| Время ответа (среднее) | 2.23s | 1.11s |
| Время ответа (макс.) | 14.63s | 6.04s |
| Время ответа (суммарно) | 40.10s | 20.02s |
Оценка vs общая стоимость
Время ответа (среднее)
Оценка vs Время ответа (среднее)
Общее число выходных токенов
Оценка vs Общее число выходных токенов
Разбивка по категориям
Быстрое сравнение
Сменить пару сравнения
Gemini 2.5 FlashnonevsMercury 2mediumMercury 2mediumvsMiMo-V2-OmninoneGemma 4 26B A4BnoneБесплатно доступноvsMercury 2mediumElephant AlphamediumvsGrok 4.20noneDeepSeek V4 PrononevsMercury 2mediumMistral Small 4mediumvsGrok 4.20noneMiniMax M2.5mediumБесплатно доступноvsGrok 4.20noneMercury 2mediumvsGLM 5noneMercury 2mediumvsQwen3.5 Plus 2026-02-15noneSeed-2.0-LitenonevsMercury 2mediumMercury 2mediumvsGLM 5V TurbononeMercury 2mediumvsQwen3.5-Flashnone