#59
Inception
Релиз: 2026-02-24
Проверено: 2026-04-11 01:44
inception/mercury-2::medium
(medium)
(none)
6.5
Стабильность
8.6
Н/Д
Общее число выходных токенов
52,305
Общее число входных токенов
0
Цена входа
$0.250 / 1M
Цена выхода
$0.750 / 1M
Нестабильные тесты
3
Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).
История запусков
| Проверено | Оценка | Надежность | Тестов верно | Общая стоимость | Сравнить |
|---|---|---|---|---|---|
| 2026-06-04 14:27 Добавлен новый тест | 6.6 | 10.0 | $0.058 | Сравнить | |
| 2026-05-22 00:40 Повторный тест | 6.3 | 10.0 | $0.055 | Сравнить | |
| 2026-04-11 01:44 Первый зафиксированный запуск | 6.5 | Н/Д | $0.047 | Текущий запуск |
Сравнение запусков
| Запуск | Оценка | Стабильность | Надежность | Тестов верно | Нестабильные тесты | Общее число выходных токенов | Общее число входных токенов | Общая стоимость | Время ответа (среднее) |
|---|---|---|---|---|---|---|---|---|---|
| 2026-04-11 01:44 · Первый зафиксированный запуск | 6.5 | 8.6 | Н/Д | 8/18 | 3 | 52,305 | 0 | $0.047 | 2.21s |
| 2026-05-22 00:40 · Повторный тест | 6.3 | 8.4 | 10.0 | 8/20 | 4 | 62,397 | 0 | $0.055 | 2.27s |
| Разница | +0.2 | +0.2 | 0 | -1 | -10092 | 0 | -$0.009 | -65ms |
Эти два запуска использовали разные наборы бенчмарков, поэтому различия отражают и изменения модели, и изменения набора.
Графики
Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.
Оценка vs Общая стоимость
Время ответа (среднее)
Оценка vs Время ответа (среднее)
Общее число выходных токенов
Оценка vs Общее число выходных токенов
Быстрое сравнение
Mercury 2mediumvsQwen3.6 Max PreviewnoneMercury 2mediumvsKimi K2.5mediumMercury 2mediumvsSeed-2.0-MinimediumMercury 2mediumvsClaude Sonnet 4.6noneMercury 2mediumvsDeepSeek V3.2mediumMercury 2mediumvsQwen3.6 27BmediumMercury 2mediumvsGemini 3 Flash PreviewmediumMercury 2mediumvsGemini 3.5 FlashhighMercury 2mediumvsNemotron 3 Ultra 550b A55bmediumБесплатно доступноMercury 2mediumvsGemini 3.5 Flashlow
Разбивка по категориям
| Категория | Оценка | Стабильность | Тестов верно |
|---|---|---|---|
| Анти-ИИ уловки | 6.9 | 9.9 | |
| Программирование | 10.0 | 10.0 | |
| Комбинированный | 10.0 | 10.0 | |
| Парсинг и извлечение данных | 7.3 | 5.9 | |
| Предметно-ориентированное | 2.9 | 7.2 | |
| Общий интеллект | 4.8 | 10.0 | |
| Следование инструкциям | 10.0 | 10.0 | |
| Решение головоломок | 3.9 | 7.5 | |
| Вызов инструментов | 10.0 | 10.0 |