Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Inception: Mercury 2 vs Qwen: Qwen3.6 27B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-04

Метрика Mercury 2 Mercury 2 medium Релиз: 2026-02-24 Qwen3.6 27B Qwen3.6 27B medium Релиз: 2026-04-20
Оценка 6.6 6.8
Ранг #81 #78
Надежность 10.0 10.0
Стабильность 8.8 8.2
Тестов верно
Доля успешных попыток 54.0% 60.3%
Нестабильные тесты 3 5
Всего запусков 63 63
Стоимость за результат 0.578 3.361
Общая стоимость $0.058 $0.444
Цена входа $0.250 / 1M $0.290 / 1M
Цена выхода $0.750 / 1M $3.200 / 1M
Общее число входных токенов 35,116 39,376
Выходные токены 4,048 16,189
Токены рассуждений 61,219 122,521
Время ответа (среднее) 2.24s 59.71s
Время ответа (макс.) 14.63s 168.22s
Время ответа (суммарно) 44.72s 1254.01s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 6.9 9.9 50.0% 0 1.12s 554 2,546 2,609
Qwen3.6 27B 8.3 10.0 75.0% 0 12.62s 453 582 4,311
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 8.2 7.7 77.8% 1 2.04s 7,065 296 11,328
Qwen3.6 27B 7.7 10.0 66.7% 0 142.99s 5,051 7,968 43,367
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 10.0 10.0 100.0% 0 3.28s 12,909 268 4,887
Qwen3.6 27B 7.0 3.7 66.7% 1 83.07s 15,104 2,088 14,689
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 7.3 5.9 83.3% 1 1.11s 6,234 183 1,656
Qwen3.6 27B 3.5 1.4 50.0% 2 37.30s 7,778 568 9,404
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 2.9 7.2 11.1% 1 6.48s 695 41 30,754
Qwen3.6 27B 2.9 7.2 11.1% 1 73.38s 662 3,510 20,352
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 4.8 10.0 0.0% 0 821ms 456 137 542
Qwen3.6 27B 6.5 3.4 66.7% 1 39.53s 516 81 3,045
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 10.0 10.0 100.0% 0 1.07s 340 14 958
Qwen3.6 27B 10.0 10.0 100.0% 0 37.96s 699 346 6,548
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 5.4 10.0 33.3% 0 949ms 601 361 2,781
Qwen3.6 27B 7.7 10.0 66.7% 0 61.14s 696 255 12,044
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 10.0 10.0 100.0% 0 1.89s 6,080 180 1,956
Qwen3.6 27B 10.0 10.0 100.0% 0 16.88s 8,213 390 2,954
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 3.0 10.0 0.0% 0 2.58s 182 22 3,748
Qwen3.6 27B 3.0 10.0 0.0% 0 80.99s 204 401 5,807

Быстрое сравнение

Сменить пару сравнения