Навигация
AI BENCHY
Сравнить Графики
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Inception: Mercury 2 vs Qwen: Qwen3 Coder Next

Сравнить:

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-05

Метрика Inception: Mercury 2 medium Релиз: 2026-02-24 Qwen: Qwen3 Coder Next none Релиз: 2026-02-03
Ранг #35 #49
Средний балл 5.4 3.6
Тестов верно
Стабильность 8.3 10.0
Стоимость за результат 0.622 0.226
Общая стоимость $0.044 $0.007
Доля успешных попыток 57.8% 20.0%
Нестабильные тесты 3 0
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
Выходные токены 3,571 2,874
Токены рассуждений 45,379 0
Время ответа (среднее) 2.47s 12.82s
Время ответа (макс.) 14.63s 45.14s
Время ответа (суммарно) 34.56s 115.42s

Лучшие модели по оценке

Время ответа (среднее)

Оценка vs общая стоимость

Средний балл vs Время ответа (среднее)

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Inception: Mercury 2 7.3 9.8 66.7% 0 1.30s 2,531 2,410
Qwen: Qwen3 Coder Next 2.3 10.0 0.0% 0 4.39s 1,315 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Inception: Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
Qwen: Qwen3 Coder Next 10.0 10.0 0.0% 0 45.14s 317 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Inception: Mercury 2 5.5 5.9 83.3% 1 1.11s 183 1,656
Qwen: Qwen3 Coder Next 5.4 10.0 50.0% 0 1.32s 246 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Inception: Mercury 2 10.0 7.2 11.1% 1 6.48s 41 30,754
Qwen: Qwen3 Coder Next 4.0 10.0 33.3% 0 962ms 26 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Inception: Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
Qwen: Qwen3 Coder Next 4.5 10.0 0.0% 0 7.71s 63 0
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Inception: Mercury 2 1.7 7.5 22.2% 1 934ms 354 2,758
Qwen: Qwen3 Coder Next 1.3 10.0 0.0% 0 22.86s 652 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Inception: Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
Qwen: Qwen3 Coder Next 10.0 10.0 100.0% 0 2.47s 255 0

Быстрое сравнение

Сменить пару сравнения