Сравнить Графики

Язык:

❤️ Made by XCS

AI BENCHY Compare

Inception: Mercury 2 vs Qwen: Qwen3 Coder Next

Сравнить:

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-05

Метрика	Inception: Mercury 2 medium Релиз: 2026-02-24	Qwen: Qwen3 Coder Next none Релиз: 2026-02-03
Ранг	#35	#49
Средний балл	5.4	3.6
Тестов верно
Стабильность	8.3	10.0
Стоимость за результат	0.622	0.226
Общая стоимость	$0.044	$0.007
Доля успешных попыток	57.8%	20.0%
Нестабильные тесты	3	0
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
Выходные токены	3,571	2,874
Токены рассуждений	45,379	0
Время ответа (среднее)	2.47s	12.82s
Время ответа (макс.)	14.63s	45.14s
Время ответа (суммарно)	34.56s	115.42s

Лучшие модели по оценке

Время ответа (среднее)

Оценка vs общая стоимость

Средний балл vs Время ответа (среднее)

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	7.3	9.8	66.7%	0		1.30s	2,531	2,410
Qwen: Qwen3 Coder Next	2.3	10.0	0.0%	0		4.39s	1,315	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	10.0	10.0	100.0%	0		3.28s	268	4,887
Qwen: Qwen3 Coder Next	10.0	10.0	0.0%	0		45.14s	317	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	5.5	5.9	83.3%	1		1.11s	183	1,656
Qwen: Qwen3 Coder Next	5.4	10.0	50.0%	0		1.32s	246	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	10.0	7.2	11.1%	1		6.48s	41	30,754
Qwen: Qwen3 Coder Next	4.0	10.0	33.3%	0		962ms	26	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	10.0	10.0	100.0%	0		1.07s	14	958
Qwen: Qwen3 Coder Next	4.5	10.0	0.0%	0		7.71s	63	0

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	1.7	7.5	22.2%	1		934ms	354	2,758
Qwen: Qwen3 Coder Next	1.3	10.0	0.0%	0		22.86s	652	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	10.0	10.0	100.0%	0		1.89s	180	1,956
Qwen: Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	255	0

Быстрое сравнение

Сменить пару сравнения

Gemini 2.5 FlashnonevsMercury 2medium DeepSeek V3.2nonevsMercury 2medium Qwen3 Coder NextnonevsGLM 4.7 Flashmedium Mercury 2mediumvsQwen3.5-122B-A10Bnone Mercury 2mediumvsGLM 5none Mercury 2mediumvsQwen3.5-Flashnone Mercury 2mediumvsQwen3.5-27Bnone Mercury 2mediumvsQwen3.5-35B-A3Bnone Mercury 2mediumvsGPT-5.4none Mercury 2mediumvsQwen3.5 Plus 2026-02-15none Trinity Large Preview (free)noneБесплатно доступноvsMercury 2medium MiniMax M2.5mediumvsQwen3 Coder Nextnone