Сравнить Графики

Язык:

❤️ Made by XCS

AI BENCHY Compare

Inception: Mercury 2 vs OpenAI: GPT-5 Mini

Сравнить:

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-05

Метрика	Inception: Mercury 2 none Релиз: 2026-02-24	OpenAI: GPT-5 Mini medium Релиз: 2025-08-07
Ранг	#50	#31
Средний балл	3.4	6.1
Тестов верно
Стабильность	8.9	8.9
Стоимость за результат	0.147	1.401
Общая стоимость	$0.006	$0.113
Доля успешных попыток	33.3%	62.2%
Нестабильные тесты	2	2
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
Выходные токены	1,144	5,477
Токены рассуждений	0	46,912
Время ответа (среднее)	594ms	25.92s
Время ответа (макс.)	1.27s	88.15s
Время ответа (суммарно)	8.91s	388.79s

Лучшие модели по оценке

Время ответа (среднее)

Оценка vs общая стоимость

Средний балл vs Время ответа (среднее)

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	10.0	10.0	0.0%	0		466ms	274	0
OpenAI: GPT-5 Mini	7.0	9.6	66.7%	0		16.45s	1,645	5,824

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	10.0	10.0	0.0%	0		606ms	131	0
OpenAI: GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	754	11,520

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	5.5	5.9	83.3%	1		667ms	180	0
OpenAI: GPT-5 Mini	9.9	10.0	100.0%	0		12.58s	453	3,200

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	4.0	7.2	44.4%	1		534ms	46	0
OpenAI: GPT-5 Mini	10.0	7.2	22.2%	1		44.63s	293	14,016

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	5.5	10.0	50.0%	0		551ms	82	0
OpenAI: GPT-5 Mini	7.5	6.6	83.3%	1		15.66s	318	4,992

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	10.0	10.0	0.0%	0		533ms	234	0
OpenAI: GPT-5 Mini	4.3	9.8	33.3%	0		14.09s	1,527	5,760

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	10.0	10.0	100.0%	0		1.27s	197	0
OpenAI: GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	487	1,600

Быстрое сравнение

Сменить пару сравнения

Mercury 2nonevsQwen3 Coder Nextmedium Mercury 2nonevsGLM 4.7 Flashmedium GPT-5 MinimediumvsGLM 5none GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none Claude Sonnet 4.6nonevsGPT-5 Minimedium Gemini 2.5 FlashnonevsGPT-5 Minimedium DeepSeek V3.2nonevsGPT-5 Minimedium Gemini 3 Flash PreviewnonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5-122B-A10Bnone GPT-5 MinimediumvsQwen3.5-Flashnone GPT-5 MinimediumvsQwen3.5-27Bnone Gemini 3.1 Flash Lite PreviewnonevsGPT-5 Minimedium