Сравнить Графики

Язык:

❤️ Made by XCS

AI BENCHY Compare

Inception: Mercury 2 vs OpenAI: GPT-5 Nano

Сравнить:

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-05

Метрика	Inception: Mercury 2 none Релиз: 2026-02-24	OpenAI: GPT-5 Nano medium Релиз: 2025-08-07
Средний балл	3.4	5.7
Тестов верно
Ранг	#50	#34
Стабильность	8.9	6.8
Стоимость за результат	0.147	0.829
Общая стоимость	$0.006	$0.058
Доля успешных попыток	33.3%	64.4%
Нестабильные тесты	2	6
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
Выходные токены	1,144	4,184
Токены рассуждений	0	137,472
Время ответа (среднее)	594ms	51.74s
Время ответа (макс.)	1.27s	204.02s
Время ответа (суммарно)	8.91s	413.95s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Средний балл vs Время ответа (среднее)

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	10.0	10.0	0.0%	0		466ms	274	0
OpenAI: GPT-5 Nano	7.0	10.0	66.7%	0		37.73s	1,107	19,968

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	10.0	10.0	0.0%	0		606ms	131	0
OpenAI: GPT-5 Nano	10.0	10.0	100.0%	0		65.96s	578	17,984

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	5.5	5.9	83.3%	1		667ms	180	0
OpenAI: GPT-5 Nano	10.0	1.7	50.0%	2		21.42s	453	10,560

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	4.0	7.2	44.4%	1		534ms	46	0
OpenAI: GPT-5 Nano	4.0	4.4	55.6%	2		204.02s	237	64,448

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	5.5	10.0	50.0%	0		551ms	82	0
OpenAI: GPT-5 Nano	9.0	6.8	83.3%	1		11.90s	382	4,096

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	10.0	10.0	0.0%	0		533ms	234	0
OpenAI: GPT-5 Nano	4.0	7.2	44.4%	1		19.81s	869	13,440

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Inception: Mercury 2	10.0	10.0	100.0%	0		1.27s	197	0
OpenAI: GPT-5 Nano	10.0	10.0	100.0%	0		33.30s	558	6,976

Быстрое сравнение

Сменить пару сравнения

GPT-5 NanomediumvsGLM 5none Mercury 2nonevsQwen3 Coder Nextmedium Mercury 2nonevsGLM 4.7 Flashmedium Gemini 2.5 FlashnonevsGPT-5 Nanomedium DeepSeek V3.2nonevsGPT-5 Nanomedium GPT-5 NanomediumvsQwen3.5-122B-A10Bnone GPT-5 NanomediumvsQwen3.5 Plus 2026-02-15none GPT-5 NanomediumvsQwen3.5-Flashnone GPT-5 NanomediumvsQwen3.5-27Bnone GPT-5 NanomediumvsQwen3.5-35B-A3Bnone Claude Sonnet 4.6nonevsGPT-5 Nanomedium Gemini 3 Flash PreviewnonevsGPT-5 Nanomedium