DeepSeek: DeepSeek V3.2 vs Inception: Mercury 2

Средний балл практически равен: 7.0 vs 7.0. DeepSeek V3.2 (medium) имеет более низкую стоимость benchmark: $0.078 vs $0.093. Mercury 2 (medium) быстрее: 2.72s vs 68.62s, с долей успешных попыток 65.2% vs 51.5%.

Рекомендуемая модельMercury 2 (medium)Здесь у него лучший балл (7.0), и он отвечает примерно в 25.2 раза быстрее, чем DeepSeek V3.2 (medium).

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-18

Метрика	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01	Mercury 2 Mercury 2 medium Релиз: 2026-02-24

Метрика	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01	Mercury 2 Mercury 2 medium Релиз: 2026-02-24
Оценка	7.0	7.0
Ранг	#75	#77
Надежность	10.0	10.0
Стабильность	7.4	8.8
Тестов верно
Доля успешных попыток	65.2%	51.5%
Нестабильные тесты	7	3
Всего запусков	66	66
Стоимость за результат	0.671	0.928
Общая стоимость	$0.078	$0.093
Цена входа	$0.269 / 1M	$0.250 / 1M
Цена выхода	$0.400 / 1M	$0.750 / 1M
Общее число входных токенов	101,047	109,572
Выходные токены	11,834	10,313
Токены рассуждений	117,014	76,806
Время ответа (среднее)	68.62s	2.72s
Время ответа (макс.)	376.10s	14.63s
Время ответа (суммарно)	1509.53s	57.12s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#75 DeepSeek V3.2

medium

Стоимость: $0.001
Время: 53.6s
Токены: 1,932 tok

#77 Mercury 2

medium

Стоимость: $0.002
Время: 2.1s
Токены: 1,702 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	8.2	7.9	83.3%	1		24.23s	448	3,247	6,953
Mercury 2	6.9	9.9	50.0%	0		1.12s	554	2,546	2,609

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.0	7.2	55.6%	1		248.68s	5,717	649	52,014
Mercury 2	8.2	7.7	77.8%	1		2.04s	7,065	296	11,328

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.3	5.8	83.3%	1		79.92s	76,997	5,219	24,229
Mercury 2	6.7	9.1	50.0%	0		7.84s	87,365	6,533	20,474

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		36.09s	7,388	207	7,693
Mercury 2	7.3	5.9	83.3%	1		1.11s	6,234	183	1,656

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	2.9	4.4	22.2%	2		24.27s	472	21	6,838
Mercury 2	2.9	7.2	11.1%	1		6.48s	695	41	30,754

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.4	2.5	33.3%	1		58.29s	314	49	2,189
Mercury 2	4.8	10.0	0.0%	0		821ms	456	137	542

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		35.78s	627	1,397	2,845
Mercury 2	10.0	10.0	100.0%	0		1.07s	340	14	958

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.0	7.2	55.6%	1		37.69s	594	518	6,375
Mercury 2	5.4	10.0	33.3%	0		949ms	601	361	2,781

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		34.81s	8,307	507	859
Mercury 2	10.0	10.0	100.0%	0		1.89s	6,080	180	1,956

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		83.99s	183	20	7,019
Mercury 2	3.0	10.0	0.0%	0		2.58s	182	22	3,748

Быстрое сравнение

Сменить пару сравнения

Gemini 3.5 FlashnonevsMercury 2medium DeepSeek V3.2mediumvsGemini 3.5 Flashnone DeepSeek V4 PrononevsMercury 2medium Mercury 2mediumvsGPT-5.6 Solnone DeepSeek V3.2mediumvsGPT-5.6 Solnone Mercury 2mediumvsStep 3.7 Flashhigh Mercury 2mediumvsGPT-5.5none DeepSeek V3.2mediumvsQwen3.7 Plusnone DeepSeek V3.2mediumvsStep 3.7 Flashhigh DeepSeek V3.2mediumvsGPT-5.5none Mercury 2mediumvsQwen3.7 Plusnone Gemini 3.5 FlashminimalvsMercury 2medium