Claude Sonnet 4.6 vs MiMo-V2.5-Pro (medium)

Claude Sonnet 4.6 лидирует по среднему баллу: 7.3 vs 6.9. MiMo-V2.5-Pro (medium) имеет более низкую стоимость benchmark: $0.187 vs $0.661. Claude Sonnet 4.6 быстрее: 8.12s vs 33.92s, с долей успешных попыток 57.6% vs 66.7%.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Ранг: #71
Общее число выходных токенов: 19,362
Время ответа (среднее): 8.12s
Общая стоимость: $0.661

Ранг: #92
Общее число выходных токенов: 146,513
Время ответа (среднее): 33.92s
Общая стоимость: $0.187

Рекомендуемая модель Claude Sonnet 4.6

Здесь у него лучший балл (7.3), и он отвечает примерно в 4.2 раза быстрее, чем MiMo-V2.5-Pro (medium).

Подробное сравнение

Метрика	Claude Sonnet 4.6 Claude Sonnet 4.6 none Релиз: 2026-02-17	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Релиз: 2026-04-22

Метрика	Claude Sonnet 4.6 Claude Sonnet 4.6 none Релиз: 2026-02-17	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Релиз: 2026-04-22
Оценка	7.3	6.9
Ранг	#71	#92
Надежность	10.0	10.0
Стабильность	9.7	8.2
Тестов верно
Доля успешных попыток	57.6%	66.7%
Нестабильные тесты	1	5
Всего запусков	66	66
Стоимость за результат	5.502	3.218
Общая стоимость	$0.661	$0.187
Цена входа	$3.000 / 1M	$0.435 / 1M
Цена выхода	$15.000 / 1M	$0.870 / 1M
Общее число входных токенов	123,264	139,883
Выходные токены	19,362	15,521
Токены рассуждений	0	130,992
Время ответа (среднее)	8.12s	33.92s
Время ответа (макс.)	51.18s	197.54s
Время ответа (суммарно)	121.78s	746.19s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#71 Claude Sonnet 4.6

none

Стоимость: $0.038
Время: 27.3s
Токены: 2,598 tok

#92 MiMo-V2.5-Pro

medium

Неверный SVG

Стоимость: $0.000
Время: 300.0s
Токены: 0 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	4.8	10.0	25.0%	0		2.94s	636	1,214	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.26s	621	323	1,179

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	5.5	10.0	33.3%	0		5.19s	8,522	2,127	0
MiMo-V2.5-Pro	6.2	4.7	66.7%	2		92.07s	6,543	780	51,218

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	9.8	10.0	100.0%	0		37.51s	91,402	13,663	0
MiMo-V2.5-Pro	6.9	5.9	66.7%	1		125.45s	114,089	10,854	45,120

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	10.0	10.0	100.0%	0		3.43s	8,574	252	0
MiMo-V2.5-Pro	7.3	5.8	83.3%	1		18.81s	7,746	260	8,383

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	7.7	10.0	66.7%	0		3.54s	759	413	0
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		37.87s	630	275	17,023

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	6.1	3.1	66.7%	1		2.56s	513	192	0
MiMo-V2.5-Pro	5.5	10.0	0.0%	0		4.02s	492	155	163

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	6.5	10.0	50.0%	0		1.96s	690	90	0
MiMo-V2.5-Pro	9.9	10.0	100.0%	0		2.77s	672	82	803

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	7.7	10.0	66.7%	0		2.53s	663	533	0
MiMo-V2.5-Pro	6.7	7.9	55.6%	1		5.31s	660	540	2,181

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.11s	11,301	447	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		16.87s	8,220	311	2,908

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	3.0	10.0	0.0%	0		4.67s	204	431	0
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		12.46s	210	1,941	2,014

Быстрое сравнение

Сменить пару сравнения

GPT-5.6 SolnonevsMiMo-V2.5-Promedium DeepSeek V4 PrononevsMiMo-V2.5-Promedium Claude Sonnet 4.6nonevsKAT-Coder-Pro V2.5low Claude Sonnet 4.6nonevsGemini 3.1 Flash Lite Previewmedium Step 3.7 FlashhighvsMiMo-V2.5-Promedium Claude Sonnet 4.6nonevsGemini 3 Flash Previewlow GPT-5.5nonevsMiMo-V2.5-Promedium Claude Sonnet 4.6nonevsGemini 3.1 Flash Litemedium Claude Sonnet 4.6nonevsLongCat 2.0medium Gemini 3.5 FlashminimalvsMiMo-V2.5-Promedium Claude Sonnet 4.6nonevsStep 3.7 Flashlow Gemini 3.5 FlashnonevsMiMo-V2.5-Promedium