Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Xiaomi: MiMo-V2.5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-25

Метрика DeepSeek V4 Pro DeepSeek V4 Pro high Релиз: 2026-04-24 MiMo-V2.5 MiMo-V2.5 medium Релиз: 2026-04-22
Оценка 7.4 7.8
Ранг #49 #40
Надежность 3.9 Н/Д
Стабильность 9.2 8.6
Тестов верно
Доля успешных попыток 77.8% 74.1%
Нестабильные тесты 2 3
Всего запусков 54 54
Стоимость за результат 2.524 2.102
Общая стоимость $0.329 $0.253
???? ????? $1.740 / 1M $0.400 / 1M
???? ?????? $3.480 / 1M $2.000 / 1M
Выходные токены 1,937 2,840
Токены рассуждений 82,625 116,242
Время ответа (среднее) 72.92s 13.71s
Время ответа (макс.) 414.38s 86.93s
Время ответа (суммарно) 1312.59s 246.73s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Pro 7.4 10.0 75.0% 0 29.33s 83 3,829
MiMo-V2.5 10.0 10.0 100.0% 0 1.98s 303 2,022
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Pro 10.0 10.0 100.0% 0 81.96s 339 6,962
MiMo-V2.5 10.0 10.0 100.0% 0 31.48s 488 14,813
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Pro 6.6 10.0 100.0% 0 71.08s 134 2,163
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Pro 8.8 10.0 100.0% 0 88.40s 795 6,370
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Pro 4.5 10.0 33.3% 0 202.43s 22 53,478
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Pro 6.1 3.1 66.7% 1 23.11s 106 1,248
MiMo-V2.5 3.8 2.5 33.3% 1 1.55s 118 170
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Pro 10.0 10.0 100.0% 0 20.97s 66 2,590
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Pro 7.6 7.4 77.8% 1 51.47s 223 5,645
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Pro 7.6 10.0 100.0% 0 38.69s 169 340
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424

Быстрое сравнение

Сменить пару сравнения