Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Xiaomi: MiMo-V2-Omni

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-29

Метрика DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01 MiMo-V2-Omni MiMo-V2-Omni medium Релиз: 2026-03-18
Оценка 7.3 6.9
Ранг #67 #81
Надежность 10.0 10.0
Стабильность 7.9 8.7
Тестов верно
Доля успешных попыток 67.5% 58.3%
Нестабильные тесты 5 3
Всего запусков 60 52
Стоимость за результат 0.335 7.334
Общая стоимость $0.037 $0.734
Цена входа $0.252 / 1M $0.400 / 1M
Цена выхода $0.378 / 1M $2.000 / 1M
Выходные токены 7,177 1,952
Токены рассуждений 68,297 357,306
Время ответа (среднее) 53.34s 41.16s
Время ответа (макс.) 189.03s 299.23s
Время ответа (суммарно) 1066.71s 823.26s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 24.23s 3,247 6,953
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.75s 269 1,701
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 4.1 5.8 33.3% 1 184.97s 640 21,230
MiMo-V2-Omni 3.4 4.8 16.7% 1 183.89s 292 174,314
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 571 6,296
MiMo-V2-Omni 10.0 10.0 100.0% 0 25.87s 380 8,673
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 207 7,693
MiMo-V2-Omni 10.0 10.0 100.0% 0 3.04s 155 591
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 2.9 4.4 22.2% 2 24.27s 21 6,838
MiMo-V2-Omni 3.0 10.0 0.0% 0 47.89s 155 68,398
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 5.1 2.5 50.0% 1 58.29s 49 2,189
MiMo-V2-Omni 5.4 2.5 66.7% 1 3.61s 136 492
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 1,397 2,845
MiMo-V2-Omni 8.3 10.0 50.0% 0 4.99s 49 515
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 7.0 7.2 55.6% 1 37.69s 518 6,375
MiMo-V2-Omni 5.9 7.2 55.6% 1 2.38s 210 860
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 507 859
MiMo-V2-Omni 10.0 10.0 100.0% 0 13.98s 303 3,461
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 3.0 10.0 0.0% 0 83.99s 20 7,019
MiMo-V2-Omni 3.0 10.0 0.0% 0 234.19s 3 98,301

Быстрое сравнение

Сменить пару сравнения