Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Xiaomi: MiMo-V2-Flash

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-19

Метрика DeepSeek V4 Flash DeepSeek V4 Flash none Релиз: 2026-04-24 Бесплатно доступно MiMo-V2-Flash MiMo-V2-Flash none Релиз: 2025-12-16
Оценка 5.2 4.5
Ранг #127 #144
Надежность 10.0 10.0
Стабильность 9.2 7.9
Тестов верно
Доля успешных попыток 31.6% 26.3%
Нестабильные тесты 2 5
Всего запусков 57 57
Стоимость за результат 0.147 0.754
Общая стоимость $0.008 $0.023
???? ????? $0.112 / 1M $0.100 / 1M
???? ?????? $0.224 / 1M $0.300 / 1M
Выходные токены 4,464 68,534
Токены рассуждений 0 0
Время ответа (среднее) 28.01s 2.73s
Время ответа (макс.) 111.96s 19.68s
Время ответа (суммарно) 532.17s 40.90s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 3.0 10.0 0.0% 0 20.18s 174 0
MiMo-V2-Flash 3.2 8.0 8.3% 1 1.19s 865 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 6.3 10.0 0.0% 0 24.04s 471 0
MiMo-V2-Flash 6.3 3.7 33.3% 1 2.79s 726 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 4.5 2.1 66.7% 1 111.96s 2,664 0
MiMo-V2-Flash 3.0 10.0 0.0% 0 2.87s 330 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 10.0 10.0 100.0% 0 23.79s 195 0
MiMo-V2-Flash 2.9 5.8 16.7% 1 19.68s 161 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 5.3 10.0 33.3% 0 19.73s 18 0
MiMo-V2-Flash 5.3 7.2 44.4% 1 564ms 24 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 4.2 9.9 0.0% 0 23.74s 67 0
MiMo-V2-Flash 4.6 10.0 0.0% 0 1.67s 104 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 6.5 10.0 50.0% 0 17.54s 321 0
MiMo-V2-Flash 6.5 10.0 50.0% 0 857ms 69 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 3.1 7.3 11.1% 1 22.96s 207 0
MiMo-V2-Flash 3.6 7.2 22.2% 1 1.38s 65,971 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 10.0 10.0 100.0% 0 77.93s 327 0
MiMo-V2-Flash 10.0 10.0 100.0% 0 2.28s 272 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V4 Flash 3.0 10.0 0.0% 0 3.07s 20 0
MiMo-V2-Flash 3.0 10.0 0.0% 0 1.82s 12 0

Быстрое сравнение

Сменить пару сравнения