AI BENCHY
Advertise here
#103

MiMo-V2-Flash

Xiaomi Релиз: 2025-12-16 Проверено: 2026-04-11 01:44 xiaomi/mimo-v2-flash::none
(medium) (none)

Сводка

MiMo-V2-Flash набирает 4.5 в AI BENCHY и занимает #103. У модели надежность Н/Д, доля успешных попыток 27.8%, общая стоимость $0.023 и среднее время ответа 2.79s.

Что делает MiMo-V2-Flash особенной: Сильнее всего модель выделяется в Программирование, где занимает #1; самая слабая область — Парсинг и извлечение данных с #15.

Архивная модель: эта модель больше не обновляется и не тестируется на новых тестах.

Стабильность

7.8

Надежность

Н/Д

Общее число выходных токенов

68,522

Общее число входных токенов

0

Цена входа

$0.090 / 1M

Цена выхода

$0.290 / 1M

Тестов верно

Ошибочных тестов: 15

Доля успешных попыток: 27.8%

Нестабильные тесты

5

Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).

Время ответа (среднее)

2.79s

Время ответа (макс.): 19.68s

Время ответа (суммарно): 39.08s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#103 MiMo-V2-Flash

none
Стоимость
$0.001
Время
7.7s
Токены
1,481 tok

История запусков

Проверено Оценка Надежность Тестов верно Общая стоимость Сравнить
2026-06-04 13:47 Добавлен новый тест 4.6 6.7 $0.025 Сравнить
2026-05-22 00:20 Набор изменён 4.4 10.0 $0.024 Сравнить
2026-04-11 01:44 Первый зафиксированный запуск 4.5 Н/Д $0.023 Текущий запуск

Сравнение запусков

ЗапускОценкаСтабильностьНадежностьТестов верноНестабильные тестыОбщее число выходных токеновОбщее число входных токеновОбщая стоимостьВремя ответа (среднее)
2026-04-11 01:44 · Первый зафиксированный запуск4.57.8Н/Д3/18568,5220$0.0232.79s
2026-06-04 13:47 · Добавлен новый тест4.68.56.74/21468,88236,851$0.0252.76s
Разница-0.1-0.7-1+1-360-36851-$0.002+28ms

Эти два запуска использовали разные наборы бенчмарков, поэтому различия отражают и изменения модели, и изменения набора.

Графики

Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Быстрое сравнение

Разбивка по категориям

Категория Оценка Стабильность Тестов верно
Анти-ИИ уловки 3.2 8.0
Программирование 6.3 3.7
Комбинированный 3.0 10.0
Парсинг и извлечение данных 2.9 5.8
Предметно-ориентированное 5.3 7.2
Общий интеллект 4.6 10.0
Следование инструкциям 6.5 10.0
Решение головоломок 3.6 7.2
Вызов инструментов 10.0 10.0

Сравниваемые модели