Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

IBM: Granite 4.1 8B vs Xiaomi: MiMo-V2-Flash

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-01

Метрика Granite 4.1 8B Granite 4.1 8B none Релиз: 2026-05-01 MiMo-V2-Flash MiMo-V2-Flash none Релиз: 2025-12-16
Оценка 4.3 4.5
Ранг #135 #129
Надежность 10.0 Н/Д
Стабильность 10.0 7.8
Тестов верно
Доля успешных попыток 11.1% 27.8%
Нестабильные тесты 0 5
Всего запусков 54 54
Стоимость за результат 0.110 0.753
Общая стоимость $0.003 $0.023
???? ????? $0.050 / 1M $0.090 / 1M
???? ?????? $0.100 / 1M $0.290 / 1M
Выходные токены 2,712 68,522
Токены рассуждений 0 0
Время ответа (среднее) 767ms 2.79s
Время ответа (макс.) 2.17s 19.68s
Время ответа (суммарно) 13.81s 39.08s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 903 0
MiMo-V2-Flash 3.2 8.0 8.3% 1 1.19s 865 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Granite 4.1 8B 6.9 10.0 0.0% 0 1.07s 339 0
MiMo-V2-Flash 6.3 3.7 33.3% 1 2.79s 726 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 396 0
MiMo-V2-Flash 3.0 10.0 0.0% 0 2.87s 330 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 195 0
MiMo-V2-Flash 2.9 5.8 16.7% 1 19.68s 161 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 24 0
MiMo-V2-Flash 5.3 7.2 44.4% 1 564ms 24 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 115 0
MiMo-V2-Flash 4.6 10.0 0.0% 0 1.67s 104 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 66 0
MiMo-V2-Flash 6.5 10.0 50.0% 0 857ms 69 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Granite 4.1 8B 3.7 10.0 0.0% 0 635ms 431 0
MiMo-V2-Flash 3.6 7.2 22.2% 1 1.38s 65,971 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 243 0
MiMo-V2-Flash 10.0 10.0 100.0% 0 2.28s 272 0

Быстрое сравнение

Сменить пару сравнения