Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Owl Alpha vs Xiaomi: MiMo-V2-Omni

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-08

Метрика Owl Alpha Owl Alpha medium Релиз: 2026-04-30 MiMo-V2-Omni MiMo-V2-Omni none Релиз: 2026-03-18
Оценка 6.0 6.3
Ранг #88 #79
Надежность 10.0 10.0
Стабильность 9.6 9.7
Тестов верно
Доля успешных попыток 43.9% 43.9%
Нестабильные тесты 1 1
Всего запусков 57 49
Стоимость за результат 0.000 0.241
Общая стоимость $0.000 $0.020
???? ????? $0.000 / 1M $0.400 / 1M
???? ?????? $0.000 / 1M $2.000 / 1M
Выходные токены 1,613 2,254
Токены рассуждений 0 0
Время ответа (среднее) 10.58s 2.37s
Время ответа (макс.) 58.63s 6.81s
Время ответа (суммарно) 201.03s 45.03s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Owl Alpha 4.8 10.0 25.0% 0 3.97s 87 0
MiMo-V2-Omni 3.6 8.4 8.3% 1 1.63s 773 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Owl Alpha 10.0 10.0 100.0% 0 7.35s 402 0
MiMo-V2-Omni 6.6 10.0 0.0% 0 1.72s 399 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Owl Alpha 3.0 10.0 0.0% 0 10.01s 315 0
MiMo-V2-Omni 3.0 10.0 0.0% 0 5.96s 387 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Owl Alpha 10.0 10.0 100.0% 0 21.64s 246 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 1.76s 147 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Owl Alpha 5.3 10.0 33.3% 0 8.58s 28 0
MiMo-V2-Omni 5.3 10.0 33.3% 0 2.10s 24 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Owl Alpha 4.3 10.0 0.0% 0 58.63s 98 0
MiMo-V2-Omni 4.1 10.0 0.0% 0 2.33s 103 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Owl Alpha 6.3 10.0 50.0% 0 9.59s 57 0
MiMo-V2-Omni 6.5 10.0 50.0% 0 4.26s 30 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Owl Alpha 5.3 7.2 44.4% 1 3.44s 135 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 1.16s 148 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Owl Alpha 10.0 10.0 100.0% 0 8.26s 228 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 5.40s 231 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Owl Alpha 3.0 10.0 0.0% 0 2.38s 17 0
MiMo-V2-Omni 3.0 10.0 0.0% 0 1.30s 12 0

Быстрое сравнение

Сменить пару сравнения