Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Сравниваемые модели

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-04

Метрика Hunter Alpha Hunter Alpha medium Релиз: 2026-03-11 MiMo-V2-Pro MiMo-V2-Pro medium Релиз: 2026-03-18 MiMo-V2-Omni MiMo-V2-Omni medium Релиз: 2026-03-18
Оценка 7.0 8.0 7.9
Ранг #43 #24 #26
Стабильность 7.2 8.5 10.0
Тестов верно
Доля успешных попыток 68.6% 76.5% 64.7%
Нестабильные тесты 6 3 0
Всего запусков 51 45 17
Стоимость за результат 0.000 1.110 0.763
Общая стоимость $0.000 $0.123 $0.084
???? ????? $0.000 / 1M $1.000 / 1M $0.400 / 1M
???? ?????? $0.000 / 1M $3.000 / 1M $2.000 / 1M
Выходные токены 4,724 1,875 663
Токены рассуждений 17,921 26,959 39,001
Время ответа (среднее) 10.33s 9.78s 13.71s
Время ответа (макс.) 30.53s 64.71s 158.78s
Время ответа (суммарно) 175.60s 156.45s 233.06s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Hunter Alpha 7.3 5.8 83.3% 2 4.75s 479 1,103
MiMo-V2-Pro 10.0 10.0 100.0% 0 3.06s 223 1,107
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.11s 112 402
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Hunter Alpha 4.7 1.6 66.7% 1 30.53s 792 3,456
MiMo-V2-Pro 4.7 1.6 66.7% 1 64.71s 380 14,186
MiMo-V2-Omni 10.0 10.0 100.0% 0 19.29s 131 2,807
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Hunter Alpha 10.0 10.0 100.0% 0 23.16s 1,488 8,017
MiMo-V2-Pro 7.3 5.8 83.3% 1 17.20s 260 7,484
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.29s 87 323
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Hunter Alpha 3.0 10.0 0.0% 0 10.52s 892 2,406
MiMo-V2-Pro 5.3 10.0 33.3% 0 6.00s 155 1,048
MiMo-V2-Omni 3.0 10.0 0.0% 0 55.12s 13 33,279
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Hunter Alpha 7.0 3.7 66.7% 1 6.44s 116 260
MiMo-V2-Pro 10.0 10.0 100.0% 0 4.06s 198 424
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.86s 58 202
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Hunter Alpha 9.9 10.0 100.0% 0 4.18s 208 465
MiMo-V2-Pro 9.9 10.0 100.0% 0 3.36s 83 667
MiMo-V2-Omni 8.3 10.0 50.0% 0 4.92s 35 201
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Hunter Alpha 6.1 4.7 66.7% 2 5.36s 441 1,310
MiMo-V2-Pro 7.0 7.2 55.6% 1 4.71s 313 1,179
MiMo-V2-Omni 6.5 10.0 33.3% 0 3.88s 126 481
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Hunter Alpha 10.0 10.0 100.0% 0 17.33s 308 904
MiMo-V2-Pro 10.0 10.0 100.0% 0 8.19s 263 864
MiMo-V2-Omni 10.0 10.0 100.0% 0 11.07s 101 1,306

Быстрое сравнение

Сменить пару сравнения