Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 vs Xiaomi: MiMo-V2.5-Pro

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика GPT-5.4 GPT-5.4 medium Релиз: 2026-03-05 MiMo-V2.5-Pro MiMo-V2.5-Pro medium Релиз: 2026-04-22
Оценка 7.9 7.6
Ранг #27 #40
Надежность 10.0 10.0
Стабильность 8.5 8.9
Тестов верно
Доля успешных попыток 75.0% 68.3%
Нестабильные тесты 4 3
Всего запусков 60 60
Стоимость за результат 8.767 2.407
Общая стоимость $1.140 $0.289
???? ????? $2.500 / 1M $1.000 / 1M
???? ?????? $15.000 / 1M $3.000 / 1M
Выходные токены 2,222 4,957
Токены рассуждений 68,503 80,301
Время ответа (среднее) 22.31s 21.77s
Время ответа (макс.) 100.41s 130.77s
Время ответа (суммарно) 446.15s 435.33s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 8.3 10.0 75.0% 0 4.11s 240 1,511
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.26s 323 1,179
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 8.2 6.7 83.3% 1 54.98s 412 19,995
MiMo-V2.5-Pro 7.0 6.2 66.7% 1 81.67s 769 33,771
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 348 11,870
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 260 8,383
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 275 17,023
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
MiMo-V2.5-Pro 5.5 10.0 0.0% 0 4.02s 155 163
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 82 803
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.16s 493 2,187
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 311 2,908
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 3.0 10.0 0.0% 0 13.95s 30 1,821
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 12.46s 1,941 2,014

Быстрое сравнение

Сменить пару сравнения