Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 2.5 Flash vs Xiaomi: MiMo-V2.5-Pro

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-29

Метрика Gemini 2.5 Flash Gemini 2.5 Flash medium Релиз: 2025-06-17 MiMo-V2.5-Pro MiMo-V2.5-Pro medium Релиз: 2026-04-22
Оценка 7.7 7.6
Ранг #42 #48
Надежность 10.0 10.0
Стабильность 9.6 8.9
Тестов верно
Доля успешных попыток 68.3% 68.3%
Нестабильные тесты 1 3
Всего запусков 60 60
Стоимость за результат 2.750 2.408
Общая стоимость $0.358 $0.289
Цена входа $0.300 / 1M $0.435 / 1M
Цена выхода $2.500 / 1M $0.870 / 1M
Выходные токены 1,924 5,004
Токены рассуждений 137,255 80,295
Время ответа (среднее) 15.57s 21.79s
Время ответа (макс.) 95.48s 130.77s
Время ответа (суммарно) 311.47s 435.79s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 8.4 10.0 75.0% 0 6.30s 255 10,233
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.26s 323 1,179
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 6.6 10.0 50.0% 0 54.56s 537 24,413
MiMo-V2.5-Pro 7.0 6.2 66.7% 1 81.67s 769 33,771
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 10.0 10.0 100.0% 0 28.44s 303 11,922
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 348 11,870
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 10.0 10.0 100.0% 0 4.06s 279 2,325
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 260 8,383
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 5.9 7.2 55.6% 1 37.34s 18 80,702
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 275 17,023
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 4.8 10.0 0.0% 0 4.86s 92 1,899
MiMo-V2.5-Pro 5.5 10.0 0.0% 0 4.02s 155 163
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 9.8 10.0 100.0% 0 2.62s 69 1,203
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 82 803
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 7.7 10.0 66.7% 0 3.18s 126 2,499
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.31s 540 2,181
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 10.0 10.0 100.0% 0 6.20s 234 1,140
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 311 2,908
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 3.0 10.0 0.0% 0 2.76s 11 919
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 12.46s 1,941 2,014

Быстрое сравнение

Сменить пару сравнения