Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Mimo V2 PRO

Сводка

Сравнение benchmark Gemini 3 Flash Preview vs Mimo V2 PRO: Gemini 3 Flash Preview лидирует по среднему баллу: 9.6 vs 6.7. Mimo V2 PRO имеет более низкую стоимость benchmark: $0.333 vs $0.667. Gemini 3 Flash Preview быстрее: 18.64s vs 22.16s, с долей успешных попыток 98.4% vs 73.0%.

Рекомендуемая модель: Gemini 3 Flash Preview - У него самый высокий балл в этом сравнении (9.6) и лучший общий баланс стоимости и времени ответа среди всех 2 моделей.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-18

Метрика Gemini 3 Flash Preview Gemini 3 Flash Preview medium Релиз: 2025-12-17 Mimo V2 PRO Mimo V2 PRO medium Релиз: 2026-03-18
Оценка 9.6 6.7
Ранг #2 #77
Надежность 10.0 9.6
Стабильность 9.7 8.0
Тестов верно
Доля успешных попыток 98.4% 73.0%
Нестабильные тесты 1 5
Всего запусков 63 63
Стоимость за результат 3.335 2.450
Общая стоимость $0.667 $0.333
Цена входа $0.500 / 1M $2.653 / 1M
Цена выхода $3.000 / 1M $2.653 / 1M
Общее число входных токенов 37,017 40,961
Выходные токены 2,006 2,518
Токены рассуждений 214,153 81,801
Время ответа (среднее) 18.64s 22.16s
Время ответа (макс.) 117.26s 136.29s
Время ответа (суммарно) 391.35s 443.22s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#2 Gemini 3 Flash Preview

medium
Стоимость
$0.010
Время
17.9s
Токены
3,236 tok

#77 Mimo V2 PRO

medium
This model has been deprecated. It is recommended to migrate to xiaomi/mimo-v2.5-pro
Стоимость
$0.000
Время
0.1s
Токены
0 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.88s 494 330 3,216
Mimo V2 PRO 10.0 10.0 100.0% 0 2.86s 621 251 1,154
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 8.6 7.6 88.9% 1 84.40s 8,122 462 161,084
Mimo V2 PRO 6.0 7.4 55.6% 1 94.21s 4,787 527 37,424
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 22.42s 12,873 351 10,485
Mimo V2 PRO 4.7 1.6 66.7% 1 64.71s 17,028 380 14,186
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.43s 7,548 279 4,893
Mimo V2 PRO 7.3 5.8 83.3% 1 17.20s 7,746 260 7,484
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 15.27s 633 12 21,684
Mimo V2 PRO 5.3 10.0 33.3% 0 8.82s 525 170 2,158
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.19s 486 72 1,905
Mimo V2 PRO 10.0 10.0 100.0% 0 4.92s 492 184 400
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.04s 615 72 2,709
Mimo V2 PRO 9.9 10.0 100.0% 0 3.36s 672 83 667
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.05s 558 183 4,365
Mimo V2 PRO 6.4 4.4 77.8% 2 5.08s 660 372 1,622
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 12.60s 5,532 234 1,487
Mimo V2 PRO 10.0 10.0 100.0% 0 8.19s 8,220 263 864
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.50s 156 11 2,325
Mimo V2 PRO 3.0 10.0 0.0% 0 82.71s 210 28 15,842

Быстрое сравнение

Сменить пару сравнения