Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.5 vs Mimo V2 PRO

Сводка

Сравнение benchmark GPT-5.5 vs Mimo V2 PRO: GPT-5.5 лидирует по среднему баллу: 9.3 vs 6.7. Mimo V2 PRO имеет более низкую стоимость benchmark: $0.333 vs $0.907. GPT-5.5 быстрее: 9.76s vs 22.16s, с долей успешных попыток 85.7% vs 73.0%.

Рекомендуемая модель: GPT-5.5 - Здесь у него лучший балл (9.3), и он отвечает примерно в 2.3 раза быстрее, чем Mimo V2 PRO.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-18

Метрика GPT-5.5 GPT-5.5 low Релиз: 2026-04-24 Mimo V2 PRO Mimo V2 PRO medium Релиз: 2026-03-18
Оценка 9.3 6.7
Ранг #4 #77
Надежность 10.0 9.6
Стабильность 10.0 8.0
Тестов верно
Доля успешных попыток 85.7% 73.0%
Нестабильные тесты 0 5
Всего запусков 63 63
Стоимость за результат 5.035 2.450
Общая стоимость $0.907 $0.333
Цена входа $5.000 / 1M $2.653 / 1M
Цена выхода $30.000 / 1M $2.653 / 1M
Общее число входных токенов 34,209 40,961
Выходные токены 2,046 2,518
Токены рассуждений 22,460 81,801
Время ответа (среднее) 9.76s 22.16s
Время ответа (макс.) 56.19s 136.29s
Время ответа (суммарно) 204.92s 443.22s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#4 GPT-5.5

low
Стоимость
$0.068
Время
37.0s
Токены
2,339 tok

#77 Mimo V2 PRO

medium
This model has been deprecated. It is recommended to migrate to xiaomi/mimo-v2.5-pro
Стоимость
$0.000
Время
0.1s
Токены
0 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
Mimo V2 PRO 10.0 10.0 100.0% 0 2.86s 621 251 1,154
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
Mimo V2 PRO 6.0 7.4 55.6% 1 94.21s 4,787 527 37,424
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
Mimo V2 PRO 4.7 1.6 66.7% 1 64.71s 17,028 380 14,186
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
Mimo V2 PRO 7.3 5.8 83.3% 1 17.20s 7,746 260 7,484
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Mimo V2 PRO 5.3 10.0 33.3% 0 8.82s 525 170 2,158
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
Mimo V2 PRO 10.0 10.0 100.0% 0 4.92s 492 184 400
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
Mimo V2 PRO 9.9 10.0 100.0% 0 3.36s 672 83 667
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
Mimo V2 PRO 6.4 4.4 77.8% 2 5.08s 660 372 1,622
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
Mimo V2 PRO 10.0 10.0 100.0% 0 8.19s 8,220 263 864
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840
Mimo V2 PRO 3.0 10.0 0.0% 0 82.71s 210 28 15,842

Быстрое сравнение

Сменить пару сравнения