Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.5 vs Mimo V2 PRO

Сводка

Сравнение benchmark GPT-5.5 vs Mimo V2 PRO: GPT-5.5 лидирует по среднему баллу: 9.3 vs 5.8. Mimo V2 PRO имеет более низкую стоимость benchmark: $0.045 vs $0.907. Mimo V2 PRO быстрее: 2.27s vs 9.76s, с долей успешных попыток 85.7% vs 41.3%.

Рекомендуемая модель: GPT-5.5 - У него самый высокий балл в этом сравнении (9.3) и лучший общий баланс стоимости и времени ответа среди всех 2 моделей.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-18

Метрика GPT-5.5 GPT-5.5 low Релиз: 2026-04-24 Mimo V2 PRO Mimo V2 PRO none Релиз: 2026-03-18
Оценка 9.3 5.8
Ранг #4 #109
Надежность 10.0 10.0
Стабильность 10.0 8.8
Тестов верно
Доля успешных попыток 85.7% 41.3%
Нестабильные тесты 0 3
Всего запусков 63 63
Стоимость за результат 5.035 0.663
Общая стоимость $0.907 $0.045
Цена входа $5.000 / 1M $1.076 / 1M
Цена выхода $30.000 / 1M $1.076 / 1M
Общее число входных токенов 34,209 39,344
Выходные токены 2,046 2,352
Токены рассуждений 22,460 0
Время ответа (среднее) 9.76s 2.27s
Время ответа (макс.) 56.19s 6.58s
Время ответа (суммарно) 204.92s 45.50s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#4 GPT-5.5

low
Стоимость
$0.068
Время
37.0s
Токены
2,339 tok

#109 Mimo V2 PRO

none
This model has been deprecated. It is recommended to migrate to xiaomi/mimo-v2.5-pro
Стоимость
$0.000
Время
0.1s
Токены
0 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
Mimo V2 PRO 3.5 8.0 16.7% 1 1.80s 645 315 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
Mimo V2 PRO 5.5 10.0 33.3% 0 2.65s 4,799 626 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
Mimo V2 PRO 3.0 10.0 0.0% 0 6.58s 15,075 333 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
Mimo V2 PRO 10.0 10.0 100.0% 0 1.39s 7,758 249 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Mimo V2 PRO 5.3 7.2 44.4% 1 1.78s 753 26 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
Mimo V2 PRO 4.3 9.9 0.0% 0 2.44s 498 125 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
Mimo V2 PRO 6.5 10.0 50.0% 0 2.51s 684 69 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
Mimo V2 PRO 6.0 7.1 55.6% 1 1.61s 678 308 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
Mimo V2 PRO 10.0 10.0 100.0% 0 4.39s 8,238 277 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840
Mimo V2 PRO 3.0 10.0 0.0% 0 1.63s 216 24 0

Быстрое сравнение

Сменить пару сравнения