Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs OpenAI: GPT-5.5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-19

Метрика Gemini 3.5 Flash Gemini 3.5 Flash minimal Релиз: 2026-05-19 GPT-5.5 GPT-5.5 medium Релиз: 2026-04-24
Оценка 8.1 8.9
Ранг #21 #8
Надежность 10.0 10.0
Стабильность 9.6 9.1
Тестов верно
Доля успешных попыток 75.4% 87.7%
Нестабильные тесты 1 2
Всего запусков 57 57
Стоимость за результат 0.494 18.365
Общая стоимость $0.070 $2.939
???? ????? $1.500 / 1M $5.000 / 1M
???? ?????? $9.000 / 1M $30.000 / 1M
Выходные токены 2,262 1,950
Токены рассуждений 0 91,386
Время ответа (среднее) 1.37s 33.02s
Время ответа (макс.) 3.56s 332.10s
Время ответа (суммарно) 26.04s 627.45s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 6.5 10.0 50.0% 0 892ms 405 0
GPT-5.5 10.0 10.0 100.0% 0 4.66s 250 1,335
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.28s 441 0
GPT-5.5 10.0 10.0 100.0% 0 9.09s 318 1,391
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 3.0 10.0 0.0% 0 3.56s 404 0
GPT-5.5 10.0 10.0 100.0% 0 19.29s 312 2,841
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.66s 279 0
GPT-5.5 10.0 10.0 100.0% 0 4.18s 234 593
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 899ms 12 0
GPT-5.5 5.3 7.2 44.4% 1 164.14s 67 79,625
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 922ms 117 0
GPT-5.5 10.0 10.0 100.0% 0 4.16s 138 223
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 6.4 5.8 66.7% 1 893ms 76 0
GPT-5.5 10.0 10.0 100.0% 0 3.36s 93 538
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.45s 282 0
GPT-5.5 10.0 10.0 100.0% 0 6.78s 250 2,254
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.79s 234 0
GPT-5.5 10.0 10.0 100.0% 0 10.57s 258 832
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 3.0 10.0 0.0% 0 1.76s 12 0
GPT-5.5 2.8 1.6 33.3% 1 37.86s 30 1,754

Быстрое сравнение

Сменить пару сравнения