Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs OpenAI: GPT-5.5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-19

Метрика Gemini 3.5 Flash Gemini 3.5 Flash high Релиз: 2026-05-19 GPT-5.5 GPT-5.5 medium Релиз: 2026-04-24
Оценка 9.6 8.9
Ранг #4 #8
Надежность 10.0 10.0
Стабильность 9.6 9.1
Тестов верно
Доля успешных попыток 96.5% 87.7%
Нестабильные тесты 1 2
Всего запусков 57 57
Стоимость за результат 4.294 18.365
Общая стоимость $0.773 $2.939
???? ????? $1.500 / 1M $5.000 / 1M
???? ?????? $9.000 / 1M $30.000 / 1M
Выходные токены 1,945 1,950
Токены рассуждений 78,877 91,386
Время ответа (среднее) 6.90s 33.02s
Время ответа (макс.) 22.37s 332.10s
Время ответа (суммарно) 131.10s 627.45s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.57s 174 4,997
GPT-5.5 10.0 10.0 100.0% 0 4.66s 250 1,335
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 14.42s 426 10,368
GPT-5.5 10.0 10.0 100.0% 0 9.09s 318 1,391
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.37s 351 16,323
GPT-5.5 10.0 10.0 100.0% 0 19.29s 312 2,841
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.43s 279 8,466
GPT-5.5 10.0 10.0 100.0% 0 4.18s 234 593
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 7.6 7.2 77.8% 1 14.09s 12 24,721
GPT-5.5 5.3 7.2 44.4% 1 164.14s 67 79,625
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.63s 115 1,650
GPT-5.5 10.0 10.0 100.0% 0 4.16s 138 223
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.35s 70 3,799
GPT-5.5 10.0 10.0 100.0% 0 3.36s 93 538
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.23s 241 4,940
GPT-5.5 10.0 10.0 100.0% 0 6.78s 250 2,254
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 9.8 10.0 100.0% 0 4.96s 265 1,608
GPT-5.5 10.0 10.0 100.0% 0 10.57s 258 832
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.94s 12 2,005
GPT-5.5 2.8 1.6 33.3% 1 37.86s 30 1,754

Быстрое сравнение

Сменить пару сравнения