AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs OpenAI: GPT-5.5

Сводка

Сравнение benchmark Gemini 3.1 Flash Lite vs GPT-5.5: GPT-5.5 лидирует по среднему баллу: 9.3 vs 7.8. Gemini 3.1 Flash Lite имеет более низкую стоимость benchmark: $0.071 vs $0.907. Gemini 3.1 Flash Lite быстрее: 3.23s vs 9.76s, с долей успешных попыток 65.1% vs 85.7%.

Рекомендуемая модель: Gemini 3.1 Flash Lite - Он дает лучший общий компромисс: конкурентный балл (7.8), ниже стоимость, чем у GPT-5.5, и сбалансированное время ответа.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-18

Метрика	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Релиз: 2026-05-08	GPT-5.5 GPT-5.5 low Релиз: 2026-04-24

Метрика	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Релиз: 2026-05-08	GPT-5.5 GPT-5.5 low Релиз: 2026-04-24
Оценка	7.8	9.3
Ранг	#34	#4
Надежность	10.0	10.0
Стабильность	9.2	10.0
Тестов верно
Доля успешных попыток	65.1%	85.7%
Нестабильные тесты	2	0
Всего запусков	63	63
Стоимость за результат	0.539	5.035
Общая стоимость	$0.071	$0.907
Цена входа	$0.250 / 1M	$5.000 / 1M
Цена выхода	$1.500 / 1M	$30.000 / 1M
Общее число входных токенов	36,808	34,209
Выходные токены	2,254	2,046
Токены рассуждений	38,300	22,460
Время ответа (среднее)	3.23s	9.76s
Время ответа (макс.)	10.87s	56.19s
Время ответа (суммарно)	67.80s	204.92s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#34 Gemini 3.1 Flash Lite

medium

Стоимость: $0.003
Время: 5.3s
Токены: 1,754 tok

#4 GPT-5.5

low

Стоимость: $0.068
Время: 37.0s
Токены: 2,339 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	9.1	10.0	75.0%	0		2.39s	502	604	4,201
GPT-5.5	10.0	10.0	100.0%	0		4.41s	606	238	1,020

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	5.5	10.0	33.3%	0		3.81s	8,134	459	8,978
GPT-5.5	10.0	10.0	100.0%	0		15.04s	7,302	423	6,402

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		10.87s	12,873	327	7,401
GPT-5.5	10.0	10.0	100.0%	0		9.56s	11,019	303	717

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.60s	7,362	279	2,845
GPT-5.5	10.0	10.0	100.0%	0		3.28s	7,140	228	157

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		3.16s	643	15	5,165
GPT-5.5	5.3	10.0	33.3%	0		28.05s	723	69	11,609

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.60s	488	84	1,142
GPT-5.5	10.0	10.0	100.0%	0		5.17s	477	133	245

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	9.9	10.0	100.0%	0		2.59s	623	75	3,320
GPT-5.5	9.9	10.0	100.0%	0		3.74s	660	93	415

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	7.6	7.2	77.8%	1		1.95s	568	165	2,450
GPT-5.5	10.0	10.0	100.0%	0		4.74s	642	279	954

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		4.55s	5,457	234	921
GPT-5.5	10.0	10.0	100.0%	0		4.96s	5,445	250	101

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		3.08s	158	12	1,877
GPT-5.5	3.0	10.0	0.0%	0		10.06s	195	30	840

Быстрое сравнение

Сменить пару сравнения

GPT-5.5lowvsQwen3.7 Maxmedium Gemini 3.1 Flash LitemediumvsStep 3.7 Flashlow Claude Fable 5mediumvsGPT-5.5low Gemini 3.1 Pro PreviewmediumvsGPT-5.5low DeepSeek V4 ProhighvsGemini 3.1 Flash Litemedium Gemini 3.5 FlashmediumvsGPT-5.5low Gemini 3.1 Flash LitemediumvsGPT-5.3 Chatnone Gemini 3 Flash PreviewmediumvsGPT-5.5low GPT-5.5lowvsQwen3.6 Max Previewmedium Claude Sonnet 4.6nonevsGemini 3.1 Flash Litemedium DeepSeek V4 FlashhighvsGemini 3.1 Flash Litemedium Claude Opus 4.8mediumvsGPT-5.5low