AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.2

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-04

Метрика	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Релиз: 2026-03-03	GPT-5.2 GPT-5.2 medium Релиз: 2025-12-11

Метрика	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Релиз: 2026-03-03	GPT-5.2 GPT-5.2 medium Релиз: 2025-12-11
Оценка	7.4	7.5
Ранг	#50	#42
Надежность	10.0	10.0
Стабильность	10.0	8.4
Тестов верно
Доля успешных попыток	61.9%	71.4%
Нестабильные тесты	0	4
Всего запусков	63	63
Стоимость за результат	0.196	4.209
Общая стоимость	$0.026	$0.548
Цена входа	$0.250 / 1M	$1.750 / 1M
Цена выхода	$1.500 / 1M	$14.000 / 1M
Общее число входных токенов	32,715	33,967
Выходные токены	2,286	2,901
Токены рассуждений	9,166	31,932
Время ответа (среднее)	2.77s	16.88s
Время ответа (макс.)	11.91s	77.80s
Время ответа (суммарно)	58.12s	236.34s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	8.3	10.0	75.0%	0		2.12s	506	462	1,638
GPT-5.2	6.5	8.0	58.3%	1		7.81s	606	567	2,002

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		1.39s	8,138	660	1,060
GPT-5.2	10.0	10.0	100.0%	0		22.73s	7,302	511	11,912

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		11.91s	8,381	225	762
GPT-5.2	10.0	10.0	100.0%	0		14.06s	11,019	291	1,757

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.00s	7,455	291	696
GPT-5.2	10.0	10.0	100.0%	0		3.15s	7,140	234	420

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		2.36s	641	18	1,212
GPT-5.2	5.9	7.2	55.6%	1		77.80s	473	42	10,342

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		1.54s	490	69	384
GPT-5.2	3.7	9.7	0.0%	0		4.32s	477	162	269

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.49s	621	72	753
GPT-5.2	9.9	10.0	100.0%	0		3.12s	660	94	614

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.69s	566	243	1,248
GPT-5.2	7.5	7.3	77.8%	1		5.80s	642	735	924

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		9.54s	5,757	237	993
GPT-5.2	4.7	1.6	66.7%	1		10.30s	5,453	239	469

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		1.35s	160	9	420
GPT-5.2	3.0	10.0	0.0%	0		28.18s	195	26	3,223

Быстрое сравнение

Сменить пару сравнения

Gemini 3.1 Flash Lite PreviewlowvsQwen3.5-Flashmedium Gemini 3.1 Flash Lite PreviewlowvsMimo V2 PROmedium Gemini 3.1 Flash Lite PreviewlowvsGrok Build 0.1medium Gemini 3.1 Flash Lite PreviewlowvsQwen3.6 35B A3Bmedium Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewlow Gemini 3 Flash PreviewnonevsGPT-5.2medium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.4 Minimedium Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2.5-Promedium Gemini 3.1 Flash Lite PreviewlowvsGPT-5 Minimedium Gemini 3.1 Flash Lite PreviewlowvsNemotron 3 Ultra 550b A55bmediumБесплатно доступно Gemini 3.1 Flash Lite PreviewlowvsQwen3.6 Flashmedium Gemini 3.1 Flash Lite PreviewlowvsGLM 5.1medium