AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.3-Codex

Сводка

Сравнение benchmark Gemini 3.1 Flash Lite Preview vs GPT-5.3-Codex: GPT-5.3-Codex лидирует по среднему баллу: 8.9 vs 6.5. Gemini 3.1 Flash Lite Preview имеет более низкую стоимость benchmark: $0.026 vs $0.740. Gemini 3.1 Flash Lite Preview быстрее: 2.77s vs 16.22s, с долей успешных попыток 61.9% vs 82.5%.

Рекомендуемая модель: Gemini 3.1 Flash Lite Preview - Он дает лучший общий компромисс: конкурентный балл (6.5), ниже стоимость, чем у GPT-5.3-Codex, и сбалансированное время ответа.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-18

Метрика	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Релиз: 2026-03-03	GPT-5.3-Codex GPT-5.3-Codex medium Релиз: 2026-02-05

Метрика	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Релиз: 2026-03-03	GPT-5.3-Codex GPT-5.3-Codex medium Релиз: 2026-02-05
Оценка	6.5	8.9
Ранг	#82	#10
Надежность	10.0	10.0
Стабильность	10.0	8.5
Тестов верно
Доля успешных попыток	61.9%	82.5%
Нестабильные тесты	0	4
Всего запусков	63	63
Стоимость за результат	0.196	4.932
Общая стоимость	$0.026	$0.740
Цена входа	$0.250 / 1M	$1.750 / 1M
Цена выхода	$1.500 / 1M	$14.000 / 1M
Общее число входных токенов	32,715	34,299
Выходные токены	2,286	2,357
Токены рассуждений	9,166	46,189
Время ответа (среднее)	2.77s	16.22s
Время ответа (макс.)	11.91s	100.93s
Время ответа (суммарно)	58.12s	340.67s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#82 Gemini 3.1 Flash Lite Preview

low

Стоимость: $0.002
Время: 3.7s
Токены: 1,203 tok

#10 GPT-5.3-Codex

medium

Стоимость: $0.049
Время: 54.9s
Токены: 3,580 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	8.3	10.0	75.0%	0		2.12s	506	462	1,638
GPT-5.3-Codex	8.7	7.9	91.7%	1		4.16s	606	240	1,722

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		1.39s	8,138	660	1,060
GPT-5.3-Codex	10.0	10.0	100.0%	0		19.50s	7,302	535	10,890

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		11.91s	8,381	225	762
GPT-5.3-Codex	10.0	10.0	100.0%	0		19.56s	11,019	364	2,731

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.00s	7,455	291	696
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.07s	7,140	234	728

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		2.36s	641	18	1,212
GPT-5.3-Codex	5.9	7.2	55.6%	1		64.31s	813	64	25,308

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		1.54s	490	69	384
GPT-5.3-Codex	4.6	10.0	0.0%	0		4.87s	477	187	331

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.49s	621	72	753
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.04s	660	93	693

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.69s	566	243	1,248
GPT-5.3-Codex	9.0	7.9	88.9%	1		5.05s	642	356	1,593

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		9.54s	5,757	237	993
GPT-5.3-Codex	10.0	10.0	100.0%	0		6.37s	5,445	254	492

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		1.35s	160	9	420
GPT-5.3-Codex	2.8	1.6	33.3%	1		14.43s	195	30	1,701

Быстрое сравнение

Сменить пару сравнения