AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.3-Codex

Сводка

Сравнение benchmark Gemini 3.1 Flash Lite Preview vs GPT-5.3-Codex: GPT-5.3-Codex лидирует по среднему баллу: 8.9 vs 6.4. Gemini 3.1 Flash Lite Preview имеет более низкую стоимость benchmark: $0.018 vs $0.740. Gemini 3.1 Flash Lite Preview быстрее: 1.21s vs 16.22s, с долей успешных попыток 60.3% vs 82.5%.

Рекомендуемая модель: Gemini 3.1 Flash Lite Preview - Он дает лучший общий компромисс: конкурентный балл (6.4), ниже стоимость, чем у GPT-5.3-Codex, и сбалансированное время ответа.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-18

Метрика	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Релиз: 2026-03-03	GPT-5.3-Codex GPT-5.3-Codex medium Релиз: 2026-02-05

Метрика	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Релиз: 2026-03-03	GPT-5.3-Codex GPT-5.3-Codex medium Релиз: 2026-02-05
Оценка	6.4	8.9
Ранг	#84	#10
Надежность	10.0	10.0
Стабильность	9.7	8.5
Тестов верно
Доля успешных попыток	60.3%	82.5%
Нестабильные тесты	1	4
Всего запусков	63	63
Стоимость за результат	0.148	4.932
Общая стоимость	$0.018	$0.740
Цена входа	$0.250 / 1M	$1.750 / 1M
Цена выхода	$1.500 / 1M	$14.000 / 1M
Общее число входных токенов	37,582	34,299
Выходные токены	5,547	2,357
Токены рассуждений	0	46,189
Время ответа (среднее)	1.21s	16.22s
Время ответа (макс.)	3.39s	100.93s
Время ответа (суммарно)	25.45s	340.67s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#84 Gemini 3.1 Flash Lite Preview

none

Стоимость: $0.003
Время: 4.7s
Токены: 1,827 tok

#10 GPT-5.3-Codex

medium

Стоимость: $0.049
Время: 54.9s
Токены: 3,580 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	7.5	8.4	66.7%	1		1.04s	504	1,092	0
GPT-5.3-Codex	8.7	7.9	91.7%	1		4.16s	606	240	1,722

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		967ms	8,128	670	0
GPT-5.3-Codex	10.0	10.0	100.0%	0		19.50s	7,302	535	10,890

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		3.20s	13,026	339	0
GPT-5.3-Codex	10.0	10.0	100.0%	0		19.56s	11,019	364	2,731

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.22s	7,550	399	0
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.07s	7,140	234	728

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		942ms	641	568	0
GPT-5.3-Codex	5.9	7.2	55.6%	1		64.31s	813	64	25,308

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		741ms	488	69	0
GPT-5.3-Codex	4.6	10.0	0.0%	0		4.87s	477	187	331

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.13s	623	574	0
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.04s	660	93	693

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		900ms	570	1,045	0
GPT-5.3-Codex	9.0	7.9	88.9%	1		5.05s	642	356	1,593

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.39s	5,894	782	0
GPT-5.3-Codex	10.0	10.0	100.0%	0		6.37s	5,445	254	492

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		814ms	158	9	0
GPT-5.3-Codex	2.8	1.6	33.3%	1		14.43s	195	30	1,701

Быстрое сравнение

Сменить пару сравнения