Google: Gemini 3.5 Flash vs OpenAI: GPT-5.3-Codex

GPT-5.3-Codex (medium) лидирует по среднему баллу: 8.9 vs 6.8. Gemini 3.5 Flash (minimal) имеет более низкую стоимость benchmark: $0.300 vs $0.920. Gemini 3.5 Flash (minimal) быстрее: 2.65s vs 16.96s, с долей успешных попыток 65.2% vs 83.3%.

Рекомендуемая модельGPT-5.3-Codex (medium)У него самый высокий балл в этом сравнении (8.9) и лучший общий баланс стоимости и времени ответа среди всех 2 моделей.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Метрика	Gemini 3.5 Flash Gemini 3.5 Flash minimal Релиз: 2026-05-19	GPT-5.3-Codex GPT-5.3-Codex medium Релиз: 2026-02-05

Метрика	Gemini 3.5 Flash Gemini 3.5 Flash minimal Релиз: 2026-05-19	GPT-5.3-Codex GPT-5.3-Codex medium Релиз: 2026-02-05
Оценка	6.8	8.9
Ранг	#96	#18
Надежность	10.0	10.0
Стабильность	9.6	8.6
Тестов верно
Доля успешных попыток	65.2%	83.3%
Нестабильные тесты	1	4
Всего запусков	66	66
Стоимость за результат	2.138	5.748
Общая стоимость	$0.300	$0.920
Цена входа	$1.500 / 1M	$1.750 / 1M
Цена выхода	$9.000 / 1M	$14.000 / 1M
Общее число входных токенов	100,753	81,268
Выходные токены	16,454	6,251
Токены рассуждений	0	49,274
Время ответа (среднее)	2.65s	16.96s
Время ответа (макс.)	25.26s	100.93s
Время ответа (суммарно)	58.27s	373.19s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#96 Gemini 3.5 Flash

minimal

Стоимость: $0.041
Время: 20.4s
Токены: 4,608 tok

#18 GPT-5.3-Codex

medium

Стоимость: $0.049
Время: 54.9s
Токены: 3,580 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	6.5	10.0	50.0%	0		892ms	492	405	0
GPT-5.3-Codex	8.7	7.9	91.7%	1		4.16s	606	240	1,722

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	5.6	9.9	33.3%	0		2.75s	8,122	3,456	0
GPT-5.3-Codex	10.0	10.0	100.0%	0		19.50s	7,302	535	10,890

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	3.0	10.0	0.0%	0		14.41s	76,686	11,581	0
GPT-5.3-Codex	10.0	10.0	100.0%	0		26.04s	57,988	4,258	5,816

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.66s	7,548	279	0
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.07s	7,140	234	728

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		899ms	633	12	0
GPT-5.3-Codex	5.9	7.2	55.6%	1		64.31s	813	64	25,308

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		922ms	486	117	0
GPT-5.3-Codex	4.6	10.0	0.0%	0		4.87s	477	187	331

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	6.4	5.8	66.7%	1		893ms	615	76	0
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.04s	660	93	693

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.45s	558	282	0
GPT-5.3-Codex	9.0	7.9	88.9%	1		5.05s	642	356	1,593

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.79s	5,457	234	0
GPT-5.3-Codex	10.0	10.0	100.0%	0		6.37s	5,445	254	492

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	3.0	10.0	0.0%	0		1.76s	156	12	0
GPT-5.3-Codex	2.8	1.6	33.3%	1		14.43s	195	30	1,701

Быстрое сравнение

Сменить пару сравнения