Gemini 3.1 Pro Preview (medium) vs GPT-5.3 Chat

Gemini 3.1 Pro Preview (medium) лидирует по среднему баллу: 9.2 vs 7.5. GPT-5.3 Chat имеет более низкую стоимость benchmark: $0.571 vs $1.361. GPT-5.3 Chat быстрее: 6.88s vs 21.47s, с долей успешных попыток 90.9% vs 68.2%.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Ранг: #10
Общее число выходных токенов: 97,958
Время ответа (среднее): 21.47s
Общая стоимость: $1.361

Ранг: #62
Общее число выходных токенов: 30,854
Время ответа (среднее): 6.88s
Общая стоимость: $0.571

Рекомендуемая модель Gemini 3.1 Pro Preview (medium)

У него самый высокий балл в этом сравнении (9.2) и лучший общий баланс стоимости и времени ответа среди всех 2 моделей.

Подробное сравнение

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	GPT-5.3 Chat GPT-5.3 Chat none Релиз: 2026-03-03

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	GPT-5.3 Chat GPT-5.3 Chat none Релиз: 2026-03-03
Оценка	9.2	7.5
Ранг	#10	#62
Надежность	10.0	10.0
Стабильность	10.0	8.2
Тестов верно
Доля успешных попыток	90.9%	68.2%
Нестабильные тесты	0	5
Всего запусков	66	66
Стоимость за результат	6.801	4.387
Общая стоимость	$1.361	$0.571
Цена входа	$2.000 / 1M	$1.750 / 1M
Цена выхода	$12.000 / 1M	$14.000 / 1M
Общее число входных токенов	92,287	78,990
Выходные токены	5,232	30,854
Токены рассуждений	92,726	0
Время ответа (среднее)	21.47s	6.88s
Время ответа (макс.)	88.68s	18.33s
Время ответа (суммарно)	322.08s	151.31s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#10 Gemini 3.1 Pro Preview

medium

Стоимость: $0.115
Время: 87.2s
Токены: 9,629 tok

#62 GPT-5.3 Chat

none

Стоимость: $0.008
Время: 8.1s
Токены: 634 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	498	112	3,218
GPT-5.3 Chat	6.7	8.1	58.3%	1		3.86s	606	3,167	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	7.9	9.9	66.7%	0		40.17s	8,124	435	41,247
GPT-5.3 Chat	5.6	4.7	55.6%	2		10.52s	7,302	6,632	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	9.8	10.0	100.0%	0		40.39s	67,910	3,687	23,111
GPT-5.3 Chat	10.0	10.0	100.0%	0		15.07s	55,800	6,851	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	7,265	279	3,904
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.21s	7,140	942	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	635	18	12,424
GPT-5.3 Chat	3.5	4.4	33.3%	2		13.01s	723	8,264	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	490	108	1,179
GPT-5.3 Chat	4.6	10.0	0.0%	0		1.99s	477	319	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	621	72	2,236
GPT-5.3 Chat	9.8	10.0	100.0%	0		3.51s	660	1,491	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.90s	570	235	3,128
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.99s	642	1,758	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	6,018	274	982
GPT-5.3 Chat	10.0	10.0	100.0%	0		8.36s	5,445	861	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.27s	156	12	1,297
GPT-5.3 Chat	3.0	10.0	0.0%	0		4.38s	195	569	0

Быстрое сравнение

Сменить пару сравнения

Claude Opus 5highvsGemini 3.1 Pro Previewmedium Kimi K2.7 CodemediumvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsQwen3.5 Plus 2026-02-15medium Nemotron 3 UltramediumБесплатно доступноvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsQwen3.5-27Bmedium GPT-5.3 ChatnonevsGrok Build 0.1medium Gemini 3.1 Pro PreviewmediumvsGPT-5.5low LongCat 2.0mediumvsGPT-5.3 Chatnone MiniMax M3mediumvsGPT-5.3 Chatnone Gemini 3.1 Pro PreviewmediumvsGPT-5.6 Solhigh Gemini 3 Flash PreviewlowvsGPT-5.3 Chatnone KAT-Coder-Pro V2.5lowvsGPT-5.3 Chatnone