Сравнить Графики Методология

Язык:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3 Pro Preview vs OpenAI: GPT-5.3 Chat

Сравнить:

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-06

Метрика	Google: Gemini 3 Pro Preview medium Релиз: 2025-11-18	OpenAI: GPT-5.3 Chat none Релиз: 2026-03-03
Ранг	#6	#19
Средний балл	8.2	7.3
Стабильность	10.0	8.5
Стоимость за результат	1.477	3.163
Общая стоимость	$0.192	$0.317
Тестов верно
Доля успешных попыток	81.3%	70.8%
Нестабильные тесты	0	3
Всего запусков	48 (16 x 3)	48 (16 x 3)
Выходные токены	1,502	19,272
Токены рассуждений	9,706	0
Время ответа (среднее)	7.15s	5.96s
Время ответа (макс.)	11.96s	18.33s
Время ответа (суммарно)	64.34s	95.30s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Средний балл vs Время ответа (среднее)

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Google: Gemini 3 Pro Preview	10.0	10.0	100.0%	0		3.75s	143	1,107
OpenAI: GPT-5.3 Chat	7.3	7.5	77.8%	1		4.72s	3,091	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Google: Gemini 3 Pro Preview	10.0	10.0	0.0%	0		10.37s	351	952
OpenAI: GPT-5.3 Chat	10.0	10.0	100.0%	0		11.96s	2,614	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Google: Gemini 3 Pro Preview	9.9	10.0	100.0%	0		10.84s	279	3,156
OpenAI: GPT-5.3 Chat	9.9	10.0	100.0%	0		2.21s	942	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Google: Gemini 3 Pro Preview	4.0	10.0	33.3%	0		7.01s	15	1,195
OpenAI: GPT-5.3 Chat	10.0	4.4	33.3%	2		13.01s	8,264	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Google: Gemini 3 Pro Preview	10.0	10.0	100.0%	0		9.34s	78	374
OpenAI: GPT-5.3 Chat	4.0	10.0	0.0%	0		1.99s	319	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Google: Gemini 3 Pro Preview	9.5	10.0	100.0%	0		3.26s	69	754
OpenAI: GPT-5.3 Chat	9.0	10.0	50.0%	0		3.29s	1,455	0

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Google: Gemini 3 Pro Preview	10.0	10.0	100.0%	0		3.91s	243	1,197
OpenAI: GPT-5.3 Chat	10.0	10.0	100.0%	0		2.93s	1,726	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Google: Gemini 3 Pro Preview	10.0	10.0	100.0%	0		11.96s	324	971
OpenAI: GPT-5.3 Chat	10.0	10.0	100.0%	0		8.36s	861	0

Быстрое сравнение

Сменить пару сравнения

DeepSeek V3.2mediumvsGPT-5.3 Chatnone Gemini 3.1 Flash Lite PreviewlowvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsMiMo-V2-Flashmedium Gemini 2.5 FlashmediumvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsGLM 5medium GPT-5.3 ChatnonevsStep 3.5 FlashmediumБесплатно доступно Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.3 Chatnone Seed-2.0-MinimediumvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsQwen3.5-Flashmedium Claude Sonnet 4.6mediumvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsQwen3.5-122B-A10Bmedium Claude Opus 4.6mediumvsGPT-5.3 Chatnone