Сравнить Графики Методология

Язык:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3 Pro Preview vs OpenAI: GPT-5.2 Chat

Сравнить:

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-06

Метрика	Google: Gemini 3 Pro Preview medium Релиз: 2025-11-18	OpenAI: GPT-5.2 Chat none Релиз: 2025-12-11
Ранг	#6	#15
Средний балл	8.2	7.4
Стабильность	10.0	9.1
Стоимость за результат	1.477	2.440
Общая стоимость	$0.192	$0.269
Тестов верно
Доля успешных попыток	81.3%	75.0%
Нестабильные тесты	0	2
Всего запусков	48 (16 x 3)	48 (16 x 3)
Выходные токены	1,502	15,845
Токены рассуждений	9,706	0
Время ответа (среднее)	7.15s	7.03s
Время ответа (макс.)	11.96s	38.52s
Время ответа (суммарно)	64.34s	112.51s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Средний балл vs Время ответа (среднее)

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Google: Gemini 3 Pro Preview	10.0	10.0	100.0%	0		3.75s	143	1,107
OpenAI: GPT-5.2 Chat	10.0	10.0	100.0%	0		3.97s	1,651	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Google: Gemini 3 Pro Preview	10.0	10.0	0.0%	0		10.37s	351	952
OpenAI: GPT-5.2 Chat	10.0	10.0	100.0%	0		9.12s	1,243	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Google: Gemini 3 Pro Preview	9.9	10.0	100.0%	0		10.84s	279	3,156
OpenAI: GPT-5.2 Chat	9.9	10.0	100.0%	0		3.05s	980	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Google: Gemini 3 Pro Preview	4.0	10.0	33.3%	0		7.01s	15	1,195
OpenAI: GPT-5.2 Chat	4.0	10.0	33.3%	0		17.78s	7,810	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Google: Gemini 3 Pro Preview	10.0	10.0	100.0%	0		9.34s	78	374
OpenAI: GPT-5.2 Chat	4.0	3.0	33.3%	1		3.20s	335	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Google: Gemini 3 Pro Preview	9.5	10.0	100.0%	0		3.26s	69	754
OpenAI: GPT-5.2 Chat	6.0	6.1	83.3%	1		5.46s	1,528	0

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Google: Gemini 3 Pro Preview	10.0	10.0	100.0%	0		3.91s	243	1,197
OpenAI: GPT-5.2 Chat	7.0	10.0	66.7%	0		4.42s	1,743	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Google: Gemini 3 Pro Preview	10.0	10.0	100.0%	0		11.96s	324	971
OpenAI: GPT-5.2 Chat	10.0	10.0	100.0%	0		4.68s	555	0

Быстрое сравнение

Сменить пару сравнения

GPT-5.2 ChatnonevsGLM 5medium Gemini 2.5 FlashmediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsStep 3.5 FlashmediumБесплатно доступно Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2 Chatnone DeepSeek V3.2mediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsMiMo-V2-Flashmedium Claude Sonnet 4.6mediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsQwen3.5-122B-A10Bmedium Seed-2.0-MinimediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsQwen3.5-Flashmedium Gemini 3.1 Flash Lite PreviewhighvsGPT-5.2 Chatnone