Compară Grafice Metodologie

Limbă:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3 Pro Preview vs OpenAI: GPT-5.2 Chat

Compară:

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-06

Metrică	Google: Gemini 3 Pro Preview medium Lansare: 2025-11-18	OpenAI: GPT-5.2 Chat none Lansare: 2025-12-11
Scor mediu	8.2	7.4
Rang	#6	#15
Teste corecte
Consistență	10.0	9.1
Cost per rezultat	1.477	2.440
Cost total	$0.192	$0.269
Rată de trecere pe încercare	81.3%	75.0%
Teste instabile	0	2
common.totalRuns	48 (16 x 3)	48 (16 x 3)
Tokenuri de ieșire	1,502	15,845
Tokenuri de raționament	9,706	0
Timp de răspuns (mediu)	7.15s	7.03s
Timp de răspuns (maxim)	11.96s	38.52s
Timp de răspuns (total)	64.34s	112.51s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor mediu vs Timp de răspuns (mediu)

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3 Pro Preview	10.0	10.0	100.0%	0		3.75s	143	1,107
OpenAI: GPT-5.2 Chat	10.0	10.0	100.0%	0		3.97s	1,651	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3 Pro Preview	10.0	10.0	0.0%	0		10.37s	351	952
OpenAI: GPT-5.2 Chat	10.0	10.0	100.0%	0		9.12s	1,243	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3 Pro Preview	9.9	10.0	100.0%	0		10.84s	279	3,156
OpenAI: GPT-5.2 Chat	9.9	10.0	100.0%	0		3.05s	980	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3 Pro Preview	4.0	10.0	33.3%	0		7.01s	15	1,195
OpenAI: GPT-5.2 Chat	4.0	10.0	33.3%	0		17.78s	7,810	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3 Pro Preview	10.0	10.0	100.0%	0		9.34s	78	374
OpenAI: GPT-5.2 Chat	4.0	3.0	33.3%	1		3.20s	335	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3 Pro Preview	9.5	10.0	100.0%	0		3.26s	69	754
OpenAI: GPT-5.2 Chat	6.0	6.1	83.3%	1		5.46s	1,528	0

Puzzle Solving	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3 Pro Preview	10.0	10.0	100.0%	0		3.91s	243	1,197
OpenAI: GPT-5.2 Chat	7.0	10.0	66.7%	0		4.42s	1,743	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3 Pro Preview	10.0	10.0	100.0%	0		11.96s	324	971
OpenAI: GPT-5.2 Chat	10.0	10.0	100.0%	0		4.68s	555	0

Comparație rapidă

Schimbă perechea de comparație

GPT-5.2 ChatnonevsGLM 5medium Gemini 2.5 FlashmediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsStep 3.5 FlashmediumDisponibil gratuit Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2 Chatnone DeepSeek V3.2mediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsMiMo-V2-Flashmedium Claude Sonnet 4.6mediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsQwen3.5-122B-A10Bmedium Seed-2.0-MinimediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsQwen3.5-Flashmedium Gemini 3.1 Flash Lite PreviewhighvsGPT-5.2 Chatnone