Compară Grafice

Limbă:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs OpenAI: GPT-5.2

Nume model:

Benchmark-urile au fost generate din suitele de teste AI BENCHY la : 2026-02-27 15:16

Rezumat

Metrică	Google: Gemini 3 Flash Preview none Lansare: Data lansării necunoscută	OpenAI: GPT-5.2 medium Lansare: Data lansării necunoscută
Rang	#10	#12
Scor	7.21	6.93
Consistență	9.36	8.22
Cost per rezultat	0.078	2.780
Cost total	$0.007	$0.251
Teste corecte
Teste greșite	4	5
Rată de trecere pe încercare	71.8%	76.2%
Teste instabile	1	3
Tokenuri de ieșire	734	1,869
Tokenuri de raționament	0	14,190

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3 Flash Preview	7.00	10.00	66.7%	0		240	0
OpenAI: GPT-5.2	7.00	7.28	77.8%	1		549	2,002

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3 Flash Preview	9.88	10.00	100.0%	0		279	0
OpenAI: GPT-5.2	10.00	10.00	100.0%	0		234	499

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3 Flash Preview	7.00	10.00	66.7%	0		18	0
OpenAI: GPT-5.2	4.00	7.21	55.6%	1		42	9,690

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3 Flash Preview	5.50	5.81	66.7%	1		74	0
OpenAI: GPT-5.2	9.50	10.00	100.0%	0		95	587

Puzzle Solving	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3 Flash Preview	7.00	10.00	66.7%	0		123	0
OpenAI: GPT-5.2	8.00	10.00	66.7%	0		710	943

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3 Flash Preview	0.00	0.00	0.0%	0		0	0
OpenAI: GPT-5.2	1.00	1.62	66.7%	1		239	469

Schimbă perechea de comparație

Compară Google: Gemini 3 Flash Preview cu...

Compară OpenAI: GPT-5.2 cu...