Compară Grafice

Limbă:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs OpenAI: GPT-4o-mini

Nume model:

Benchmark-urile au fost generate din suitele de teste AI BENCHY la : 2026-02-27 15:16

Rezumat

Metrică	Google: Gemini 3.1 Pro Preview medium Lansare: Data lansării necunoscută	OpenAI: GPT-4o-mini none Lansare: Data lansării necunoscută
Rang	#2	#28
Scor	9.36	4.86
Consistență	10.00	9.98
Cost per rezultat	2.443	0.056
Cost total	$0.318	$0.003
Teste corecte
Teste greșite	1	9
Rată de trecere pe încercare	92.9%	35.7%
Teste instabile	0	0
Tokenuri de ieșire	1,000	949
Tokenuri de raționament	22,936	0

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		106	2,533
OpenAI: GPT-4o-mini	4.00	10.00	33.3%	0		180	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		292	3,164
OpenAI: GPT-4o-mini	10.00	10.00	100.0%	0		183	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3.1 Pro Preview	7.00	10.00	66.7%	0		18	10,688
OpenAI: GPT-4o-mini	1.00	10.00	0.0%	0		15	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		72	2,436
OpenAI: GPT-4o-mini	5.50	10.00	50.0%	0		71	0

Puzzle Solving	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		238	3,133
OpenAI: GPT-4o-mini	4.00	9.92	0.0%	0		295	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		274	982
OpenAI: GPT-4o-mini	10.00	10.00	100.0%	0		205	0

Schimbă perechea de comparație

Compară Google: Gemini 3.1 Pro Preview cu...

Compară OpenAI: GPT-4o-mini cu...