Google: Gemini 3.1 Pro Preview vs OpenAI: GPT-5.2 Chat

Gemini 3.1 Pro Preview (medium) conduce la scorul mediu cu 9.2 vs 8.0. GPT-5.2 Chat are costul de benchmark mai mic, $0.604 vs $1.361. GPT-5.2 Chat este mai rapid cu 7.65s vs 21.47s, cu rate de reușită de 90.9% vs 74.2%.

Model recomandatGemini 3.1 Pro Preview (medium)Are cel mai puternic scor din această comparație (9.2) și cel mai bun echilibru între cost și timp de răspuns dintre toate cele 2 modele.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-25

Metrică	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Lansare: 2026-02-19	GPT-5.2 Chat GPT-5.2 Chat none Lansare: 2025-12-11

Metrică	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Lansare: 2026-02-19	GPT-5.2 Chat GPT-5.2 Chat none Lansare: 2025-12-11
Scor	9.2	8.0
Rang	#10	#37
Fiabilitate	10.0	10.0
Consistență	10.0	8.6
Teste corecte
Rată de trecere pe încercare	90.9%	74.2%
Teste instabile	0	4
Rulări totale	66	66
Cost per rezultat	6.801	4.308
Cost total	$1.361	$0.604
Preț de intrare	$2.000 / 1M	$1.750 / 1M
Preț de ieșire	$12.000 / 1M	$14.000 / 1M
Total tokenuri de intrare	92,287	101,248
Tokenuri de ieșire	5,232	30,424
Tokenuri de raționament	92,726	0
Timp de răspuns (mediu)	21.47s	7.65s
Timp de răspuns (maxim)	88.68s	38.52s
Timp de răspuns (total)	322.08s	168.39s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#10 Gemini 3.1 Pro Preview

medium

Cost: $0.115
Timp: 87.2s
Tokenuri: 9,629 tok

#37 GPT-5.2 Chat

none

Cost: $0.010
Timp: 15.3s
Tokenuri: 797 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	498	112	3,218
GPT-5.2 Chat	8.7	7.9	91.7%	1		3.40s	606	1,807	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	7.9	9.9	66.7%	0		40.17s	8,124	435	41,247
GPT-5.2 Chat	8.8	7.8	88.9%	1		9.82s	7,305	6,731	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	9.8	10.0	100.0%	0		40.39s	67,910	3,687	23,111
GPT-5.2 Chat	7.3	5.8	83.3%	1		13.91s	78,055	7,923	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	7,265	279	3,904
GPT-5.2 Chat	10.0	10.0	100.0%	0		3.05s	7,140	980	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	635	18	12,424
GPT-5.2 Chat	5.3	10.0	33.3%	0		17.78s	723	7,810	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	490	108	1,179
GPT-5.2 Chat	4.4	3.0	33.3%	1		3.20s	477	335	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	621	72	2,236
GPT-5.2 Chat	9.8	10.0	100.0%	0		5.51s	660	1,441	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.90s	570	235	3,128
GPT-5.2 Chat	7.7	10.0	66.7%	0		4.10s	642	1,603	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	6,018	274	982
GPT-5.2 Chat	10.0	10.0	100.0%	0		4.68s	5,445	555	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.27s	156	12	1,297
GPT-5.2 Chat	3.0	10.0	0.0%	0		6.89s	195	1,239	0

Comparație rapidă

Schimbă perechea de comparație

GPT-5.2 ChatnonevsStep 3.7 Flashmedium Claude Opus 5highvsGemini 3.1 Pro Previewmedium GPT-5.2 ChatnonevsInklinghigh Gemini 3.5 Flash-LitehighvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsGLM 5.2high Muse Spark 1.1highvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsInklingmedium Kimi K3maxvsGPT-5.2 Chatnone Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Gemini 3.1 Pro PreviewmediumvsGPT-5.6 Solhigh Seed-2.0-LitemediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsQwen3.7 Plusmedium