Google: Gemini 3.1 Pro Preview vs OpenAI: GPT-5.3-Codex

Gemini 3.1 Pro Preview (medium) conduce la scorul mediu cu 9.2 vs 8.9. GPT-5.3-Codex (medium) are costul de benchmark mai mic, $0.920 vs $1.361. GPT-5.3-Codex (medium) este mai rapid cu 16.96s vs 21.47s, cu rate de reușită de 90.9% vs 83.3%.

Model recomandatGPT-5.3-Codex (medium)Oferă cel mai bun compromis per total: scor competitiv (8.9), cost mai mic decât Gemini 3.1 Pro Preview (medium) și timp de răspuns echilibrat.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-25

Metrică	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Lansare: 2026-02-19	GPT-5.3-Codex GPT-5.3-Codex medium Lansare: 2026-02-05

Metrică	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Lansare: 2026-02-19	GPT-5.3-Codex GPT-5.3-Codex medium Lansare: 2026-02-05
Scor	9.2	8.9
Rang	#10	#18
Fiabilitate	10.0	10.0
Consistență	10.0	8.6
Teste corecte
Rată de trecere pe încercare	90.9%	83.3%
Teste instabile	0	4
Rulări totale	66	66
Cost per rezultat	6.801	5.748
Cost total	$1.361	$0.920
Preț de intrare	$2.000 / 1M	$1.750 / 1M
Preț de ieșire	$12.000 / 1M	$14.000 / 1M
Total tokenuri de intrare	92,287	81,268
Tokenuri de ieșire	5,232	6,251
Tokenuri de raționament	92,726	49,274
Timp de răspuns (mediu)	21.47s	16.96s
Timp de răspuns (maxim)	88.68s	100.93s
Timp de răspuns (total)	322.08s	373.19s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#10 Gemini 3.1 Pro Preview

medium

Cost: $0.115
Timp: 87.2s
Tokenuri: 9,629 tok

#18 GPT-5.3-Codex

medium

Cost: $0.049
Timp: 54.9s
Tokenuri: 3,580 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	498	112	3,218
GPT-5.3-Codex	8.7	7.9	91.7%	1		4.16s	606	240	1,722

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	7.9	9.9	66.7%	0		40.17s	8,124	435	41,247
GPT-5.3-Codex	10.0	10.0	100.0%	0		19.50s	7,302	535	10,890

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	9.8	10.0	100.0%	0		40.39s	67,910	3,687	23,111
GPT-5.3-Codex	10.0	10.0	100.0%	0		26.04s	57,988	4,258	5,816

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	7,265	279	3,904
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.07s	7,140	234	728

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	635	18	12,424
GPT-5.3-Codex	5.9	7.2	55.6%	1		64.31s	813	64	25,308

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	490	108	1,179
GPT-5.3-Codex	4.6	10.0	0.0%	0		4.87s	477	187	331

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	621	72	2,236
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.04s	660	93	693

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.90s	570	235	3,128
GPT-5.3-Codex	9.0	7.9	88.9%	1		5.05s	642	356	1,593

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	6,018	274	982
GPT-5.3-Codex	10.0	10.0	100.0%	0		6.37s	5,445	254	492

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.27s	156	12	1,297
GPT-5.3-Codex	2.8	1.6	33.3%	1		14.43s	195	30	1,701

Comparație rapidă

Schimbă perechea de comparație

GPT-5.3-CodexmediumvsGrok 4.5high Claude Opus 5highvsGemini 3.1 Pro Previewmedium Gemini 3.5 FlashlowvsGPT-5.3-Codexmedium Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Gemini 3.1 Pro PreviewmediumvsGPT-5.6 Solhigh Gemini 3.1 Pro PreviewmediumvsGPT-5.6 Sollow Claude Opus 5highvsGPT-5.3-Codexmedium Gemini 3.1 Pro PreviewmediumvsGrok 4.5high Claude Opus 5lowvsGPT-5.3-Codexmedium Gemini 3.6 FlashlowvsGPT-5.3-Codexmedium GPT-5.3-CodexmediumvsGrok 4.5low Gemini 3.5 FlashhighvsGPT-5.3-Codexmedium