AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.3-Codex

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-30

Metrică	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Lansare: 2026-03-03	GPT-5.3-Codex GPT-5.3-Codex medium Lansare: 2026-02-05

Metrică	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Lansare: 2026-03-03	GPT-5.3-Codex GPT-5.3-Codex medium Lansare: 2026-02-05
Scor	8.2	8.6
Rang	#23	#13
Fiabilitate	N/D	N/D
Consistență	10.0	8.7
Teste corecte
Rată de trecere pe încercare	72.2%	83.3%
Teste instabile	0	3
Rulări totale	54	54
Cost per rezultat	0.419	4.405
Cost total	$0.055	$0.573
Preț de intrare	$0.250 / 1M	$1.750 / 1M
Preț de ieșire	$1.500 / 1M	$14.000 / 1M
Tokenuri de ieșire	2,168	2,279
Tokenuri de raționament	29,030	35,179
Timp de răspuns (mediu)	3.74s	15.38s
Timp de răspuns (maxim)	14.93s	100.93s
Timp de răspuns (total)	67.31s	276.91s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	9.1	10.0	75.0%	0		2.33s	570	4,305
GPT-5.3-Codex	8.7	7.9	91.7%	1		4.16s	240	1,722

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		4.34s	431	2,684
GPT-5.3-Codex	10.0	10.0	100.0%	0		8.95s	491	1,530

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		14.93s	327	7,347
GPT-5.3-Codex	10.0	10.0	100.0%	0		19.56s	364	2,731

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		2.29s	279	2,952
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.07s	234	728

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		4.21s	18	5,325
GPT-5.3-Codex	5.9	7.2	55.6%	1		64.31s	64	25,308

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.16s	96	1,488
GPT-5.3-Codex	4.6	10.0	0.0%	0		4.87s	187	331

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.91s	72	2,121
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.04s	93	693

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	7.7	10.0	66.7%	0		3.58s	141	1,896
GPT-5.3-Codex	9.0	7.9	88.9%	1		5.12s	352	1,644

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.80s	234	912
GPT-5.3-Codex	10.0	10.0	100.0%	0		6.37s	254	492

Comparație rapidă

Schimbă perechea de comparație

GPT-5.3-CodexmediumvsHY3 PreviewhighDisponibil gratuit Gemini 3.1 Flash Lite PreviewmediumvsHY3 PreviewlowDisponibil gratuit Gemini 3 Flash PreviewlowvsGPT-5.3-Codexmedium Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.3 Chatnone DeepSeek V4 FlashhighvsGemini 3.1 Flash Lite Previewmedium Gemini 3.1 Flash Lite PreviewmediumvsHY3 PreviewhighDisponibil gratuit GPT-5.3-CodexmediumvsHY3 PreviewlowDisponibil gratuit Gemini 3 Flash PreviewnonevsGPT-5.3-Codexmedium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.3-Codexmedium Claude Opus 4.7nonevsGPT-5.3-Codexmedium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.3-Codexmedium