Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.3 Chat

GPT-5.3 Chat conduce la scorul mediu cu 7.5 vs 6.4. Gemini 3.1 Flash Lite Preview are costul de benchmark mai mic, $0.052 vs $0.571. Gemini 3.1 Flash Lite Preview este mai rapid cu 1.58s vs 6.88s, cu rate de reușită de 57.6% vs 68.2%.

Model recomandatGemini 3.1 Flash Lite PreviewOferă cel mai bun compromis per total: scor competitiv (6.4), cost mai mic decât GPT-5.3 Chat și timp de răspuns echilibrat.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-21

Metrică	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Lansare: 2026-03-03	GPT-5.3 Chat GPT-5.3 Chat none Lansare: 2026-03-03

Metrică	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Lansare: 2026-03-03	GPT-5.3 Chat GPT-5.3 Chat none Lansare: 2026-03-03
Scor	6.4	7.5
Rang	#112	#58
Fiabilitate	10.0	10.0
Consistență	9.7	8.2
Teste corecte
Rată de trecere pe încercare	57.6%	68.2%
Teste instabile	1	5
Rulări totale	66	66
Cost per rezultat	0.431	4.387
Cost total	$0.052	$0.571
Preț de intrare	$0.250 / 1M	$1.750 / 1M
Preț de ieșire	$1.500 / 1M	$14.000 / 1M
Total tokenuri de intrare	120,942	78,990
Tokenuri de ieșire	14,292	30,854
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	1.58s	6.88s
Timp de răspuns (maxim)	9.27s	18.33s
Timp de răspuns (total)	34.72s	151.31s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#112 Gemini 3.1 Flash Lite Preview

none

Cost: $0.003
Timp: 4.7s
Tokenuri: 1,827 tok

#58 GPT-5.3 Chat

none

Cost: $0.008
Timp: 8.1s
Tokenuri: 634 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	7.5	8.4	66.7%	1		1.04s	504	1,092	0
GPT-5.3 Chat	6.7	8.1	58.3%	1		3.86s	606	3,167	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		967ms	8,128	670	0
GPT-5.3 Chat	5.6	4.7	55.6%	2		10.52s	7,302	6,632	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		6.23s	96,386	9,084	0
GPT-5.3 Chat	10.0	10.0	100.0%	0		15.07s	55,800	6,851	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.22s	7,550	399	0
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.21s	7,140	942	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		942ms	641	568	0
GPT-5.3 Chat	3.5	4.4	33.3%	2		13.01s	723	8,264	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		741ms	488	69	0
GPT-5.3 Chat	4.6	10.0	0.0%	0		1.99s	477	319	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.13s	623	574	0
GPT-5.3 Chat	9.8	10.0	100.0%	0		3.51s	660	1,491	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		900ms	570	1,045	0
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.99s	642	1,758	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.39s	5,894	782	0
GPT-5.3 Chat	10.0	10.0	100.0%	0		8.36s	5,445	861	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		814ms	158	9	0
GPT-5.3 Chat	3.0	10.0	0.0%	0		4.38s	195	569	0

Comparație rapidă

Schimbă perechea de comparație

Kimi K2.7 CodemediumvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsQwen3.5 Plus 2026-02-15medium Nemotron 3 UltramediumDisponibil gratuitvsGPT-5.3 Chatnone Gemini 3.1 Flash Lite PreviewnonevsLaguna XS 2.1mediumDisponibil gratuit Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2.5medium GPT-5.3 ChatnonevsQwen3.5-27Bmedium GPT-5.3 ChatnonevsGrok Build 0.1medium Gemini 3.1 Flash Lite PreviewnonevsQwen3.6 27Bmedium LongCat 2.0mediumvsGPT-5.3 Chatnone Gemini 3.1 Flash Lite PreviewnonevsRing-2.6-1Tmedium MiniMax M3mediumvsGPT-5.3 Chatnone Gemini 3 Flash PreviewlowvsGPT-5.3 Chatnone