AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs OpenAI: GPT-5.5

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-22

Metrică	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Lansare: 2026-05-08	GPT-5.5 GPT-5.5 medium Lansare: 2026-04-24

Metrică	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Lansare: 2026-05-08	GPT-5.5 GPT-5.5 medium Lansare: 2026-04-24
Scor	6.7	8.7
Rang	#78	#11
Fiabilitate	10.0	10.0
Consistență	8.8	8.8
Teste corecte
Rată de trecere pe încercare	56.7%	86.7%
Teste instabile	3	3
Rulări totale	60	60
Cost per rezultat	0.123	21.891
Cost total	$0.013	$3.503
Preț de intrare	$0.250 / 1M	$5.000 / 1M
Preț de ieșire	$1.500 / 1M	$30.000 / 1M
Tokenuri de ieșire	2,481	1,973
Tokenuri de raționament	0	109,510
Timp de răspuns (mediu)	1.37s	37.89s
Timp de răspuns (maxim)	4.49s	332.10s
Timp de răspuns (total)	27.32s	757.71s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	8.3	10.0	75.0%	0		1.10s	639	0
GPT-5.5	10.0	10.0	100.0%	0		4.66s	250	1,335

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	6.8	10.0	50.0%	0		951ms	660	0
GPT-5.5	8.2	6.7	83.3%	1		69.68s	341	19,515

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		2.53s	357	0
GPT-5.5	10.0	10.0	100.0%	0		19.29s	312	2,841

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.04s	279	0
GPT-5.5	10.0	10.0	100.0%	0		4.18s	234	593

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		1.02s	15	0
GPT-5.5	5.3	7.2	44.4%	1		164.14s	67	79,625

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	4.0	10.0	0.0%	0		791ms	63	0
GPT-5.5	10.0	10.0	100.0%	0		4.16s	138	223

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		932ms	72	0
GPT-5.5	10.0	10.0	100.0%	0		3.36s	93	538

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	6.0	4.6	66.7%	2		2.15s	153	0
GPT-5.5	10.0	10.0	100.0%	0		6.78s	250	2,254

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		3.51s	234	0
GPT-5.5	10.0	10.0	100.0%	0		10.57s	258	832

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		724ms	9	0
GPT-5.5	2.8	1.6	33.3%	1		37.86s	30	1,754

Comparație rapidă

Schimbă perechea de comparație

Gemini 3.1 Flash LiteminimalvsKimi K2.5medium DeepSeek V4 ProhighvsGemini 3.1 Flash Liteminimal Gemini 3.1 Flash LiteminimalvsGrok 4.20medium Gemini 3.1 Flash LiteminimalvsGrok Build 0.1none Gemini 3 Flash PreviewlowvsGPT-5.5medium Gemini 3.1 Flash LiteminimalvsQwen3.6 27Bmedium Gemini 3.1 Flash LiteminimalvsGPT-5.5none Gemini 3.5 FlashnonevsGPT-5.5medium Gemini 3.1 Flash LiteminimalvsGPT-5 Minimedium Gemini 3.1 Flash LiteminimalvsMiMo-V2-Omnimedium Gemini 3.1 Flash LiteminimalvsQwen3.5 Plus 2026-02-15none DeepSeek V3.2mediumvsGemini 3.1 Flash Liteminimal