Gemini 3.1 Flash Lite (low) vs gpt-oss-120b (medium)

Model recomandat gpt-oss-120b (medium)

Scorul rămâne aproape de cel mai bun scor de aici (6.1 vs 6.5) și costă de aproximativ 33.1x mai puțin decât Gemini 3.1 Flash Lite (low).

Comparație detaliată

Metrică	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite low Lansare: 2026-05-08	gpt-oss-120b gpt-oss-120b medium Lansare: 2025-08-05

Metrică	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite low Lansare: 2026-05-08	gpt-oss-120b gpt-oss-120b medium Lansare: 2025-08-05
Scor	6.5	6.1
Rang	#118	#135
Fiabilitate	10.0	10.0
Consistență	9.2	8.0
Teste corecte
Rată de trecere pe încercare	59.1%	50.0%
Teste instabile	2	5
Rulări totale	66	66
Cost per rezultat	5.170	0.221
Cost total	$0.621	$0.019
Preț de intrare	$0.250 / 1M	$0.037 / 1M
Preț de ieșire	$1.500 / 1M	$0.170 / 1M
Total tokenuri de intrare	94,224	108,747
Tokenuri de ieșire	7,759	29,772
Tokenuri de raționament	390,126	68,044
Timp de răspuns (mediu)	16.26s	21.91s
Timp de răspuns (maxim)	318.02s	68.16s
Timp de răspuns (total)	357.64s	328.70s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

low

medium

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	7.3	6.2	75.0%	2		1.84s	500	1,013	1,548
gpt-oss-120b	6.7	9.9	50.0%	0		10.21s	1,314	3,518	2,177

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	5.5	10.0	33.3%	0		1.53s	8,132	471	1,072
gpt-oss-120b	5.9	7.0	55.6%	1		38.37s	7,782	3,365	11,973

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	3.2	9.1	0.0%	0		161.25s	70,202	5,375	381,841
gpt-oss-120b	6.5	10.0	50.0%	0		23.96s	81,198	10,453	22,883

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.44s	7,453	291	697
gpt-oss-120b	6.4	5.9	66.7%	1		1.98s	7,476	241	1,114

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	5.3	10.0	33.3%	0		1.52s	639	15	1,214
gpt-oss-120b	2.9	4.4	22.2%	2		50.92s	1,266	6,784	20,606

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	4.0	10.0	0.0%	0		1.37s	492	69	438
gpt-oss-120b	4.3	10.0	0.0%	0		7.90s	659	107	387

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.52s	619	72	760
gpt-oss-120b	9.9	10.0	100.0%	0		7.63s	1,036	126	1,799

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.40s	570	210	1,191
gpt-oss-120b	5.3	7.2	44.4%	1		21.71s	1,190	1,790	2,264

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		5.66s	5,457	234	945
gpt-oss-120b	9.8	10.0	100.0%	0		6.91s	6,514	287	1,083

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		1.46s	160	9	420
gpt-oss-120b	3.0	10.0	0.0%	0		26.51s	312	3,101	3,758

Schimbă perechea de comparație