AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.6 Max Preview

Rezumat

Comparație benchmark Gemini 3.1 Flash Lite Preview vs Qwen3.6 Max Preview: Qwen3.6 Max Preview conduce la scorul mediu cu 8.9 vs 6.4. Gemini 3.1 Flash Lite Preview are costul de benchmark mai mic, $0.018 vs $0.960. Gemini 3.1 Flash Lite Preview este mai rapid cu 1.21s vs 59.63s, cu rate de reușită de 60.3% vs 81.0%.

Model recomandat: Gemini 3.1 Flash Lite Preview - Oferă cel mai bun compromis per total: scor competitiv (6.4), cost mai mic decât Qwen3.6 Max Preview și timp de răspuns echilibrat.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-18

Metrică	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Lansare: 2026-03-03	Qwen3.6 Max Preview Qwen3.6 Max Preview medium Lansare: 2026-04-20

Metrică	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Lansare: 2026-03-03	Qwen3.6 Max Preview Qwen3.6 Max Preview medium Lansare: 2026-04-20
Scor	6.4	8.9
Rang	#84	#11
Fiabilitate	10.0	10.0
Consistență	9.7	9.3
Teste corecte
Rată de trecere pe încercare	60.3%	81.0%
Teste instabile	1	2
Rulări totale	63	63
Cost per rezultat	0.148	7.024
Cost total	$0.018	$0.960
Preț de intrare	$0.250 / 1M	$1.040 / 1M
Preț de ieșire	$1.500 / 1M	$6.240 / 1M
Total tokenuri de intrare	37,582	42,362
Tokenuri de ieșire	5,547	2,273
Tokenuri de raționament	0	144,367
Timp de răspuns (mediu)	1.21s	59.63s
Timp de răspuns (maxim)	3.39s	238.07s
Timp de răspuns (total)	25.45s	1252.17s

Prezentare generare

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#84 Gemini 3.1 Flash Lite Preview

none

Cost: $0.003
Timp: 4.7s
Tokenuri: 1,827 tok

#11 Qwen3.6 Max Preview

medium

Cost: $0.024
Timp: 76.5s
Tokenuri: 3,861 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	7.5	8.4	66.7%	1		1.04s	504	1,092	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		22.13s	672	228	10,075

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		967ms	8,128	670	0
Qwen3.6 Max Preview	8.8	7.8	88.9%	1		146.48s	7,895	427	52,957

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		3.20s	13,026	339	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		121.49s	14,934	390	14,575

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.22s	7,550	399	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		41.15s	7,782	270	10,106

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		942ms	641	568	0
Qwen3.6 Max Preview	2.9	7.2	11.1%	1		95.91s	771	60	30,371

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		741ms	488	69	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		32.24s	516	129	3,510

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.13s	623	574	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		24.31s	699	103	5,848

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		900ms	570	1,045	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		24.32s	696	329	7,693

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.39s	5,894	782	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		18.32s	8,193	309	1,571

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		814ms	158	9	0
Qwen3.6 Max Preview	3.0	10.0	0.0%	0		60.56s	204	28	7,661

Comparație rapidă

Schimbă perechea de comparație