AI BENCHY Compare

Google: Gemini 3.5 Flash vs Qwen: Qwen3.5-122B-A10B

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-28

Metrică	Gemini 3.5 Flash Gemini 3.5 Flash low Lansare: 2026-05-19	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Lansare: 2026-02-24

Metrică	Gemini 3.5 Flash Gemini 3.5 Flash low Lansare: 2026-05-19	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Lansare: 2026-02-24
Scor	9.3	5.4
Rang	#3	#127
Fiabilitate	10.0	10.0
Consistență	10.0	9.5
Teste corecte
Rată de trecere pe încercare	90.0%	33.3%
Teste instabile	0	1
Rulări totale	60	60
Cost per rezultat	1.582	0.380
Cost total	$0.285	$0.019
Preț de intrare	$1.500 / 1M	$0.260 / 1M
Preț de ieșire	$9.000 / 1M	$2.080 / 1M
Tokenuri de ieșire	2,027	3,374
Tokenuri de raționament	23,938	0
Timp de răspuns (mediu)	2.98s	3.38s
Timp de răspuns (maxim)	6.44s	46.00s
Timp de răspuns (total)	59.59s	67.55s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.52s	209	2,536
Qwen3.5-122B-A10B	4.8	10.0	25.0%	0		1.59s	312	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	6.8	10.0	50.0%	0		5.54s	452	6,839
Qwen3.5-122B-A10B	4.0	5.5	33.3%	1		2.14s	684	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	10.0	10.0	100.0%	0		6.44s	351	3,050
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		46.00s	1,137	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.81s	279	1,164
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		1.01s	243	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	7.7	10.0	66.7%	0		3.39s	12	4,538
Qwen3.5-122B-A10B	5.3	10.0	33.3%	0		465ms	15	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.27s	119	916
Qwen3.5-122B-A10B	5.0	10.0	0.0%	0		1.12s	66	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	9.9	10.0	100.0%	0		1.86s	71	1,652
Qwen3.5-122B-A10B	6.3	10.0	50.0%	0		513ms	69	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.35s	288	2,150
Qwen3.5-122B-A10B	3.8	10.0	0.0%	0		1.00s	575	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.27s	234	403
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		2.04s	264	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.88s	12	690
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		295ms	9	0

Comparație rapidă

Schimbă perechea de comparație

MiniMax M2.7mediumvsQwen3.5-122B-A10Bnone Elephant AlphamediumvsQwen3.5-122B-A10Bnone Mistral Small 4mediumvsQwen3.5-122B-A10Bnone MiniMax M2.5mediumDisponibil gratuitvsQwen3.5-122B-A10Bnone Gemini 3.5 FlashlowvsQwen3.7 Maxmedium Claude Opus 4.7mediumvsGemini 3.5 Flashlow CobuddymediumvsQwen3.5-122B-A10Bnone Owl AlphamediumvsQwen3.5-122B-A10Bnone gpt-oss-120bmediumDisponibil gratuitvsQwen3.5-122B-A10Bnone Nemotron 3 SupermediumDisponibil gratuitvsQwen3.5-122B-A10Bnone Gemini 3.5 FlashlowvsGPT-5.5medium Claude Opus 4.8mediumvsGemini 3.5 Flashlow