Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.5-122B-A10B vs Qwen: Qwen3.5-Flash

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-28

Metrică Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium Lansare: 2026-02-24 Qwen3.5-Flash Qwen3.5-Flash medium Lansare: 2026-02-24
Scor 7.7 7.6
Rang #41 #48
Fiabilitate 10.0 10.0
Consistență 8.8 8.0
Teste corecte
Rată de trecere pe încercare 71.7% 75.0%
Teste instabile 3 5
Rulări totale 60 60
Cost per rezultat 5.031 0.821
Cost total $0.509 $0.074
Preț de intrare $0.260 / 1M $0.065 / 1M
Preț de ieșire $2.080 / 1M $0.260 / 1M
Tokenuri de ieșire 26,166 2,074
Tokenuri de raționament 213,524 272,063
Timp de răspuns (mediu) 39.40s 63.04s
Timp de răspuns (maxim) 168.16s 234.29s
Timp de răspuns (total) 788.00s 1197.71s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.75s 269 16,835
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 383 32,992
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Qwen3.5-122B-A10B 4.1 5.8 33.3% 1 119.57s 8,036 45,074
Qwen3.5-Flash 4.1 5.8 33.3% 1 54.23s 288 67,546
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 107.79s 483 11,337
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 483 8,270
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 23.41s 270 16,558
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 235 16,237
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Qwen3.5-122B-A10B 2.9 7.2 11.1% 1 63.40s 15,537 64,889
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 58 43,615
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Qwen3.5-122B-A10B 3.4 2.2 33.3% 1 34.11s 66 7,592
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 99 38,486
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.88s 77 7,372
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 98 14,139
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 17.89s 284 27,575
Qwen3.5-Flash 8.2 7.2 88.9% 1 27.61s 89 12,457
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 4.60s 322 1,226
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 309 1,284
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 52.87s 822 15,066
Qwen3.5-Flash 3.0 10.0 0.0% 0 48.98s 32 37,037

Comparație rapidă

Schimbă perechea de comparație