Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs Qwen: Qwen3.6 27B

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-26

Metrică Kimi K2.5 Kimi K2.5 none Lansare: 2026-01-27 Qwen3.6 27B Qwen3.6 27B none Lansare: 2026-04-20
Scor 5.3 5.8
Rang #128 #107
Fiabilitate 10.0 10.0
Consistență 8.9 7.5
Teste corecte
Rată de trecere pe încercare 36.7% 50.0%
Teste instabile 3 6
Rulări totale 98 98
Cost per rezultat 0.447 0.655
Cost total $0.027 $0.046
Preț de intrare $0.400 / 1M $0.317 / 1M
Preț de ieșire $1.900 / 1M $3.200 / 1M
Tokenuri de ieșire 6,767 10,112
Tokenuri de raționament 0 0
Timp de răspuns (mediu) 14.06s 3.85s
Timp de răspuns (maxim) 42.13s 11.82s
Timp de răspuns (total) 182.72s 77.09s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 373 0
Qwen3.6 27B 3.8 3.7 41.7% 3 2.83s 490 0
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Kimi K2.5 6.8 10.0 50.0% 0 35.97s 4,704 0
Qwen3.6 27B 6.8 10.0 50.0% 0 5.75s 531 0
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 748 0
Qwen3.6 27B 3.0 10.0 0.0% 0 9.95s 1,401 0
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 187 0
Qwen3.6 27B 7.3 5.8 83.3% 1 2.06s 248 0
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 29 0
Qwen3.6 27B 7.7 10.0 66.7% 0 3.03s 24 0
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
Qwen3.6 27B 5.2 9.9 0.0% 0 1.07s 72 0
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 60 0
Qwen3.6 27B 6.2 5.8 66.7% 1 1.92s 49 0
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Kimi K2.5 3.0 10.0 0.0% 0 4.04s 350 0
Qwen3.6 27B 5.3 7.2 44.4% 1 5.15s 6,947 0
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0
Qwen3.6 27B 9.5 10.0 100.0% 0 6.74s 339 0
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Kimi K2.5 3.0 10.0 0.0% 0 3.90s 20 0
Qwen3.6 27B 3.0 10.0 0.0% 0 4.03s 11 0

Comparație rapidă

Schimbă perechea de comparație