AI BENCHY Compare
MoonshotAI: Kimi K2.5 vs xAI: Grok 4.20
Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-02
| Metrică | Kimi K2.5 Kimi K2.5 medium | Grok 4.20 Grok 4.20 medium |
|---|---|---|
| Scor | 7.2 | 7.1 |
| Rang | #39 | #40 |
| Consistență | 7.2 | 8.2 |
| Teste corecte | ||
| Rată de trecere pe încercare | 72.6% | 66.7% |
| Teste instabile | 6 | 4 |
| Rulări totale | 51 | 51 |
| Cost per rezultat | 2.232 | 7.358 |
| Cost total | $0.201 | $0.663 |
| Preț de intrare | $0.383 / 1M | $2.000 / 1M |
| Preț de ieșire | $1.909 / 1M | $6.000 / 1M |
| Tokenuri de ieșire | 40,907 | 1,494 |
| Tokenuri de raționament | 75,121 | 97,078 |
| Timp de răspuns (mediu) | 64.59s | 9.50s |
| Timp de răspuns (maxim) | 137.29s | 29.87s |
| Timp de răspuns (total) | 645.93s | 161.54s |
Scor vs cost total
Timp de răspuns (mediu)
Scor vs Timp de răspuns (mediu)
Total tokenuri de ieșire
Scor vs Total tokenuri de ieșire
Defalcare pe categorii
Comparație rapidă
Schimbă perechea de comparație
Claude Sonnet 4.6nonevsKimi K2.5mediumClaude Sonnet 4.6nonevsGrok 4.20mediumQwen3.5 Plus 2026-02-15nonevsGrok 4.20mediumKimi K2.5mediumvsGPT-5.3 ChatnoneGemma 4 31BnonevsGrok 4.20mediumGrok 4.20mediumvsGLM 5noneKimi K2.5mediumvsQwen3.5 Plus 2026-02-15noneGPT-5.3 ChatnonevsGrok 4.20mediumGemma 4 31BnonevsKimi K2.5mediumKimi K2.5mediumvsGLM 5noneKimi K2.5mediumvsGPT-5.2 ChatnoneGemini 3.1 Flash Lite PreviewnonevsKimi K2.5medium