AI BENCHY
Comparer
❤️ Made by XCS

Nom du modèle

MoonshotAI: Kimi K2.5

Benchmarks générés à partir des suites de tests Aibenchy le : 19 févr. 2026

Métrique MoonshotAI: Kimi K2.5
Rang#9
EntrepriseMoonshotAI
Score 6.42
Cohérence 8.00
Coût par résultat 2.4097
Coût total $0.16868
Tests corrects 7/12
Taux de réussite par tentative 72.2%
Tests instables 3
Jetons de sortie 30,235
Jetons de raisonnement 53,179

Répartition par catégorie

Catégorie Tests entièrement réussis Score Cohérence Taux de réussite par tentative Tests instables Score de raisonnement Coût
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 9.77 $0.00634
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.67 $0.02325
Domain specific 0/3 1.00 4.41 33.3% 2 7.22 $0.09579
Instructions following 2/2 9.50 10.00 100.0% 0 9.42 $0.01428
Puzzle Solving 1/3 5.00 7.61 55.6% 1 9.26 $0.02904

Modèles comparés

Comparer MoonshotAI: Kimi K2.5 à...

#8 · X Ai

xAI: Grok 4.1 Fast

Raisonnement (medium)

Score: 6.42

Cohérence: 8.60

Taux de réussite par tentative: 66.7%

Tests instables: 2

Coût par résultat: 0.4800

Tests corrects: 7/12

Coût total: $0.03360

Comparer

#10 · Google

Google: Gemini 3 Flash Preview

Sans raisonnement

Score: 6.25

Cohérence: 8.60

Taux de réussite par tentative: 66.7%

Tests instables: 2

Coût par résultat: 0.0754

Tests corrects: 7/12

Coût total: $0.00528

Comparer

#7 · Z.ai

Z.ai: GLM 5

Raisonnement (medium)

Score: 6.83

Cohérence: 7.86

Taux de réussite par tentative: 80.6%

Tests instables: 3

Coût par résultat: 1.3424

Tests corrects: 8/12

Coût total: $0.10740

Comparer

Comparaison rapide

Comparer MoonshotAI: Kimi K2.5 à...