Navigation
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs MoonshotAI: Kimi K2.6

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-04

Métrique Claude Sonnet 4.6 Claude Sonnet 4.6 none Sortie: 2026-02-17 Kimi K2.6 Kimi K2.6 medium Sortie: 2026-04-20 Disponible gratuitement
Score 6.8 7.2
Rang #77 #60
Fiabilité 10.0 10.0
Cohérence 9.7 8.6
Tests corrects
Taux de réussite par tentative 55.6% 65.1%
Tests instables 1 3
Exécutions totales 63 63
Coût par résultat 2.870 8.358
Coût total $0.316 $0.891
Prix d'entrée $3.000 / 1M $0.684 / 1M
Prix de sortie $15.000 / 1M $3.420 / 1M
Total des jetons d'entrée 57,886 29,450
Jetons de sortie 9,465 102,923
Jetons de raisonnement 0 254,094
Temps de réponse (moy.) 5.04s 71.67s
Temps de réponse (max) 23.84s 406.78s
Temps de réponse (total) 70.60s 1433.36s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
Kimi K2.6 7.0 8.0 66.7% 1 11.59s 618 7,115 8,934
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
Kimi K2.6 5.7 8.6 33.3% 0 214.42s 2,925 9,970 77,189
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
Kimi K2.6 10.0 10.0 100.0% 0 40.96s 11,271 711 13,876
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
Kimi K2.6 10.0 10.0 100.0% 0 20.38s 7,014 316 11,305
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
Kimi K2.6 5.3 7.2 44.4% 1 202.38s 326 47,035 98,262
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
Kimi K2.6 10.0 10.0 100.0% 0 17.83s 477 3,981 4,472
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
Kimi K2.6 10.0 10.0 100.0% 0 12.53s 669 3,977 5,269
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
Kimi K2.6 6.0 7.4 55.6% 1 25.06s 651 13,860 17,599
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
Kimi K2.6 10.0 10.0 100.0% 0 8.92s 5,286 248 1,011
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
Kimi K2.6 3.0 10.0 0.0% 0 130.27s 213 15,710 16,177

Comparaison rapide

Changer la paire de comparaison