Navigation
AI BENCHY
Comparer Graphiques Méthodologie
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs MoonshotAI: Kimi K2.5

Comparer:

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-03-05

Métrique Google: Gemini 3.1 Flash Lite Preview low Sortie: 2026-03-03 MoonshotAI: Kimi K2.5 medium Sortie: 2026-01-27
Score moy. 7.6 6.4
Rang #12 #29
Tests corrects
Cohérence 10.0 7.8
Coût par résultat 0.170 2.082
Coût total $0.019 $0.188
Taux de réussite par tentative 73.3% 73.3%
Tests instables 0 4
common.totalRuns 45 (15 x 3) 45 (15 x 3)
Jetons de sortie 1,542 34,638
Jetons de raisonnement 6,888 68,234
Temps de réponse (moy.) 3.49s 69.84s
Temps de réponse (max) 11.91s 137.29s
Temps de réponse (total) 52.29s 558.72s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score moy. vs Temps de réponse (moy.)

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Google: Gemini 3.1 Flash Lite Preview 7.0 10.0 66.7% 0 2.18s 456 1,224
MoonshotAI: Kimi K2.5 7.0 7.2 88.9% 1 85.28s 335 6,255
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 0.0% 0 11.91s 225 762
MoonshotAI: Kimi K2.5 10.0 10.0 100.0% 0 71.37s 703 3,713
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Google: Gemini 3.1 Flash Lite Preview 9.9 10.0 100.0% 0 3.00s 291 696
MoonshotAI: Kimi K2.5 9.9 10.0 100.0% 0 49.78s 563 7,940
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Google: Gemini 3.1 Flash Lite Preview 4.0 10.0 33.3% 0 2.36s 18 1,212
MoonshotAI: Kimi K2.5 10.0 4.4 33.3% 2 137.29s 20,753 30,564
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
MoonshotAI: Kimi K2.5 10.0 10.0 100.0% 0 92.47s 5,371 6,547
Puzzle Solving Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.76s 243 1,248
MoonshotAI: Kimi K2.5 4.0 7.3 44.4% 1 45.40s 6,671 12,403
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993
MoonshotAI: Kimi K2.5 10.0 10.0 100.0% 0 31.74s 242 812

Comparaison rapide

Changer la paire de comparaison