AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs Owl Alpha

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-22

Métrique	Kimi K2.5 Kimi K2.5 none Sortie: 2026-01-27	Owl Alpha Owl Alpha none Sortie: 2026-04-30

Métrique	Kimi K2.5 Kimi K2.5 none Sortie: 2026-01-27	Owl Alpha Owl Alpha none Sortie: 2026-04-30
Score	5.3	5.7
Rang	#126	#106
Fiabilité	10.0	10.0
Cohérence	8.9	9.2
Tests corrects
Taux de réussite par tentative	36.7%	41.7%
Tests instables	3	2
Exécutions totales	60	60
Coût par résultat	0.428	0.000
Coût total	$0.026	$0.000
Prix d'entrée	$0.400 / 1M	$0.000 / 1M
Prix de sortie	$1.900 / 1M	$0.000 / 1M
Jetons de sortie	6,734	4,864
Jetons de raisonnement	0	0
Temps de réponse (moy.)	14.16s	8.84s
Temps de réponse (max)	42.13s	47.10s
Temps de réponse (total)	184.10s	176.83s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Kimi K2.5	3.6	8.4	8.3%	1		6.24s	373	0
Owl Alpha	3.4	7.9	16.7%	1		2.78s	57	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Kimi K2.5	6.8	10.0	50.0%	0		35.97s	4,704	0
Owl Alpha	7.0	9.9	50.0%	0		39.68s	3,629	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Kimi K2.5	2.8	2.1	33.3%	1		19.16s	748	0
Owl Alpha	3.0	10.0	0.0%	0		21.74s	315	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Kimi K2.5	7.3	5.8	83.3%	1		42.13s	187	0
Owl Alpha	10.0	10.0	100.0%	0		3.60s	246	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Kimi K2.5	5.3	10.0	33.3%	0		4.38s	29	0
Owl Alpha	5.3	10.0	33.3%	0		3.00s	27	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Kimi K2.5	10.0	10.0	100.0%	0		4.00s	76	0
Owl Alpha	4.3	10.0	0.0%	0		4.61s	80	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Kimi K2.5	6.5	10.0	50.0%	0		2.67s	60	0
Owl Alpha	6.4	10.0	50.0%	0		2.63s	63	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Kimi K2.5	3.0	10.0	0.0%	0		4.73s	317	0
Owl Alpha	5.9	7.2	55.6%	1		4.43s	202	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Kimi K2.5	10.0	10.0	100.0%	0		13.99s	220	0
Owl Alpha	10.0	10.0	100.0%	0		22.78s	231	0

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Kimi K2.5	3.0	10.0	0.0%	0		3.90s	20	0
Owl Alpha	3.0	10.0	0.0%	0		2.50s	14	0

Comparaison rapide

Changer la paire de comparaison

CobuddymediumDisponible gratuitementvsOwl Alphanone Kimi K2.5nonevsElephant Alphamedium Mistral Small 4mediumvsKimi K2.5none MiniMax M2.5mediumDisponible gratuitementvsKimi K2.5none gpt-oss-120bmediumDisponible gratuitementvsOwl Alphanone Nemotron 3 SupermediumDisponible gratuitementvsOwl Alphanone MiniMax M2.7mediumvsKimi K2.5none Kimi K2.5nonevsgpt-oss-120bmediumDisponible gratuitement MiniMax M2.5mediumDisponible gratuitementvsOwl Alphanone Mistral Small 4mediumvsOwl Alphanone GPT-5 NanomediumvsOwl Alphanone CobuddymediumDisponible gratuitementvsKimi K2.5none