Comparer Graphiques

Langue:

❤️ Made by XCS

AI BENCHY Compare

Arcee AI: Trinity Large Preview (free) vs MoonshotAI: Kimi K2.5

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-03-03

Métrique	Arcee AI: Trinity Large Preview (free) none Sortie: 2026-01-27 Disponible gratuitement	MoonshotAI: Kimi K2.5 none Sortie: 2026-01-27
Rang	#33	#35
Score moy.	4.34	4.07
Cohérence	9.97	8.92
Coût par résultat	0.000	0.232
Coût total	$0.000	$0.010
Tests corrects	5/14	4/14
Taux de réussite par tentative	35.7%	35.7%
Tests instables	0	2
Jetons de sortie	1,415	1,915
Jetons de raisonnement	0	0

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Arcee AI: Trinity Large Preview (free)	1.00	10.00	0.0%	0		587	0
MoonshotAI: Kimi K2.5	2.67	7.86	11.1%	1		363	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Arcee AI: Trinity Large Preview (free)	9.88	10.00	100.0%	0		186	0
MoonshotAI: Kimi K2.5	5.50	5.81	83.3%	1		995	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Arcee AI: Trinity Large Preview (free)	4.00	10.00	33.3%	0		21	0
MoonshotAI: Kimi K2.5	4.00	10.00	33.3%	0		29	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Arcee AI: Trinity Large Preview (free)	2.00	9.79	0.0%	0		63	0
MoonshotAI: Kimi K2.5	5.00	9.99	50.0%	0		61	0

Puzzle Solving	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Arcee AI: Trinity Large Preview (free)	4.00	9.99	33.3%	0		291	0
MoonshotAI: Kimi K2.5	2.00	9.92	0.0%	0		247	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Arcee AI: Trinity Large Preview (free)	10.00	10.00	100.0%	0		267	0
MoonshotAI: Kimi K2.5	10.00	10.00	100.0%	0		220	0

Comparaison rapide

Changer la paire de comparaison

Kimi K2.5nonevsGLM 4.7 Flashmedium Trinity Large Preview (free)noneDisponible gratuitementvsGLM 4.7 Flashmedium Kimi K2.5nonevsQwen3 Coder Nextmedium Trinity Large Preview (free)noneDisponible gratuitementvsQwen3 Coder Nextmedium Trinity Large Preview (free)noneDisponible gratuitementvsMiniMax M2.5medium Trinity Large Preview (free)noneDisponible gratuitementvsgpt-oss-120bmediumDisponible gratuitement Trinity Large Preview (free)noneDisponible gratuitementvsQwen3.5-Flashmedium Trinity Large Preview (free)noneDisponible gratuitementvsGPT-5 Nanomedium MiniMax M2.5mediumvsKimi K2.5none Kimi K2.5nonevsgpt-oss-120bmediumDisponible gratuitement Trinity Large Preview (free)noneDisponible gratuitementvsQwen3.5-35B-A3Bmedium Trinity Large Preview (free)noneDisponible gratuitementvsMiMo-V2-Flashmedium