Vergleichen Diagramme

Sprache:

❤️ Made by XCS

AI BENCHY Compare

Arcee AI: Trinity Large Preview (free) vs MoonshotAI: Kimi K2.5

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-03-03

Metrik	Arcee AI: Trinity Large Preview (free) none Veröffentlichung: 2026-01-27 Kostenlos verfügbar	MoonshotAI: Kimi K2.5 none Veröffentlichung: 2026-01-27
Rang	#33	#35
Ø-Score	4.34	4.07
Konsistenz	9.97	8.92
Kosten pro Ergebnis	0.000	0.232
Gesamtkosten	$0.000	$0.010
Korrekte Tests	5/14	4/14
Erfolgsquote pro Versuch	35.7%	35.7%
Instabile Tests	0	2
Ausgabe-Token	1,415	1,915
Denk-Token	0	0

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
Arcee AI: Trinity Large Preview (free)	1.00	10.00	0.0%	0		587	0
MoonshotAI: Kimi K2.5	2.67	7.86	11.1%	1		363	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
Arcee AI: Trinity Large Preview (free)	9.88	10.00	100.0%	0		186	0
MoonshotAI: Kimi K2.5	5.50	5.81	83.3%	1		995	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
Arcee AI: Trinity Large Preview (free)	4.00	10.00	33.3%	0		21	0
MoonshotAI: Kimi K2.5	4.00	10.00	33.3%	0		29	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
Arcee AI: Trinity Large Preview (free)	2.00	9.79	0.0%	0		63	0
MoonshotAI: Kimi K2.5	5.00	9.99	50.0%	0		61	0

Puzzle Solving	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
Arcee AI: Trinity Large Preview (free)	4.00	9.99	33.3%	0		291	0
MoonshotAI: Kimi K2.5	2.00	9.92	0.0%	0		247	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
Arcee AI: Trinity Large Preview (free)	10.00	10.00	100.0%	0		267	0
MoonshotAI: Kimi K2.5	10.00	10.00	100.0%	0		220	0

Schnellvergleich

Vergleichspaar wechseln

Kimi K2.5nonevsGLM 4.7 Flashmedium Trinity Large Preview (free)noneKostenlos verfügbarvsGLM 4.7 Flashmedium Kimi K2.5nonevsQwen3 Coder Nextmedium Trinity Large Preview (free)noneKostenlos verfügbarvsQwen3 Coder Nextmedium Trinity Large Preview (free)noneKostenlos verfügbarvsMiniMax M2.5medium Trinity Large Preview (free)noneKostenlos verfügbarvsgpt-oss-120bmediumKostenlos verfügbar Trinity Large Preview (free)noneKostenlos verfügbarvsQwen3.5-Flashmedium Trinity Large Preview (free)noneKostenlos verfügbarvsGPT-5 Nanomedium MiniMax M2.5mediumvsKimi K2.5none Kimi K2.5nonevsgpt-oss-120bmediumKostenlos verfügbar Trinity Large Preview (free)noneKostenlos verfügbarvsQwen3.5-35B-A3Bmedium Trinity Large Preview (free)noneKostenlos verfügbarvsMiMo-V2-Flashmedium