AI BENCHY Compare

North Mini Code vs MoonshotAI: Kimi K2.5

Zusammenfassung

North Mini Code vs Kimi K2.5 Benchmark-Vergleich: Kimi K2.5 führt beim Durchschnittsscore mit 5.5 vs 5.1. North Mini Code hat die niedrigeren Benchmark-Kosten mit $0.000 vs $0.027. Kimi K2.5 ist schneller mit 13.18s vs 29.82s, mit Erfolgsraten von 19.1% vs 34.9%.

Empfohlenes Modell: Kimi K2.5 - Es hat hier die beste Punktzahl (5.5) und antwortet etwa 2.3x schneller als North Mini Code.

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-06-18

Metrik	North Mini Code North Mini Code none Veröffentlichung: 2026-06-18 Kostenlos verfügbar	Kimi K2.5 Kimi K2.5 none Veröffentlichung: 2026-01-27

Metrik	North Mini Code North Mini Code none Veröffentlichung: 2026-06-18 Kostenlos verfügbar	Kimi K2.5 Kimi K2.5 none Veröffentlichung: 2026-01-27
Punktzahl	5.1	5.5
Rang	#131	#118
Zuverlässigkeit	8.5	10.0
Konsistenz	9.9	8.9
Korrekte Tests
Erfolgsquote pro Versuch	19.1%	34.9%
Instabile Tests	0	3
Gesamtläufe	57	63
Kosten pro Ergebnis	0.000	0.442
Gesamtkosten	$0.000	$0.027
Eingabepreis	$0.000 / 1M	$0.375 / 1M
Ausgabepreis	$0.000 / 1M	$2.025 / 1M
Gesamte Eingabe-Token	43,264	36,034
Ausgabe-Token	8,278	6,657
Denk-Token	0	0
Antwortzeit (Durchschnitt)	29.82s	13.18s
Antwortzeit (Maximum)	159.85s	42.13s
Antwortzeit (Gesamt)	626.26s	184.47s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#131 North Mini Code

none

Cost: $0.000
Time: 266.1s
Tokens: 63,551 tok

#118 MoonshotAI: Kimi K2.5

none

Cost: $0.015
Time: 89.1s
Tokens: 5,421 tok

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	3.0	10.0	0.0%	0		22.48s	402	4,075	0
Kimi K2.5	3.6	8.4	8.3%	1		6.24s	652	373	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	3.9	10.0	0.0%	0		21.96s	7,119	504	0
Kimi K2.5	5.5	10.0	33.3%	0		24.56s	7,311	4,708	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	3.5	8.7	0.0%	0		159.85s	24,265	2,920	0
Kimi K2.5	2.8	2.1	33.3%	1		19.16s	12,264	748	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	10.0	10.0	100.0%	0		28.00s	6,819	183	0
Kimi K2.5	7.3	5.8	83.3%	1		42.13s	7,180	187	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	3.0	10.0	0.0%	0		14.73s	621	14	0
Kimi K2.5	5.3	10.0	33.3%	0		4.38s	753	29	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	3.9	9.6	0.0%	0		34.77s	444	115	0
Kimi K2.5	10.0	10.0	100.0%	0		4.00s	483	76	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	6.5	10.0	50.0%	0		30.68s	597	57	0
Kimi K2.5	6.5	10.0	50.0%	0		2.67s	677	60	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	3.5	10.0	0.0%	0		24.43s	435	353	0
Kimi K2.5	3.0	10.0	0.0%	0		4.04s	667	236	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	9.5	10.0	100.0%	0		3.64s	2,403	51	0
Kimi K2.5	10.0	10.0	100.0%	0		13.99s	5,835	220	0

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	3.0	10.0	0.0%	0		37.37s	159	6	0
Kimi K2.5	3.0	10.0	0.0%	0		3.90s	212	20	0

Schnellvergleich

Vergleichspaar wechseln

North Mini CodenoneKostenlos verfügbarvsMistral Small 4medium North Mini CodenoneKostenlos verfügbarvsMiniMax M2.7medium CobuddymediumvsNorth Mini CodenoneKostenlos verfügbar MiniMax M2.7mediumvsKimi K2.5none North Mini CodemediumKostenlos verfügbarvsKimi K2.5none Mistral Small 4mediumvsKimi K2.5none North Mini CodenoneKostenlos verfügbarvsMiniMax M2.5medium North Mini CodenoneKostenlos verfügbarvsQwen3 Coder Nextmedium CobuddymediumvsKimi K2.5none Gemini 3.1 Flash LiteminimalvsKimi K2.5none MiniMax M2.5mediumvsKimi K2.5none Kimi K2.5nonevsQwen3.5-35B-A3Bmedium