AI BENCHY Compare

Anthropic: Claude Sonnet 5 vs North Mini Code

Zusammenfassung

Claude Sonnet 5 vs North Mini Code Benchmark-Vergleich: North Mini Code führt beim Durchschnittsscore mit 5.8 vs 5.7. North Mini Code hat die niedrigeren Benchmark-Kosten mit $0.000 vs $0.287. Claude Sonnet 5 ist schneller mit 4.74s vs 106.18s, mit Erfolgsraten von 42.9% vs 50.8%.

Empfohlenes Modell: Claude Sonnet 5 - Die Punktzahl bleibt nah an der besten hier (5.7 vs 5.8) und es antwortet etwa 22.4x schneller als North Mini Code.

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-06-30

Metrik	Claude Sonnet 5 Claude Sonnet 5 none Veröffentlichung: 2026-06-30	North Mini Code North Mini Code medium Veröffentlichung: 2026-06-18 Kostenlos verfügbar

Metrik	Claude Sonnet 5 Claude Sonnet 5 none Veröffentlichung: 2026-06-30	North Mini Code North Mini Code medium Veröffentlichung: 2026-06-18 Kostenlos verfügbar
Punktzahl	5.7	5.8
Rang	#117	#109
Zuverlässigkeit	10.0	8.5
Konsistenz	8.6	8.5
Korrekte Tests
Erfolgsquote pro Versuch	42.9%	50.8%
Instabile Tests	4	4
Gesamtläufe	63	55
Kosten pro Ergebnis	4.098	0.000
Gesamtkosten	$0.287	$0.000
Eingabepreis	$2.000 / 1M	$0.000 / 1M
Ausgabepreis	$10.000 / 1M	$0.000 / 1M
Gesamte Eingabe-Token	76,797	32,891
Ausgabe-Token	13,325	424,772
Denk-Token	0	1,021,489
Antwortzeit (Durchschnitt)	4.74s	106.18s
Antwortzeit (Maximum)	29.46s	357.05s
Antwortzeit (Gesamt)	99.46s	2229.70s

Generierungs-Showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 Claude Sonnet 5

none

Kosten: $0.061
Zeit: 53.7s
Token: 6,172 tok

#109 North Mini Code

medium

Kosten: $0.000
Zeit: 51.8s
Token: 12,460 tok

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 5	5.3	10.0	25.0%	0		3.60s	834	1,813	0
North Mini Code	8.4	10.0	75.0%	0		64.79s	324	64,441	68,535

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 5	4.6	7.9	22.2%	1		3.67s	10,590	1,864	0
North Mini Code	4.5	4.9	33.3%	2		320.43s	7,119	219,891	561,569

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 5	3.0	10.0	0.0%	0		29.46s	38,775	6,340	0
North Mini Code	2.8	1.6	33.3%	1		323.07s	14,760	0	151,500

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 5	10.0	10.0	100.0%	0		3.01s	10,503	309	0
North Mini Code	10.0	10.0	100.0%	0		24.06s	6,819	240	2,659

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 5	5.3	7.2	44.4%	1		3.28s	975	933	0
North Mini Code	5.3	7.2	44.4%	1		71.37s	621	8,483	104,079

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 5	4.7	3.1	33.3%	1		2.81s	708	272	0
North Mini Code	5.1	10.0	0.0%	0		25.08s	444	1,546	1,635

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 5	6.4	10.0	50.0%	0		2.58s	909	103	0
North Mini Code	9.8	10.0	100.0%	0		15.43s	379	909	1,339

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 5	6.0	7.4	55.6%	1		3.22s	894	778	0
North Mini Code	3.3	10.0	0.0%	0		19.70s	543	2,215	2,485

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 5	10.0	10.0	100.0%	0		6.80s	12,351	522	0
North Mini Code	10.0	10.0	100.0%	0		3.93s	1,776	41	563

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 5	3.0	10.0	0.0%	0		4.31s	258	391	0
North Mini Code	3.0	10.0	0.0%	0		305.02s	106	127,006	127,125

Schnellvergleich

Vergleichspaar wechseln