AI BENCHY Compare

North Mini Code vs DeepSeek: DeepSeek V4 Flash

Zusammenfassung

North Mini Code vs DeepSeek V4 Flash Benchmark-Vergleich: DeepSeek V4 Flash führt beim Durchschnittsscore mit 5.5 vs 5.1. North Mini Code hat die niedrigeren Benchmark-Kosten mit $0.000 vs $0.007. DeepSeek V4 Flash ist schneller mit 26.75s vs 29.82s, mit Erfolgsraten von 19.1% vs 30.2%.

Empfohlenes Modell: DeepSeek V4 Flash - Es hat die stärkste Punktzahl in diesem Vergleich (5.5) und die beste Gesamtbalance aus Kosten und Antwortzeit über alle 2 Modelle.

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-06-18

Metrik	North Mini Code North Mini Code none Veröffentlichung: 2026-06-18 Kostenlos verfügbar	DeepSeek V4 Flash DeepSeek V4 Flash none Veröffentlichung: 2026-04-24

Metrik	North Mini Code North Mini Code none Veröffentlichung: 2026-06-18 Kostenlos verfügbar	DeepSeek V4 Flash DeepSeek V4 Flash none Veröffentlichung: 2026-04-24
Punktzahl	5.1	5.5
Rang	#131	#117
Zuverlässigkeit	8.5	10.0
Konsistenz	9.9	8.9
Korrekte Tests
Erfolgsquote pro Versuch	19.1%	30.2%
Instabile Tests	0	3
Gesamtläufe	57	63
Kosten pro Ergebnis	0.000	0.203
Gesamtkosten	$0.000	$0.007
Eingabepreis	$0.000 / 1M	$0.090 / 1M
Ausgabepreis	$0.000 / 1M	$0.180 / 1M
Gesamte Eingabe-Token	43,264	50,127
Ausgabe-Token	8,278	13,710
Denk-Token	0	0
Antwortzeit (Durchschnitt)	29.82s	26.75s
Antwortzeit (Maximum)	159.85s	111.96s
Antwortzeit (Gesamt)	626.26s	561.82s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#131 North Mini Code

none

Cost: $0.000
Time: 266.1s
Tokens: 63,551 tok

#117 DeepSeek V4 Flash

none

Cost: $0.004
Time: 157.6s
Tokens: 11,297 tok

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	3.0	10.0	0.0%	0		22.48s	402	4,075	0
DeepSeek V4 Flash	3.0	10.0	0.0%	0		20.18s	540	174	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	3.9	10.0	0.0%	0		21.96s	7,119	504	0
DeepSeek V4 Flash	4.2	7.4	11.1%	1		17.13s	7,279	9,717	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	3.5	8.7	0.0%	0		159.85s	24,265	2,920	0
DeepSeek V4 Flash	4.5	2.1	66.7%	1		111.96s	24,398	2,664	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	10.0	10.0	100.0%	0		28.00s	6,819	183	0
DeepSeek V4 Flash	10.0	10.0	100.0%	0		23.79s	7,290	195	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	3.0	10.0	0.0%	0		14.73s	621	14	0
DeepSeek V4 Flash	5.3	10.0	33.3%	0		19.73s	666	18	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	3.9	9.6	0.0%	0		34.77s	444	115	0
DeepSeek V4 Flash	4.2	9.9	0.0%	0		23.74s	471	67	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	6.5	10.0	50.0%	0		30.68s	597	57	0
DeepSeek V4 Flash	6.5	10.0	50.0%	0		17.54s	627	321	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	3.5	10.0	0.0%	0		24.43s	435	353	0
DeepSeek V4 Flash	3.1	7.3	11.1%	1		23.72s	594	207	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	9.5	10.0	100.0%	0		3.64s	2,403	51	0
DeepSeek V4 Flash	10.0	10.0	100.0%	0		77.93s	8,079	327	0

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
North Mini Code	3.0	10.0	0.0%	0		37.37s	159	6	0
DeepSeek V4 Flash	3.0	10.0	0.0%	0		3.07s	183	20	0

Schnellvergleich

Vergleichspaar wechseln

North Mini CodenoneKostenlos verfügbarvsMistral Small 4medium North Mini CodenoneKostenlos verfügbarvsMiniMax M2.7medium CobuddymediumvsNorth Mini CodenoneKostenlos verfügbar North Mini CodemediumKostenlos verfügbarvsDeepSeek V4 Flashnone DeepSeek V4 FlashnonevsMiniMax M2.7medium North Mini CodenoneKostenlos verfügbarvsMiniMax M2.5medium North Mini CodenoneKostenlos verfügbarvsQwen3 Coder Nextmedium DeepSeek V4 FlashnonevsMistral Small 4medium DeepSeek V4 FlashnonevsGemini 3.1 Flash Liteminimal CobuddymediumvsDeepSeek V4 Flashnone DeepSeek V4 FlashnonevsQwen3.5-35B-A3Bmedium DeepSeek V4 FlashnonevsGemma 4 31BmediumKostenlos verfügbar