DeepSeek V4 Flash (high) vs Qwen3.6 Plus (medium)

Empfohlenes Modell DeepSeek V4 Flash (high)

Die Punktzahl bleibt nah an der besten hier (7.7 vs 7.8) und es kostet etwa 6.8x weniger als Qwen3.6 Plus (medium).

Detaillierter Vergleich

Metrik	DeepSeek V4 Flash DeepSeek V4 Flash high Veröffentlichung: 2026-04-24	Qwen3.6 Plus Qwen3.6 Plus medium Veröffentlichung: 2026-04-20

Metrik	DeepSeek V4 Flash DeepSeek V4 Flash high Veröffentlichung: 2026-04-24	Qwen3.6 Plus Qwen3.6 Plus medium Veröffentlichung: 2026-04-20
Punktzahl	7.7	7.8
Rang	#57	#48
Zuverlässigkeit	10.0	10.0
Konsistenz	8.2	9.3
Korrekte Tests
Erfolgsquote pro Versuch	72.7%	71.2%
Instabile Tests	5	2
Gesamtläufe	66	66
Kosten pro Ergebnis	0.402	1.514
Gesamtkosten	$0.060	$0.405
Eingabepreis	$0.140 / 1M	$0.325 / 1M
Ausgabepreis	$0.280 / 1M	$1.950 / 1M
Gesamte Eingabe-Token	108,392	97,689
Ausgabe-Token	14,478	6,412
Denk-Token	153,687	184,825
Antwortzeit (Durchschnitt)	49.75s	43.12s
Antwortzeit (Maximum)	218.13s	291.55s
Antwortzeit (Gesamt)	1094.41s	905.53s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

high

medium

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	540	140	7,770
Qwen3.6 Plus	10.0	10.0	100.0%	0		9.90s	672	207	7,557

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	7.8	10.0	66.7%	0		50.60s	7,279	395	34,862
Qwen3.6 Plus	6.1	7.8	44.4%	1		153.12s	7,098	58	50,586

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	6.4	5.8	66.7%	1		104.10s	82,663	4,633	37,533
Qwen3.6 Plus	10.0	10.0	100.0%	0		163.25s	71,058	5,011	55,925

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	7,290	201	1,179
Qwen3.6 Plus	10.0	10.0	100.0%	0		14.95s	7,782	270	10,706

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	4.1	4.4	44.5%	2		100.31s	666	27	59,249
Qwen3.6 Plus	2.9	7.2	11.1%	1		29.59s	771	56	33,464

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	471	79	632
Qwen3.6 Plus	5.1	10.0	0.0%	0		27.05s	516	111	5,232

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	627	63	1,622
Qwen3.6 Plus	10.0	10.0	100.0%	0		7.54s	699	102	5,552

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	8.2	7.2	88.9%	1		26.11s	594	196	1,767
Qwen3.6 Plus	10.0	10.0	100.0%	0		6.34s	696	309	6,712

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	8,079	228	542
Qwen3.6 Plus	10.0	10.0	100.0%	0		5.87s	8,193	267	1,330

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
DeepSeek V4 Flash	3.0	10.0	0.0%	0		54.46s	183	8,516	8,531
Qwen3.6 Plus	3.0	10.0	0.0%	0		47.51s	204	21	7,761

Vergleichspaar wechseln