Claude Opus 4.6 (medium) vs DeepSeek V4 Flash (high)

Empfohlenes Modell DeepSeek V4 Flash (high)

Es hat hier die beste Punktzahl (7.7) und kostet etwa 51.1x weniger als Claude Opus 4.6 (medium).

Detaillierter Vergleich

Metrik	Claude Opus 4.6 Claude Opus 4.6 medium Veröffentlichung: 2026-02-05	DeepSeek V4 Flash DeepSeek V4 Flash high Veröffentlichung: 2026-04-24

Metrik	Claude Opus 4.6 Claude Opus 4.6 medium Veröffentlichung: 2026-02-05	DeepSeek V4 Flash DeepSeek V4 Flash high Veröffentlichung: 2026-04-24
Punktzahl	7.7	7.7
Rang	#51	#53
Zuverlässigkeit	10.0	10.0
Konsistenz	8.8	8.2
Korrekte Tests
Erfolgsquote pro Versuch	63.6%	72.7%
Instabile Tests	3	5
Gesamtläufe	66	66
Kosten pro Ergebnis	23.524	0.402
Gesamtkosten	$3.059	$0.060
Eingabepreis	$5.000 / 1M	$0.140 / 1M
Ausgabepreis	$25.000 / 1M	$0.280 / 1M
Gesamte Eingabe-Token	108,615	108,392
Ausgabe-Token	72,286	14,478
Denk-Token	28,315	153,687
Antwortzeit (Durchschnitt)	34.27s	49.75s
Antwortzeit (Maximum)	151.51s	218.13s
Antwortzeit (Gesamt)	513.99s	1094.41s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

Ungültiges SVG

high

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.6	6.4	5.8	66.7%	2		7.45s	840	986	1,071
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	540	140	7,770

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.6	5.7	7.1	44.4%	1		30.10s	8,522	13,057	4,121
DeepSeek V4 Flash	7.8	10.0	66.7%	0		50.60s	7,279	395	34,862

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.6	10.0	10.0	100.0%	0		114.08s	76,073	33,018	9,509
DeepSeek V4 Flash	6.4	5.8	66.7%	1		104.10s	82,663	4,633	37,533

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.6	10.0	10.0	100.0%	0		7.37s	8,676	691	757
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	7,290	201	1,179

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.6	3.0	10.0	0.0%	0		83.40s	674	14,642	8,687
DeepSeek V4 Flash	4.1	4.4	44.5%	2		100.31s	666	27	59,249

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.6	10.0	10.0	100.0%	0		5.04s	564	188	292
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	471	79	632

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.6	10.0	10.0	100.0%	0		2.43s	792	266	467
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	627	63	1,622

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.6	7.7	10.0	66.7%	0		4.71s	816	532	630
DeepSeek V4 Flash	8.2	7.2	88.9%	1		26.11s	594	196	1,767

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.6	10.0	10.0	100.0%	0		9.73s	11,454	861	329
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	8,079	228	542

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.6	3.0	10.0	0.0%	0		63.24s	204	8,045	2,452
DeepSeek V4 Flash	3.0	10.0	0.0%	0		54.46s	183	8,516	8,531

Vergleichspaar wechseln