#47
DeepSeek
Veröffentlichung: 2026-04-24
Getestet am: 2026-04-26 10:50
deepseek/deepseek-v4-pro::high
(high)
(none)
Eingabepreis
$1.740 / 1M
Ausgabepreis
$3.480 / 1M
Instabile Tests
4
Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).
Testverlauf
| Getestet am | Punktzahl | Zuverlässigkeit | Korrekte Tests | Gesamtkosten | Vergleichen |
|---|---|---|---|---|---|
| 2026-05-22 00:54 Suite geändert | 6.6 | 9.0 | $0.212 | Vergleichen | |
| 2026-04-29 14:47 Erneuter Test | 7.5 | 9.3 | $0.209 | Vergleichen | |
| 2026-04-26 10:50 Erneuter Test | 7.5 | 8.4 | $0.201 | Aktueller Lauf | |
| 2026-04-25 21:53 Erster Lauf | 8.2 | k. A. | $0.329 | Vergleichen |
Diagramme
Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.
Punktzahl vs Gesamtkosten
Antwortzeit (Durchschnitt)
Punktzahl vs Antwortzeit (Durchschnitt)
Gesamte Ausgabe-Token
Punktzahl vs Gesamte Ausgabe-Token
Schnellvergleich
DeepSeek V4 ProhighvsSeed-2.0-MinimediumDeepSeek V4 ProhighvsQwen3.5-35B-A3BmediumDeepSeek V4 ProhighvsMiMo-V2-FlashmediumDeepSeek V4 ProhighvsDeepSeek V3.2mediumDeepSeek V4 ProhighvsQwen3.6 Max PreviewnoneDeepSeek V4 ProhighvsMiMo-V2-OmnimediumDeepSeek V4 ProhighvsGemini 3 Flash PreviewmediumDeepSeek V4 ProhighvsGemini 3.5 FlashhighDeepSeek V4 ProhighvsRing-2.6-1TmediumDeepSeek V4 ProhighvsGemini 3.5 Flashlow
Kategorieaufschlüsselung
| Kategorie | Punktzahl | Konsistenz | Korrekte Tests |
|---|---|---|---|
| Anti-KI-Tricks | 8.3 | 10.0 | |
| Programmierung | 3.0 | 0.0 | |
| Kombiniert | 10.0 | 10.0 | |
| Datenanalyse und -extraktion | 10.0 | 10.0 | |
| Domänenspezifisch | 3.2 | 6.9 | |
| Allgemeine Intelligenz | 6.1 | 3.1 | |
| Befolgung von Anweisungen | 10.0 | 10.0 | |
| Rätsellösen | 8.0 | 7.0 | |
| Werkzeugaufrufe | 10.0 | 10.0 |