#104
DeepSeek
Veröffentlichung: 2025-12-01
Getestet am: 2026-05-08 15:31
deepseek/deepseek-v3.2::none
(medium)
(none)
Eingabepreis
$0.252 / 1M
Ausgabepreis
$0.378 / 1M
Instabile Tests
5
Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).
Testverlauf
| Getestet am | Punktzahl | Zuverlässigkeit | Korrekte Tests | Gesamtkosten | Vergleichen |
|---|---|---|---|---|---|
| 2026-05-22 00:35 Suite geändert | 5.6 | 10.0 | $0.018 | Vergleichen | |
| 2026-05-08 15:31 Suite geändert | 5.7 | 10.0 | $0.016 | Aktueller Lauf | |
| 2026-04-20 17:48 Erster erfasster Lauf | 6.1 | k. A. | $0.016 | Vergleichen |
Dieser Lauf nutzte eine andere Benchmark-Suite. Berücksichtige Suite-Änderungen bei der historischen Einordnung.
Diagramme
Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.
Punktzahl vs Gesamtkosten
Antwortzeit (Durchschnitt)
Punktzahl vs Antwortzeit (Durchschnitt)
Gesamte Ausgabe-Token
Punktzahl vs Gesamte Ausgabe-Token
Schnellvergleich
DeepSeek V3.2nonevsGLM 5V TurbononeDeepSeek V3.2nonevsOwl AlphamediumDeepSeek V3.2nonevsQwen3.5-FlashnoneDeepSeek V3.2nonevsQwen3.5 Plus 2026-04-20noneDeepSeek V3.2nonevsNemotron 3 SupermediumKostenlos verfügbarDeepSeek V3.2nonevsQwen3.5-35B-A3BnoneDeepSeek V3.2nonevsGemini 3 Flash PreviewmediumDeepSeek V3.2nonevsGemini 3.5 FlashhighDeepSeek V3.2nonevsRing-2.6-1TmediumDeepSeek V3.2nonevsGemini 3.5 Flashlow
Kategorieaufschlüsselung
| Kategorie | Punktzahl | Konsistenz | Korrekte Tests |
|---|---|---|---|
| Anti-KI-Tricks | 3.3 | 8.2 | |
| Programmierung | 2.4 | 1.3 | |
| Kombiniert | 6.5 | 10.0 | |
| Datenanalyse und -extraktion | 6.3 | 5.8 | |
| Domänenspezifisch | 3.0 | 6.9 | |
| Allgemeine Intelligenz | 7.6 | 10.0 | |
| Befolgung von Anweisungen | 10.0 | 10.0 | |
| Rätsellösen | 7.5 | 7.7 | |
| Werkzeugaufrufe | 10.0 | 10.0 | |
| Allgemeinwissen | 3.0 | 10.0 |