#31

DeepSeek V3.2

DeepSeek Veröffentlichung: 2025-12-01 Getestet am: 2026-04-20 17:48 deepseek/deepseek-v3.2::medium

(medium) (none)

Zusammenfassung

DeepSeek V3.2 erreicht 8.0 bei AI BENCHY und liegt auf #31. Das Modell hat k. A. Zuverlässigkeit, 79.6% Erfolgsrate, $0.029 Gesamtkosten und 46.41s durchschnittliche Antwortzeit.

Was DeepSeek V3.2 besonders macht: Die Benchmark-Gesamtkosten sind für diese Leistungsklasse ungewöhnlich niedrig.

Punktzahl

8.0

Konsistenz

8.2

Zuverlässigkeit

k. A.

Gesamtkosten (aktueller Preis)

$0.029

Gesamte Ausgabe-Token

59,131

Gesamte Eingabe-Token

Eingabepreis

$0.252 / 1M

Ausgabepreis

$0.378 / 1M

Korrekte Tests

Falsche Tests: 6

Erfolgsquote pro Versuch: 79.6%

Instabile Tests

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

46.41s

Antwortzeit (Maximum): 180.92s

Antwortzeit (Gesamt): 835.33s

Falsche Antwort: 3 Zeitüberschreitung: 2 Anweisungen nicht befolgt: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#31 DeepSeek V3.2

medium

Kosten: $0.001
Zeit: 53.6s
Token: 1,932 tok

Testverlauf

Getestet am	Punktzahl	Zuverlässigkeit	Gesamtkosten	Vergleichen
2026-07-16 23:13 Neuer Test hinzugefügt	7.0	10.0	$0.078 ↑	Vergleichen
2026-06-04 14:41 Neuer Test hinzugefügt	7.0	10.0	$0.044 ↓	Vergleichen
2026-05-22 00:46 Suite geändert	7.0	9.1	$0.037	Vergleichen
2026-05-08 15:27 Suite geändert	7.2	10.0	$0.031	Vergleichen
2026-04-20 17:48 Erster erfasster Lauf	8.0	k. A.	$0.029	Aktueller Lauf

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

DeepSeek V3.2mediumvsGLM 5.1medium DeepSeek V3.2mediumvsGrok 4.3medium DeepSeek V3.2mediumvsKimi K2.5medium DeepSeek V3.2mediumvsQwen3.5-122B-A10Bmedium DeepSeek V3.2mediumvsMercury 2medium DeepSeek V3.2mediumvsGemini 3 Flash Previewmedium DeepSeek V3.2mediumvsGemini 3.5 Flashhigh DeepSeek V3.2mediumvsNemotron 3 UltramediumKostenlos verfügbar DeepSeek V3.2mediumvsGPT-5.5low

Kategorieaufschlüsselung

Kategorie	Punktzahl	Konsistenz
Anti-KI-Tricks	8.4	9.9
Programmierung	4.7	1.6
Kombiniert	10.0	10.0
Datenanalyse und -extraktion	10.0	10.0
Domänenspezifisch	5.3	7.2
Allgemeine Intelligenz	5.4	2.5
Befolgung von Anweisungen	10.0	10.0
Rätsellösen	8.2	7.2
Werkzeugaufrufe	10.0	10.0

DeepSeek V3.2

Hamster playing table tennis

#31 DeepSeek V3.2

Diagramme

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Kategorieaufschlüsselung

Verglichene Modelle