AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Owl Alpha

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-04-30

Metrik	DeepSeek V3.2 DeepSeek V3.2 none Veröffentlichung: 2025-12-01	Owl Alpha Owl Alpha none Veröffentlichung: 2026-04-30

Metrik	DeepSeek V3.2 DeepSeek V3.2 none Veröffentlichung: 2025-12-01	Owl Alpha Owl Alpha none Veröffentlichung: 2026-04-30
Punktzahl	6.0	6.0
Rang	#85	#87
Zuverlässigkeit	k. A.	10.0
Konsistenz	8.6	9.1
Korrekte Tests
Erfolgsquote pro Versuch	46.3%	46.3%
Instabile Tests	3	2
Gesamtläufe	52	54
Kosten pro Ergebnis	0.225	0.000
Gesamtkosten	$0.016	$0.000
Eingabepreis	$0.252 / 1M	$0.000 / 1M
Ausgabepreis	$0.378 / 1M	$0.000 / 1M
Ausgabe-Token	8,378	1,671
Denk-Token	0	0
Antwortzeit (Durchschnitt)	12.07s	7.07s
Antwortzeit (Maximum)	115.89s	32.27s
Antwortzeit (Gesamt)	217.28s	127.23s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	3.2	9.8	0.0%	0		7.63s	1,419	0
Owl Alpha	3.4	7.9	16.7%	1		2.78s	57	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	2.4	1.3	33.3%	1		7.63s	553	0
Owl Alpha	10.0	10.0	100.0%	0		32.27s	450	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
Owl Alpha	3.0	10.0	0.0%	0		21.74s	315	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
Owl Alpha	10.0	10.0	100.0%	0		3.60s	246	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	3.0	10.0	0.0%	0		1.52s	18	0
Owl Alpha	5.3	10.0	33.3%	0		3.00s	27	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	10.0	10.0	100.0%	0		2.86s	67	0
Owl Alpha	4.3	10.0	0.0%	0		4.61s	80	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
Owl Alpha	6.4	10.0	50.0%	0		2.63s	63	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	8.5	7.5	88.9%	1		7.37s	1,136	0
Owl Alpha	5.9	7.2	55.6%	1		4.43s	202	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
Owl Alpha	10.0	10.0	100.0%	0		22.78s	231	0

Schnellvergleich

Vergleichspaar wechseln

gpt-oss-120bmediumKostenlos verfügbarvsOwl Alphanone DeepSeek V3.2nonevsLaguna Xs.2mediumKostenlos verfügbar DeepSeek V3.2nonevsgpt-oss-120bmediumKostenlos verfügbar DeepSeek V3.2nonevsOwl Alphamedium Owl AlphanonevsLaguna Xs.2mediumKostenlos verfügbar Mistral Small 4mediumvsOwl Alphanone DeepSeek V3.2nonevsLaguna M.1mediumKostenlos verfügbar MiniMax M2.5mediumKostenlos verfügbarvsOwl Alphanone DeepSeek V3.2nonevsMistral Small 4medium Owl AlphanonevsLaguna M.1mediumKostenlos verfügbar DeepSeek V3.2nonevsMiniMax M2.5mediumKostenlos verfügbar DeepSeek V3.2nonevsGPT-5 Nanomedium