Fehler-Ranking für Zeitüberschreitung

Sieh, bei welchen KI-Modellen Zeitüberschreitung besonders häufig auftritt, damit du Zuverlässigkeitsrisiken vor der Auswahl erkennst. Sortieren nach: Antwortzeit (Durchschnitt) ↓.

Angezeigte Modelle

Gesamtfehler

Am stärksten betroffenes Modell

Step 3.5 Flash 1

Kategorien

In der Kategorie Domänenspezifisch43 In der Kategorie Programmierung26 In der Kategorie Kombiniert5 In der Kategorie Rätsellösen5 In der Kategorie Allgemeine Intelligenz4 In der Kategorie Anti-KI-Tricks4 In der Kategorie Befolgung von Anweisungen1 In der Kategorie Datenanalyse und -extraktion1

44/44

Rang	Modell	Unternehmen	Zeitüberschreitung-Anzahl	Punktzahl	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#210	Qwen3.5-9B medium	Qwen	12	3.8	$0.036	3/22	82.2s
Gesamttests 22 Falsche Tests 19 Gesamtkosten $0.036 Antwortzeit (Durchschnitt) 82.2s
#50	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
Gesamttests 22 Falsche Tests 12 Gesamtkosten $0.200 Antwortzeit (Durchschnitt) 79.1s
#116	Gemma 4 31B medium	Google	2	6.3	$0.107	14/22	75.4s
Gesamttests 22 Falsche Tests 8 Gesamtkosten $0.107 Antwortzeit (Durchschnitt) 75.4s
#51	MiniMax M3 medium	Minimax	3	7.6	$0.286	12/22	75.0s
Gesamttests 22 Falsche Tests 10 Gesamtkosten $0.286 Antwortzeit (Durchschnitt) 75.0s
#80	DeepSeek V3.2 medium	DeepSeek	2	7.0	$0.078	11/22	68.6s
Gesamttests 22 Falsche Tests 11 Gesamtkosten $0.078 Antwortzeit (Durchschnitt) 68.6s
#196	MiniMax M2.5 medium	Minimax	4	4.6	$0.340	5/22	68.3s
Gesamttests 22 Falsche Tests 17 Gesamtkosten $0.340 Antwortzeit (Durchschnitt) 68.3s
#22	Qwen3.6 Max Preview medium	Qwen	1	8.4	$1.143	16/22	67.5s
Gesamttests 22 Falsche Tests 6 Gesamtkosten $1.143 Antwortzeit (Durchschnitt) 67.5s
#76	Qwen3.5-122B-A10B medium	Qwen	2	7.1	$1.046	14/22	64.2s
Gesamttests 22 Falsche Tests 8 Gesamtkosten $1.046 Antwortzeit (Durchschnitt) 64.2s
#35	GLM 5.2 high	Z.ai	3	8.0	$0.817	14/22	62.7s
Gesamttests 22 Falsche Tests 8 Gesamtkosten $0.817 Antwortzeit (Durchschnitt) 62.7s
#134	GPT-5 Nano medium	OpenAI	1	6.1	$0.114	9/22	54.9s
Gesamttests 22 Falsche Tests 13 Gesamtkosten $0.114 Antwortzeit (Durchschnitt) 54.9s
#146	Nemotron 3 Super medium	NVIDIA	1	5.7	$0.055	8/22	52.0s
Gesamttests 22 Falsche Tests 14 Gesamtkosten $0.055 Antwortzeit (Durchschnitt) 52.0s
#40	Qwen3.7 Plus medium	Qwen	1	7.9	$0.267	15/22	51.5s
Gesamttests 22 Falsche Tests 7 Gesamtkosten $0.267 Antwortzeit (Durchschnitt) 51.5s
#78	GLM 5.1 medium	Z.ai	2	7.1	$0.535	13/22	46.8s
Gesamttests 22 Falsche Tests 9 Gesamtkosten $0.535 Antwortzeit (Durchschnitt) 46.8s
#74	Qwen3.5 Plus 2026-04-20 medium	Qwen	1	7.2	$0.317	13/22	46.4s
Gesamttests 22 Falsche Tests 9 Gesamtkosten $0.317 Antwortzeit (Durchschnitt) 46.4s
#178	MiniMax M2.7 medium	Minimax	2	5.0	$0.163	5/22	41.3s
Gesamttests 22 Falsche Tests 17 Gesamtkosten $0.163 Antwortzeit (Durchschnitt) 41.3s

Zeitüberschreitung-Fehler

Modelle filtern

Top-Modelle nach Zeitüberschreitung-Anzahl

Zeitüberschreitung-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)