Fehler-Ranking für Zeitüberschreitung

Sieh, bei welchen KI-Modellen Zeitüberschreitung besonders häufig auftritt, damit du Zuverlässigkeitsrisiken vor der Auswahl erkennst. Sortieren nach: Punktzahl ↑.

Angezeigte Modelle

Gesamtfehler

Am stärksten betroffenes Modell

Qwen3.5-9B 12

Kategorien

In der Kategorie Domänenspezifisch43 In der Kategorie Programmierung26 In der Kategorie Kombiniert5 In der Kategorie Rätsellösen5 In der Kategorie Allgemeine Intelligenz4 In der Kategorie Anti-KI-Tricks4 In der Kategorie Befolgung von Anweisungen1 In der Kategorie Datenanalyse und -extraktion1

44/44

Rang	Modell	Unternehmen	Zeitüberschreitung-Anzahl	Punktzahl	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#210	Qwen3.5-9B medium	Qwen	12	3.8	$0.036	3/22	82.2s
Gesamttests 22 Falsche Tests 19 Gesamtkosten $0.036 Antwortzeit (Durchschnitt) 82.2s
#200	GLM 4.7 Flash medium	Z.ai	2	4.3	$0.166	4/22	142.6s
Gesamttests 22 Falsche Tests 18 Gesamtkosten $0.166 Antwortzeit (Durchschnitt) 142.6s
#196	MiniMax M2.5 medium	Minimax	4	4.6	$0.340	5/22	68.3s
Gesamttests 22 Falsche Tests 17 Gesamtkosten $0.340 Antwortzeit (Durchschnitt) 68.3s
#193	Qwen3 Coder Next medium	Qwen	1	4.7	$0.032	4/22	9.61s
Gesamttests 22 Falsche Tests 18 Gesamtkosten $0.032 Antwortzeit (Durchschnitt) 9.61s
#191	Grok 4.1 Fast medium	X AI	1	4.7	$0.069	9/19	23.8s
Gesamttests 19 Falsche Tests 10 Gesamtkosten $0.069 Antwortzeit (Durchschnitt) 23.8s
#190	Hunter Alpha medium	OpenRouter	2	4.7	$0.000	8/18	10.3s
Gesamttests 18 Falsche Tests 10 Gesamtkosten $0.000 Antwortzeit (Durchschnitt) 10.3s
#178	MiniMax M2.7 medium	Minimax	2	5.0	$0.163	5/22	41.3s
Gesamttests 22 Falsche Tests 17 Gesamtkosten $0.163 Antwortzeit (Durchschnitt) 41.3s
#166	Laguna XS 2.1 none	Poolside	1	5.3	$0.008	5/22	1.55s
Gesamttests 22 Falsche Tests 17 Gesamtkosten $0.008 Antwortzeit (Durchschnitt) 1.55s
#162	Gemma 4 26B A4B none	Google	1	5.5	$0.015	8/22	7.64s
Gesamttests 22 Falsche Tests 14 Gesamtkosten $0.015 Antwortzeit (Durchschnitt) 7.64s
#146	Nemotron 3 Super medium	NVIDIA	1	5.7	$0.055	8/22	52.0s
Gesamttests 22 Falsche Tests 14 Gesamtkosten $0.055 Antwortzeit (Durchschnitt) 52.0s
#136	Step 3.5 Flash medium	Stepfun	1	6.0	$0.108	11/21	174.2s
Gesamttests 21 Falsche Tests 10 Gesamtkosten $0.108 Antwortzeit (Durchschnitt) 174.2s
#134	GPT-5 Nano medium	OpenAI	1	6.1	$0.114	9/22	54.9s
Gesamttests 22 Falsche Tests 13 Gesamtkosten $0.114 Antwortzeit (Durchschnitt) 54.9s
#125	Qwen3.5-35B-A3B medium	Qwen	5	6.2	$0.837	11/22	112.5s
Gesamttests 22 Falsche Tests 11 Gesamtkosten $0.837 Antwortzeit (Durchschnitt) 112.5s
#120	Qwen3.5-Flash medium	Qwen	3	6.2	$0.139	12/22	84.8s
Gesamttests 22 Falsche Tests 10 Gesamtkosten $0.139 Antwortzeit (Durchschnitt) 84.8s
#119	MiMo-V2-Flash medium	Xiaomi	1	6.3	$0.043	12/21	20.1s
Gesamttests 21 Falsche Tests 9 Gesamtkosten $0.043 Antwortzeit (Durchschnitt) 20.1s

Zeitüberschreitung-Fehler

Modelle filtern

Top-Modelle nach Zeitüberschreitung-Anzahl

Zeitüberschreitung-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)