Fehler-Ranking für Zeitüberschreitung

Sieh, bei welchen KI-Modellen Zeitüberschreitung besonders häufig auftritt, damit du Zuverlässigkeitsrisiken vor der Auswahl erkennst. Sortieren nach: Antwortzeit (Durchschnitt) ↓.

Angezeigte Modelle

Gesamtfehler

Am stärksten betroffenes Modell

Step 3.5 Flash 1

Kategorien

In der Kategorie Domänenspezifisch43 In der Kategorie Programmierung26 In der Kategorie Kombiniert5 In der Kategorie Rätsellösen5 In der Kategorie Allgemeine Intelligenz4 In der Kategorie Anti-KI-Tricks4 In der Kategorie Befolgung von Anweisungen1 In der Kategorie Datenanalyse und -extraktion1

44/44

Rang	Modell	Unternehmen	Zeitüberschreitung-Anzahl	Punktzahl	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#136	Step 3.5 Flash medium	Stepfun	1	6.0	$0.108	11/21	174.2s
Gesamttests 21 Falsche Tests 10 Gesamtkosten $0.108 Antwortzeit (Durchschnitt) 174.2s
#102	LongCat 2.0 high	Meituan	3	6.6	$0.469	9/22	148.7s
Gesamttests 22 Falsche Tests 13 Gesamtkosten $0.469 Antwortzeit (Durchschnitt) 148.7s
#200	GLM 4.7 Flash medium	Z.ai	2	4.3	$0.166	4/22	142.6s
Gesamttests 22 Falsche Tests 18 Gesamtkosten $0.166 Antwortzeit (Durchschnitt) 142.6s
#64	LongCat 2.0 medium	Meituan	1	7.4	$0.478	12/22	136.6s
Gesamttests 22 Falsche Tests 10 Gesamtkosten $0.478 Antwortzeit (Durchschnitt) 136.6s
#37	Kimi K3 max	Moonshot AI	2	8.0	$3.112	16/22	122.5s
Gesamttests 22 Falsche Tests 6 Gesamtkosten $3.112 Antwortzeit (Durchschnitt) 122.5s
#125	Qwen3.5-35B-A3B medium	Qwen	5	6.2	$0.837	11/22	112.5s
Gesamttests 22 Falsche Tests 11 Gesamtkosten $0.837 Antwortzeit (Durchschnitt) 112.5s
#62	Qwen3.5-27B medium	Qwen	1	7.4	$1.627	13/22	111.9s
Gesamttests 22 Falsche Tests 9 Gesamtkosten $1.627 Antwortzeit (Durchschnitt) 111.9s
#72	Kimi K2.6 medium	Moonshot AI	3	7.2	$1.036	12/22	110.0s
Gesamttests 22 Falsche Tests 10 Gesamtkosten $1.036 Antwortzeit (Durchschnitt) 110.0s
#100	Gemma 4 26B A4B medium	Google	2	6.6	$0.089	14/22	103.8s
Gesamttests 22 Falsche Tests 8 Gesamtkosten $0.089 Antwortzeit (Durchschnitt) 103.8s
#96	LongCat 2.0 low	Meituan	1	6.7	$0.391	10/22	100.3s
Gesamttests 22 Falsche Tests 12 Gesamtkosten $0.391 Antwortzeit (Durchschnitt) 100.3s
#81	Kimi K2.5 medium	Moonshot AI	2	7.0	$0.600	10/22	99.0s
Gesamttests 22 Falsche Tests 12 Gesamtkosten $0.600 Antwortzeit (Durchschnitt) 99.0s
#84	Seed-2.0-Mini medium	Bytedance Seed	5	7.0	$0.101	11/22	92.5s
Gesamttests 22 Falsche Tests 11 Gesamtkosten $0.101 Antwortzeit (Durchschnitt) 92.5s
#61	Qwen3.5 Plus 2026-02-15 medium	Qwen	2	7.5	$0.437	14/22	89.2s
Gesamttests 22 Falsche Tests 8 Gesamtkosten $0.437 Antwortzeit (Durchschnitt) 89.2s
#120	Qwen3.5-Flash medium	Qwen	3	6.2	$0.139	12/22	84.8s
Gesamttests 22 Falsche Tests 10 Gesamtkosten $0.139 Antwortzeit (Durchschnitt) 84.8s
#56	Kimi K2.7 Code medium	Moonshot AI	3	7.5	$0.740	12/22	84.2s
Gesamttests 22 Falsche Tests 10 Gesamtkosten $0.740 Antwortzeit (Durchschnitt) 84.2s

Zeitüberschreitung-Fehler

Modelle filtern

Top-Modelle nach Zeitüberschreitung-Anzahl

Zeitüberschreitung-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)