Modell-Ranking für Domänenspezifisch

AI BENCHY Kategorie

Sieh, welche KI-Modelle bei Domänenspezifisch am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Metrik ↑.

Angezeigte Modelle

Durchschnittlicher Wert für Domänenspezifisch-Score

4.8

Bestes Modell

GLM 5 Turbo 2.9

Fehlergründe

Mit Fehlergrund Falsche Antwort325 Mit Fehlergrund Zeitüberschreitung36 Mit Fehlergrund Zusätzliche Formatierung13 Mit Fehlergrund Keine Antwort6 Mit Fehlergrund API-Fehler5 Mit Fehlergrund Anweisungen nicht befolgt1

169/169

Rang	Modell	Unternehmen	Domänenspezifisch-Score	Punktzahl	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#106	Qwen3.5 Plus 2026-02-15 none	Qwen	5.3	5.8	$0.016	1/3	1.17s
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.016 Antwortzeit (Durchschnitt) 1.17s
#108	Owl Alpha medium	Openrouter	5.3	5.8	$0.000	1/3	8.58s
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.000 Antwortzeit (Durchschnitt) 8.58s
#110	Owl Alpha none	Openrouter	5.3	5.8	$0.000	1/3	3.00s
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.000 Antwortzeit (Durchschnitt) 3.00s
#114	Mimo V2 Omni none	Xiaomi	5.3	5.7	$0.021	1/3	2.10s
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.021 Antwortzeit (Durchschnitt) 2.10s
#117	DeepSeek V4 Flash none	DeepSeek	5.3	5.5	$0.007	1/3	19.7s
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.007 Antwortzeit (Durchschnitt) 19.7s
#118	Kimi K2.5 none	Moonshot AI	5.3	5.5	$0.027	1/3	4.38s
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.027 Antwortzeit (Durchschnitt) 4.38s
#119	MiMo-V2.5-Pro none	Xiaomi	5.3	5.5	$0.017	1/3	877ms
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.017 Antwortzeit (Durchschnitt) 877ms
#122	Qwen3.5 Plus 2026-04-20 none	Qwen	5.3	5.5	$0.032	1/3	4.43s
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.032 Antwortzeit (Durchschnitt) 4.43s
#123	GLM 5 Turbo none	Z.ai	5.3	5.3	$0.047	1/3	1.97s
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.047 Antwortzeit (Durchschnitt) 1.97s
#125	Qwen3.5-122B-A10B none	Qwen	5.3	5.3	$0.020	1/3	465ms
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.020 Antwortzeit (Durchschnitt) 465ms
#129	Mistral Small 4 none	Mistral	5.3	5.1	$0.007	1/3	367ms
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.007 Antwortzeit (Durchschnitt) 367ms
#130	Qwen3 Coder Next none	Qwen	5.3	5.1	$0.009	1/3	962ms
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.009 Antwortzeit (Durchschnitt) 962ms
#137	Trinity Large Preview none	Arcee AI	5.3	5.0	$0.008	1/3	877ms
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.008 Antwortzeit (Durchschnitt) 877ms
#148	Qwen3 Coder Next medium	Qwen	5.3	4.7	$0.008	1/3	638ms
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.008 Antwortzeit (Durchschnitt) 638ms
#154	Hunter Alpha none	OpenRouter	5.3	4.5	$0.000	1/3	2.33s
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.000 Antwortzeit (Durchschnitt) 2.33s

Domänenspezifisch-Ranking

Modelle filtern

Top-Modelle nach Domänenspezifisch-Score

Domänenspezifisch-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)