Modell-Ranking für Domänenspezifisch

AI BENCHY Kategorie

Sieh, welche KI-Modelle bei Domänenspezifisch am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Antwortzeit (Durchschnitt) ↑.

Angezeigte Modelle

Durchschnittlicher Wert für Domänenspezifisch-Score

4.8

Bestes Modell

GLM 5 3.5

Fehlergründe

Mit Fehlergrund Falsche Antwort314 Mit Fehlergrund Zeitüberschreitung34 Mit Fehlergrund Zusätzliche Formatierung12 Mit Fehlergrund API-Fehler6 Mit Fehlergrund Keine Antwort5 Mit Fehlergrund Anweisungen nicht befolgt1

Rang	Modell	Unternehmen	Domänenspezifisch-Score	Punktzahl	Korrekte Tests	Antwortzeit (Durchschnitt)
#91	GPT-5.5 none	OpenAI	2.9	6.4	0/3	1.31s
#110	Seed-2.0-Lite none	Bytedance Seed	3.6	5.8	0/3	1.33s
#124	Kimi K2.6 none	Moonshot AI	5.3	5.5	1/3	1.48s
#61	Gemini 3.1 Flash Lite low	Google	5.3	7.2	1/3	1.52s
#68	Claude Opus 4.8 none	Anthropic	5.3	7.0	1/3	1.66s
#120	Mimo V2 PRO none	Xiaomi	5.3	5.6	1/3	1.78s
#134	GLM 5 Turbo none	Z.ai	5.3	5.2	1/3	1.97s
#112	GLM 5.1 none	Z.ai	2.9	5.7	0/3	1.99s
#109	GLM 5V Turbo none	Z.ai	5.3	5.8	1/3	2.09s
#101	Mimo V2 Omni none	Xiaomi	5.3	6.0	1/3	2.10s
#98	GLM 5 none	Z.ai	3.0	6.1	0/3	2.24s
#116	Hunter Alpha none	OpenRouter	5.3	5.7	1/3	2.33s
#50	Gemini 3.1 Flash Lite Preview low	Google	5.3	7.4	1/3	2.36s
#102	Gemma 4 26B A4B none	Google	3.6	6.0	0/3	2.49s
#121	Owl Alpha none	Openrouter	5.3	5.5	1/3	3.00s

Domänenspezifisch-Ranking

Top-Modelle nach Domänenspezifisch-Score

Domänenspezifisch-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)