Modell-Ranking für Domänenspezifisch

AI BENCHY Kategorie

Sieh, welche KI-Modelle bei Domänenspezifisch am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Korrekte Tests ↓.

Angezeigte Modelle

Durchschnittlicher Wert für Domänenspezifisch-Score

4.8

Bestes Modell

Gemini 3 Flash Preview 10.0

Fehlergründe

Mit Fehlergrund Falsche Antwort314 Mit Fehlergrund Zeitüberschreitung34 Mit Fehlergrund Zusätzliche Formatierung12 Mit Fehlergrund API-Fehler6 Mit Fehlergrund Keine Antwort5 Mit Fehlergrund Anweisungen nicht befolgt1

Rang	Modell	Unternehmen	Domänenspezifisch-Score	Punktzahl	Korrekte Tests	Antwortzeit (Durchschnitt)
#89	Hy3 preview low	Tencent	5.9	6.4	1/3	40.4s
#92	Laguna M.1 medium	Poolside	5.3	6.4	1/3	24.1s
#94	GPT-5 Nano medium	OpenAI	5.2	6.3	1/3	204.0s
#95	Qwen3.5 Plus 2026-02-15 none	Qwen	5.3	6.3	1/3	1.17s
#96	Ring-2.6-1T none	Inclusionai	5.3	6.2	1/3	73.4s
#97	Gemini 2.5 Flash none	Google	5.9	6.2	1/3	495ms
#101	Mimo V2 Omni none	Xiaomi	5.3	6.0	1/3	2.10s
#104	Nemotron 3 Ultra 550b A55b none	NVIDIA	5.3	6.0	1/3	698ms
#109	GLM 5V Turbo none	Z.ai	5.3	5.8	1/3	2.09s
#111	Owl Alpha medium	Openrouter	5.3	5.7	1/3	8.58s
#113	DeepSeek V4 Pro none	DeepSeek	5.3	5.7	1/3	3.17s
#114	Qwen3.5 Plus 2026-04-20 none	Qwen	5.3	5.7	1/3	4.43s
#116	Hunter Alpha none	OpenRouter	5.3	5.7	1/3	2.33s
#120	Mimo V2 PRO none	Xiaomi	5.3	5.6	1/3	1.78s
#121	Owl Alpha none	Openrouter	5.3	5.5	1/3	3.00s

Domänenspezifisch-Ranking

Top-Modelle nach Domänenspezifisch-Score

Domänenspezifisch-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)