Modell-Ranking für Domänenspezifisch

AI BENCHY Kategorie

Sieh, welche KI-Modelle bei Domänenspezifisch am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Antwortzeit (Durchschnitt) ↓.

Angezeigte Modelle

Durchschnittlicher Wert für Domänenspezifisch-Score

4.8

Bestes Modell

MiniMax M2.5 2.9

Fehlergründe

Mit Fehlergrund Falsche Antwort314 Mit Fehlergrund Zeitüberschreitung34 Mit Fehlergrund Zusätzliche Formatierung12 Mit Fehlergrund API-Fehler6 Mit Fehlergrund Keine Antwort5 Mit Fehlergrund Anweisungen nicht befolgt1

Rang	Modell	Unternehmen	Domänenspezifisch-Score	Punktzahl	Korrekte Tests	Antwortzeit (Durchschnitt)
#155	Mercury 2 none	Inception	5.3	4.5	1/3	534ms
#97	Gemini 2.5 Flash none	Google	5.9	6.2	1/3	495ms
#162	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.6	4.1	0/3	489ms
#117	Qwen3.5-35B-A3B none	Qwen	7.7	5.6	2/3	485ms
#131	Qwen3.5-122B-A10B none	Qwen	5.3	5.3	1/3	465ms
#154	Qwen3.5-9B none	Qwen	3.0	4.6	0/3	464ms
#146	Laguna Xs.2 none	Poolside	5.3	4.8	1/3	371ms
#142	Mistral Small 4 none	Mistral	5.3	4.9	1/3	367ms
#163	Granite 4.1 8B none	IBM Granite	3.0	4.0	0/3	357ms
#160	LFM2-24B-A2B none	Liquid	5.9	4.2	1/3	287ms
#17	GLM 5 medium	Z.ai	3.5	8.3	0/3	0ms
#52	Claude Sonnet 4.6 medium	Anthropic	2.9	7.4	0/3	0ms
#73	Seed-2.0-Mini medium	Bytedance Seed	3.0	6.9	0/3	0ms

Domänenspezifisch-Ranking

Top-Modelle nach Domänenspezifisch-Score

Domänenspezifisch-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)