Modell-Ranking für Domänenspezifisch

Sieh, welche KI-Modelle bei Domänenspezifisch am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen.

Angezeigte Modelle

Durchschnittlicher Wert für Domänenspezifisch-Score

4.7

Bestes Modell

Gemini 3 Flash Preview 10.0

Fehlergründe

Mit Fehlergrund Falsche Antwort404 Mit Fehlergrund Zeitüberschreitung39 Mit Fehlergrund Zusätzliche Formatierung17 Mit Fehlergrund Keine Antwort8 Mit Fehlergrund API-Fehler7 Mit Fehlergrund Anweisungen nicht befolgt1

206/206

Rang	Modell	Unternehmen	Domänenspezifisch-Score	Punktzahl	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#1	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	3/3	15.3s
Gesamttests 3 Falsche Tests 0 Gesamtkosten $0.742 Antwortzeit (Durchschnitt) 15.3s
#87	Gemini 3.5 Flash minimal	Google	10.0	6.8	$0.300	3/3	899ms
Gesamttests 3 Falsche Tests 0 Gesamtkosten $0.300 Antwortzeit (Durchschnitt) 899ms
#7	Gemini 3.1 Pro Preview medium	Google	7.7	9.2	$1.361	2/3	32.7s
Gesamttests 3 Falsche Tests 1 Gesamtkosten $1.361 Antwortzeit (Durchschnitt) 32.7s
#9	Gemini 3.5 Flash medium	Google	7.7	9.1	$0.642	2/3	5.24s
Gesamttests 3 Falsche Tests 1 Gesamtkosten $0.642 Antwortzeit (Durchschnitt) 5.24s
#11	Gemini 3.5 Flash low	Google	7.7	8.9	$0.433	2/3	3.39s
Gesamttests 3 Falsche Tests 1 Gesamtkosten $0.433 Antwortzeit (Durchschnitt) 3.39s
#15	Claude Opus 4.7 medium	Anthropic	7.7	8.7	$1.477	2/3	1.17s
Gesamttests 3 Falsche Tests 1 Gesamtkosten $1.477 Antwortzeit (Durchschnitt) 1.17s
#23	Claude Sonnet 5 medium	Anthropic	7.7	8.3	$0.922	2/3	20.4s
Gesamttests 3 Falsche Tests 1 Gesamtkosten $0.922 Antwortzeit (Durchschnitt) 20.4s
#28	Inkling high	Thinkingmachines	7.7	8.0	$1.006	2/3	186.4s
Gesamttests 3 Falsche Tests 1 Gesamtkosten $1.006 Antwortzeit (Durchschnitt) 186.4s
#29	Step 3.7 Flash medium	Stepfun	7.7	8.0	$0.515	2/3	48.3s
Gesamttests 3 Falsche Tests 1 Gesamtkosten $0.515 Antwortzeit (Durchschnitt) 48.3s
#44	GPT-5.6 Luna high	OpenAI	7.7	7.7	$1.017	2/3	79.0s
Gesamttests 3 Falsche Tests 1 Gesamtkosten $1.017 Antwortzeit (Durchschnitt) 79.0s
#59	Qwen3.7 Max none	Qwen	7.7	7.4	$0.197	2/3	975ms
Gesamttests 3 Falsche Tests 1 Gesamtkosten $0.197 Antwortzeit (Durchschnitt) 975ms
#62	Claude Sonnet 4.6 none	Anthropic	7.7	7.3	$0.661	2/3	3.54s
Gesamttests 3 Falsche Tests 1 Gesamtkosten $0.661 Antwortzeit (Durchschnitt) 3.54s
#88	Gemini 3 Flash Preview none	Google	7.7	6.8	$0.085	2/3	963ms
Gesamttests 3 Falsche Tests 1 Gesamtkosten $0.085 Antwortzeit (Durchschnitt) 963ms
#92	Claude Opus 4.7 none	Anthropic	7.7	6.6	$0.505	2/3	1.19s
Gesamttests 3 Falsche Tests 1 Gesamtkosten $0.505 Antwortzeit (Durchschnitt) 1.19s
#95	Qwen3.6 Max Preview none	Qwen	7.7	6.6	$0.231	2/3	1.22s
Gesamttests 3 Falsche Tests 1 Gesamtkosten $0.231 Antwortzeit (Durchschnitt) 1.22s

Domänenspezifisch-Ranking

Modelle filtern

Top-Modelle nach Domänenspezifisch-Score

Domänenspezifisch-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)