Modell-Ranking für Allgemeinwissen

AI BENCHY Kategorie

Sieh, welche KI-Modelle bei Allgemeinwissen am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Metrik ↑.

Angezeigte Modelle

Durchschnittlicher Wert für Allgemeinwissen-Score

3.1

Bestes Modell

Grok 4.20 Beta 0.0

Fehlergründe

Mit Fehlergrund Falsche Antwort133 Mit Fehlergrund API-Fehler13 Mit Fehlergrund Keine Antwort8

169/169

Rang	Modell	Unternehmen	Allgemeinwissen-Score	Punktzahl	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#156	Laguna Xs.2 medium	Poolside	3.0	4.3	$0.000	0/1	0ms
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.000 Antwortzeit (Durchschnitt) 0ms
#157	GLM 4.7 Flash medium	Z.ai	3.0	4.3	$0.054	0/1	11.1s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.054 Antwortzeit (Durchschnitt) 11.1s
#158	Hy3 preview none	Tencent	3.0	4.3	$0.003	0/1	2.71s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.003 Antwortzeit (Durchschnitt) 2.71s
#159	MiMo-V2-Flash none	Xiaomi	3.0	4.3	$0.025	0/1	1.82s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.025 Antwortzeit (Durchschnitt) 1.82s
#160	Grok Build 0.1 none	X AI	3.0	4.2	$0.547	0/1	36.1s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.547 Antwortzeit (Durchschnitt) 36.1s
#161	Grok 4.1 Fast none	X AI	3.0	4.0	$0.008	0/1	731ms
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.008 Antwortzeit (Durchschnitt) 731ms
#162	Laguna Xs.2 none	Poolside	3.0	4.0	$0.000	0/1	0ms
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.000 Antwortzeit (Durchschnitt) 0ms
#163	Granite 4.1 8B none	IBM Granite	3.0	4.0	$0.003	0/1	306ms
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.003 Antwortzeit (Durchschnitt) 306ms
#164	gpt-oss-120b none	OpenAI	3.0	4.0	$0.010	0/1	47.3s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.010 Antwortzeit (Durchschnitt) 47.3s
#165	Qwen3.5-9B medium	Qwen	3.0	3.8	$0.036	0/1	177.0s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.036 Antwortzeit (Durchschnitt) 177.0s
#166	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	3.0	3.6	$0.000	0/1	0ms
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.000 Antwortzeit (Durchschnitt) 0ms
#167	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.0	3.5	$0.000	0/1	0ms
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.000 Antwortzeit (Durchschnitt) 0ms
#168	Step 3.5 Flash none	Stepfun	3.0	2.6	$0.020	0/1	114.1s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.020 Antwortzeit (Durchschnitt) 114.1s
#1	Gemini 3.5 Flash high	Google	10.0	9.8	$1.115	1/1	3.94s
Gesamttests 1 Falsche Tests 0 Gesamtkosten $1.115 Antwortzeit (Durchschnitt) 3.94s
#2	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.667	1/1	5.50s
Gesamttests 1 Falsche Tests 0 Gesamtkosten $0.667 Antwortzeit (Durchschnitt) 5.50s

Allgemeinwissen-Ranking

Modelle filtern

Top-Modelle nach Allgemeinwissen-Score

Allgemeinwissen-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)