Modell-Ranking für Allgemeinwissen

AI BENCHY Kategorie

Sieh, welche KI-Modelle bei Allgemeinwissen am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Gesamtkosten ↓.

Angezeigte Modelle

Durchschnittlicher Wert für Allgemeinwissen-Score

3.1

Bestes Modell

Grok 4.20 Multi Agent Beta 0.0

Fehlergründe

Mit Fehlergrund Falsche Antwort133 Mit Fehlergrund API-Fehler13 Mit Fehlergrund Keine Antwort8

169/169

Rang	Modell	Unternehmen	Allgemeinwissen-Score	Punktzahl	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#109	Mimo V2 PRO none	Xiaomi	3.0	5.8	$0.045	0/1	1.63s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.045 Antwortzeit (Durchschnitt) 1.63s
#59	Gemma 4 26B A4B medium	Google	3.0	7.2	$0.045	0/1	180.9s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.045 Antwortzeit (Durchschnitt) 180.9s
#48	DeepSeek V3.2 medium	DeepSeek	3.0	7.5	$0.044	0/1	84.0s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.044 Antwortzeit (Durchschnitt) 84.0s
#50	Seed-2.0-Mini medium	Bytedance Seed	3.0	7.4	$0.044	0/1	56.8s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.044 Antwortzeit (Durchschnitt) 56.8s
#62	MiMo-V2-Flash medium	Xiaomi	3.0	7.1	$0.043	0/1	1.96s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.043 Antwortzeit (Durchschnitt) 1.96s
#124	GPT-5.4 Mini none	OpenAI	3.0	5.3	$0.038	0/1	1.33s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.038 Antwortzeit (Durchschnitt) 1.33s
#165	Qwen3.5-9B medium	Qwen	3.0	3.8	$0.036	0/1	177.0s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.036 Antwortzeit (Durchschnitt) 177.0s
#58	DeepSeek V4 Pro none	DeepSeek	3.0	7.2	$0.034	0/1	5.76s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.034 Antwortzeit (Durchschnitt) 5.76s
#72	Ring-2.6-1T medium	Inclusionai	3.0	6.8	$0.033	0/1	113.9s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.033 Antwortzeit (Durchschnitt) 113.9s
#88	Gemma 4 31B medium	Google	3.0	6.3	$0.033	0/1	90.1s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.033 Antwortzeit (Durchschnitt) 90.1s
#122	Qwen3.5 Plus 2026-04-20 none	Qwen	3.0	5.5	$0.032	0/1	33.3s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.032 Antwortzeit (Durchschnitt) 33.3s
#128	Qwen3.6 35B A3B none	Qwen	3.0	5.2	$0.031	0/1	414ms
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.031 Antwortzeit (Durchschnitt) 414ms
#120	Qwen3.6 27B none	Qwen	3.0	5.5	$0.028	0/1	4.03s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.028 Antwortzeit (Durchschnitt) 4.03s
#85	Gemini 3.1 Flash Lite low	Google	3.0	6.4	$0.028	0/1	1.46s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.028 Antwortzeit (Durchschnitt) 1.46s
#118	Kimi K2.5 none	Moonshot AI	3.0	5.5	$0.027	0/1	3.90s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.027 Antwortzeit (Durchschnitt) 3.90s

Allgemeinwissen-Ranking

Modelle filtern

Top-Modelle nach Allgemeinwissen-Score

Allgemeinwissen-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)