Modelranglijst voor Algemene kennis

AI BENCHY Categorie

Zie welke AI-modellen het best presteren op Algemene kennis, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Correcte tests ↓.

Getoonde modellen

Gemiddelde Algemene kennis-score

3.1

Beste model

Gemini 3.5 Flash 10.0

Foutredenen

Met foutreden Verkeerd antwoord133 Met foutreden API-fout13 Met foutreden Geen antwoord8

169/169

Rang	Model	Bedrijf	Algemene kennis-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#151	Mercury 2 none	Inception	3.0	4.6	$0.011	0/1	548ms
Totaal tests 1 Foute tests 1 Totale kosten $0.011 Responstijd (gem.) 548ms
#152	Elephant Alpha none	Openrouter	3.0	4.6	$0.000	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.000 Responstijd (gem.) 0ms
#153	Elephant Alpha medium	Openrouter	3.0	4.5	$0.000	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.000 Responstijd (gem.) 0ms
#154	Hunter Alpha none	OpenRouter	0.0	4.5	$0.000	0/0	0ms
Totaal tests 0 Foute tests 0 Totale kosten $0.000 Responstijd (gem.) 0ms
#155	Grok 4.20 none	X AI	0.0	4.4	$0.057	0/0	0ms
Totaal tests 0 Foute tests 0 Totale kosten $0.057 Responstijd (gem.) 0ms
#156	Laguna Xs.2 medium	Poolside	3.0	4.3	$0.000	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.000 Responstijd (gem.) 0ms
#157	GLM 4.7 Flash medium	Z.ai	3.0	4.3	$0.054	0/1	11.1s
Totaal tests 1 Foute tests 1 Totale kosten $0.054 Responstijd (gem.) 11.1s
#158	Hy3 preview none	Tencent	3.0	4.3	$0.003	0/1	2.71s
Totaal tests 1 Foute tests 1 Totale kosten $0.003 Responstijd (gem.) 2.71s
#159	MiMo-V2-Flash none	Xiaomi	3.0	4.3	$0.025	0/1	1.82s
Totaal tests 1 Foute tests 1 Totale kosten $0.025 Responstijd (gem.) 1.82s
#160	Grok Build 0.1 none	X AI	3.0	4.2	$0.547	0/1	36.1s
Totaal tests 1 Foute tests 1 Totale kosten $0.547 Responstijd (gem.) 36.1s
#161	Grok 4.1 Fast none	X AI	3.0	4.0	$0.008	0/1	731ms
Totaal tests 1 Foute tests 1 Totale kosten $0.008 Responstijd (gem.) 731ms
#162	Laguna Xs.2 none	Poolside	3.0	4.0	$0.000	0/1	0ms
Totaal tests 1 Foute tests 1 Totale kosten $0.000 Responstijd (gem.) 0ms
#163	Granite 4.1 8B none	IBM Granite	3.0	4.0	$0.003	0/1	306ms
Totaal tests 1 Foute tests 1 Totale kosten $0.003 Responstijd (gem.) 306ms
#164	gpt-oss-120b none	OpenAI	3.0	4.0	$0.010	0/1	47.3s
Totaal tests 1 Foute tests 1 Totale kosten $0.010 Responstijd (gem.) 47.3s
#165	Qwen3.5-9B medium	Qwen	3.0	3.8	$0.036	0/1	177.0s
Totaal tests 1 Foute tests 1 Totale kosten $0.036 Responstijd (gem.) 177.0s

Algemene kennis-ranglijst

Modellen filteren

Topmodellen op Algemene kennis-score

Algemene kennis-score vs totale kosten

Topmodellen op Responstijd (gem.)