Modelranglijst voor Gecombineerd

Zie welke AI-modellen het best presteren op Gecombineerd, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Correcte tests ↓.

Getoonde modellen

Gemiddelde Gecombineerd-score

5.6

Beste model

Gemini 3.6 Flash 10.0

Foutredenen

Met foutreden Ongeldige toolaanroep91 Met foutreden Verkeerd antwoord69 Met foutreden Geen antwoord32 Met foutreden API-fout26 Met foutreden Time-out5 Met foutreden Extra opmaak1 Met foutreden Instructies niet gevolgd1

216/216

Rang	Model	Bedrijf	Gecombineerd-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#140	Mimo V2 Omni medium	Xiaomi	5.0	5.9	$0.683	1/1	25.9s
Totaal tests 1 Foute tests 0 Totale kosten $0.683 Responstijd (gem.) 25.9s
#141	Hy3 preview high	Tencent	5.0	5.9	$0.048	1/1	113.1s
Totaal tests 1 Foute tests 0 Totale kosten $0.048 Responstijd (gem.) 113.1s
#149	Gemini 3.1 Flash Lite high	Google	5.0	5.6	$2.044	1/1	149.2s
Totaal tests 1 Foute tests 0 Totale kosten $2.044 Responstijd (gem.) 149.2s
#159	Hy3 preview low	Tencent	5.0	5.5	$0.015	1/1	78.7s
Totaal tests 1 Foute tests 0 Totale kosten $0.015 Responstijd (gem.) 78.7s
#169	Gemini 3.1 Flash Lite Preview high	Google	5.0	5.3	$2.310	1/1	280.5s
Totaal tests 1 Foute tests 0 Totale kosten $2.310 Responstijd (gem.) 280.5s
#181	Qwen3.6 Plus Preview medium	Qwen	5.0	4.9	$0.000	1/1	35.0s
Totaal tests 1 Foute tests 0 Totale kosten $0.000 Responstijd (gem.) 35.0s
#191	Grok 4.1 Fast medium	X AI	5.0	4.7	$0.069	1/1	37.6s
Totaal tests 1 Foute tests 0 Totale kosten $0.069 Responstijd (gem.) 37.6s
#4	Gemini 3.5 Flash high	Google	8.2	9.5	$1.976	1/2	84.1s
Totaal tests 2 Foute tests 1 Totale kosten $1.976 Responstijd (gem.) 84.1s
#11	Qwen3.7 Max medium	Qwen	8.7	9.2	$1.116	1/2	287.8s
Totaal tests 2 Foute tests 1 Totale kosten $1.116 Responstijd (gem.) 287.8s
#14	Gemini 3.5 Flash low	Google	8.2	8.9	$0.433	1/2	30.0s
Totaal tests 2 Foute tests 1 Totale kosten $0.433 Responstijd (gem.) 30.0s
#19	Muse Spark 1.1 medium	Meta	8.3	8.6	$1.357	1/2	42.6s
Totaal tests 2 Foute tests 1 Totale kosten $1.357 Responstijd (gem.) 42.6s
#20	Claude Fable 5 medium	Anthropic	6.5	8.6	$3.478	1/2	27.5s
Totaal tests 2 Foute tests 1 Totale kosten $3.478 Responstijd (gem.) 27.5s
#22	Qwen3.6 Max Preview medium	Qwen	7.3	8.4	$1.143	1/2	177.5s
Totaal tests 2 Foute tests 1 Totale kosten $1.143 Responstijd (gem.) 177.5s
#23	Grok 4.5 low	X AI	6.5	8.4	$0.935	1/2	12.8s
Totaal tests 2 Foute tests 1 Totale kosten $0.935 Responstijd (gem.) 12.8s
#26	Claude Sonnet 5 medium	Anthropic	7.3	8.3	$0.922	1/2	51.9s
Totaal tests 2 Foute tests 1 Totale kosten $0.922 Responstijd (gem.) 51.9s

Gecombineerd-ranglijst

Modellen filteren

Topmodellen op Gecombineerd-score

Gecombineerd-score vs totale kosten

Topmodellen op Responstijd (gem.)