Modelranglijst voor Toolaanroepen

Zie welke AI-modellen het best presteren op Toolaanroepen, welke betrouwbaar blijven en waar de grootste verschillen zitten.

Getoonde modellen

Gemiddelde Toolaanroepen-score

8.8

Beste model

Gemini 3.6 Flash 10.0

Foutredenen

Met foutreden API-fout17 Met foutreden Ongeldige toolaanroep9 Met foutreden Instructies niet gevolgd8 Met foutreden Verkeerd antwoord4 Met foutreden Geen antwoord2

220/220

Rang	Model	Bedrijf	Toolaanroepen-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#183	GPT-4o-mini none	OpenAI	10.0	5.0	$0.010	1/1	2.51s
Totaal tests 1 Foute tests 0 Totale kosten $0.010 Responstijd (gem.) 2.51s
#184	Qwen3.6 Plus Preview medium	Qwen	10.0	4.9	$0.000	1/1	5.87s
Totaal tests 1 Foute tests 0 Totale kosten $0.000 Responstijd (gem.) 5.87s
#189	GPT-5.4 Nano none	OpenAI	10.0	4.8	$0.041	1/1	3.40s
Totaal tests 1 Foute tests 0 Totale kosten $0.041 Responstijd (gem.) 3.40s
#191	KAT-Coder-Air V2.5 none	Kwaipilot	10.0	4.8	$0.067	1/1	5.13s
Totaal tests 1 Foute tests 0 Totale kosten $0.067 Responstijd (gem.) 5.13s
#192	Trinity Large Preview none	Arcee AI	10.0	4.8	$0.008	1/1	6.67s
Totaal tests 1 Foute tests 0 Totale kosten $0.008 Responstijd (gem.) 6.67s
#193	Hunter Alpha medium	OpenRouter	10.0	4.7	$0.000	1/1	17.3s
Totaal tests 1 Foute tests 0 Totale kosten $0.000 Responstijd (gem.) 17.3s
#195	Laguna M.1 medium	Poolside	10.0	4.7	$0.033	1/1	6.31s
Totaal tests 1 Foute tests 0 Totale kosten $0.033 Responstijd (gem.) 6.31s
#196	Qwen3 Coder Next medium	Qwen	10.0	4.7	$0.032	1/1	2.64s
Totaal tests 1 Foute tests 0 Totale kosten $0.032 Responstijd (gem.) 2.64s
#197	Cobuddy medium	Baidu	10.0	4.7	$0.000	1/1	11.2s
Totaal tests 1 Foute tests 0 Totale kosten $0.000 Responstijd (gem.) 11.2s
#198	Mercury 2 none	Inception	10.0	4.6	$0.030	1/1	1.27s
Totaal tests 1 Foute tests 0 Totale kosten $0.030 Responstijd (gem.) 1.27s
#199	MiniMax M2.5 medium	Minimax	10.0	4.6	$0.340	1/1	15.4s
Totaal tests 1 Foute tests 0 Totale kosten $0.340 Responstijd (gem.) 15.4s
#201	Grok 4.20 Beta none	X AI	10.0	4.4	$0.087	1/1	4.79s
Totaal tests 1 Foute tests 0 Totale kosten $0.087 Responstijd (gem.) 4.79s
#202	Laguna M.1 none	Poolside	10.0	4.4	$0.009	1/1	7.54s
Totaal tests 1 Foute tests 0 Totale kosten $0.009 Responstijd (gem.) 7.54s
#204	GLM 4.7 Flash medium	Z.ai	10.0	4.3	$0.166	1/1	15.9s
Totaal tests 1 Foute tests 0 Totale kosten $0.166 Responstijd (gem.) 15.9s
#206	Hunter Alpha none	OpenRouter	10.0	4.2	$0.000	1/1	6.02s
Totaal tests 1 Foute tests 0 Totale kosten $0.000 Responstijd (gem.) 6.02s

Toolaanroepen-ranglijst

Modellen filteren

Topmodellen op Toolaanroepen-score

Toolaanroepen-score vs totale kosten

Topmodellen op Responstijd (gem.)