AI BENCHY
AD
Track all your projects in one dashboard. Get ๐Ÿ“Šstats, ๐Ÿ”ฅheatmaps and ๐Ÿ‘€recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Categoriefouten

Algemene kennis: Geen antwoord

Algemene kennis
Geen antwoord

Zie welke AI-modellen op Algemene kennis het meest kans hebben op Geen antwoord, zodat je zwakke punten sneller ziet. Sorteren op: Responstijd (gem.) โ†‘.

Getoonde modellen

6

Totaal fouten

6

Meest getroffen model

Claude Opus 4.8 1
Rang Model Bedrijf Geen antwoord-aantal Categoriescore Correcte tests Responstijd (gem.)
#68 Claude Opus 4.8 none Anthropic 1 3.0 0/1 3.41s
#10 Claude Opus 4.8 medium Anthropic 1 3.0 0/1 6.14s
#67 MiniMax M3 medium Minimax 1 3.0 0/1 100.8s
#22 Step 3.7 Flash medium Stepfun 1 3.0 0/1 114.0s
#57 Step 3.7 Flash low Stepfun 1 3.0 0/1 124.8s
#71 Step 3.7 Flash high Stepfun 1 3.0 0/1 149.3s

Topmodellen op Geen antwoord-aantal

Geen antwoord-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten