AI BENCHY
AD
Track all your projects in one dashboard. Get ๐Ÿ“Šstats, ๐Ÿ”ฅheatmaps and ๐Ÿ‘€recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Categoriefouten

Domeinspecifiek: API-fout

Domeinspecifiek
API-fout

Zie welke AI-modellen op Domeinspecifiek het meest kans hebben op API-fout, zodat je zwakke punten sneller ziet.

Getoonde modellen

6

Totaal fouten

6

Meest getroffen model

Qwen3.6 Plus Preview 1
Rang Model Bedrijf API-fout-aantal Categoriescore Correcte tests Responstijd (gem.)
#93 Qwen3.6 Plus Preview medium Qwen 1 3.0 0/3 22.1s
#103 DeepSeek V4 Pro high DeepSeek 1 2.9 0/3 205.7s
#132 Mistral Small 4 medium Mistral 1 5.3 1/3 6.11s
#133 DeepSeek V3.2 none DeepSeek 1 2.9 0/3 4.17s
#156 Hy3 preview none Tencent 1 3.6 0/3 17.6s
#160 LFM2-24B-A2B none Liquid 1 5.9 1/3 287ms

Topmodellen op API-fout-aantal

API-fout-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten