AI BENCHY
Vergelijken Grafieken Methodologie
โค๏ธ Made by XCS
Your ad here

AI BENCHY Fouten

Extra opmaak-fouten

Zie welke AI-modellen het vaakst tegen Extra opmaak aanlopen, zodat je betrouwbaarheidsrisico's ziet voordat je kiest. Sorteren op: Gem. score โ†“.

Getoonde modellen

6

Totaal fouten

13

Meest getroffen model

Claude Sonnet 4.6 2
Rang Model Bedrijf Extra opmaak-aantal Gem. score Correcte tests Responstijd (gem.)
#11 Claude Sonnet 4.6 medium Anthropic 2 7.7 12/16 11.2s
#25 Claude Sonnet 4.6 none Anthropic 3 6.8 10/16 5.57s
#26 Claude Opus 4.6 medium Anthropic 4 6.6 10/16 22.9s
#33 DeepSeek V3.2 none DeepSeek 2 5.5 7/16 12.9s
#48 Qwen3 Coder Next none Qwen 1 4.0 4/16 11.7s
#54 MiMo-V2-Flash none Xiaomi 1 2.9 3/16 2.97s

Topmodellen op Extra opmaak-aantal

Extra opmaak-aantal vs gem. score

Topmodellen op Responstijd (gem.)