AI BENCHY
Advertise here

AI BENCHY Fouten

API-fout-fouten

Zie welke AI-modellen het vaakst tegen API-fout aanlopen, zodat je betrouwbaarheidsrisico's ziet voordat je kiest.

Getoonde modellen

9

Totaal fouten

144

Meest getroffen model

Qwen3.6 Plus Preview 8
Rang Model Bedrijf API-fout-aantal Score Correcte tests Responstijd (gem.)
#101 Mimo V2 Omni none Xiaomi 1 6.0 8/21 2.44s
#111 Owl Alpha medium Openrouter 1 5.7 8/21 11.9s
#113 DeepSeek V4 Pro none DeepSeek 1 5.7 7/21 12.4s
#116 Hunter Alpha none OpenRouter 1 5.7 6/18 4.70s
#119 Cobuddy medium Baidu 1 5.6 7/21 39.9s
#120 Mimo V2 PRO none Xiaomi 1 5.6 7/21 2.27s
#130 MiniMax M2.7 medium Minimax 1 5.3 5/21 38.2s
#152 MiMo-V2-Flash none Xiaomi 1 4.6 4/21 2.76s
#161 Qwen3.5-9B medium Qwen 1 4.2 3/21 82.2s

Topmodellen op API-fout-aantal

API-fout-aantal vs Score

Topmodellen op Responstijd (gem.)