Kushindwa kwa kategoria za AI BENCHY
Akili ya jumla
Muda umeisha
Akili ya jumla
Muda umeisha
Ona ni modeli gani za AI zina uwezekano mkubwa wa kupata Muda umeisha katika Akili ya jumla, ili uone udhaifu haraka. Panga kwa: Muda wa majibu (wastani) ↑.
Sababu zinazohusiana za kushindwa
Kategoria zinazohusiana
| Nafasi | Modeli | Kampuni | Idadi ya Muda umeisha | Alama ya kategoria | Majaribio sahihi | Muda wa majibu (wastani) |
|---|---|---|---|---|---|---|
| #35 | Qwen3.5-35B-A3B medium | Qwen | 1 | 10.0 | 0/1 | 30.3s |
| #10 | Qwen3.5-122B-A10B medium | Qwen | 1 | 10.0 | 0/1 | 34.1s |
| #4 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 1 | 10.0 | 0/1 | 79.9s |