Kushindwa kwa kategoria za AI BENCHY
Akili ya jumla
Muda umeisha
Akili ya jumla
Muda umeisha
Ona ni modeli gani za AI zina uwezekano mkubwa wa kupata Muda umeisha katika Akili ya jumla, ili uone udhaifu haraka. Panga kwa: Majaribio sahihi ↓.
Sababu zinazohusiana za kushindwa
Kategoria zinazohusiana
| Nafasi | Modeli | Kampuni | Idadi ya Muda umeisha | Alama ya kategoria | Majaribio sahihi | Muda wa majibu (wastani) |
|---|---|---|---|---|---|---|
| #4 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 1 | 10.0 | 0/1 | 79.9s |
| #10 | Qwen3.5-122B-A10B medium | Qwen | 1 | 10.0 | 0/1 | 34.1s |
| #35 | Qwen3.5-35B-A3B medium | Qwen | 1 | 10.0 | 0/1 | 30.3s |