Falhas por categoria AI BENCHY
Específico do domínio: Tempo esgotado
Específico do domínio
Tempo esgotado
Veja quais modelos de IA têm mais chance de encontrar Tempo esgotado em Específico do domínio, para identificar pontos fracos mais rápido. Ordenar por: Tempo de resposta (médio) ↑.
Motivos de falha
| Posição | Modelo | Empresa | Contagem de Tempo esgotado | Pontuação da categoria | Testes corretos | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|
| #13 | GLM 5 medium | Z.ai | 1 | 3.5 | 0/3 | 0ms |
| #26 | Claude Sonnet 4.6 medium | Anthropic | 1 | 2.9 | 0/3 | 0ms |
| #39 | Seed-2.0-Mini medium | Bytedance Seed | 3 | 3.0 | 0/3 | 0ms |
| #3 | Claude Opus 4.7 medium | Anthropic | 1 | 7.7 | 2/3 | 1.17s |
| #23 | MiMo-V2-Pro medium | Xiaomi | 1 | 5.3 | 1/3 | 6.00s |
| #50 | Hunter Alpha medium | OpenRouter | 1 | 3.0 | 0/3 | 10.5s |
| #51 | Nemotron 3 Super medium | NVIDIA | 1 | 2.9 | 0/3 | 16.2s |
| #8 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 1 | 5.3 | 1/3 | 17.5s |
| #80 | MiniMax M2.7 medium | Minimax | 2 | 3.0 | 0/3 | 19.0s |
| #24 | Gemma 4 26B A4B medium | 1 | 2.9 | 0/3 | 23.6s | |
| #33 | GLM 5.1 medium | Z.ai | 1 | 5.3 | 1/3 | 29.8s |
| #27 | DeepSeek V3.2 medium | DeepSeek | 1 | 5.3 | 1/3 | 39.3s |
| #45 | GPT-5 Mini medium | OpenAI | 1 | 3.6 | 0/3 | 44.6s |
| #18 | GLM 5 Turbo medium | Z.ai | 1 | 2.9 | 0/3 | 71.1s |
| #40 | GPT-5.2 medium | OpenAI | 1 | 5.9 | 1/3 | 77.8s |