#66
OpenAI · Lansare: 2026-03-17 · openai/gpt-5.4-mini::none
Teste instabile
3
Testele instabile au avut rezultate mixte între rulări (cel puțin un succes și un eșec).
Grafice
Alege primul model, apoi fă clic pe al doilea model pentru a deschide o pagină alăturată.
Scor vs Cost total
Timp de răspuns (mediu)
Scor vs Timp de răspuns (mediu)
Total tokenuri de ieșire
Scor vs Total tokenuri de ieșire
Comparație rapidă
GPT-5.4 MininonevsQwen3 Coder NextnoneGPT-5.4 MininonevsGPT-4o-mininoneGPT-5.4 MininonevsQwen3.5-9BnoneGPT-5.4 MininonevsNemotron 3 Super 120b A12bnoneDisponibil gratuitGPT-5.4 MininonevsQwen3 Coder NextmediumGPT-5.4 MininonevsGemini 3 Flash PreviewmediumGPT-5.4 MininonevsGemini 3.1 Pro PreviewmediumGPT-5.4 MininonevsStep 3.5 FlashmediumDisponibil gratuit
Defalcare pe categorii
| Categorie | Scor | Consistență | Teste corecte |
|---|---|---|---|
| Trucuri anti-AI | 3.1 | 8.1 | |
| Combinat | 3.0 | 10.0 | |
| Parsare și extragere de date | 10.0 | 10.0 | |
| Specific domeniului | 3.5 | 4.4 | |
| Inteligență generală | 4.8 | 10.0 | |
| Respectarea instrucțiunilor | 6.3 | 10.0 | |
| Rezolvare de puzzle-uri | 5.4 | 10.0 | |
| Apelare instrumente | 3.0 | 10.0 |