AI BENCHY Compare
Owl Alpha vs xAI: Grok 4.20
Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-10
| Metrică | Owl Alpha Owl Alpha none | Grok 4.20 Grok 4.20 none |
|---|---|---|
| Scor | 5.8 | 5.4 |
| Rang | #98 | #115 |
| Fiabilitate | 10.0 | N/D |
| Consistență | 9.1 | 9.5 |
| Teste corecte | ||
| Rată de trecere pe încercare | 43.9% | 35.2% |
| Teste instabile | 2 | 1 |
| Rulări totale | 57 | 54 |
| Cost per rezultat | 0.000 | 1.574 |
| Cost total | $0.000 | $0.095 |
| Preț de intrare | $0.000 / 1M | $1.250 / 1M |
| Preț de ieșire | $0.000 / 1M | $2.500 / 1M |
| Tokenuri de ieșire | 1,685 | 1,967 |
| Tokenuri de raționament | 0 | 0 |
| Timp de răspuns (mediu) | 6.83s | 1.11s |
| Timp de răspuns (maxim) | 32.27s | 6.04s |
| Timp de răspuns (total) | 129.73s | 20.02s |
Scor vs cost total
Timp de răspuns (mediu)
Scor vs Timp de răspuns (mediu)
Total tokenuri de ieșire
Scor vs Total tokenuri de ieșire
Defalcare pe categorii
Comparație rapidă
Schimbă perechea de comparație
CobuddymediumDisponibil gratuitvsOwl AlphanoneElephant AlphamediumvsGrok 4.20nonegpt-oss-120bmediumDisponibil gratuitvsOwl AlphanoneMistral Small 4mediumvsGrok 4.20noneMiniMax M2.5mediumDisponibil gratuitvsGrok 4.20noneNemotron 3 SupermediumDisponibil gratuitvsOwl AlphanoneMiniMax M2.5mediumDisponibil gratuitvsOwl AlphanoneMistral Small 4mediumvsOwl AlphanoneMiniMax M2.7mediumvsGrok 4.20nonegpt-oss-120bmediumDisponibil gratuitvsGrok 4.20noneGPT-5 NanomediumvsOwl AlphanoneCobuddymediumDisponibil gratuitvsGrok 4.20none