AI BENCHY Compare
Owl Alpha vs xAI: Grok 4.20
Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-10
| Métrique | Owl Alpha Owl Alpha none | Grok 4.20 Grok 4.20 none |
|---|---|---|
| Score | 5.8 | 5.4 |
| Rang | #98 | #115 |
| Fiabilité | 10.0 | N/D |
| Cohérence | 9.1 | 9.5 |
| Tests corrects | ||
| Taux de réussite par tentative | 43.9% | 35.2% |
| Tests instables | 2 | 1 |
| Exécutions totales | 57 | 54 |
| Coût par résultat | 0.000 | 1.574 |
| Coût total | $0.000 | $0.095 |
| Prix d'entrée | $0.000 / 1M | $1.250 / 1M |
| Prix de sortie | $0.000 / 1M | $2.500 / 1M |
| Jetons de sortie | 1,685 | 1,967 |
| Jetons de raisonnement | 0 | 0 |
| Temps de réponse (moy.) | 6.83s | 1.11s |
| Temps de réponse (max) | 32.27s | 6.04s |
| Temps de réponse (total) | 129.73s | 20.02s |
Score vs coût total
Temps de réponse (moy.)
Score vs Temps de réponse (moy.)
Total des jetons de sortie
Score vs Total des jetons de sortie
Répartition par catégorie
Comparaison rapide
Changer la paire de comparaison
CobuddymediumDisponible gratuitementvsOwl AlphanoneElephant AlphamediumvsGrok 4.20nonegpt-oss-120bmediumDisponible gratuitementvsOwl AlphanoneMistral Small 4mediumvsGrok 4.20noneMiniMax M2.5mediumDisponible gratuitementvsGrok 4.20noneNemotron 3 SupermediumDisponible gratuitementvsOwl AlphanoneMiniMax M2.5mediumDisponible gratuitementvsOwl AlphanoneMistral Small 4mediumvsOwl AlphanoneMiniMax M2.7mediumvsGrok 4.20nonegpt-oss-120bmediumDisponible gratuitementvsGrok 4.20noneGPT-5 NanomediumvsOwl AlphanoneCobuddymediumDisponible gratuitementvsGrok 4.20none