AI BENCHY Compare
Inception: Mercury 2 vs Owl Alpha
Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-30
| Metrică | Mercury 2 Mercury 2 medium | Owl Alpha Owl Alpha none |
|---|---|---|
| Scor | 6.5 | 6.0 |
| Rang | #71 | #87 |
| Fiabilitate | N/D | 10.0 |
| Consistență | 8.6 | 9.1 |
| Teste corecte | ||
| Rată de trecere pe încercare | 53.7% | 46.3% |
| Teste instabile | 3 | 2 |
| Rulări totale | 54 | 54 |
| Cost per rezultat | 0.580 | 0.000 |
| Cost total | $0.047 | $0.000 |
| Preț de intrare | $0.250 / 1M | $0.000 / 1M |
| Preț de ieșire | $0.750 / 1M | $0.000 / 1M |
| Tokenuri de ieșire | 3,972 | 1,671 |
| Tokenuri de raționament | 48,333 | 0 |
| Timp de răspuns (mediu) | 2.21s | 7.07s |
| Timp de răspuns (maxim) | 14.63s | 32.27s |
| Timp de răspuns (total) | 37.51s | 127.23s |
Scor vs cost total
Timp de răspuns (mediu)
Scor vs Timp de răspuns (mediu)
Total tokenuri de ieșire
Scor vs Total tokenuri de ieșire
Defalcare pe categorii
Comparație rapidă
Schimbă perechea de comparație
Mercury 2mediumvsMiMo-V2-OmninoneGemma 4 26B A4BnoneDisponibil gratuitvsMercury 2mediumgpt-oss-120bmediumDisponibil gratuitvsOwl AlphanoneMercury 2mediumvsGLM 5noneGemini 2.5 FlashnonevsMercury 2mediumOwl AlphanonevsLaguna Xs.2mediumDisponibil gratuitMercury 2mediumvsGPT-5.5noneMercury 2mediumvsQwen3.5 Plus 2026-02-15noneMercury 2mediumvsGLM 5V TurbononeMercury 2mediumvsQwen3.5-FlashnoneSeed-2.0-LitenonevsMercury 2mediumMistral Small 4mediumvsOwl Alphanone