#88
Openrouter
Releasedatum: 2026-04-14
Getest op: 2026-04-22 12:55
openrouter/elephant-alpha::medium
(medium)
(none)
5.2
Consistentie
9.6
n.v.t.
Totaal aantal uitvoer-tokens
2,596
Invoerprijs
$0.000 / 1M
Uitvoerprijs
$0.000 / 1M
Instabiele tests
1
Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).
Rungeschiedenis
| Getest op | Score | Betrouwbaarheid | Correcte tests | Totale kosten | Vergelijken |
|---|---|---|---|---|---|
| 2026-05-22 00:40 Suite gewijzigd | 5.4 | n.v.t. | $0.000 | Vergelijken | |
| 2026-04-22 12:55 Eerste geregistreerde run | 5.2 | n.v.t. | $0.000 | Huidige run |
Runvergelijking
| Run | Score | Consistentie | Betrouwbaarheid | Correcte tests | Instabiele tests | Totaal aantal uitvoer-tokens | Totale kosten | Responstijd (gem.) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-22 12:55 · Eerste geregistreerde run | 5.2 | 9.6 | n.v.t. | 5/18 | 1 | 2,596 | $0.000 | 1.27s |
| 2026-05-22 00:40 · Suite gewijzigd | 5.4 | 9.6 | n.v.t. | 6/19 | 1 | 2,596 | $0.000 | 1.27s |
| Verschil | -0.1 | 0.0 | -2 | 0 | 0 | $0.000 | 0ms |
Deze twee runs gebruikten verschillende benchmarksets, dus de verschillen weerspiegelen zowel modelveranderingen als suitewijzigingen.
Grafieken
Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.
Score vs Totale kosten
Responstijd (gem.)
Score vs Responstijd (gem.)
Totaal aantal uitvoer-tokens
Score vs Totaal aantal uitvoer-tokens
Snelle vergelijking
Elephant AlphamediumvsQwen3.5 Plus 2026-04-20noneElephant AlphamediumvsGLM 5.1noneElephant AlphamediumvsQwen3.5-27BnoneElephant AlphamediumvsSeed-2.0-LitenoneElephant AlphamediumvsQwen3.6 27BnoneElephant AlphamediumvsGemini 3 Flash PreviewmediumElephant AlphamediumvsGemini 3.5 FlashhighElephant AlphamediumvsRing-2.6-1TmediumElephant AlphamediumvsGemini 3.5 Flashlow
Categorie-uitsplitsing
| Categorie | Score | Consistentie | Correcte tests |
|---|---|---|---|
| Anti-AI-trucs | 6.6 | 10.0 | |
| Programmeren | 5.1 | 3.3 | |
| Gecombineerd | 3.0 | 10.0 | |
| Gegevensparsering en extractie | 6.5 | 10.0 | |
| Domeinspecifiek | 3.0 | 10.0 | |
| Algemene intelligentie | 4.3 | 10.0 | |
| Instructies opvolgen | 9.8 | 10.0 | |
| Puzzeloplossing | 3.7 | 10.0 | |
| Toolaanroepen | 3.0 | 10.0 |