Totaal tests: 4
Foute tests: 0
Score: 10.00
Uitvoer-tokens: 220
Redeneer-tokens: 6,003
| Categorie | Tests | Fout | Score | Uitvoer-tokens | Redeneer-tokens |
|---|---|---|---|---|---|
| Anti-AI Tricks | 2 | 0 | 10.00 | 201 | 585 |
| Domain specific | 1 | 0 | 10.00 | 0 | 4,865 |
| Puzzle Solving | 1 | 0 | 10.00 | 19 | 553 |
Aibenchy
2026-02-16T02:24:03.805Z
| Rang | Modelnaam | Bedrijf ⓘ | Score ⓘ | Kosten per resultaat ⓘ | Correcte tests ⓘ | ||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| #1 | Z.ai: GLM 5 Redenering (medium) Releasedatum: Onbekende releasedatum · Totale kosten: $0.0159816 | Z.ai | 10.00 | 0.3995 | 4/4 | ||||||||||||||||||||||||
| Totaal tests: 4 Foute tests: 0 Score: 10.00 Uitvoer-tokens: 220 Redeneer-tokens: 6,003
| |||||||||||||||||||||||||||||
| #2 | StepFun: Step 3.5 Flash Zonder redenering Gratis beschikbaar Releasedatum: Onbekende releasedatum · Totale kosten: $0.0000 | StepFun | 8.00 | 0.0000 | 3/4 | ||||||||||||||||||||||||
| Totaal tests: 4 Foute tests: 1 Score: 8.00 Uitvoer-tokens: 225 Redeneer-tokens: 4,197
| |||||||||||||||||||||||||||||
| #3 | Z.ai: GLM 5 Zonder redenering Releasedatum: Onbekende releasedatum · Totale kosten: $0.0123402 | Z.ai | 7.75 | 0.4113 | 3/4 | ||||||||||||||||||||||||
| Totaal tests: 4 Foute tests: 1 Score: 7.75 Uitvoer-tokens: 282 Redeneer-tokens: 4,697
| |||||||||||||||||||||||||||||
| #4 | MiniMax: MiniMax M2.5 Zonder redenering Releasedatum: Onbekende releasedatum · Totale kosten: $0.0142142 | MiniMax | 7.75 | 0.4738 | 3/4 | ||||||||||||||||||||||||
| Totaal tests: 4 Foute tests: 1 Score: 7.75 Uitvoer-tokens: 101 Redeneer-tokens: 15,007
| |||||||||||||||||||||||||||||
| #5 | Z.ai: GLM 4.7 Flash Zonder redenering Releasedatum: Onbekende releasedatum · Totale kosten: $0.00087212 | Z.ai | 5.50 | 0.0436 | 2/4 | ||||||||||||||||||||||||
| Totaal tests: 4 Foute tests: 2 Score: 5.50 Uitvoer-tokens: 218 Redeneer-tokens: 1,932
| |||||||||||||||||||||||||||||
| #6 | Qwen: Qwen3 Coder Next Redenering (medium) Releasedatum: Onbekende releasedatum · Totale kosten: $0.00003684 | Qwen | 3.25 | 0.0037 | 1/4 | ||||||||||||||||||||||||
| Totaal tests: 4 Foute tests: 3 Score: 3.25 Uitvoer-tokens: 64 Redeneer-tokens: 0
| |||||||||||||||||||||||||||||
| #7 | Qwen: Qwen3 Coder Next Zonder redenering Releasedatum: Onbekende releasedatum · Totale kosten: $0.00003894 | Qwen | 3.25 | 0.0039 | 1/4 | ||||||||||||||||||||||||
| Totaal tests: 4 Foute tests: 3 Score: 3.25 Uitvoer-tokens: 71 Redeneer-tokens: 0
| |||||||||||||||||||||||||||||
| #8 | Z.ai: GLM 4.7 Flash Redenering (medium) Releasedatum: Onbekende releasedatum · Totale kosten: $0.00733692 | Z.ai | 3.25 | 0.7337 | 1/4 | ||||||||||||||||||||||||
| Totaal tests: 4 Foute tests: 3 Score: 3.25 Uitvoer-tokens: 1,159 Redeneer-tokens: 17,192
| |||||||||||||||||||||||||||||
| #9 | MiniMax: MiniMax M2.5 Redenering (medium) Releasedatum: Onbekende releasedatum · Totale kosten: $0.0225838 | MiniMax | 3.25 | 2.2584 | 1/4 | ||||||||||||||||||||||||
| Totaal tests: 4 Foute tests: 3 Score: 3.25 Uitvoer-tokens: 46 Redeneer-tokens: 22,487
| |||||||||||||||||||||||||||||
| #10 | OpenAI: GPT-4o-mini Zonder redenering Releasedatum: Onbekende releasedatum · Totale kosten: $0.0000591 | OpenAI | 1.00 | - | 0/4 | ||||||||||||||||||||||||
| Totaal tests: 4 Foute tests: 4 Score: 1.00 Uitvoer-tokens: 38 Redeneer-tokens: 0
| |||||||||||||||||||||||||||||
Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.