Gesamttests: 4
Falsche Tests: 0
Score: 10.00
Ausgabe-Token: 220
Denk-Token: 6,003
| Kategorie | Tests | Falsch | Score | Ausgabe-Token | Denk-Token |
|---|---|---|---|---|---|
| Anti-AI Tricks | 2 | 0 | 10.00 | 201 | 585 |
| Domain specific | 1 | 0 | 10.00 | 0 | 4,865 |
| Puzzle Solving | 1 | 0 | 10.00 | 19 | 553 |
Aibenchy
2026-02-16T02:24:03.805Z
| Rang | Modellname | Unternehmen ⓘ | Score ⓘ | Kosten pro Ergebnis ⓘ | Korrekte Tests ⓘ | ||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| #1 | Z.ai: GLM 5 Schlussfolgern (medium) Veröffentlichung: Unbekanntes Veröffentlichungsdatum · Gesamtkosten: $0.0159816 | Z.ai | 10.00 | 0.3995 | 4/4 | ||||||||||||||||||||||||
| Gesamttests: 4 Falsche Tests: 0 Score: 10.00 Ausgabe-Token: 220 Denk-Token: 6,003
| |||||||||||||||||||||||||||||
| #2 | StepFun: Step 3.5 Flash Ohne Schlussfolgern Kostenlos verfügbar Veröffentlichung: Unbekanntes Veröffentlichungsdatum · Gesamtkosten: $0.0000 | StepFun | 8.00 | 0.0000 | 3/4 | ||||||||||||||||||||||||
| Gesamttests: 4 Falsche Tests: 1 Score: 8.00 Ausgabe-Token: 225 Denk-Token: 4,197
| |||||||||||||||||||||||||||||
| #3 | Z.ai: GLM 5 Ohne Schlussfolgern Veröffentlichung: Unbekanntes Veröffentlichungsdatum · Gesamtkosten: $0.0123402 | Z.ai | 7.75 | 0.4113 | 3/4 | ||||||||||||||||||||||||
| Gesamttests: 4 Falsche Tests: 1 Score: 7.75 Ausgabe-Token: 282 Denk-Token: 4,697
| |||||||||||||||||||||||||||||
| #4 | MiniMax: MiniMax M2.5 Ohne Schlussfolgern Veröffentlichung: Unbekanntes Veröffentlichungsdatum · Gesamtkosten: $0.0142142 | MiniMax | 7.75 | 0.4738 | 3/4 | ||||||||||||||||||||||||
| Gesamttests: 4 Falsche Tests: 1 Score: 7.75 Ausgabe-Token: 101 Denk-Token: 15,007
| |||||||||||||||||||||||||||||
| #5 | Z.ai: GLM 4.7 Flash Ohne Schlussfolgern Veröffentlichung: Unbekanntes Veröffentlichungsdatum · Gesamtkosten: $0.00087212 | Z.ai | 5.50 | 0.0436 | 2/4 | ||||||||||||||||||||||||
| Gesamttests: 4 Falsche Tests: 2 Score: 5.50 Ausgabe-Token: 218 Denk-Token: 1,932
| |||||||||||||||||||||||||||||
| #6 | Qwen: Qwen3 Coder Next Schlussfolgern (medium) Veröffentlichung: Unbekanntes Veröffentlichungsdatum · Gesamtkosten: $0.00003684 | Qwen | 3.25 | 0.0037 | 1/4 | ||||||||||||||||||||||||
| Gesamttests: 4 Falsche Tests: 3 Score: 3.25 Ausgabe-Token: 64 Denk-Token: 0
| |||||||||||||||||||||||||||||
| #7 | Qwen: Qwen3 Coder Next Ohne Schlussfolgern Veröffentlichung: Unbekanntes Veröffentlichungsdatum · Gesamtkosten: $0.00003894 | Qwen | 3.25 | 0.0039 | 1/4 | ||||||||||||||||||||||||
| Gesamttests: 4 Falsche Tests: 3 Score: 3.25 Ausgabe-Token: 71 Denk-Token: 0
| |||||||||||||||||||||||||||||
| #8 | Z.ai: GLM 4.7 Flash Schlussfolgern (medium) Veröffentlichung: Unbekanntes Veröffentlichungsdatum · Gesamtkosten: $0.00733692 | Z.ai | 3.25 | 0.7337 | 1/4 | ||||||||||||||||||||||||
| Gesamttests: 4 Falsche Tests: 3 Score: 3.25 Ausgabe-Token: 1,159 Denk-Token: 17,192
| |||||||||||||||||||||||||||||
| #9 | MiniMax: MiniMax M2.5 Schlussfolgern (medium) Veröffentlichung: Unbekanntes Veröffentlichungsdatum · Gesamtkosten: $0.0225838 | MiniMax | 3.25 | 2.2584 | 1/4 | ||||||||||||||||||||||||
| Gesamttests: 4 Falsche Tests: 3 Score: 3.25 Ausgabe-Token: 46 Denk-Token: 22,487
| |||||||||||||||||||||||||||||
| #10 | OpenAI: GPT-4o-mini Ohne Schlussfolgern Veröffentlichung: Unbekanntes Veröffentlichungsdatum · Gesamtkosten: $0.0000591 | OpenAI | 1.00 | - | 0/4 | ||||||||||||||||||||||||
| Gesamttests: 4 Falsche Tests: 4 Score: 1.00 Ausgabe-Token: 38 Denk-Token: 0
| |||||||||||||||||||||||||||||
Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.