#160 xAI: Grok 4.20
none- Kosten
- $0.004
- Zeit
- 6.5s
- Token
- 1,367 tok
Zusammenfassung
Grok 4.20 erreicht 4.4 bei AI BENCHY und liegt auf #160. Das Modell hat k. A. Zuverlässigkeit, 28.6% Erfolgsrate, $0.057 Gesamtkosten und 1.11s durchschnittliche Antwortzeit.
Was Grok 4.20 besonders macht: Die Benchmark-Gesamtkosten sind für diese Leistungsklasse ungewöhnlich niedrig. Es ist im Vergleich zu ähnlichen Modellen auffällig schnell.
Identitätshinweis
Grok 4.20 Beta war die Vorschauversion von Grok 4.20.
4.4
Konsistenz
8.5
k. A.
Gesamte Ausgabe-Token
1,923
Gesamte Eingabe-Token
41,313
Eingabepreis
$1.250 / 1M
Ausgabepreis
$2.500 / 1M
Instabile Tests
0
Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).
Generierungs-Showcase
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
Testverlauf
| Getestet am | Punktzahl | Zuverlässigkeit | Korrekte Tests | Gesamtkosten | Vergleichen |
|---|---|---|---|---|---|
| 2026-05-06 14:16 Erneuter Test | 5.4 | k. A. | $0.057 ↓ | Aktueller Lauf | |
| 2026-05-06 14:16 Erneuter Test | 5.4 | k. A. | $0.095 | Vergleichen | |
| 2026-05-06 14:16 Erneuter Test | 5.4 | k. A. | $0.095 | Vergleichen | |
| 2026-05-06 14:16 Suite geändert | 5.4 | k. A. | $0.095 | Vergleichen | |
| 2026-04-11 01:44 Erster erfasster Lauf | 5.2 | k. A. | $0.095 | Vergleichen |
Laufvergleich
| Lauf | Punktzahl | Konsistenz | Zuverlässigkeit | Korrekte Tests | Instabile Tests | Gesamte Ausgabe-Token | Gesamte Eingabe-Token | Gesamtkosten | Antwortzeit (Durchschnitt) |
|---|---|---|---|---|---|---|---|---|---|
| 2026-05-06 14:16 · Aktueller Lauf | 4.4 | 8.5 | k. A. | 6/18 | 0 | 1,923 | 41,313 | $0.057 | 1.11s |
| 2026-05-06 14:16 · Suite geändert | 5.4 | 9.5 | k. A. | 6/18 | 1 | 1,967 | 0 | $0.095 | 1.11s |
| Differenz | -1.0 | -1.0 | 0 | -1 | -44 | +41313 | -$0.038 | -4ms |
Preisverlauf
Historische Preisdaten für dieses Modell von OpenRouter.
| Datum | Eingabepreis | Ausgabepreis |
|---|---|---|
| 2026-06-04 15:40 | $1.250 / 1M | $2.500 / 1M |
Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.
| Kategorie | Punktzahl | Konsistenz | Korrekte Tests |
|---|---|---|---|
| Anti-KI-Tricks | 4.8 | 10.0 | |
| Programmierung | 1.1 | 3.1 | |
| Kombiniert | 3.0 | 10.0 | |
| Datenanalyse und -extraktion | 10.0 | 10.0 | |
| Domänenspezifisch | 3.0 | 10.0 | |
| Allgemeine Intelligenz | 4.8 | 10.0 | |
| Befolgung von Anweisungen | 6.3 | 10.0 | |
| Rätsellösen | 5.3 | 10.0 | |
| Werkzeugaufrufe | 10.0 | 10.0 | |
| Allgemeinwissen | 0.0 | 0.0 |