X AI
Veröffentlichung: 2026-05-21
Getestet am: 2026-05-21 12:40
x-ai/grok-build-0.1::none
(medium)
(none)
Zusammenfassung
Grok Build 0.1 erreicht 4.2 bei AI BENCHY und liegt auf #165. Das Modell hat 10.0 Zuverlässigkeit, 46.0% Erfolgsrate, $0.547 Gesamtkosten und 28.69s durchschnittliche Antwortzeit.
Archiviertes Modell: Dieses Modell wird nicht mehr aktualisiert und nicht mehr in neuen Tests getestet.
4.2
Konsistenz
7.5
10.0
Gesamte Ausgabe-Token
267,275
Gesamte Eingabe-Token
11,793
Eingabepreis
$1.000 / 1M
Ausgabepreis
$2.000 / 1M
Instabile Tests
4
Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).
Testverlauf
| Getestet am | Punktzahl | Zuverlässigkeit | Korrekte Tests | Gesamtkosten | Vergleichen |
|---|---|---|---|---|---|
| 2026-05-21 12:40 Erneuter Test | 6.0 | 10.0 | $0.547 | Aktueller Lauf | |
| 2026-05-21 12:40 Erneuter Test | 6.6 | 10.0 | $0.547 | Vergleichen |
Laufvergleich
| Lauf | Punktzahl | Konsistenz | Zuverlässigkeit | Korrekte Tests | Instabile Tests | Gesamte Ausgabe-Token | Gesamte Eingabe-Token | Gesamtkosten | Antwortzeit (Durchschnitt) |
|---|---|---|---|---|---|---|---|---|---|
| 2026-05-21 12:40 · Aktueller Lauf | 4.2 | 7.5 | 10.0 | 7/19 | 4 | 267,275 | 11,793 | $0.547 | 28.69s |
| 2026-05-21 12:40 · Erneuter Test | 6.6 | 8.0 | 10.0 | 7/16 | 4 | 267,275 | 0 | $0.547 | 28.69s |
| Differenz | -2.4 | -0.5 | 0.0 | -3 | 0 | 0 | +11793 | $0.000 | 0ms |
Preisverlauf
Historische Preisdaten für dieses Modell von OpenRouter.
| Datum | Eingabepreis | Ausgabepreis |
|---|---|---|
| 2026-06-04 15:40 | $1.000 / 1M | $2.000 / 1M |
Diagramme
Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.
Punktzahl vs Gesamtkosten
Antwortzeit (Durchschnitt)
Punktzahl vs Antwortzeit (Durchschnitt)
Gesamte Ausgabe-Token
Punktzahl vs Gesamte Ausgabe-Token
Schnellvergleich
Kategorieaufschlüsselung
| Kategorie | Punktzahl | Konsistenz | Korrekte Tests |
|---|---|---|---|
| Anti-KI-Tricks | 8.7 | 7.9 | |
| Programmierung | 3.3 | 3.3 | |
| Kombiniert | 3.0 | 10.0 | |
| Datenanalyse und -extraktion | 3.8 | 5.8 | |
| Domänenspezifisch | 3.6 | 7.2 | |
| Allgemeine Intelligenz | 4.3 | 10.0 | |
| Befolgung von Anweisungen | 9.8 | 10.0 | |
| Rätsellösen | 6.4 | 7.7 | |
| Werkzeugaufrufe | 3.0 | 10.0 | |
| Allgemeinwissen | 3.0 | 10.0 |