Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

xAI: Grok 4.1 Fast vs xAI: Grok 4.20 Beta

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-03-12

Metriek Grok 4.1 Fast Grok 4.1 Fast medium Releasedatum: 2025-11-19 Grok 4.20 Beta Grok 4.20 Beta medium Releasedatum: 2026-03-12
Rang #32 #24
Gem. score 6.2 7.0
Consistentie 7.9 9.0
Kosten per resultaat 0.563 5.989
Totale kosten $0.051 $0.599
Correcte tests
Slaagpercentage per poging 66.7% 70.8%
Instabiele tests 4 2
Totaal runs 48 48
Uitvoer-tokens 1,183 1,481
Redeneer-tokens 83,875 86,628
Responstijd (gem.) 26.35s 8.89s
Responstijd (max) 121.79s 24.21s
Responstijd (totaal) 237.11s 142.18s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Gem. score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Gem. score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Grok 4.1 Fast 10.0 10.0 100.0% 0 5.65s 102 4,021
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.19s 262 6,289
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Grok 4.1 Fast 10.0 10.0 100.0% 0 37.64s 261 12,272
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 227 12,212
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Grok 4.1 Fast 9.9 10.0 100.0% 0 6.63s 180 5,409
Grok 4.20 Beta 9.9 10.0 100.0% 0 4.01s 180 5,281
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Grok 4.1 Fast 4.0 4.4 66.7% 2 121.79s 11 37,657
Grok 4.20 Beta 4.0 10.0 33.3% 0 21.33s 251 40,255
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Grok 4.1 Fast 3.0 9.9 0.0% 0 16.25s 127 3,456
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 72 3,440
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Grok 4.1 Fast 5.5 10.0 50.0% 0 5.30s 55 3,489
Grok 4.20 Beta 9.0 10.0 50.0% 0 4.97s 57 7,107
Puzzle Solving Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Grok 4.1 Fast 4.0 7.2 44.4% 1 8.08s 187 6,086
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.85s 249 6,660
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Grok 4.1 Fast 10.0 1.6 33.3% 1 27.71s 260 11,485
Grok 4.20 Beta 10.0 10.0 0.0% 0 12.39s 183 5,384

Snelle vergelijking

Vergelijkingspaar wisselen