AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#88

GLM 5v Turbo X Ai/grok 4.20 Google/gemma 4 31b IT

Z.ai · Releasedatum: Onbekende releasedatum · z-ai/glm-5v-turbo x-ai/grok-4.20 google/gemma-4-31b-it::none

Score

3.0

Consistentie

10.0

Totale kosten

$0.000

Totaal aantal uitvoer-tokens

0

Invoerprijs

$0.000 / 1M

Uitvoerprijs

$0.000 / 1M

Correcte tests

Foute tests: 16

Slaagpercentage per poging: 0.0%

Instabiele tests

0

Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).

Responstijd (gem.)

0ms

Responstijd (max): 0ms

Responstijd (totaal): 0ms

Grafieken

Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Snelle vergelijking

Categorie-uitsplitsing

Categorie Score Consistentie Correcte tests
Anti-AI-trucs 3.0 10.0
Gecombineerd 3.0 10.0
Gegevensparsering en extractie 3.0 10.0
Domeinspecifiek 3.0 10.0
Algemene intelligentie 3.0 10.0
Instructies opvolgen 3.0 10.0
Puzzeloplossing 3.0 10.0
Toolaanroepen 3.0 10.0

Vergeleken modellen