Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

xAI: Grok Build 0.1 vs Z.ai: GLM 5.2

Rezumat

Comparație benchmark Grok Build 0.1 vs GLM 5.2: Grok Build 0.1 conduce la scorul mediu cu 7.6 vs 7.1. GLM 5.2 are costul de benchmark mai mic, $0.051 vs $0.927. GLM 5.2 este mai rapid cu 6.34s vs 49.90s, cu rate de reușită de 61.9% vs 60.3%.

Model recomandat: GLM 5.2 - Scorul rămâne aproape de cel mai bun scor de aici (7.1 vs 7.6) și costă de aproximativ 18.4x mai puțin decât Grok Build 0.1.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-02

Metrică Grok Build 0.1 Grok Build 0.1 medium Lansare: 2026-05-21 GLM 5.2 GLM 5.2 none Lansare: 2026-06-17
Scor 7.6 7.1
Rang #44 #63
Fiabilitate 10.0 9.9
Consistență 9.9 9.6
Teste corecte
Rată de trecere pe încercare 61.9% 60.3%
Teste instabile 0 1
Rulări totale 63 63
Cost per rezultat 7.124 0.628
Cost total $0.927 $0.051
Preț de intrare $1.000 / 1M $0.930 / 1M
Preț de ieșire $2.000 / 1M $3.000 / 1M
Total tokenuri de intrare 44,418 38,671
Tokenuri de ieșire 2,782 4,817
Tokenuri de raționament 438,018 0
Timp de răspuns (mediu) 49.90s 6.34s
Timp de răspuns (maxim) 252.69s 20.69s
Timp de răspuns (total) 1047.92s 133.19s

Prezentare generare

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#44 xAI: Grok Build 0.1

medium
Cost
$0.028
Timp
81.3s
Tokenuri
14,009 tok

#63 GLM 5.2

none
SVG invalid
Cost
$0.033
Timp
87.7s
Tokenuri
7,455 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Grok Build 0.1 8.3 10.0 75.0% 0 7.43s 2,010 220 12,162
GLM 5.2 8.3 10.0 75.0% 0 3.70s 567 313 0
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Grok Build 0.1 5.7 9.7 33.3% 0 108.46s 8,304 1,138 161,452
GLM 5.2 3.7 9.5 0.0% 0 7.55s 7,263 1,958 0
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Grok Build 0.1 10.0 10.0 100.0% 0 32.81s 12,909 231 16,917
GLM 5.2 10.0 10.0 100.0% 0 20.69s 14,296 1,489 0
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Grok Build 0.1 10.0 10.0 100.0% 0 10.72s 7,761 180 8,876
GLM 5.2 10.0 10.0 100.0% 0 7.17s 7,113 204 0
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Grok Build 0.1 5.3 10.0 33.3% 0 158.00s 1,764 492 175,294
GLM 5.2 5.3 10.0 33.3% 0 6.50s 696 27 0
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Grok Build 0.1 4.4 9.9 0.0% 0 18.41s 825 76 6,345
GLM 5.2 6.1 3.1 66.7% 1 4.42s 480 82 0
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Grok Build 0.1 9.8 10.0 100.0% 0 12.36s 1,362 57 9,599
GLM 5.2 9.8 10.0 100.0% 0 3.84s 642 66 0
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Grok Build 0.1 7.7 10.0 66.7% 0 18.26s 1,689 195 20,841
GLM 5.2 7.7 10.0 66.7% 0 3.31s 618 265 0
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Grok Build 0.1 10.0 10.0 100.0% 0 13.12s 7,263 180 4,969
GLM 5.2 10.0 10.0 100.0% 0 15.76s 6,807 400 0
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Grok Build 0.1 3.0 10.0 0.0% 0 53.51s 531 13 21,563
GLM 5.2 3.0 10.0 0.0% 0 3.41s 189 13 0

Comparație rapidă

Schimbă perechea de comparație