Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

xAI: Grok 4.3 vs Z.ai: GLM 5 Turbo

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-22

Metrică Grok 4.3 Grok 4.3 medium Lansare: 2026-05-01 GLM 5 Turbo GLM 5 Turbo medium Lansare: 2026-03-15
Scor 7.8 7.9
Rang #31 #28
Fiabilitate 10.0 8.3
Consistență 8.4 8.1
Teste corecte
Rată de trecere pe încercare 75.0% 76.7%
Teste instabile 4 5
Rulări totale 60 60
Cost per rezultat 4.562 1.872
Cost total $0.593 $0.244
Preț de intrare $1.250 / 1M $1.200 / 1M
Preț de ieșire $2.500 / 1M $4.000 / 1M
Tokenuri de ieșire 1,485 12,231
Tokenuri de raționament 214,928 53,558
Timp de răspuns (mediu) 49.23s 22.69s
Timp de răspuns (maxim) 216.69s 194.23s
Timp de răspuns (total) 984.54s 453.72s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Grok 4.3 10.0 10.0 100.0% 0 8.83s 88 8,207
GLM 5 Turbo 10.0 10.0 100.0% 0 4.82s 362 3,137
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Grok 4.3 7.4 6.5 66.7% 1 55.26s 532 24,554
GLM 5 Turbo 7.3 5.8 83.3% 1 53.92s 346 16,607
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Grok 4.3 10.0 10.0 100.0% 0 63.99s 234 15,301
GLM 5 Turbo 10.0 10.0 100.0% 0 13.88s 390 2,037
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Grok 4.3 10.0 10.0 100.0% 0 18.97s 180 9,546
GLM 5 Turbo 10.0 10.0 100.0% 0 6.19s 577 3,632
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Grok 4.3 5.3 7.2 44.4% 1 181.74s 14 111,300
GLM 5 Turbo 2.9 4.4 22.2% 2 71.07s 9,665 19,279
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Grok 4.3 5.4 2.5 66.7% 1 24.70s 70 5,020
GLM 5 Turbo 6.1 3.1 66.7% 1 10.05s 60 2,216
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Grok 4.3 9.8 10.0 100.0% 0 18.58s 57 8,713
GLM 5 Turbo 10.0 10.0 100.0% 0 5.38s 255 2,183
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Grok 4.3 5.9 7.2 55.6% 1 22.53s 128 14,686
GLM 5 Turbo 8.7 7.9 77.8% 1 5.44s 315 2,702
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Grok 4.3 10.0 10.0 100.0% 0 17.66s 168 4,615
GLM 5 Turbo 10.0 10.0 100.0% 0 9.84s 241 446
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Grok 4.3 3.0 10.0 0.0% 0 44.47s 14 12,986
GLM 5 Turbo 3.0 10.0 0.0% 0 40.17s 20 1,319

Comparație rapidă

Schimbă perechea de comparație