Navigare
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

StepFun: Step 3.7 Flash vs Z.ai: GLM 5

Rezumat

Comparație benchmark Step 3.7 Flash vs GLM 5: GLM 5 conduce la scorul mediu cu 8.6 vs 7.7. GLM 5 are costul de benchmark mai mic, $0.228 vs $0.341. Step 3.7 Flash este mai rapid cu 15.74s vs 33.54s, cu rate de reușită de 68.3% vs 82.5%.

Model recomandat: GLM 5 - Are cel mai bun scor aici (8.6) și costă de aproximativ 1.5x mai puțin decât Step 3.7 Flash.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-17

Metrică Step 3.7 Flash Step 3.7 Flash low Lansare: 2026-05-29 GLM 5 GLM 5 medium Lansare: 2026-02-12
Scor 7.7 8.6
Rang #39 #15
Fiabilitate 10.0 10.0
Consistență 8.4 8.5
Teste corecte
Rată de trecere pe încercare 68.3% 82.5%
Teste instabile 4 4
Rulări totale 63 63
Cost per rezultat 2.840 1.668
Cost total $0.341 $0.228
Preț de intrare $0.200 / 1M $0.600 / 1M
Preț de ieșire $1.150 / 1M $1.920 / 1M
Total tokenuri de intrare 40,101 35,224
Tokenuri de ieșire 289,325 21,570
Tokenuri de raționament 0 102,996
Timp de răspuns (mediu) 15.74s 33.54s
Timp de răspuns (maxim) 124.75s 99.85s
Timp de răspuns (total) 330.63s 435.99s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#39 Step 3.7 Flash

low
Invalid SVG
Cost
$0.004
Time
25.3s
Tokens
3,072 tok

#15 GLM 5

medium
Cost
$0.005
Time
20.7s
Tokens
2,068 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 756 10,896 0
GLM 5 10.0 10.0 100.0% 0 23.66s 555 480 7,056
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Step 3.7 Flash 8.2 7.2 88.9% 1 9.46s 7,437 18,685 0
GLM 5 10.0 10.0 100.0% 0 74.30s 7,254 2,997 52,930
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 13,683 6,426 0
GLM 5 10.0 10.0 100.0% 0 28.96s 12,804 662 3,242
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 7,398 2,667 0
GLM 5 7.1 5.6 83.3% 1 8.90s 5,508 567 3,734
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 828 104,487 0
GLM 5 3.5 4.4 33.3% 2 0ms 260 13,176 14,137
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 525 4,604 0
GLM 5 6.1 3.1 66.7% 1 14.69s 477 2,020 2,248
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 735 1,857 0
GLM 5 10.0 10.0 100.0% 0 7.25s 636 1,001 2,129
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 756 3,564 0
GLM 5 10.0 10.0 100.0% 0 11.33s 609 33 4,076
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 7,746 1,360 0
GLM 5 10.0 10.0 100.0% 0 15.93s 6,935 233 994
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 237 134,779 0
GLM 5 3.0 10.0 0.0% 0 67.37s 186 401 12,450

Comparație rapidă

Schimbă perechea de comparație