Navigare
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.5 Flash vs Z.ai: GLM 4.7 Flash

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-19

Metrică Gemini 3.5 Flash Gemini 3.5 Flash low Lansare: 2026-05-19 GLM 4.7 Flash GLM 4.7 Flash medium Lansare: 2026-01-19
Scor 9.6 4.5
Rang #2 #143
Fiabilitate 10.0 10.0
Consistență 10.0 6.5
Teste corecte
Rată de trecere pe încercare 94.7% 36.8%
Teste instabile 0 8
Rulări totale 57 57
Cost per rezultat 1.359 1.139
Cost total $0.245 $0.046
Preț de intrare $1.500 / 1M $0.060 / 1M
Preț de ieșire $9.000 / 1M $0.400 / 1M
Tokenuri de ieșire 2,003 39,759
Tokenuri de raționament 20,245 73,598
Timp de răspuns (mediu) 2.84s 30.57s
Timp de răspuns (maxim) 6.44s 174.55s
Timp de răspuns (total) 54.00s 366.78s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.52s 209 2,536
GLM 4.7 Flash 4.7 5.9 41.7% 2 14.95s 1,122 6,110
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 5.49s 428 3,146
GLM 4.7 Flash 3.6 2.1 33.3% 1 21.26s 969 6,936
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.44s 351 3,050
GLM 4.7 Flash 2.8 2.1 33.3% 1 65.57s 2,585 20,648
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.81s 279 1,164
GLM 4.7 Flash 6.3 10.0 50.0% 0 1.51s 584 2,755
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 7.7 10.0 66.7% 0 3.39s 12 4,538
GLM 4.7 Flash 3.5 4.4 33.3% 2 174.55s 33,000 25,394
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.27s 119 916
GLM 4.7 Flash 3.6 9.7 0.0% 0 18.14s 18 2,138
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 9.9 10.0 100.0% 0 1.86s 71 1,652
GLM 4.7 Flash 6.2 5.8 66.7% 1 2.97s 388 2,181
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.35s 288 2,150
GLM 4.7 Flash 2.9 7.2 11.1% 1 12.90s 798 5,225
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.27s 234 403
GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 224 1,014
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.88s 12 690
GLM 4.7 Flash 3.0 10.0 0.0% 0 11.13s 71 1,197

Comparație rapidă

Schimbă perechea de comparație