Navigare
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemma 4 26B A4B vs Mistral: Mistral Small 4

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-04

Metrică Gemma 4 26B A4B Gemma 4 26B A4B none Lansare: 2026-04-03 Mistral Small 4 Mistral Small 4 medium Lansare: 2026-03-16
Scor 6.3 5.6
Rang #53 #68
Consistență 9.1 7.0
Teste corecte
Rată de trecere pe încercare 47.1% 49.0%
Teste instabile 2 6
Rulări totale 51 51
Cost per rezultat 0.068 0.502
Cost total $0.005 $0.026
Preț de intrare $0.130 / 1M $0.150 / 1M
Preț de ieșire $0.400 / 1M $0.600 / 1M
Tokenuri de ieșire 1,335 12,288
Tokenuri de raționament 0 28,112
Timp de răspuns (mediu) 6.56s 4.18s
Timp de răspuns (maxim) 57.10s 25.25s
Timp de răspuns (total) 111.54s 71.03s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemma 4 26B A4B 8.3 10.0 75.0% 0 1.28s 230 0
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 4,055 4,778
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemma 4 26B A4B 3.0 10.0 0.0% 0 30.53s 309 0
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 2,612 10,700
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemma 4 26B A4B 10.0 10.0 100.0% 0 1.70s 285 0
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 335 723
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemma 4 26B A4B 3.6 7.2 22.2% 1 2.49s 27 0
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 2,621 6,904
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemma 4 26B A4B 4.0 10.0 0.0% 0 3.54s 85 0
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 821 828
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemma 4 26B A4B 4.4 6.9 16.7% 1 1.08s 75 0
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 540 1,031
Puzzle Solving Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemma 4 26B A4B 5.7 10.0 33.3% 0 739ms 114 0
Mistral Small 4 3.4 9.7 0.0% 0 2.00s 983 2,338
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemma 4 26B A4B 10.0 10.0 100.0% 0 57.10s 210 0
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 321 810

Comparație rapidă

Schimbă perechea de comparație