Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemma 4 31B vs Inception: Mercury 2

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-29

Metrică Gemma 4 31B Gemma 4 31B none Lansare: 2026-04-02 Disponibil gratuit Mercury 2 Mercury 2 medium Lansare: 2026-02-24
Scor 6.7 6.5
Rang #83 #92
Fiabilitate 10.0 10.0
Consistență 10.0 8.8
Teste corecte
Rată de trecere pe încercare 50.0% 51.7%
Teste instabile 0 3
Rulări totale 60 60
Cost per rezultat 0.030 0.611
Cost total $0.003 $0.055
Preț de intrare $0.120 / 1M $0.250 / 1M
Preț de ieșire $0.370 / 1M $0.750 / 1M
Tokenuri de ieșire 1,398 4,022
Tokenuri de raționament 0 58,405
Timp de răspuns (mediu) 4.05s 2.27s
Timp de răspuns (maxim) 26.13s 14.63s
Timp de răspuns (total) 72.97s 43.20s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemma 4 31B 6.5 10.0 50.0% 0 1.85s 45 0
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemma 4 31B 6.8 10.0 50.0% 0 14.84s 726 0
Mercury 2 7.2 6.5 66.7% 1 2.29s 270 8,514
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemma 4 31B 10.0 10.0 100.0% 0 2.25s 285 0
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemma 4 31B 7.7 10.0 66.7% 0 3.22s 27 0
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemma 4 31B 10.0 10.0 100.0% 0 2.09s 117 0
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemma 4 31B 6.5 10.0 50.0% 0 2.84s 78 0
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemma 4 31B 6.5 10.0 33.3% 0 4.23s 108 0
Mercury 2 5.4 10.0 33.3% 0 949ms 361 2,781
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemma 4 31B 3.0 10.0 0.0% 0 1.25s 12 0
Mercury 2 3.0 10.0 0.0% 0 2.58s 22 3,748

Comparație rapidă

Schimbă perechea de comparație