Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs Google: Gemma 4 26B A4B

Rezumat

Comparație benchmark Gemini 3.5 Flash vs Gemma 4 26B A4B: Gemma 4 26B A4B conduce la scorul mediu cu 7.2 vs 7.0. Gemma 4 26B A4B are costul de benchmark mai mic, $0.045 vs $1.079. Gemini 3.5 Flash este mai rapid cu 9.93s vs 63.41s, cu rate de reușită de 77.8% vs 69.8%.

Model recomandat: Gemma 4 26B A4B - Are cel mai bun scor aici (7.2) și costă de aproximativ 24.5x mai puțin decât Gemini 3.5 Flash.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-18

Metrică Gemini 3.5 Flash Gemini 3.5 Flash none Lansare: 2026-05-19 Gemma 4 26B A4B Gemma 4 26B A4B medium Lansare: 2026-04-03 Disponibil gratuit
Scor 7.0 7.2
Rang #66 #59
Fiabilitate 10.0 10.0
Consistență 8.9 9.2
Teste corecte
Rată de trecere pe încercare 77.8% 69.8%
Teste instabile 3 2
Rulări totale 63 63
Cost per rezultat 7.190 0.361
Cost total $1.079 $0.045
Preț de intrare $1.500 / 1M $0.060 / 1M
Preț de ieșire $9.000 / 1M $0.330 / 1M
Total tokenuri de intrare 13,843 40,252
Tokenuri de ieșire 117,518 28,000
Tokenuri de raționament 0 100,490
Timp de răspuns (mediu) 9.93s 63.41s
Timp de răspuns (maxim) 64.36s 369.32s
Timp de răspuns (total) 178.68s 1268.28s

Prezentare generare

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#66 Gemini 3.5 Flash

none
Cost
$0.225
Timp
125.5s
Tokenuri
25,004 tok

#59 Gemma 4 26B A4B

medium
SVG invalid
Cost
$0.000
Timp
300.0s
Tokenuri
0 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.53s 492 5,101 0
Gemma 4 26B A4B 10.0 10.0 100.0% 0 6.20s 816 1,142 3,045
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 8.8 7.8 88.9% 1 34.69s 8,122 75,927 0
Gemma 4 26B A4B 2.9 10.0 0.0% 0 272.54s 5,062 14,838 44,567
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
Gemma 4 26B A4B 9.6 10.0 100.0% 0 73.55s 17,092 5,415 13,112
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 6.5 10.0 50.0% 0 8.10s 2,781 5,895 0
Gemma 4 26B A4B 10.0 10.0 100.0% 0 16.51s 8,334 1,567 2,827
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 7.6 7.2 77.8% 1 10.64s 633 17,910 0
Gemma 4 26B A4B 2.9 4.4 22.2% 2 23.62s 516 2,469 7,105
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.46s 486 1,620 0
Gemma 4 26B A4B 10.0 10.0 100.0% 0 29.76s 567 25 5,075
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 9.8 10.0 100.0% 0 3.38s 615 3,928 0
Gemma 4 26B A4B 10.0 10.0 100.0% 0 17.54s 777 887 4,470
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.13s 558 4,640 0
Gemma 4 26B A4B 10.0 10.0 100.0% 0 5.79s 801 410 2,128
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
Gemma 4 26B A4B 10.0 10.0 100.0% 0 9.01s 6,096 450 1,256
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 2.8 1.6 33.3% 1 4.87s 156 2,497 0
Gemma 4 26B A4B 3.0 10.0 0.0% 0 180.87s 191 797 16,905

Comparație rapidă

Schimbă perechea de comparație