Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs Google: Gemma 4 26B A4B

Rezumat

Comparație benchmark Claude Sonnet 4.6 vs Gemma 4 26B A4B: Claude Sonnet 4.6 conduce la scorul mediu cu 7.3 vs 7.2. Gemma 4 26B A4B are costul de benchmark mai mic, $0.045 vs $0.316. Claude Sonnet 4.6 este mai rapid cu 5.04s vs 63.41s, cu rate de reușită de 55.6% vs 69.8%.

Model recomandat: Claude Sonnet 4.6 - Are cel mai bun scor aici (7.3) și răspunde de aproximativ 12.6x mai rapid decât Gemma 4 26B A4B.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-02

Metrică Claude Sonnet 4.6 Claude Sonnet 4.6 none Lansare: 2026-02-17 Gemma 4 26B A4B Gemma 4 26B A4B medium Lansare: 2026-04-03 Disponibil gratuit
Scor 7.3 7.2
Rang #57 #61
Fiabilitate 10.0 10.0
Consistență 9.7 9.2
Teste corecte
Rată de trecere pe încercare 55.6% 69.8%
Teste instabile 1 2
Rulări totale 63 63
Cost per rezultat 2.870 0.361
Cost total $0.316 $0.045
Preț de intrare $3.000 / 1M $0.060 / 1M
Preț de ieșire $15.000 / 1M $0.330 / 1M
Total tokenuri de intrare 57,886 40,252
Tokenuri de ieșire 9,465 28,000
Tokenuri de raționament 0 100,490
Timp de răspuns (mediu) 5.04s 63.41s
Timp de răspuns (maxim) 23.84s 369.32s
Timp de răspuns (total) 70.60s 1268.28s

Prezentare generare

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#57 Claude Sonnet 4.6

none
Cost
$0.038
Timp
27.3s
Tokenuri
2,598 tok

#61 Gemma 4 26B A4B

medium
SVG invalid
Cost
$0.000
Timp
300.0s
Tokenuri
0 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
Gemma 4 26B A4B 10.0 10.0 100.0% 0 6.20s 816 1,142 3,045
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
Gemma 4 26B A4B 2.9 10.0 0.0% 0 272.54s 5,062 14,838 44,567
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
Gemma 4 26B A4B 9.6 10.0 100.0% 0 73.55s 17,092 5,415 13,112
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
Gemma 4 26B A4B 10.0 10.0 100.0% 0 16.51s 8,334 1,567 2,827
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
Gemma 4 26B A4B 2.9 4.4 22.2% 2 23.62s 516 2,469 7,105
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
Gemma 4 26B A4B 10.0 10.0 100.0% 0 29.76s 567 25 5,075
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
Gemma 4 26B A4B 10.0 10.0 100.0% 0 17.54s 777 887 4,470
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
Gemma 4 26B A4B 10.0 10.0 100.0% 0 5.79s 801 410 2,128
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
Gemma 4 26B A4B 10.0 10.0 100.0% 0 9.01s 6,096 450 1,256
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
Gemma 4 26B A4B 3.0 10.0 0.0% 0 180.87s 191 797 16,905

Comparație rapidă

Schimbă perechea de comparație