Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Fable 5 vs Google: Gemini 3.5 Flash

Rezumat

Comparație benchmark Claude Fable 5 vs Gemini 3.5 Flash: Claude Fable 5 conduce la scorul mediu cu 8.7 vs 7.7. Gemini 3.5 Flash are costul de benchmark mai mic, $0.108 vs $3.165. Gemini 3.5 Flash este mai rapid cu 1.57s vs 17.01s, cu rate de reușită de 82.5% vs 68.3%.

Model recomandat: Gemini 3.5 Flash - Oferă cel mai bun compromis per total: scor competitiv (7.7), cost mai mic decât Claude Fable 5 și timp de răspuns echilibrat.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-10

Metrică Claude Fable 5 Claude Fable 5 medium Lansare: 2026-06-10 Gemini 3.5 Flash Gemini 3.5 Flash minimal Lansare: 2026-05-19
Scor 8.7 7.7
Rang #12 #33
Fiabilitate 10.0 10.0
Consistență 9.6 9.6
Teste corecte
Rată de trecere pe încercare 82.5% 68.3%
Teste instabile 1 1
Rulări totale 63 63
Cost per rezultat 18.614 0.767
Cost total $3.165 $0.108
Preț de intrare $10.000 / 1M $1.500 / 1M
Preț de ieșire $50.000 / 1M $9.000 / 1M
Total tokenuri de intrare 58,383 39,847
Tokenuri de ieșire 41,340 5,277
Tokenuri de raționament 10,269 0
Timp de răspuns (mediu) 17.01s 1.57s
Timp de răspuns (maxim) 80.80s 5.51s
Timp de răspuns (total) 357.17s 33.02s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#12 Claude Fable 5

medium
Cost
$0.606
Time
156.7s
Tokens
12,264 tok

#33 Gemini 3.5 Flash

minimal
Cost
$0.041
Time
20.4s
Tokens
4,608 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Fable 5 10.0 10.0 100.0% 0 6.20s 834 530 402
Gemini 3.5 Flash 6.5 10.0 50.0% 0 892ms 492 405 0
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Fable 5 10.0 10.0 100.0% 0 15.59s 10,590 7,383 1,318
Gemini 3.5 Flash 5.6 9.9 33.3% 0 2.75s 8,122 3,456 0
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Fable 5 10.0 10.0 100.0% 0 33.70s 20,937 2,353 1,599
Gemini 3.5 Flash 3.0 10.0 0.0% 0 3.56s 15,780 404 0
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Fable 5 10.0 10.0 100.0% 0 7.18s 10,503 521 363
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.66s 7,548 279 0
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Fable 5 5.3 7.2 44.4% 1 53.40s 975 25,215 5,001
Gemini 3.5 Flash 10.0 10.0 100.0% 0 899ms 633 12 0
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Fable 5 10.0 10.0 100.0% 0 7.42s 708 366 144
Gemini 3.5 Flash 10.0 10.0 100.0% 0 922ms 486 117 0
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Fable 5 10.0 10.0 100.0% 0 5.90s 909 139 202
Gemini 3.5 Flash 6.4 5.8 66.7% 1 893ms 615 76 0
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Fable 5 7.7 10.0 66.7% 0 5.18s 894 402 324
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.45s 558 282 0
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Fable 5 10.0 10.0 100.0% 0 16.96s 11,775 729 344
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.79s 5,457 234 0
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Fable 5 3.0 10.0 0.0% 0 25.64s 258 3,702 572
Gemini 3.5 Flash 3.0 10.0 0.0% 0 1.76s 156 12 0

Comparație rapidă

Schimbă perechea de comparație