Navigation
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 5 vs Google: Gemini 3.1 Flash Lite Preview

Résumé

Comparaison benchmark Claude Sonnet 5 vs Gemini 3.1 Flash Lite Preview : Gemini 3.1 Flash Lite Preview mène au score moyen avec 6.5 vs 5.7. Gemini 3.1 Flash Lite Preview a le coût de benchmark le plus bas avec $0.026 vs $0.287. Gemini 3.1 Flash Lite Preview est plus rapide avec 2.77s vs 4.74s, avec des taux de réussite de 42.9% vs 61.9%.

Modèle recommandé: Gemini 3.1 Flash Lite Preview - Il obtient le meilleur score ici (6.5) tout en coûtant environ 11.3x moins que Claude Sonnet 5.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-30

Métrique Claude Sonnet 5 Claude Sonnet 5 none Sortie: 2026-06-30 Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Sortie: 2026-03-03
Score 5.7 6.5
Rang #117 #84
Fiabilité 10.0 10.0
Cohérence 8.6 10.0
Tests corrects
Taux de réussite par tentative 42.9% 61.9%
Tests instables 4 0
Exécutions totales 63 63
Coût par résultat 4.098 0.196
Coût total $0.287 $0.026
Prix d'entrée $2.000 / 1M $0.250 / 1M
Prix de sortie $10.000 / 1M $1.500 / 1M
Total des jetons d'entrée 76,797 32,715
Jetons de sortie 13,325 2,286
Jetons de raisonnement 0 9,166
Temps de réponse (moy.) 4.74s 2.77s
Temps de réponse (max) 29.46s 11.91s
Temps de réponse (total) 99.46s 58.12s

Génération showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 Claude Sonnet 5

none
Coût
$0.061
Temps
53.7s
Tokens
6,172 tok

#84 Gemini 3.1 Flash Lite Preview

low
Coût
$0.002
Temps
3.7s
Tokens
1,203 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 5 5.3 10.0 25.0% 0 3.60s 834 1,813 0
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 506 462 1,638
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 5 4.6 7.9 22.2% 1 3.67s 10,590 1,864 0
Gemini 3.1 Flash Lite Preview 5.5 10.0 33.3% 0 1.39s 8,138 660 1,060
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 5 3.0 10.0 0.0% 0 29.46s 38,775 6,340 0
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 8,381 225 762
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 5 10.0 10.0 100.0% 0 3.01s 10,503 309 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 7,455 291 696
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 5 5.3 7.2 44.4% 1 3.28s 975 933 0
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 641 18 1,212
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 5 4.7 3.1 33.3% 1 2.81s 708 272 0
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 490 69 384
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 5 6.4 10.0 50.0% 0 2.58s 909 103 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 621 72 753
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 5 6.0 7.4 55.6% 1 3.22s 894 778 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.69s 566 243 1,248
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 5 10.0 10.0 100.0% 0 6.80s 12,351 522 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 5,757 237 993
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 5 3.0 10.0 0.0% 0 4.31s 258 391 0
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 1.35s 160 9 420

Comparaison rapide

Changer la paire de comparaison