Navigation
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs Google: Gemini 3.5 Flash

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-19

Métrique Claude Opus 4.7 Claude Opus 4.7 medium Sortie: 2026-04-16 Gemini 3.5 Flash Gemini 3.5 Flash minimal Sortie: 2026-05-19
Score 8.9 8.1
Rang #7 #21
Fiabilité 10.0 10.0
Cohérence 10.0 9.6
Tests corrects
Taux de réussite par tentative 84.2% 75.4%
Tests instables 0 1
Exécutions totales 57 57
Coût par résultat 2.802 0.494
Coût total $0.449 $0.070
Prix d'entrée $5.000 / 1M $1.500 / 1M
Prix de sortie $25.000 / 1M $9.000 / 1M
Jetons de sortie 5,399 2,262
Jetons de raisonnement 1,341 0
Temps de réponse (moy.) 3.46s 1.37s
Temps de réponse (max) 21.45s 3.56s
Temps de réponse (total) 62.29s 26.04s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 348 0
Gemini 3.5 Flash 6.5 10.0 50.0% 0 892ms 405 0
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Claude Opus 4.7 10.0 10.0 100.0% 0 6.41s 1,141 257
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.28s 441 0
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 2,369 1,084
Gemini 3.5 Flash 3.0 10.0 0.0% 0 3.56s 404 0
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 324 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.66s 279 0
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 51 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 899ms 12 0
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 256 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 922ms 117 0
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 114 0
Gemini 3.5 Flash 6.4 5.8 66.7% 1 893ms 76 0
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Claude Opus 4.7 10.0 10.0 100.0% 0 2.51s 399 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.45s 282 0
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 373 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.79s 234 0
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Claude Opus 4.7 3.0 10.0 0.0% 0 2.25s 24 0
Gemini 3.5 Flash 3.0 10.0 0.0% 0 1.76s 12 0

Comparaison rapide

Changer la paire de comparaison