AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs Google: Gemini 3.1 Pro Preview

Résumé

Comparaison benchmark Claude Opus 4.7 vs Gemini 3.1 Pro Preview : Gemini 3.1 Pro Preview mène au score moyen avec 9.2 vs 7.4. Claude Opus 4.7 a le coût de benchmark le plus bas avec $0.505 vs $1.054. Claude Opus 4.7 est plus rapide avec 3.02s vs 20.14s, avec des taux de réussite de 76.2% vs 90.5%.

Modèle recommandé: Claude Opus 4.7 - Il offre le meilleur compromis global: score compétitif (7.4), coût inférieur à Gemini 3.1 Pro Preview et temps de réponse équilibré.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-18

Métrique	Claude Opus 4.7 Claude Opus 4.7 none Sortie: 2026-04-16	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Sortie: 2026-02-19

Métrique	Claude Opus 4.7 Claude Opus 4.7 none Sortie: 2026-04-16	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Sortie: 2026-02-19
Score	7.4	9.2
Rang	#49	#7
Fiabilité	10.0	10.0
Cohérence	9.0	10.0
Tests corrects
Taux de réussite par tentative	76.2%	90.5%
Tests instables	0	0
Exécutions totales	57	63
Coût par résultat	3.154	5.546
Coût total	$0.505	$1.054
Prix d'entrée	$5.000 / 1M	$2.000 / 1M
Prix de sortie	$25.000 / 1M	$12.000 / 1M
Total des jetons d'entrée	69,576	41,617
Jetons de sortie	6,265	1,977
Jetons de raisonnement	0	78,896
Temps de réponse (moy.)	3.02s	20.14s
Temps de réponse (max)	18.27s	88.68s
Temps de réponse (total)	57.44s	281.92s

Génération showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#49 Claude Opus 4.7

none

Coût: $0.051
Temps: 24.2s
Tokens: 2,181 tok

#7 Gemini 3.1 Pro Preview

medium

Coût: $0.115
Temps: 87.2s
Tokens: 9,629 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.7	8.3	10.0	75.0%	0		2.12s	894	522	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	498	112	3,218

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.7	3.3	3.3	33.3%	0		2.84s	1,176	494	0
Gemini 3.1 Pro Preview	7.9	9.9	66.7%	0		40.17s	8,124	435	41,247

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.7	9.5	10.0	100.0%	0		18.27s	37,740	3,504	0
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	17,240	432	9,281

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.7	10.0	10.0	100.0%	0		2.15s	10,533	324	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	7,265	279	3,904

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.7	7.7	10.0	66.7%	0		1.19s	1,020	78	0
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	635	18	12,424

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.7	10.0	10.0	100.0%	0		3.47s	723	257	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	490	108	1,179

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.7	10.0	10.0	100.0%	0		1.46s	939	114	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	621	72	2,236

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.7	10.0	10.0	100.0%	0		2.46s	939	597	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.90s	570	235	3,128

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.7	10.0	10.0	100.0%	0		4.74s	15,339	372	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	6,018	274	982

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.7	3.0	10.0	0.0%	0		1.46s	273	3	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.27s	156	12	1,297

Comparaison rapide

Changer la paire de comparaison