Comparer Graphiques

Langue:

❤️ Made by XCS

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs Google: Gemini 3 Pro Preview

Nom du modèle:

Benchmarks générés à partir des suites de tests AI BENCHY le : 2026-02-27 15:16

Résumé

Métrique	Anthropic: Claude Sonnet 4.6 medium Sortie: Date de sortie inconnue	Google: Gemini 3 Pro Preview medium Sortie: Date de sortie inconnue
Rang	#8	#3
Score	7.43	8.64
Cohérence	9.40	10.00
Coût par résultat	8.105	0.947
Coût total	$0.811	$0.114
Tests corrects
Tests incorrects	4	2
Taux de réussite par tentative	73.8%	85.7%
Tests instables	1	0
Jetons de sortie	29,098	1,100
Jetons de raisonnement	20,435	5,910

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Anthropic: Claude Sonnet 4.6	7.00	10.00	66.7%	0		1,031	1,093
Google: Gemini 3 Pro Preview	10.00	10.00	100.0%	0		143	1,107

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Anthropic: Claude Sonnet 4.6	10.00	10.00	100.0%	0		727	907
Google: Gemini 3 Pro Preview	10.00	10.00	100.0%	0		318	687

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Anthropic: Claude Sonnet 4.6	1.00	7.21	11.1%	1		25,790	16,919
Google: Gemini 3 Pro Preview	4.00	10.00	33.3%	0		15	1,211

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Anthropic: Claude Sonnet 4.6	10.00	10.00	100.0%	0		316	523
Google: Gemini 3 Pro Preview	9.50	10.00	100.0%	0		69	754

Puzzle Solving	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Anthropic: Claude Sonnet 4.6	10.00	10.00	100.0%	0		579	642
Google: Gemini 3 Pro Preview	10.00	10.00	100.0%	0		231	1,180

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Anthropic: Claude Sonnet 4.6	10.00	10.00	100.0%	0		655	351
Google: Gemini 3 Pro Preview	10.00	10.00	100.0%	0		324	971

Changer la paire de comparaison

Comparer Anthropic: Claude Sonnet 4.6 à...

Comparer Google: Gemini 3 Pro Preview à...