Comparer Graphiques

Langue:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs OpenAI: GPT-5.4

Comparer:

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-03-05

Métrique	Google: Gemini 3 Flash Preview medium Sortie: 2025-12-17	OpenAI: GPT-5.4 none Sortie: 2026-03-05
Rang	#1	#44
Score moy.	10.0	4.6
Tests corrects
Cohérence	10.0	8.9
Coût par résultat	1.064	1.496
Coût total	$0.160	$0.090
Taux de réussite par tentative	100.0%	44.4%
Tests instables	0	2
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
Jetons de sortie	1,523	1,635
Jetons de raisonnement	46,622	0
Temps de réponse (moy.)	13.39s	1.46s
Temps de réponse (max)	50.16s	2.89s
Temps de réponse (total)	107.12s	21.86s

Meilleurs modèles par score

Temps de réponse (moy.)

Score vs coût total

Score moy. vs Temps de réponse (moy.)

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Google: Gemini 3 Flash Preview	10.0	10.0	100.0%	0		5.61s	299	3,127
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Google: Gemini 3 Flash Preview	10.0	10.0	100.0%	0		50.16s	351	12,645
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Google: Gemini 3 Flash Preview	9.9	10.0	100.0%	0		4.72s	279	5,333
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Google: Gemini 3 Flash Preview	10.0	10.0	100.0%	0		21.12s	12	14,908
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Google: Gemini 3 Flash Preview	10.0	10.0	100.0%	0		6.10s	72	4,558
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0

Puzzle Solving	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Google: Gemini 3 Flash Preview	10.0	10.0	100.0%	0		4.43s	276	4,921
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Google: Gemini 3 Flash Preview	10.0	10.0	100.0%	0		10.55s	234	1,130
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0

Comparaison rapide

Changer la paire de comparaison

MiniMax M2.5mediumvsGPT-5.4none Mercury 2mediumvsGPT-5.4none GPT-5.4nonevsQwen3.5-35B-A3Bmedium GPT-5.4nonevsQwen3 Coder Nextmedium GPT-5.4nonevsGLM 4.7 Flashmedium Claude Opus 4.6mediumvsGPT-5.4none Kimi K2.5mediumvsGPT-5.4none GPT-5.4nonevsGrok 4.1 Fastmedium Gemini 3 Flash PreviewmediumvsGPT-5.2 Chatnone GPT-5.4nonevsQwen3.5-Flashmedium Seed-2.0-MinimediumvsGPT-5.4none Gemini 3 Flash PreviewmediumvsGPT-5.3 Chatnone