AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs OpenAI: GPT-5.3-Codex

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-22

Métrique	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Sortie: 2026-05-08	GPT-5.3-Codex GPT-5.3-Codex medium Sortie: 2026-02-05

Métrique	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Sortie: 2026-05-08	GPT-5.3-Codex GPT-5.3-Codex medium Sortie: 2026-02-05
Score	6.7	8.3
Rang	#78	#15
Fiabilité	10.0	10.0
Cohérence	8.8	8.4
Tests corrects
Taux de réussite par tentative	56.7%	81.7%
Tests instables	3	4
Exécutions totales	60	60
Coût par résultat	0.123	4.891
Coût total	$0.013	$0.685
Prix d'entrée	$0.250 / 1M	$1.750 / 1M
Prix de sortie	$1.500 / 1M	$14.000 / 1M
Jetons de sortie	2,481	2,332
Jetons de raisonnement	0	42,616
Temps de réponse (moy.)	1.37s	15.97s
Temps de réponse (max)	4.49s	100.93s
Temps de réponse (total)	27.32s	319.30s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Gemini 3.1 Flash Lite	8.3	10.0	75.0%	0		1.10s	639	0
GPT-5.3-Codex	8.7	7.9	91.7%	1		4.16s	240	1,722

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Gemini 3.1 Flash Lite	6.8	10.0	50.0%	0		951ms	660	0
GPT-5.3-Codex	10.0	10.0	100.0%	0		18.45s	514	7,266

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		2.53s	357	0
GPT-5.3-Codex	10.0	10.0	100.0%	0		19.56s	364	2,731

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.04s	279	0
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.07s	234	728

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		1.02s	15	0
GPT-5.3-Codex	5.9	7.2	55.6%	1		64.31s	64	25,308

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Gemini 3.1 Flash Lite	4.0	10.0	0.0%	0		791ms	63	0
GPT-5.3-Codex	4.6	10.0	0.0%	0		4.87s	187	331

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		932ms	72	0
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.04s	93	693

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Gemini 3.1 Flash Lite	6.0	4.6	66.7%	2		2.15s	153	0
GPT-5.3-Codex	9.0	7.9	88.9%	1		5.12s	352	1,644

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		3.51s	234	0
GPT-5.3-Codex	10.0	10.0	100.0%	0		6.37s	254	492

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		724ms	9	0
GPT-5.3-Codex	2.8	1.6	33.3%	1		14.43s	30	1,701

Comparaison rapide

Changer la paire de comparaison

Gemini 3.1 Flash LiteminimalvsKimi K2.5medium DeepSeek V4 ProhighvsGemini 3.1 Flash Liteminimal Gemini 3.1 Flash LiteminimalvsGrok 4.20medium Gemini 3.1 Flash LiteminimalvsGrok Build 0.1none Gemini 3.1 Flash LiteminimalvsQwen3.6 27Bmedium Gemini 3.1 Flash LiteminimalvsGPT-5.5none Gemini 3.1 Flash LiteminimalvsGPT-5 Minimedium Gemini 3.1 Flash LiteminimalvsMiMo-V2-Omnimedium Gemini 3.1 Flash LiteminimalvsQwen3.5 Plus 2026-02-15none Gemini 3 Flash PreviewlowvsGPT-5.3-Codexmedium DeepSeek V3.2mediumvsGemini 3.1 Flash Liteminimal Gemini 3.1 Flash LiteminimalvsQwen3.5-35B-A3Bmedium