Navigation
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 2.5 Flash vs OpenAI: GPT-5.3-Codex

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-03-15

Métrique Gemini 2.5 Flash Gemini 2.5 Flash medium Sortie: 2025-06-17 GPT-5.3-Codex GPT-5.3-Codex medium Sortie: 2026-02-05
Rang #15 #5
Score 8.0 8.7
Cohérence 9.5 9.1
Coût par résultat 2.619 4.485
Coût total $0.288 $0.539
Tests corrects
Taux de réussite par tentative 72.9% 83.3%
Tests instables 1 2
Exécutions totales 48 48
Jetons de sortie 1,370 1,764
Jetons de raisonnement 110,522 33,348
Temps de réponse (moy.) 12.35s 16.59s
Temps de réponse (max) 95.48s 100.93s
Temps de réponse (total) 197.62s 265.39s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 7.8 10.0 66.7% 0 6.98s 249 8,832
GPT-5.3-Codex 10.0 10.0 100.0% 0 4.69s 216 1,421
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 10.0 10.0 100.0% 0 28.44s 303 11,922
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 10.0 10.0 100.0% 0 4.06s 279 2,325
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 5.9 7.2 55.6% 1 37.34s 18 80,702
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 4.8 10.0 0.0% 0 4.86s 92 1,899
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 9.8 10.0 100.0% 0 2.62s 69 1,203
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
Puzzle Solving Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 7.7 10.0 66.7% 0 3.94s 126 2,499
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.12s 352 1,644
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 10.0 10.0 100.0% 0 6.20s 234 1,140
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492

Comparaison rapide

Changer la paire de comparaison