Navigation
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs OpenAI: GPT-5.4 Mini

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-01

Métrique Gemini 3 Flash Preview Gemini 3 Flash Preview medium Sortie: 2025-12-17 GPT-5.4 Mini GPT-5.4 Mini none Sortie: 2026-03-17
Score 10.0 5.1
Rang #1 #117
Fiabilité N/D N/D
Cohérence 10.0 8.6
Tests corrects
Taux de réussite par tentative 100.0% 35.2%
Tests instables 0 3
Exécutions totales 18 54
Coût par résultat 0.600 0.630
Coût total $0.108 $0.032
Prix d'entrée $0.500 / 1M $0.750 / 1M
Prix de sortie $3.000 / 1M $4.500 / 1M
Jetons de sortie 655 2,418
Jetons de raisonnement 33,749 0
Temps de réponse (moy.) 12.11s 1.17s
Temps de réponse (max) 82.37s 2.52s
Temps de réponse (total) 217.93s 21.01s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.26s 110 1,076
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 82.37s 144 16,257
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.19s 333 0
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 23.58s 117 3,495
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 7.62s 93 2,197
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 14.81s 4 7,228
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.34s 24 635
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.30s 24 903
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.86s 61 1,455
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.78s 78 503
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0

Comparaison rapide

Changer la paire de comparaison