Navigation
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 2.5 Flash vs StepFun: Step 3.7 Flash

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-01

Métrique Gemini 2.5 Flash Gemini 2.5 Flash medium Sortie: 2025-06-17 Step 3.7 Flash Step 3.7 Flash medium Sortie: 2026-05-29
Score 7.7 7.9
Rang #40 #31
Fiabilité 10.0 9.9
Cohérence 9.6 9.2
Tests corrects
Taux de réussite par tentative 68.3% 71.7%
Tests instables 1 2
Exécutions totales 60 58
Coût par résultat 2.750 2.663
Coût total $0.358 $0.347
Prix d'entrée $0.300 / 1M $0.200 / 1M
Prix de sortie $2.500 / 1M $1.150 / 1M
Jetons de sortie 1,924 294,481
Jetons de raisonnement 137,255 0
Temps de réponse (moy.) 15.57s 18.32s
Temps de réponse (max) 95.48s 113.98s
Temps de réponse (total) 311.47s 366.45s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 8.4 10.0 75.0% 0 6.30s 255 10,233
Step 3.7 Flash 8.7 7.9 91.7% 1 9.65s 32,185 0
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 6.6 10.0 50.0% 0 54.56s 537 24,413
Step 3.7 Flash 8.2 6.7 83.3% 1 10.64s 19,320 0
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 10.0 10.0 100.0% 0 28.44s 303 11,922
Step 3.7 Flash 10.0 10.0 100.0% 0 9.06s 7,106 0
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 10.0 10.0 100.0% 0 4.06s 279 2,325
Step 3.7 Flash 10.0 10.0 100.0% 0 2.75s 3,020 0
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 5.9 7.2 55.6% 1 37.34s 18 80,702
Step 3.7 Flash 7.7 10.0 66.7% 0 48.27s 70,347 0
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 4.8 10.0 0.0% 0 4.86s 92 1,899
Step 3.7 Flash 4.0 10.0 0.0% 0 6.85s 3,987 0
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 9.8 10.0 100.0% 0 2.62s 69 1,203
Step 3.7 Flash 9.8 10.0 100.0% 0 1.83s 2,166 0
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 7.7 10.0 66.7% 0 3.18s 126 2,499
Step 3.7 Flash 5.7 9.9 33.3% 0 6.19s 15,071 0
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 10.0 10.0 100.0% 0 6.20s 234 1,140
Step 3.7 Flash 10.0 10.0 100.0% 0 4.16s 2,115 0
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 3.0 10.0 0.0% 0 2.76s 11 919
Step 3.7 Flash 3.0 10.0 0.0% 0 113.98s 139,164 0

Comparaison rapide

Changer la paire de comparaison