Navigation
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.5 vs StepFun: Step 3.7 Flash

Résumé

Comparaison benchmark GPT-5.5 vs Step 3.7 Flash : GPT-5.5 mène au score moyen avec 9.0 vs 7.1. Step 3.7 Flash a le coût de benchmark le plus bas avec $1.148 vs $3.679. GPT-5.5 est plus rapide avec 37.98s vs 64.46s, avec des taux de réussite de 87.3% vs 63.5%.

Modèle recommandé: GPT-5.5 - Il obtient le meilleur score ici (9.0) et répond environ 1.7x plus vite que Step 3.7 Flash.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-18

Métrique GPT-5.5 GPT-5.5 medium Sortie: 2026-04-24 Step 3.7 Flash Step 3.7 Flash high Sortie: 2026-05-29
Score 9.0 7.1
Rang #9 #63
Fiabilité 10.0 10.0
Cohérence 8.9 8.2
Tests corrects
Taux de réussite par tentative 87.3% 63.5%
Tests instables 3 4
Exécutions totales 63 63
Coût par résultat 21.638 10.434
Coût total $3.679 $1.148
Prix d'entrée $5.000 / 1M $0.200 / 1M
Prix de sortie $30.000 / 1M $1.150 / 1M
Total des jetons d'entrée 34,212 38,391
Jetons de sortie 1,985 991,355
Jetons de raisonnement 114,925 0
Temps de réponse (moy.) 37.98s 64.46s
Temps de réponse (max) 332.10s 364.99s
Temps de réponse (total) 797.60s 1353.57s

Génération showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#9 GPT-5.5

medium
Coût
$0.112
Temps
71.9s
Tokens
3,807 tok

#63 Step 3.7 Flash

high
Coût
$0.007
Temps
63.6s
Tokens
6,030 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.5 10.0 10.0 100.0% 0 4.66s 606 250 1,335
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.5 8.8 7.8 88.9% 1 59.77s 7,305 362 24,959
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.5 10.0 10.0 100.0% 0 19.29s 11,019 312 2,841
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.5 10.0 10.0 100.0% 0 4.18s 7,140 234 593
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.5 5.3 7.2 44.4% 1 164.14s 723 67 79,625
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.5 10.0 10.0 100.0% 0 4.16s 477 138 223
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.5 10.0 10.0 100.0% 0 3.36s 660 93 538
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.5 10.0 10.0 100.0% 0 6.76s 642 241 2,225
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.5 10.0 10.0 100.0% 0 10.57s 5,445 258 832
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.5 2.8 1.6 33.3% 1 37.86s 195 30 1,754
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

Comparaison rapide

Changer la paire de comparaison