Navigation
AI BENCHY
Advertise here

AI BENCHY Compare

MiniMax: MiniMax M3 vs StepFun: Step 3.7 Flash

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-01

Métrique MiniMax M3 MiniMax M3 medium Sortie: 2026-06-01 Step 3.7 Flash Step 3.7 Flash high Sortie: 2026-05-29
Score 7.3 7.1
Rang #65 #74
Fiabilité 9.6 10.0
Cohérence 8.4 8.2
Tests corrects
Taux de réussite par tentative 68.3% 65.0%
Tests instables 6 4
Exécutions totales 60 60
Coût par résultat 1.083 8.723
Coût total $0.120 $0.960
Prix d'entrée $0.300 / 1M $0.200 / 1M
Prix de sortie $1.200 / 1M $1.150 / 1M
Jetons de sortie 46,884 828,084
Jetons de raisonnement 85,935 0
Temps de réponse (moy.) 68.44s 49.43s
Temps de réponse (max) 431.03s 192.75s
Temps de réponse (total) 1300.32s 988.58s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
MiniMax M3 5.5 3.7 66.7% 3 14.95s 874 3,414
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 42,656 0
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
MiniMax M3 7.5 10.0 66.7% 1 185.58s 4,071 26,059
Step 3.7 Flash 3.2 4.6 16.7% 1 126.82s 164,069 0
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
MiniMax M3 10.0 10.0 100.0% 0 65.30s 1,306 6,253
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 8,802 0
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
MiniMax M3 10.0 10.0 100.0% 0 14.92s 514 3,164
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 23,113 0
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
MiniMax M3 6.0 10.0 44.4% 1 233.13s 16,254 19,070
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 410,502 0
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
MiniMax M3 5.1 3.4 33.3% 1 33.25s 2,487 2,523
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 2,862 0
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
MiniMax M3 9.8 10.0 100.0% 0 6.14s 103 920
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 2,010 0
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
MiniMax M3 7.9 9.9 66.7% 0 49.91s 11,946 13,761
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 25,422 0
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
MiniMax M3 10.0 10.0 100.0% 0 11.91s 281 555
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 1,172 0
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
MiniMax M3 3.0 10.0 0.0% 0 100.80s 9,048 10,216
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 147,476 0

Comparaison rapide

Changer la paire de comparaison