Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

MiniMax: MiniMax M3 vs StepFun: Step 3.7 Flash

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-01

Metrică MiniMax M3 MiniMax M3 medium Lansare: 2026-06-01 Step 3.7 Flash Step 3.7 Flash high Lansare: 2026-05-29
Scor 7.3 7.1
Rang #65 #74
Fiabilitate 9.6 10.0
Consistență 8.4 8.2
Teste corecte
Rată de trecere pe încercare 68.3% 65.0%
Teste instabile 6 4
Rulări totale 60 60
Cost per rezultat 1.083 8.723
Cost total $0.120 $0.960
Preț de intrare $0.300 / 1M $0.200 / 1M
Preț de ieșire $1.200 / 1M $1.150 / 1M
Tokenuri de ieșire 46,884 828,084
Tokenuri de raționament 85,935 0
Timp de răspuns (mediu) 68.44s 49.43s
Timp de răspuns (maxim) 431.03s 192.75s
Timp de răspuns (total) 1300.32s 988.58s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
MiniMax M3 5.5 3.7 66.7% 3 14.95s 874 3,414
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 42,656 0
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
MiniMax M3 7.5 10.0 66.7% 1 185.58s 4,071 26,059
Step 3.7 Flash 3.2 4.6 16.7% 1 126.82s 164,069 0
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
MiniMax M3 10.0 10.0 100.0% 0 65.30s 1,306 6,253
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 8,802 0
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
MiniMax M3 10.0 10.0 100.0% 0 14.92s 514 3,164
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 23,113 0
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
MiniMax M3 6.0 10.0 44.4% 1 233.13s 16,254 19,070
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 410,502 0
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
MiniMax M3 5.1 3.4 33.3% 1 33.25s 2,487 2,523
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 2,862 0
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
MiniMax M3 9.8 10.0 100.0% 0 6.14s 103 920
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 2,010 0
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
MiniMax M3 7.9 9.9 66.7% 0 49.91s 11,946 13,761
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 25,422 0
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
MiniMax M3 10.0 10.0 100.0% 0 11.91s 281 555
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 1,172 0
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
MiniMax M3 3.0 10.0 0.0% 0 100.80s 9,048 10,216
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 147,476 0

Comparație rapidă

Schimbă perechea de comparație