Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

MiniMax: MiniMax M2.7 vs MiniMax: MiniMax M3

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-02

Metrică MiniMax M2.7 MiniMax M2.7 medium Lansare: 2026-03-18 MiniMax M3 MiniMax M3 medium Lansare: 2026-06-01
Scor 5.4 7.3
Rang #129 #65
Fiabilitate 10.0 9.6
Consistență 6.7 8.4
Teste corecte
Rată de trecere pe încercare 48.3% 68.3%
Teste instabile 8 6
Rulări totale 60 60
Cost per rezultat 2.076 1.083
Cost total $0.103 $0.120
Preț de intrare $0.260 / 1M $0.300 / 1M
Preț de ieșire $1.200 / 1M $1.200 / 1M
Total tokenuri de intrare 33,493 43,447
Tokenuri de ieșire 8,224 46,884
Tokenuri de raționament 73,373 85,935
Timp de răspuns (mediu) 29.86s 68.44s
Timp de răspuns (maxim) 117.04s 431.03s
Timp de răspuns (total) 567.39s 1300.32s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
MiniMax M2.7 7.9 6.3 83.3% 2 40.32s 654 3,010 17,716
MiniMax M3 5.5 3.7 66.7% 3 14.95s 2,526 874 3,414
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
MiniMax M2.7 6.7 9.6 50.0% 0 54.73s 2,083 474 22,402
MiniMax M3 7.5 10.0 66.7% 1 185.58s 2,705 4,071 26,059
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
MiniMax M2.7 4.7 1.6 66.7% 1 41.03s 14,233 369 4,480
MiniMax M3 10.0 10.0 100.0% 0 65.30s 14,760 1,306 6,253
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
MiniMax M2.7 6.3 5.8 66.7% 1 21.95s 7,152 187 5,882
MiniMax M3 10.0 10.0 100.0% 0 14.92s 8,088 514 3,164
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
MiniMax M2.7 3.0 10.0 0.0% 0 19.00s 245 8 2,796
MiniMax M3 6.0 10.0 44.4% 1 233.13s 869 16,254 19,070
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
MiniMax M2.7 3.9 2.5 33.3% 1 38.70s 486 92 5,204
MiniMax M3 5.1 3.4 33.3% 1 33.25s 954 2,487 2,523
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
MiniMax M2.7 3.8 5.8 33.3% 1 12.80s 687 350 2,600
MiniMax M3 9.8 10.0 100.0% 0 6.14s 1,623 103 920
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
MiniMax M2.7 5.9 7.2 55.6% 1 24.87s 675 362 7,840
MiniMax M3 7.9 9.9 66.7% 0 49.91s 2,079 11,946 13,761
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
MiniMax M2.7 4.7 1.6 66.7% 1 12.05s 7,067 304 1,001
MiniMax M3 10.0 10.0 100.0% 0 11.91s 9,168 281 555
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
MiniMax M2.7 3.0 10.0 0.0% 0 22.77s 211 3,068 3,452
MiniMax M3 3.0 10.0 0.0% 0 100.80s 675 9,048 10,216

Comparație rapidă

Schimbă perechea de comparație