Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs MiniMax: MiniMax M3

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-03

Metrică Claude Sonnet 4.6 Claude Sonnet 4.6 none Lansare: 2026-02-17 MiniMax M3 MiniMax M3 medium Lansare: 2026-06-01
Scor 7.0 7.2
Rang #72 #67
Fiabilitate 10.0 9.6
Consistență 9.7 8.2
Teste corecte
Rată de trecere pe încercare 58.3% 65.0%
Teste instabile 1 4
Rulări totale 60 60
Cost per rezultat 2.782 1.083
Cost total $0.306 $0.120
Preț de intrare $3.000 / 1M $0.300 / 1M
Preț de ieșire $15.000 / 1M $1.200 / 1M
Total tokenuri de intrare 54,721 43,447
Tokenuri de ieșire 9,450 46,884
Tokenuri de raționament 0 85,935
Timp de răspuns (mediu) 5.27s 68.44s
Timp de răspuns (maxim) 23.84s 431.03s
Timp de răspuns (total) 68.50s 1300.32s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
MiniMax M3 5.5 3.7 66.7% 3 14.95s 2,526 874 3,414
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 6.8 10.0 50.0% 0 6.73s 5,357 2,112 0
MiniMax M3 6.8 8.9 50.0% 0 185.58s 2,705 4,071 26,059
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
MiniMax M3 10.0 10.0 100.0% 0 65.30s 14,760 1,306 6,253
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
MiniMax M3 10.0 10.0 100.0% 0 14.92s 8,088 514 3,164
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
MiniMax M3 5.5 9.3 33.3% 0 233.13s 869 16,254 19,070
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
MiniMax M3 5.1 3.4 33.3% 1 33.25s 954 2,487 2,523
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
MiniMax M3 9.8 10.0 100.0% 0 6.14s 1,623 103 920
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
MiniMax M3 7.9 9.9 66.7% 0 49.91s 2,079 11,946 13,761
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
MiniMax M3 10.0 10.0 100.0% 0 11.91s 9,168 281 555
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
MiniMax M3 3.0 10.0 0.0% 0 100.80s 675 9,048 10,216

Comparație rapidă

Schimbă perechea de comparație