Claude Sonnet 4.6 vs MiMo-V2.5-Pro (medium)

Model recomandat Claude Sonnet 4.6

Are cel mai bun scor aici (7.3) și răspunde de aproximativ 4.2x mai rapid decât MiMo-V2.5-Pro (medium).

Comparație detaliată

Metrică	Claude Sonnet 4.6 Claude Sonnet 4.6 none Lansare: 2026-02-17	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Lansare: 2026-04-22

Metrică	Claude Sonnet 4.6 Claude Sonnet 4.6 none Lansare: 2026-02-17	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Lansare: 2026-04-22
Scor	7.3	6.9
Rang	#71	#92
Fiabilitate	10.0	10.0
Consistență	9.7	8.2
Teste corecte
Rată de trecere pe încercare	57.6%	66.7%
Teste instabile	1	5
Rulări totale	66	66
Cost per rezultat	5.502	3.218
Cost total	$0.661	$0.187
Preț de intrare	$3.000 / 1M	$0.435 / 1M
Preț de ieșire	$15.000 / 1M	$0.870 / 1M
Total tokenuri de intrare	123,264	139,883
Tokenuri de ieșire	19,362	15,521
Tokenuri de raționament	0	130,992
Timp de răspuns (mediu)	8.12s	33.92s
Timp de răspuns (maxim)	51.18s	197.54s
Timp de răspuns (total)	121.78s	746.19s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

SVG invalid

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Sonnet 4.6	4.8	10.0	25.0%	0		2.94s	636	1,214	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.26s	621	323	1,179

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Sonnet 4.6	5.5	10.0	33.3%	0		5.19s	8,522	2,127	0
MiMo-V2.5-Pro	6.2	4.7	66.7%	2		92.07s	6,543	780	51,218

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Sonnet 4.6	9.8	10.0	100.0%	0		37.51s	91,402	13,663	0
MiMo-V2.5-Pro	6.9	5.9	66.7%	1		125.45s	114,089	10,854	45,120

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Sonnet 4.6	10.0	10.0	100.0%	0		3.43s	8,574	252	0
MiMo-V2.5-Pro	7.3	5.8	83.3%	1		18.81s	7,746	260	8,383

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Sonnet 4.6	7.7	10.0	66.7%	0		3.54s	759	413	0
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		37.87s	630	275	17,023

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Sonnet 4.6	6.1	3.1	66.7%	1		2.56s	513	192	0
MiMo-V2.5-Pro	5.5	10.0	0.0%	0		4.02s	492	155	163

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Sonnet 4.6	6.5	10.0	50.0%	0		1.96s	690	90	0
MiMo-V2.5-Pro	9.9	10.0	100.0%	0		2.77s	672	82	803

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Sonnet 4.6	7.7	10.0	66.7%	0		2.53s	663	533	0
MiMo-V2.5-Pro	6.7	7.9	55.6%	1		5.31s	660	540	2,181

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.11s	11,301	447	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		16.87s	8,220	311	2,908

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Claude Sonnet 4.6	3.0	10.0	0.0%	0		4.67s	204	431	0
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		12.46s	210	1,941	2,014

Schimbă perechea de comparație