Mercury 2 vs Qwen3.5-9B (medium)

Model recomandat Mercury 2

Are cel mai bun scor aici (4.6) și răspunde de aproximativ 99.2x mai rapid decât Qwen3.5-9B (medium).

Comparație detaliată

Metrică	Mercury 2 Mercury 2 none Lansare: 2026-02-24	Qwen3.5-9B Qwen3.5-9B medium Lansare: 2026-03-02

Metrică	Mercury 2 Mercury 2 none Lansare: 2026-02-24	Qwen3.5-9B Qwen3.5-9B medium Lansare: 2026-03-02
Scor	4.6	3.8
Rang	#204	#220
Fiabilitate	10.0	5.0
Consistență	9.2	8.1
Teste corecte
Rată de trecere pe încercare	22.7%	25.8%
Teste instabile	2	5
Rulări totale	66	66
Cost per rezultat	0.734	1.187
Cost total	$0.030	$0.036
Preț de intrare	$0.250 / 1M	$0.100 / 1M
Preț de ieșire	$0.750 / 1M	$0.150 / 1M
Total tokenuri de intrare	88,704	17,070
Tokenuri de ieșire	9,564	29,045
Tokenuri de raționament	0	209,516
Timp de răspuns (mediu)	829ms	82.24s
Timp de răspuns (maxim)	4.52s	226.38s
Timp de răspuns (total)	18.24s	1315.88s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	3.0	10.0	0.0%	0		483ms	631	286	0
Qwen3.5-9B	5.1	5.8	50.0%	2		34.44s	369	2,621	12,411

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	3.4	9.6	0.0%	0		1.03s	7,229	3,088	0
Qwen3.5-9B	2.9	10.0	0.0%	0		100.88s	2,396	7,890	41,129

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	3.0	10.0	0.0%	0		2.56s	65,412	5,256	0
Qwen3.5-9B	3.0	10.0	0.0%	0		0ms	0	0	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	7.3	5.9	83.3%	1		667ms	6,362	180	0
Qwen3.5-9B	3.6	5.6	33.3%	1		87.31s	4,722	1,383	32,113

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	5.3	7.2	44.4%	1		534ms	784	46	0
Qwen3.5-9B	3.6	7.2	22.2%	1		137.75s	295	11,549	48,475

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	4.8	10.0	0.0%	0		628ms	495	159	0
Qwen3.5-9B	2.8	1.6	33.3%	1		226.38s	180	0	30,695

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	6.5	10.0	50.0%	0		551ms	691	82	0
Qwen3.5-9B	6.5	10.0	50.0%	0		5.75s	381	491	1,824

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	3.1	10.0	0.0%	0		535ms	694	251	0
Qwen3.5-9B	3.0	10.0	0.0%	0		32.27s	376	1,593	12,026

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	10.0	10.0	100.0%	0		1.27s	6,193	197	0
Qwen3.5-9B	10.0	10.0	100.0%	0		4.31s	8,283	444	1,149

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	3.0	10.0	0.0%	0		548ms	213	19	0
Qwen3.5-9B	3.0	10.0	0.0%	0		177.02s	68	3,074	29,694

Schimbă perechea de comparație