Inception: Mercury 2 vs Qwen: Qwen3 Coder Next

Qwen3 Coder Next (medium) conduce la scorul mediu cu 4.7 vs 4.6. Mercury 2 are costul de benchmark mai mic, $0.030 vs $0.032. Mercury 2 este mai rapid cu 829ms vs 9.61s, cu rate de reușită de 22.7% vs 27.3%.

Model recomandatMercury 2Scorul rămâne aproape de cel mai bun scor de aici (4.6 vs 4.7) și răspunde de aproximativ 11.6x mai rapid decât Qwen3 Coder Next (medium).

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-18

Metrică	Mercury 2 Mercury 2 none Lansare: 2026-02-24	Qwen3 Coder Next Qwen3 Coder Next medium Lansare: 2026-02-03

Metrică	Mercury 2 Mercury 2 none Lansare: 2026-02-24	Qwen3 Coder Next Qwen3 Coder Next medium Lansare: 2026-02-03
Scor	4.6	4.7
Rang	#185	#183
Fiabilitate	10.0	10.0
Consistență	9.2	9.0
Teste corecte
Rată de trecere pe încercare	22.7%	27.3%
Teste instabile	2	3
Rulări totale	66	66
Cost per rezultat	0.734	0.793
Cost total	$0.030	$0.032
Preț de intrare	$0.250 / 1M	$0.110 / 1M
Preț de ieșire	$0.750 / 1M	$0.800 / 1M
Total tokenuri de intrare	88,704	148,194
Tokenuri de ieșire	9,564	19,069
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	829ms	9.61s
Timp de răspuns (maxim)	4.52s	81.80s
Timp de răspuns (total)	18.24s	153.69s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#185 Mercury 2

none

Cost: $0.002
Timp: 1.8s
Tokenuri: 1,514 tok

#183 Qwen3 Coder Next

medium

SVG invalid

Cost: $0.000
Timp: 300.0s
Tokenuri: 0 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	3.0	10.0	0.0%	0		483ms	631	286	0
Qwen3 Coder Next	3.5	8.1	16.7%	1		8.64s	645	1,252	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	3.4	9.6	0.0%	0		1.03s	7,229	3,088	0
Qwen3 Coder Next	3.7	7.2	22.2%	1		924ms	7,185	336	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	3.0	10.0	0.0%	0		2.56s	65,412	5,256	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		14.65s	121,413	16,067	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	7.3	5.9	83.3%	1		667ms	6,362	180	0
Qwen3 Coder Next	6.5	10.0	50.0%	0		81.80s	7,758	246	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	5.3	7.2	44.4%	1		534ms	784	46	0
Qwen3 Coder Next	5.3	10.0	33.3%	0		638ms	753	25	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	4.8	10.0	0.0%	0		628ms	495	159	0
Qwen3 Coder Next	6.3	3.4	66.7%	1		1.39s	498	142	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	6.5	10.0	50.0%	0		551ms	691	82	0
Qwen3 Coder Next	6.3	10.0	50.0%	0		7.49s	684	63	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	3.1	10.0	0.0%	0		535ms	694	251	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		1.25s	678	671	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	10.0	10.0	100.0%	0		1.27s	6,193	197	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.64s	8,364	255	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	3.0	10.0	0.0%	0		548ms	213	19	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		399ms	216	12	0

Comparație rapidă

Schimbă perechea de comparație