Inception: Mercury 2 vs Qwen: Qwen3 Coder Next

Qwen3 Coder Next conduce la scorul mediu cu 5.1 vs 4.6. Qwen3 Coder Next are costul de benchmark mai mic, $0.025 vs $0.030. Mercury 2 este mai rapid cu 829ms vs 9.12s, cu rate de reușită de 22.7% vs 25.8%.

Model recomandatQwen3 Coder NextAre cel mai puternic scor din această comparație (5.1) și cel mai bun echilibru între cost și timp de răspuns dintre toate cele 2 modele.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-18

Metrică	Mercury 2 Mercury 2 none Lansare: 2026-02-24	Qwen3 Coder Next Qwen3 Coder Next none Lansare: 2026-02-03

Metrică	Mercury 2 Mercury 2 none Lansare: 2026-02-24	Qwen3 Coder Next Qwen3 Coder Next none Lansare: 2026-02-03
Scor	4.6	5.1
Rang	#185	#162
Fiabilitate	10.0	10.0
Consistență	9.2	9.7
Teste corecte
Rată de trecere pe încercare	22.7%	25.8%
Teste instabile	2	1
Rulări totale	66	66
Cost per rezultat	0.734	0.488
Cost total	$0.030	$0.025
Preț de intrare	$0.250 / 1M	$0.110 / 1M
Preț de ieșire	$0.750 / 1M	$0.800 / 1M
Total tokenuri de intrare	88,704	134,218
Tokenuri de ieșire	9,564	11,808
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	829ms	9.12s
Timp de răspuns (maxim)	4.52s	45.14s
Timp de răspuns (total)	18.24s	145.94s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#185 Mercury 2

none

Cost: $0.002
Timp: 1.8s
Tokenuri: 1,514 tok

#162 Qwen3 Coder Next

none

SVG invalid

Cost: $0.058
Timp: 246.3s
Tokenuri: 64,126 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	3.0	10.0	0.0%	0		483ms	631	286	0
Qwen3 Coder Next	3.6	10.0	0.0%	0		3.31s	645	1,321	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	3.4	9.6	0.0%	0		1.03s	7,229	3,088	0
Qwen3 Coder Next	4.6	7.9	22.2%	1		2.22s	7,442	621	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	3.0	10.0	0.0%	0		2.56s	65,412	5,256	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		30.86s	107,180	8,541	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	7.3	5.9	83.3%	1		667ms	6,362	180	0
Qwen3 Coder Next	6.5	10.0	50.0%	0		1.32s	7,758	246	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	5.3	7.2	44.4%	1		534ms	784	46	0
Qwen3 Coder Next	5.3	10.0	33.3%	0		962ms	753	26	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	4.8	10.0	0.0%	0		628ms	495	159	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	498	152	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	6.5	10.0	50.0%	0		551ms	691	82	0
Qwen3 Coder Next	6.3	10.0	50.0%	0		7.78s	684	63	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	3.1	10.0	0.0%	0		535ms	694	251	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		24.34s	678	571	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	10.0	10.0	100.0%	0		1.27s	6,193	197	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	8,364	255	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mercury 2	3.0	10.0	0.0%	0		548ms	213	19	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		601ms	216	12	0

Comparație rapidă

Schimbă perechea de comparație

Mistral Small 4mediumvsQwen3 Coder Nextnone CobuddymediumvsMercury 2none Mercury 2nonevsQwen3 Coder Nextmedium Mercury 2nonevsMiniMax M2.5medium MiniMax M2.7mediumvsQwen3 Coder Nextnone KAT-Coder-Air V2.5lowvsQwen3 Coder Nextnone Mercury 2nonevsGLM 4.7 Flashmedium Mercury 2nonevsMiniMax M2.7medium KAT-Coder-Air V2.5mediumvsQwen3 Coder Nextnone CobuddymediumvsQwen3 Coder Nextnone Mercury 2nonevsMistral Small 4medium KAT-Coder-Air V2.5highvsQwen3 Coder Nextnone