DeepSeek: DeepSeek V4 Pro vs Inception: Mercury 2

Mercury 2 (medium) conduce la scorul mediu cu 7.0 vs 6.9. Mercury 2 (medium) are costul de benchmark mai mic, $0.093 vs $0.096. Mercury 2 (medium) este mai rapid cu 2.72s vs 11.55s, cu rate de reușită de 51.5% vs 51.5%.

Model recomandatMercury 2 (medium)Are cel mai bun scor aici (7.0) și răspunde de aproximativ 4.2x mai rapid decât DeepSeek V4 Pro.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-22

Metrică	DeepSeek V4 Pro DeepSeek V4 Pro none Lansare: 2026-04-24	Mercury 2 Mercury 2 medium Lansare: 2026-02-24

Metrică	DeepSeek V4 Pro DeepSeek V4 Pro none Lansare: 2026-04-24	Mercury 2 Mercury 2 medium Lansare: 2026-02-24
Scor	6.9	7.0
Rang	#86	#82
Fiabilitate	10.0	10.0
Consistență	8.6	8.8
Teste corecte
Rată de trecere pe încercare	51.5%	51.5%
Teste instabile	4	3
Rulări totale	66	66
Cost per rezultat	0.954	0.928
Cost total	$0.096	$0.093
Preț de intrare	$0.435 / 1M	$0.250 / 1M
Preț de ieșire	$0.870 / 1M	$0.750 / 1M
Total tokenuri de intrare	148,069	109,572
Tokenuri de ieșire	35,551	10,313
Tokenuri de raționament	0	76,806
Timp de răspuns (mediu)	11.55s	2.72s
Timp de răspuns (maxim)	119.44s	14.63s
Timp de răspuns (total)	254.11s	57.12s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#86 DeepSeek V4 Pro

none

SVG invalid

Cost: $0.000
Timp: 300.0s
Tokenuri: 0 tok

#82 Mercury 2

medium

Cost: $0.002
Timp: 2.1s
Tokenuri: 1,702 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	3.2	6.1	16.7%	2		4.02s	540	1,168	0
Mercury 2	6.9	9.9	50.0%	0		1.12s	554	2,546	2,609

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	5.6	10.0	33.3%	0		13.38s	7,275	5,500	0
Mercury 2	8.2	7.7	77.8%	1		2.04s	7,065	296	11,328

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	7.9	6.9	66.7%	1		71.59s	122,040	26,362	0
Mercury 2	6.7	9.1	50.0%	0		7.84s	87,365	6,533	20,474

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	10.0	10.0	100.0%	0		4.61s	7,568	200	0
Mercury 2	7.3	5.9	83.3%	1		1.11s	6,234	183	1,656

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	5.3	10.0	33.3%	0		3.72s	666	24	0
Mercury 2	2.9	7.2	11.1%	1		6.48s	695	41	30,754

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	5.0	10.0	0.0%	0		2.05s	471	126	0
Mercury 2	4.8	10.0	0.0%	0		821ms	456	137	542

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	6.3	5.8	66.7%	1		4.12s	627	713	0
Mercury 2	10.0	10.0	100.0%	0		1.07s	340	14	958

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	10.0	10.0	100.0%	0		3.61s	594	442	0
Mercury 2	5.4	10.0	33.3%	0		949ms	601	361	2,781

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	10.0	10.0	100.0%	0		7.40s	8,105	328	0
Mercury 2	10.0	10.0	100.0%	0		1.89s	6,080	180	1,956

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Pro	3.0	10.0	0.0%	0		5.76s	183	688	0
Mercury 2	3.0	10.0	0.0%	0		2.58s	182	22	3,748

Comparație rapidă

Schimbă perechea de comparație

Gemini 3.5 FlashnonevsMercury 2medium DeepSeek V4 PrononevsMiMo-V2.5-Promedium DeepSeek V4 PrononevsKAT-Coder-Pro V2.5medium DeepSeek V4 PrononevsQwen3.6 Flashmedium DeepSeek V4 PrononevsStep 3.7 Flashhigh Seed-2.0-MinimediumvsDeepSeek V4 Pronone DeepSeek V4 PrononevsKimi K2.5medium DeepSeek V4 PrononevsGemini 3.5 Flashminimal Mercury 2mediumvsGPT-5.6 Solnone Mercury 2mediumvsStep 3.7 Flashhigh Mercury 2mediumvsGPT-5.5none Mercury 2mediumvsQwen3.7 Plusnone