AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs DeepSeek: DeepSeek V3.2

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-30

Metrică	Claude Sonnet 4.6 Claude Sonnet 4.6 medium Lansare: 2026-02-17	DeepSeek V3.2 DeepSeek V3.2 medium Lansare: 2025-12-01

Metrică	Claude Sonnet 4.6 Claude Sonnet 4.6 medium Lansare: 2026-02-17	DeepSeek V3.2 DeepSeek V3.2 medium Lansare: 2025-12-01
Scor	8.0	8.0
Rang	#36	#37
Fiabilitate	N/D	N/D
Consistență	9.5	8.2
Teste corecte
Rată de trecere pe încercare	74.1%	79.6%
Teste instabile	1	4
Rulări totale	54	52
Cost per rezultat	8.930	0.231
Cost total	$1.161	$0.028
Preț de intrare	$3.000 / 1M	$0.252 / 1M
Preț de ieșire	$15.000 / 1M	$0.378 / 1M
Tokenuri de ieșire	42,068	7,554
Tokenuri de raționament	26,784	45,588
Timp de răspuns (mediu)	12.66s	43.49s
Timp de răspuns (maxim)	46.35s	180.92s
Timp de răspuns (total)	126.62s	782.73s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Claude Sonnet 4.6	6.5	10.0	50.0%	0		2.98s	1,046	1,093
DeepSeek V3.2	8.4	9.9	75.0%	0		30.72s	3,773	7,523

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Claude Sonnet 4.6	10.0	10.0	100.0%	0		35.76s	6,894	2,097
DeepSeek V3.2	4.7	1.6	66.7%	1		180.92s	626	6,792

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Claude Sonnet 4.6	10.0	10.0	100.0%	0		46.35s	5,871	3,962
DeepSeek V3.2	10.0	10.0	100.0%	0		93.11s	571	6,296

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Claude Sonnet 4.6	10.0	10.0	100.0%	0		13.90s	649	742
DeepSeek V3.2	10.0	10.0	100.0%	0		36.09s	207	7,693

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Claude Sonnet 4.6	2.9	7.2	11.1%	1		0ms	25,790	16,919
DeepSeek V3.2	5.3	7.2	44.4%	1		21.78s	15	4,933

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.94s	256	433
DeepSeek V3.2	5.4	2.5	66.7%	1		31.30s	68	2,366

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Claude Sonnet 4.6	10.0	10.0	100.0%	0		2.61s	318	552
DeepSeek V3.2	10.0	10.0	100.0%	0		35.78s	1,397	2,845

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.80s	589	635
DeepSeek V3.2	8.2	7.2	88.9%	1		36.87s	390	6,281

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Claude Sonnet 4.6	10.0	10.0	100.0%	0		7.48s	655	351
DeepSeek V3.2	10.0	10.0	100.0%	0		34.81s	507	859

Comparație rapidă

Schimbă perechea de comparație

DeepSeek V3.2mediumvsGPT-5.2 Chatnone Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewlow DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewnone Claude Sonnet 4.6mediumvsGemini 3 Flash Previewnone Claude Sonnet 4.6mediumvsHY3 PreviewlowDisponibil gratuit Claude Sonnet 4.6mediumvsGPT-5.2 Chatnone DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewlow Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewnone DeepSeek V3.2mediumvsGemini 3 Flash Previewnone DeepSeek V3.2mediumvsHY3 PreviewlowDisponibil gratuit DeepSeek V3.2mediumvsGPT-5.3 Chatnone Claude Sonnet 4.6mediumvsGPT-5.3 Chatnone