AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 2.5 Flash

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-16

Metrică	DeepSeek V3.2 DeepSeek V3.2 none Lansare: 2025-12-01	Gemini 2.5 Flash Gemini 2.5 Flash none Lansare: 2025-06-17

Metrică	DeepSeek V3.2 DeepSeek V3.2 none Lansare: 2025-12-01	Gemini 2.5 Flash Gemini 2.5 Flash none Lansare: 2025-06-17
Scor	6.1	6.2
Rang	#63	#61
Consistență	8.1	9.2
Teste corecte
Rată de trecere pe încercare	50.0%	44.4%
Teste instabile	4	2
Rulări totale	54	54
Cost per rezultat	0.226	0.184
Cost total	$0.016	$0.013
Preț de intrare	$0.260 / 1M	$0.300 / 1M
Preț de ieșire	$0.380 / 1M	$2.500 / 1M
Tokenuri de ieșire	8,384	1,726
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	12.09s	903ms
Timp de răspuns (maxim)	115.89s	4.39s
Timp de răspuns (total)	217.56s	16.26s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	3.2	9.8	0.0%	0		7.63s	1,419	0
Gemini 2.5 Flash	3.0	10.0	0.0%	0		582ms	102	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	2.4	1.3	33.3%	1		7.63s	553	0
Gemini 2.5 Flash	10.0	10.0	100.0%	0		1.16s	453	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
Gemini 2.5 Flash	3.0	10.0	0.0%	0		4.39s	366	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
Gemini 2.5 Flash	10.0	10.0	100.0%	0		652ms	279	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	3.6	7.2	22.2%	1		1.61s	24	0
Gemini 2.5 Flash	5.9	7.2	55.6%	1		495ms	12	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	10.0	10.0	100.0%	0		2.86s	67	0
Gemini 2.5 Flash	5.0	10.0	0.0%	0		615ms	78	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
Gemini 2.5 Flash	8.0	6.8	66.7%	1		672ms	70	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	8.5	7.5	88.9%	1		7.37s	1,136	0
Gemini 2.5 Flash	5.7	10.0	33.3%	0		576ms	132	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
Gemini 2.5 Flash	10.0	10.0	100.0%	0		1.91s	234	0

Comparație rapidă

Schimbă perechea de comparație

Gemini 2.5 FlashnonevsGPT-5 Nanomedium DeepSeek V3.2nonevsGPT-5 Nanomedium DeepSeek V3.2nonevsgpt-oss-120bmediumDisponibil gratuit Gemini 2.5 Flashnonevsgpt-oss-120bmediumDisponibil gratuit Gemini 2.5 FlashnonevsMercury 2medium DeepSeek V3.2nonevsMercury 2medium DeepSeek V3.2nonevsMiniMax M2.5mediumDisponibil gratuit DeepSeek V3.2nonevsMistral Small 4medium Gemini 2.5 FlashnonevsMiniMax M2.5mediumDisponibil gratuit Gemini 2.5 FlashnonevsGrok 4.1 Fastmedium Gemini 2.5 FlashnonevsMistral Small 4medium DeepSeek V3.2nonevsGrok 4.1 Fastmedium