AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 3.5 Flash

Résumé

Comparaison benchmark DeepSeek V3.2 vs Gemini 3.5 Flash : DeepSeek V3.2 mène au score moyen avec 7.5 vs 7.0. DeepSeek V3.2 a le coût de benchmark le plus bas avec $0.044 vs $1.079. Gemini 3.5 Flash est plus rapide avec 9.93s vs 68.71s, avec des taux de réussite de 65.1% vs 77.8%.

Modèle recommandé: DeepSeek V3.2 - Il obtient le meilleur score ici (7.5) tout en coûtant environ 24.6x moins que Gemini 3.5 Flash.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-18

Métrique	DeepSeek V3.2 DeepSeek V3.2 medium Sortie: 2025-12-01	Gemini 3.5 Flash Gemini 3.5 Flash none Sortie: 2026-05-19

Métrique	DeepSeek V3.2 DeepSeek V3.2 medium Sortie: 2025-12-01	Gemini 3.5 Flash Gemini 3.5 Flash none Sortie: 2026-05-19
Score	7.5	7.0
Rang	#48	#66
Fiabilité	10.0	10.0
Cohérence	7.6	8.9
Tests corrects
Taux de réussite par tentative	65.1%	77.8%
Tests instables	6	3
Exécutions totales	63	63
Coût par résultat	0.436	7.190
Coût total	$0.044	$1.079
Prix d'entrée	$0.229 / 1M	$1.500 / 1M
Prix de sortie	$0.344 / 1M	$9.000 / 1M
Total des jetons d'entrée	38,333	13,843
Jetons de sortie	7,186	117,518
Jetons de raisonnement	99,081	0
Temps de réponse (moy.)	68.71s	9.93s
Temps de réponse (max)	376.10s	64.36s
Temps de réponse (total)	1442.81s	178.68s

Génération showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#48 DeepSeek V3.2

medium

Coût: $0.001
Temps: 53.6s
Tokens: 1,932 tok

#66 Gemini 3.5 Flash

none

Coût: $0.225
Temps: 125.5s
Tokens: 25,004 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V3.2	8.2	7.9	83.3%	1		24.23s	448	3,247	6,953
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.53s	492	5,101	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V3.2	6.0	7.2	55.6%	1		248.68s	5,717	649	52,014
Gemini 3.5 Flash	8.8	7.8	88.9%	1		34.69s	8,122	75,927	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V3.2	10.0	10.0	100.0%	0		93.11s	14,283	571	6,296
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V3.2	10.0	10.0	100.0%	0		36.09s	7,388	207	7,693
Gemini 3.5 Flash	6.5	10.0	50.0%	0		8.10s	2,781	5,895	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V3.2	2.9	4.4	22.2%	2		24.27s	472	21	6,838
Gemini 3.5 Flash	7.6	7.2	77.8%	1		10.64s	633	17,910	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V3.2	3.4	2.5	33.3%	1		58.29s	314	49	2,189
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.46s	486	1,620	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V3.2	10.0	10.0	100.0%	0		35.78s	627	1,397	2,845
Gemini 3.5 Flash	9.8	10.0	100.0%	0		3.38s	615	3,928	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V3.2	7.0	7.2	55.6%	1		37.69s	594	518	6,375
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.13s	558	4,640	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V3.2	10.0	10.0	100.0%	0		34.81s	8,307	507	859
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V3.2	3.0	10.0	0.0%	0		83.99s	183	20	7,019
Gemini 3.5 Flash	2.8	1.6	33.3%	1		4.87s	156	2,497	0

Comparaison rapide

Changer la paire de comparaison

Gemini 3.5 FlashnonevsKimi K2.7 Codemedium DeepSeek V3.2mediumvsGPT-5.3 Chatnone DeepSeek V3.2mediumvsGemini 3 Flash Previewlow Gemini 3.5 FlashnonevsGLM 5.1medium Gemini 3.5 FlashnonevsStep 3.7 Flashhigh Gemini 3.5 FlashnonevsQwen3.5-Flashmedium Claude Sonnet 4.6nonevsDeepSeek V3.2medium Gemini 3.5 FlashnonevsRing-2.6-1Tmedium Claude Opus 4.8nonevsDeepSeek V3.2medium DeepSeek V3.2mediumvsStep 3.7 Flashlow Gemini 3.5 FlashnonevsQwen3.6 35B A3Bmedium Gemini 3.5 FlashnonevsMiMo-V2.5medium