AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Google: Gemma 4 31B

Résumé

Comparaison benchmark DeepSeek V4 Flash vs Gemma 4 31B : Gemma 4 31B mène au score moyen avec 6.3 vs 5.5. DeepSeek V4 Flash a le coût de benchmark le plus bas avec $0.008 vs $0.033. DeepSeek V4 Flash est plus rapide avec 26.75s vs 56.55s, avec des taux de réussite de 30.2% vs 69.8%.

Modèle recommandé: Gemma 4 31B - Il obtient le meilleur score de cette comparaison (6.3) et le meilleur équilibre global entre coût et temps de réponse sur les 2 modèles.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-12

Métrique	DeepSeek V4 Flash DeepSeek V4 Flash none Sortie: 2026-04-24	Gemma 4 31B Gemma 4 31B medium Sortie: 2026-04-02 Disponible gratuitement

Métrique	DeepSeek V4 Flash DeepSeek V4 Flash none Sortie: 2026-04-24	Gemma 4 31B Gemma 4 31B medium Sortie: 2026-04-02 Disponible gratuitement
Score	5.5	6.3
Rang	#120	#87
Fiabilité	10.0	10.0
Cohérence	8.9	9.4
Tests corrects
Taux de réussite par tentative	30.2%	69.8%
Tests instables	3	1
Exécutions totales	63	63
Coût par résultat	0.203	0.257
Coût total	$0.008	$0.033
Prix d'entrée	$0.098 / 1M	$0.120 / 1M
Prix de sortie	$0.196 / 1M	$0.350 / 1M
Total des jetons d'entrée	50,127	17,957
Jetons de sortie	13,710	22,356
Jetons de raisonnement	0	65,726
Temps de réponse (moy.)	26.75s	56.55s
Temps de réponse (max)	111.96s	437.40s
Temps de réponse (total)	561.82s	1074.41s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#120 DeepSeek V4 Flash

none

Cost: $0.004
Time: 157.6s
Tokens: 11,297 tok

#87 Gemma 4 31B

medium

Cost: $0.002
Time: 45.7s
Tokens: 2,696 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	3.0	10.0	0.0%	0		20.18s	540	174	0
Gemma 4 31B	10.0	10.0	100.0%	0		12.89s	816	962	2,046

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	4.2	7.4	11.1%	1		17.13s	7,279	9,717	0
Gemma 4 31B	4.3	5.8	22.2%	1		219.76s	5,568	11,098	33,212

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	4.5	2.1	66.7%	1		111.96s	24,398	2,664	0
Gemma 4 31B	3.0	10.0	0.0%	0		0ms	0	0	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	10.0	10.0	100.0%	0		23.79s	7,290	195	0
Gemma 4 31B	10.0	10.0	100.0%	0		21.11s	8,334	1,822	2,951

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	5.3	10.0	33.3%	0		19.73s	666	18	0
Gemma 4 31B	7.7	10.0	66.7%	0		38.48s	876	4,349	8,985

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	4.2	9.9	0.0%	0		23.74s	471	67	0
Gemma 4 31B	10.0	10.0	100.0%	0		9.57s	567	105	888

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	6.5	10.0	50.0%	0		17.54s	627	321	0
Gemma 4 31B	10.0	10.0	100.0%	0		12.76s	777	533	2,035

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	3.1	7.3	11.1%	1		23.72s	594	207	0
Gemma 4 31B	9.9	10.0	100.0%	0		26.91s	801	1,795	5,595

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	10.0	10.0	100.0%	0		77.93s	8,079	327	0
Gemma 4 31B	3.0	10.0	0.0%	0		0ms	0	0	0

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Flash	3.0	10.0	0.0%	0		3.07s	183	20	0
Gemma 4 31B	3.0	10.0	0.0%	0		90.14s	218	1,692	10,014

Comparaison rapide

Changer la paire de comparaison