AI BENCHY Compare

Google: Gemma 4 31B vs Qwen: Qwen3.5-35B-A3B

Résumé

Comparaison benchmark Gemma 4 31B vs Qwen3.5-35B-A3B : Qwen3.5-35B-A3B mène au score moyen avec 6.3 vs 6.1. Gemma 4 31B a le coût de benchmark le plus bas avec $0.004 vs $0.401. Gemma 4 31B est plus rapide avec 4.05s vs 72.57s, avec des taux de réussite de 47.6% vs 69.8%.

Modèle recommandé: Gemma 4 31B - Son score reste proche du meilleur score ici (6.1 vs 6.3) tout en coûtant environ 133.3x moins que Qwen3.5-35B-A3B.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-07-02

Métrique	Gemma 4 31B Gemma 4 31B none Sortie: 2026-04-02 Disponible gratuitement	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Sortie: 2026-02-24

Métrique	Gemma 4 31B Gemma 4 31B none Sortie: 2026-04-02 Disponible gratuitement	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Sortie: 2026-02-24
Score	6.1	6.3
Rang	#101	#92
Fiabilité	10.0	10.0
Cohérence	10.0	7.5
Tests corrects
Taux de réussite par tentative	47.6%	69.8%
Tests instables	0	6
Exécutions totales	63	63
Coût par résultat	0.034	5.162
Coût total	$0.004	$0.401
Prix d'entrée	$0.120 / 1M	$0.140 / 1M
Prix de sortie	$0.350 / 1M	$1.000 / 1M
Total des jetons d'entrée	20,911	42,196
Jetons de sortie	1,407	40,630
Jetons de raisonnement	0	353,577
Temps de réponse (moy.)	4.05s	72.57s
Temps de réponse (max)	26.13s	409.98s
Temps de réponse (total)	76.87s	1524.04s

Génération showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#101 Gemma 4 31B

none

Coût: $0.001
Temps: 12.8s
Tokens: 795 tok

#92 Qwen3.5-35B-A3B

medium

Coût: $0.009
Temps: 71.4s
Tokens: 8,631 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	6.5	10.0	50.0%	0		1.85s	852	45	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.13s	672	798	42,652

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	5.5	10.0	33.3%	0		11.19s	8,381	735	0
Qwen3.5-35B-A3B	5.9	9.3	33.3%	0		206.65s	4,106	23,844	111,462

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	3.0	10.0	0.0%	0		0ms	0	0	0
Qwen3.5-35B-A3B	4.7	1.6	66.7%	1		75.34s	20,992	775	12,485

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	10.0	10.0	100.0%	0		2.25s	8,352	285	0
Qwen3.5-35B-A3B	7.3	5.9	83.3%	1		59.33s	6,061	235	19,493

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	7.7	10.0	66.7%	0		3.22s	903	27	0
Qwen3.5-35B-A3B	4.1	4.4	44.5%	2		88.34s	500	41	46,368

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	10.0	10.0	100.0%	0		2.09s	576	117	0
Qwen3.5-35B-A3B	2.8	1.6	33.3%	1		30.30s	172	20	3,753

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	6.5	10.0	50.0%	0		2.84s	795	78	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	699	97	17,361

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	6.5	10.0	33.3%	0		4.23s	828	108	0
Qwen3.5-35B-A3B	8.2	7.2	88.9%	1		33.13s	597	3,592	26,585

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	3.0	10.0	0.0%	0		0ms	0	0	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	8,193	309	1,365

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	3.0	10.0	0.0%	0		1.25s	224	12	0
Qwen3.5-35B-A3B	3.0	10.0	0.0%	0		177.35s	204	10,919	72,053

Comparaison rapide

Changer la paire de comparaison