AI BENCHY Compare

Modèles comparés

Résumé

Comparaison benchmark Gemma 4 31B vs Gemini 3 PRO Preview vs GLM 5 TurboGLM 5 Turbo mène sur Score avec 8.4. Gemma 4 31B mène sur Fiabilité avec 10.0. Gemma 4 31B a le Coût total le plus bas à $0.033. Gemini 3 PRO Preview est le plus rapide à 9.05s.

Modèle recommandé: GLM 5 Turbo - Il obtient le meilleur score de cette comparaison (8.4) et le meilleur équilibre global entre coût et temps de réponse sur les 3 modèles.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-07-02

Métrique	Gemma 4 31B Gemma 4 31B medium Sortie: 2026-04-02 Disponible gratuitement	Gemini 3 PRO Preview Gemini 3 PRO Preview medium Sortie: 2025-11-18	GLM 5 Turbo GLM 5 Turbo medium Sortie: 2026-03-15

Métrique	Gemma 4 31B Gemma 4 31B medium Sortie: 2026-04-02 Disponible gratuitement	Gemini 3 PRO Preview Gemini 3 PRO Preview medium Sortie: 2025-11-18	GLM 5 Turbo GLM 5 Turbo medium Sortie: 2026-03-15
Score	6.3	6.2	8.4
Rang	#91	#94	#21
Fiabilité	10.0	N/D	10.0
Cohérence	9.4	10.0	8.5
Tests corrects
Taux de réussite par tentative	69.8%	66.7%	74.6%
Tests instables	1	0	4
Exécutions totales	63	63	63
Coût par résultat	0.257	1.406	2.011
Coût total	$0.033	$0.385	$0.323
Prix d'entrée	$0.120 / 1M	$9.506 / 1M	$1.200 / 1M
Prix de sortie	$0.350 / 1M	$9.506 / 1M	$4.000 / 1M
Total des jetons d'entrée	17,957	28,848	35,593
Jetons de sortie	22,356	1,490	12,245
Jetons de raisonnement	65,726	10,102	62,277
Temps de réponse (moy.)	56.55s	9.05s	23.00s
Temps de réponse (max)	437.40s	26.24s	194.23s
Temps de réponse (total)	1074.41s	90.53s	482.97s

Génération showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#91 Gemma 4 31B

medium

Coût: $0.002
Temps: 45.7s
Tokens: 2,696 tok

#94 Gemini 3 PRO Preview

medium

No endpoints found for google/gemini-3-pro-preview.

Coût: $0.000
Temps: 0.1s
Tokens: 0 tok

#21 GLM 5 Turbo

medium

Coût: $0.074
Temps: 206.0s
Tokens: 18,549 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	10.0	10.0	100.0%	12.89s	816	962	2,046
Gemini 3 PRO Preview	10.0	10.0	100.0%	14.99s	500	149	1,485
GLM 5 Turbo	10.0	10.0	100.0%	4.82s	555	362	3,137

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	4.3	5.8	22.2%	1	219.76s	5,568	11,098	33,212
Gemini 3 PRO Preview	3.0	10.0	0.0%	0	0ms	0	0	0
GLM 5 Turbo	8.2	9.3	66.7%	0	45.90s	5,941	363	25,381

Combiné	Score	Cohérence	Taux de réussite par tentative	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	3.0	10.0	0.0%	0ms	0	0	0
Gemini 3 PRO Preview	3.0	10.0	0.0%	10.37s	13,211	351	952
GLM 5 Turbo	10.0	10.0	100.0%	13.88s	12,714	390	2,037

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	10.0	10.0	100.0%	21.11s	8,334	1,822	2,951
Gemini 3 PRO Preview	10.0	10.0	100.0%	10.84s	7,259	279	3,156
GLM 5 Turbo	10.0	10.0	100.0%	6.19s	7,107	577	3,632

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	7.7	10.0	66.7%	0	38.48s	876	4,349	8,985
Gemini 3 PRO Preview	5.3	10.0	33.3%	0	7.01s	643	15	1,195
GLM 5 Turbo	2.9	4.4	22.2%	2	71.07s	489	9,665	19,279

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	10.0	10.0	100.0%	0	9.57s	567	105	888
Gemini 3 PRO Preview	10.0	10.0	100.0%	0	9.34s	486	78	374
GLM 5 Turbo	6.1	3.1	66.7%	1	10.05s	477	60	2,216

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	10.0	10.0	100.0%	12.76s	777	533	2,035
Gemini 3 PRO Preview	9.8	10.0	100.0%	3.26s	623	69	754
GLM 5 Turbo	10.0	10.0	100.0%	5.38s	636	255	2,183

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	9.9	10.0	100.0%	0	26.91s	801	1,795	5,595
Gemini 3 PRO Preview	10.0	10.0	100.0%	0	3.88s	570	225	1,215
GLM 5 Turbo	8.7	7.9	77.8%	1	5.23s	609	312	2,647

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	3.0	10.0	0.0%	0ms	0	0	0
Gemini 3 PRO Preview	10.0	10.0	100.0%	11.96s	5,556	324	971
GLM 5 Turbo	10.0	10.0	100.0%	9.84s	6,879	241	446

Culture générale	Score	Cohérence	Taux de réussite par tentative	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	3.0	10.0	0.0%	90.14s	218	1,692	10,014
Gemini 3 PRO Preview	3.0	10.0	0.0%	0ms	0	0	0
GLM 5 Turbo	3.0	10.0	0.0%	40.17s	186	20	1,319

Comparaison rapide

Changer la paire de comparaison