AI BENCHY Compare

Google: Gemini 3.5 Flash vs Grok 4.20 Beta

Résumé

Comparaison benchmark Gemini 3.5 Flash vs Grok 4.20 Beta : Gemini 3.5 Flash mène au score moyen avec 9.6 vs 5.8. Grok 4.20 Beta a le coût de benchmark le plus bas avec $0.087 vs $1.115. Grok 4.20 Beta est plus rapide avec 1.19s vs 8.84s, avec des taux de réussite de 96.8% vs 37.0%.

Modèle recommandé: Gemini 3.5 Flash - Il obtient le meilleur score de cette comparaison (9.6) et le meilleur équilibre global entre coût et temps de réponse sur les 2 modèles.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-10

Métrique	Gemini 3.5 Flash Gemini 3.5 Flash high Sortie: 2026-05-19	Grok 4.20 Beta Grok 4.20 Beta none Sortie: 2026-03-12

Métrique	Gemini 3.5 Flash Gemini 3.5 Flash high Sortie: 2026-05-19	Grok 4.20 Beta Grok 4.20 Beta none Sortie: 2026-03-12
Score	9.6	5.8
Rang	#2	#107
Fiabilité	10.0	N/D
Cohérence	9.6	9.6
Tests corrects
Taux de réussite par tentative	96.8%	37.0%
Tests instables	1	1
Exécutions totales	63	52
Coût par résultat	5.575	1.510
Coût total	$1.115	$0.087
Prix d'entrée	$1.500 / 1M	$2.041 / 1M
Prix de sortie	$9.000 / 1M	$2.041 / 1M
Total des jetons d'entrée	37,594	40,597
Jetons de sortie	1,975	1,657
Jetons de raisonnement	115,638	0
Temps de réponse (moy.)	8.84s	1.19s
Temps de réponse (max)	34.82s	6.48s
Temps de réponse (total)	185.57s	21.43s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#2 Gemini 3.5 Flash

high

Cost: $0.208
Time: 118.2s
Tokens: 23,158 tok

#107 Grok 4.20 Beta

none

Invalid SVG

Cost: $0.004
Time: 8.5s
Tokens: 1,672 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.57s	492	174	4,997
Grok 4.20 Beta	4.0	8.4	16.7%	1		597ms	1,986	251	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	10.0	10.0	100.0%	0		22.96s	8,118	456	47,129
Grok 4.20 Beta	5.5	10.0	0.0%	0		1.14s	358	74	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	10.0	10.0	100.0%	0		22.37s	12,873	351	16,323
Grok 4.20 Beta	3.0	10.0	0.0%	0		6.48s	17,673	282	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	10.0	10.0	100.0%	0		6.43s	7,548	279	8,466
Grok 4.20 Beta	10.0	10.0	100.0%	0		601ms	7,749	197	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	7.6	7.2	77.8%	1		14.09s	633	12	24,721
Grok 4.20 Beta	3.0	10.0	0.0%	0		611ms	1,746	160	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.63s	486	115	1,650
Grok 4.20 Beta	5.0	10.0	0.0%	0		541ms	819	87	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.35s	615	70	3,799
Grok 4.20 Beta	6.3	10.0	50.0%	0		649ms	1,350	60	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.23s	558	241	4,940
Grok 4.20 Beta	7.7	10.0	66.7%	0		586ms	1,671	357	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	9.8	10.0	100.0%	0		4.96s	6,115	265	1,608
Grok 4.20 Beta	10.0	10.0	100.0%	0		4.79s	7,245	189	0

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.94s	156	12	2,005
Grok 4.20 Beta	-	-	-	-	-	-	-	-	-

Comparaison rapide

Changer la paire de comparaison

Gemini 3.5 FlashhighvsQwen3.7 Maxmedium Gemini 3.5 FlashhighvsGPT-5.5low Gemini 3.5 FlashhighvsGPT-5.5medium Claude Opus 4.8mediumvsGemini 3.5 Flashhigh Claude Opus 4.7mediumvsGemini 3.5 Flashhigh Claude Fable 5mediumvsGemini 3.5 Flashhigh Gemini 3.5 FlashhighvsQwen3.6 Max Previewmedium Gemini 3.5 FlashhighvsGPT-5.3-Codexmedium Gemini 3.5 FlashhighvsGLM 5medium Gemini 3.5 FlashhighvsQwen3.7 Plusmedium Seed-2.0-LitemediumvsGemini 3.5 Flashhigh Gemini 3.5 FlashhighvsGPT-5.4medium