AI BENCHY Compare

Google: Gemini 3.5 Flash vs xAI: Grok Build 0.1

Résumé

Comparaison benchmark Gemini 3.5 Flash vs Grok Build 0.1 : Gemini 3.5 Flash mène au score moyen avec 9.8 vs 4.2. Grok Build 0.1 a le coût de benchmark le plus bas avec $0.547 vs $1.115. Gemini 3.5 Flash est plus rapide avec 8.84s vs 28.69s, avec des taux de réussite de 96.8% vs 46.0%.

Modèle recommandé: Gemini 3.5 Flash - Il obtient le meilleur score ici (9.8) et répond environ 3.2x plus vite que Grok Build 0.1.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-07-02

Métrique	Gemini 3.5 Flash Gemini 3.5 Flash high Sortie: 2026-05-19	Grok Build 0.1 Grok Build 0.1 none Sortie: 2026-05-21

Métrique	Gemini 3.5 Flash Gemini 3.5 Flash high Sortie: 2026-05-19	Grok Build 0.1 Grok Build 0.1 none Sortie: 2026-05-21
Score	9.8	4.2
Rang	#1	#165
Fiabilité	10.0	10.0
Cohérence	9.6	7.5
Tests corrects
Taux de réussite par tentative	96.8%	46.0%
Tests instables	1	4
Exécutions totales	63	57
Coût par résultat	5.575	7.805
Coût total	$1.115	$0.547
Prix d'entrée	$1.500 / 1M	$1.000 / 1M
Prix de sortie	$9.000 / 1M	$2.000 / 1M
Total des jetons d'entrée	37,594	11,793
Jetons de sortie	1,975	267,275
Jetons de raisonnement	115,638	0
Temps de réponse (moy.)	8.84s	28.69s
Temps de réponse (max)	34.82s	138.35s
Temps de réponse (total)	185.57s	459.00s

Génération showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#1 Gemini 3.5 Flash

high

Coût: $0.208
Temps: 118.2s
Tokens: 23,158 tok

#165 xAI: Grok Build 0.1

none

Aucun résultat showcase n'a encore été généré pour ce modèle.

Coût: $0.000
Temps: -
Tokens: 0 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.57s	492	174	4,997
Grok Build 0.1	8.7	7.9	91.7%	1		6.30s	2,010	11,162	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	10.0	10.0	100.0%	0		22.96s	8,118	456	47,129
Grok Build 0.1	3.3	3.3	33.3%	0		21.41s	1,080	16,568	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	10.0	10.0	100.0%	0		22.37s	12,873	351	16,323
Grok Build 0.1	3.0	10.0	0.0%	0		0ms	0	0	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	10.0	10.0	100.0%	0		6.43s	7,548	279	8,466
Grok Build 0.1	3.8	5.8	33.3%	1		9.33s	2,532	6,359	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	7.6	7.2	77.8%	1		14.09s	633	12	24,721
Grok Build 0.1	3.6	7.2	22.2%	1		103.71s	1,764	179,469	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.63s	486	115	1,650
Grok Build 0.1	4.3	10.0	0.0%	0		12.47s	825	6,647	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.35s	615	70	3,799
Grok Build 0.1	9.8	10.0	100.0%	0		7.36s	1,362	8,970	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.23s	558	241	4,940
Grok Build 0.1	6.4	7.7	55.6%	1		9.55s	1,689	14,982	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	9.8	10.0	100.0%	0		4.96s	6,115	265	1,608
Grok Build 0.1	3.0	10.0	0.0%	0		0ms	0	0	0

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.94s	156	12	2,005
Grok Build 0.1	3.0	10.0	0.0%	0		36.09s	531	23,118	0

Comparaison rapide

Changer la paire de comparaison

Gemini 3.5 FlashhighvsQwen3.7 Maxmedium Gemini 3.5 FlashhighvsGPT-5.5low Claude Fable 5mediumvsGemini 3.5 Flashhigh Gemini 3.5 FlashhighvsGPT-5.5medium Gemini 3.5 FlashhighvsGPT-5.3-Codexmedium Gemini 3.5 FlashhighvsQwen3.6 Max Previewmedium Claude Opus 4.8mediumvsGemini 3.5 Flashhigh Claude Opus 4.7mediumvsGemini 3.5 Flashhigh Gemini 3.5 FlashhighvsGLM 5.2medium Gemini 3.5 FlashhighvsGLM 5medium Gemini 3.5 FlashhighvsGPT-5 Minimedium Gemini 3.5 FlashhighvsGPT-5.4medium