Navigation
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Grok 4.20 Beta

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-04-26

Métrique Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Sortie: 2026-02-19 Grok 4.20 Beta Grok 4.20 Beta medium Sortie: 2026-03-12
Score 9.6 8.0
Rang #2 #31
Fiabilité N/D N/D
Cohérence 10.0 9.1
Tests corrects
Taux de réussite par tentative 94.4% 74.1%
Tests instables 0 2
Exécutions totales 54 52
Coût par résultat 3.400 5.269
Coût total $0.578 $0.633
Prix d'entrée $2.000 / 1M $0.000 / 1M
Prix de sortie $12.000 / 1M $0.000 / 1M
Jetons de sortie 1,932 1,568
Jetons de raisonnement 40,542 91,909
Temps de réponse (moy.) 15.96s 9.81s
Temps de réponse (max) 40.61s 31.36s
Temps de réponse (total) 175.52s 176.62s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
Grok 4.20 Beta 8.7 7.9 91.7% 1 3.16s 268 7,583
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201
Grok 4.20 Beta 10.0 10.0 100.0% 0 31.36s 81 3,987
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 227 12,212
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.01s 180 5,281
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Grok 4.20 Beta 5.3 10.0 33.3% 0 21.33s 251 40,255
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 72 3,440
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Grok 4.20 Beta 8.3 10.0 50.0% 0 4.97s 57 7,107
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
Grok 4.20 Beta 8.2 7.2 88.9% 1 3.85s 249 6,660
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
Grok 4.20 Beta 3.0 10.0 0.0% 0 12.39s 183 5,384

Comparaison rapide

Changer la paire de comparaison