Navigation
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.5 Flash vs Inception: Mercury 2

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-03

Métrique Gemini 3.5 Flash Gemini 3.5 Flash low Sortie: 2026-05-19 Mercury 2 Mercury 2 none Sortie: 2026-02-24
Score 9.3 4.6
Rang #3 #153
Fiabilité 10.0 10.0
Cohérence 10.0 9.1
Tests corrects
Taux de réussite par tentative 90.0% 25.0%
Tests instables 0 2
Exécutions totales 60 60
Coût par résultat 1.582 0.216
Coût total $0.285 $0.009
Prix d'entrée $1.500 / 1M $0.250 / 1M
Prix de sortie $9.000 / 1M $0.750 / 1M
Total des jetons d'entrée 33,935 25,515
Jetons de sortie 2,027 3,001
Jetons de raisonnement 23,938 0
Temps de réponse (moy.) 2.98s 614ms
Temps de réponse (max) 6.44s 1.27s
Temps de réponse (total) 59.59s 12.28s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.52s 494 209 2,536
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.5 Flash 6.8 10.0 50.0% 0 5.54s 5,115 452 6,839
Mercury 2 3.5 9.4 0.0% 0 831ms 4,631 1,650 0
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.44s 12,873 351 3,050
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.81s 7,548 279 1,164
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.5 Flash 7.7 10.0 66.7% 0 3.39s 633 12 4,538
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.27s 486 119 916
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.5 Flash 9.9 10.0 100.0% 0 1.86s 615 71 1,652
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.35s 558 288 2,150
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.27s 5,457 234 403
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.88s 156 12 690
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0

Comparaison rapide

Changer la paire de comparaison