Navigation
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 2.5 Flash vs Inception: Mercury 2

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-03

Métrique Gemini 2.5 Flash Gemini 2.5 Flash none Sortie: 2025-06-17 Mercury 2 Mercury 2 medium Sortie: 2026-02-24
Score 6.4 6.5
Rang #94 #89
Fiabilité 10.0 10.0
Cohérence 9.6 8.8
Tests corrects
Taux de réussite par tentative 48.3% 51.7%
Tests instables 1 3
Exécutions totales 60 60
Coût par résultat 0.159 0.611
Coût total $0.015 $0.055
Prix d'entrée $0.300 / 1M $0.250 / 1M
Prix de sortie $2.500 / 1M $0.750 / 1M
Total des jetons d'entrée 32,923 32,570
Jetons de sortie 1,764 4,022
Jetons de raisonnement 0 58,405
Temps de réponse (moy.) 889ms 2.27s
Temps de réponse (max) 4.39s 14.63s
Temps de réponse (total) 17.79s 43.20s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 3.0 10.0 0.0% 0 582ms 492 102 0
Mercury 2 6.9 9.9 50.0% 0 1.12s 554 2,546 2,609
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 6.8 10.0 50.0% 0 810ms 5,119 477 0
Mercury 2 7.2 6.5 66.7% 1 2.29s 4,519 270 8,514
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 3.0 10.0 0.0% 0 4.39s 12,519 366 0
Mercury 2 10.0 10.0 100.0% 0 3.28s 12,909 268 4,887
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 10.0 10.0 100.0% 0 652ms 7,257 279 0
Mercury 2 7.3 5.9 83.3% 1 1.11s 6,234 183 1,656
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 5.9 7.2 55.6% 1 495ms 633 12 0
Mercury 2 2.9 7.2 11.1% 1 6.48s 695 41 30,754
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 5.0 10.0 0.0% 0 615ms 486 78 0
Mercury 2 4.8 10.0 0.0% 0 821ms 456 137 542
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 10.0 10.0 100.0% 0 590ms 615 72 0
Mercury 2 10.0 10.0 100.0% 0 1.07s 340 14 958
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 7.7 10.0 66.7% 0 604ms 558 132 0
Mercury 2 5.4 10.0 33.3% 0 949ms 601 361 2,781
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.91s 5,088 234 0
Mercury 2 10.0 10.0 100.0% 0 1.89s 6,080 180 1,956
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 2.5 Flash 3.0 10.0 0.0% 0 1.15s 156 12 0
Mercury 2 3.0 10.0 0.0% 0 2.58s 182 22 3,748

Comparaison rapide

Changer la paire de comparaison