Navigation
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs OpenAI: GPT-5.3 Chat

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-04

Métrique Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Sortie: 2026-02-19 GPT-5.3 Chat GPT-5.3 Chat none Sortie: 2026-03-03
Score 9.4 7.2
Rang #4 #63
Fiabilité 10.0 10.0
Cohérence 10.0 8.1
Tests corrects
Taux de réussite par tentative 90.5% 66.7%
Tests instables 0 5
Exécutions totales 63 63
Coût par résultat 5.546 3.605
Coût total $1.054 $0.433
Prix d'entrée $2.000 / 1M $1.750 / 1M
Prix de sortie $12.000 / 1M $14.000 / 1M
Total des jetons d'entrée 41,617 34,209
Jetons de sortie 1,977 26,617
Jetons de raisonnement 78,896 0
Temps de réponse (moy.) 20.14s 6.34s
Temps de réponse (max) 88.68s 18.33s
Temps de réponse (total) 281.92s 133.13s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 498 112 3,218
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 606 3,167 0
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.1 Pro Preview 7.9 9.9 66.7% 0 40.17s 8,124 435 41,247
GPT-5.3 Chat 5.6 4.7 55.6% 2 10.52s 7,302 6,632 0
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 17,240 432 9,281
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 11,019 2,614 0
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 7,265 279 3,904
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 7,140 942 0
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 635 18 12,424
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 723 8,264 0
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 490 108 1,179
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 477 319 0
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 621 72 2,236
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 660 1,491 0
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 6.90s 570 235 3,128
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 642 1,758 0
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 6,018 274 982
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 5,445 861 0
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 6.27s 156 12 1,297
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 195 569 0

Comparaison rapide

Changer la paire de comparaison