Navigare
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs OpenAI: GPT-5.4 Nano

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-01

Metrică Gemini 3 Flash Preview Gemini 3 Flash Preview medium Lansare: 2025-12-17 GPT-5.4 Nano GPT-5.4 Nano medium Lansare: 2026-03-17
Scor 10.0 7.6
Rang #1 #51
Fiabilitate N/D N/D
Consistență 10.0 9.0
Teste corecte
Rată de trecere pe încercare 100.0% 68.5%
Teste instabile 0 2
Rulări totale 18 54
Cost per rezultat 0.600 0.747
Cost total $0.108 $0.083
Preț de intrare $0.500 / 1M $0.200 / 1M
Preț de ieșire $3.000 / 1M $1.250 / 1M
Tokenuri de ieșire 655 2,946
Tokenuri de raționament 33,749 58,132
Timp de răspuns (mediu) 12.11s 11.21s
Timp de răspuns (maxim) 82.37s 94.06s
Timp de răspuns (total) 217.93s 201.80s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.26s 110 1,076
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 683 2,254
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 82.37s 144 16,257
GPT-5.4 Nano 10.0 10.0 100.0% 0 13.41s 472 3,616
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 23.58s 117 3,495
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 349 5,719
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 7.62s 93 2,197
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 234 516
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 14.81s 4 7,228
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 60 43,325
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.34s 24 635
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 179 443
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.30s 24 903
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 95 521
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.86s 61 1,455
GPT-5.4 Nano 4.0 7.1 22.2% 1 3.65s 640 1,356
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.78s 78 503
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 234 382

Comparație rapidă

Schimbă perechea de comparație