Navigare
AI BENCHY
Compară Grafice
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.4

Compară:

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-05

Metrică Google: Gemini 3.1 Flash Lite Preview low Lansare: 2026-03-03 OpenAI: GPT-5.4 medium Lansare: 2026-03-05
Scor mediu 7.6 8.2
Teste corecte
Rang #12 #7
Consistență 10.0 8.9
Cost per rezultat 0.170 6.533
Cost total $0.019 $0.784
Rată de trecere pe încercare 73.3% 86.7%
Teste instabile 0 2
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
Tokenuri de ieșire 1,542 1,611
Tokenuri de raționament 6,888 46,321
Timp de răspuns (medie) 3.49s 21.06s
Timp de răspuns (maxim) 11.91s 100.41s
Timp de răspuns (total) 52.29s 315.95s

Top modele după scor

Scor vs cost total

Timp de răspuns (medie)

Scor mediu vs Timp de răspuns (medie)

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 7.0 10.0 66.7% 0 2.18s 456 1,224
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 5.02s 216 1,466
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 0.0% 0 11.91s 225 762
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 9.9 10.0 100.0% 0 3.00s 291 696
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 5.32s 234 804
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 4.0 10.0 33.3% 0 2.36s 18 1,212
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 74.27s 61 34,748
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Puzzle Solving Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.76s 243 1,248
OpenAI: GPT-5.4 7.0 7.2 88.9% 1 9.13s 442 3,832
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031

Comparație rapidă

Schimbă perechea de comparație