Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs OpenAI: GPT-5.5

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-19

Metrică Gemini 3.5 Flash Gemini 3.5 Flash high Lansare: 2026-05-19 GPT-5.5 GPT-5.5 low Lansare: 2026-04-24
Scor 9.6 8.9
Rang #4 #10
Fiabilitate 10.0 10.0
Consistență 9.6 10.0
Teste corecte
Rată de trecere pe încercare 96.5% 84.2%
Teste instabile 1 0
Rulări totale 57 57
Cost per rezultat 4.294 4.412
Cost total $0.773 $0.706
Preț de intrare $1.500 / 1M $5.000 / 1M
Preț de ieșire $9.000 / 1M $30.000 / 1M
Tokenuri de ieșire 1,945 2,008
Tokenuri de raționament 78,877 16,914
Timp de răspuns (mediu) 6.90s 8.80s
Timp de răspuns (maxim) 22.37s 56.19s
Timp de răspuns (total) 131.10s 167.26s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.57s 174 4,997
GPT-5.5 10.0 10.0 100.0% 0 4.43s 246 1,011
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 14.42s 426 10,368
GPT-5.5 10.0 10.0 100.0% 0 7.79s 369 936
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.37s 351 16,323
GPT-5.5 10.0 10.0 100.0% 0 9.56s 303 717
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.43s 279 8,466
GPT-5.5 10.0 10.0 100.0% 0 3.28s 228 157
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 7.6 7.2 77.8% 1 14.09s 12 24,721
GPT-5.5 5.3 10.0 33.3% 0 27.57s 69 11,731
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.63s 115 1,650
GPT-5.5 10.0 10.0 100.0% 0 7.14s 146 170
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.35s 70 3,799
GPT-5.5 9.9 10.0 100.0% 0 2.98s 93 356
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.23s 241 4,940
GPT-5.5 10.0 10.0 100.0% 0 4.94s 274 895
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 9.8 10.0 100.0% 0 4.96s 265 1,608
GPT-5.5 10.0 10.0 100.0% 0 4.96s 250 101
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.94s 12 2,005
GPT-5.5 3.0 10.0 0.0% 0 10.06s 30 840

Comparație rapidă

Schimbă perechea de comparație