Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs OpenAI: GPT-5.5

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-19

Metrică Gemini 3.5 Flash Gemini 3.5 Flash high Lansare: 2026-05-19 GPT-5.5 GPT-5.5 medium Lansare: 2026-04-24
Scor 9.6 8.9
Rang #4 #8
Fiabilitate 10.0 10.0
Consistență 9.6 9.1
Teste corecte
Rată de trecere pe încercare 96.5% 87.7%
Teste instabile 1 2
Rulări totale 57 57
Cost per rezultat 4.294 18.365
Cost total $0.773 $2.939
Preț de intrare $1.500 / 1M $5.000 / 1M
Preț de ieșire $9.000 / 1M $30.000 / 1M
Tokenuri de ieșire 1,945 1,950
Tokenuri de raționament 78,877 91,386
Timp de răspuns (mediu) 6.90s 33.02s
Timp de răspuns (maxim) 22.37s 332.10s
Timp de răspuns (total) 131.10s 627.45s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.57s 174 4,997
GPT-5.5 10.0 10.0 100.0% 0 4.66s 250 1,335
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 14.42s 426 10,368
GPT-5.5 10.0 10.0 100.0% 0 9.09s 318 1,391
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.37s 351 16,323
GPT-5.5 10.0 10.0 100.0% 0 19.29s 312 2,841
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.43s 279 8,466
GPT-5.5 10.0 10.0 100.0% 0 4.18s 234 593
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 7.6 7.2 77.8% 1 14.09s 12 24,721
GPT-5.5 5.3 7.2 44.4% 1 164.14s 67 79,625
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.63s 115 1,650
GPT-5.5 10.0 10.0 100.0% 0 4.16s 138 223
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.35s 70 3,799
GPT-5.5 10.0 10.0 100.0% 0 3.36s 93 538
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.23s 241 4,940
GPT-5.5 10.0 10.0 100.0% 0 6.78s 250 2,254
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 9.8 10.0 100.0% 0 4.96s 265 1,608
GPT-5.5 10.0 10.0 100.0% 0 10.57s 258 832
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.94s 12 2,005
GPT-5.5 2.8 1.6 33.3% 1 37.86s 30 1,754

Comparație rapidă

Schimbă perechea de comparație