Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.2

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-06-04

Metriek Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Releasedatum: 2026-03-03 GPT-5.2 GPT-5.2 medium Releasedatum: 2025-12-11
Score 7.4 7.5
Rang #50 #42
Betrouwbaarheid 10.0 10.0
Consistentie 10.0 8.4
Correcte tests
Slaagpercentage per poging 61.9% 71.4%
Instabiele tests 0 4
Totaal runs 63 63
Kosten per resultaat 0.196 4.209
Totale kosten $0.026 $0.548
Invoerprijs $0.250 / 1M $1.750 / 1M
Uitvoerprijs $1.500 / 1M $14.000 / 1M
Totaal aantal invoer-tokens 32,715 33,967
Uitvoer-tokens 2,286 2,901
Redeneer-tokens 9,166 31,932
Responstijd (gem.) 2.77s 16.88s
Responstijd (max) 11.91s 77.80s
Responstijd (totaal) 58.12s 236.34s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 506 462 1,638
GPT-5.2 6.5 8.0 58.3% 1 7.81s 606 567 2,002
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 5.5 10.0 33.3% 0 1.39s 8,138 660 1,060
GPT-5.2 10.0 10.0 100.0% 0 22.73s 7,302 511 11,912
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 8,381 225 762
GPT-5.2 10.0 10.0 100.0% 0 14.06s 11,019 291 1,757
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 7,455 291 696
GPT-5.2 10.0 10.0 100.0% 0 3.15s 7,140 234 420
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 641 18 1,212
GPT-5.2 5.9 7.2 55.6% 1 77.80s 473 42 10,342
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 490 69 384
GPT-5.2 3.7 9.7 0.0% 0 4.32s 477 162 269
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 621 72 753
GPT-5.2 9.9 10.0 100.0% 0 3.12s 660 94 614
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.69s 566 243 1,248
GPT-5.2 7.5 7.3 77.8% 1 5.80s 642 735 924
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 5,757 237 993
GPT-5.2 4.7 1.6 66.7% 1 10.30s 5,453 239 469
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 1.35s 160 9 420
GPT-5.2 3.0 10.0 0.0% 0 28.18s 195 26 3,223

Snelle vergelijking

Vergelijkingspaar wisselen