Navigatie
AI BENCHY
Vergelijken Grafieken
โค๏ธ Made by XCS
Your ad here

AI BENCHY Compare

Inception: Mercury 2 vs OpenAI: GPT-5 Mini

Vergelijken:

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-03-05

Metriek Inception: Mercury 2 none Releasedatum: 2026-02-24 OpenAI: GPT-5 Mini medium Releasedatum: 2025-08-07
Rang #50 #31
Gem. score 3.4 6.1
Correcte tests
Consistentie 8.9 8.9
Kosten per resultaat 0.147 1.401
Totale kosten $0.006 $0.113
Slaagpercentage per poging 33.3% 62.2%
Instabiele tests 2 2
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
Uitvoer-tokens 1,144 5,477
Redeneer-tokens 0 46,912
Responstijd (gem.) 594ms 25.92s
Responstijd (max) 1.27s 88.15s
Responstijd (totaal) 8.91s 388.79s

Topmodellen op score

Responstijd (gem.)

Score vs totale kosten

Gem. score vs Responstijd (gem.)

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Inception: Mercury 2 10.0 10.0 0.0% 0 466ms 274 0
OpenAI: GPT-5 Mini 7.0 9.6 66.7% 0 16.45s 1,645 5,824
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Inception: Mercury 2 10.0 10.0 0.0% 0 606ms 131 0
OpenAI: GPT-5 Mini 10.0 10.0 100.0% 0 88.15s 754 11,520
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Inception: Mercury 2 5.5 5.9 83.3% 1 667ms 180 0
OpenAI: GPT-5 Mini 9.9 10.0 100.0% 0 12.58s 453 3,200
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Inception: Mercury 2 4.0 7.2 44.4% 1 534ms 46 0
OpenAI: GPT-5 Mini 10.0 7.2 22.2% 1 44.63s 293 14,016
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Inception: Mercury 2 5.5 10.0 50.0% 0 551ms 82 0
OpenAI: GPT-5 Mini 7.5 6.6 83.3% 1 15.66s 318 4,992
Puzzle Solving Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Inception: Mercury 2 10.0 10.0 0.0% 0 533ms 234 0
OpenAI: GPT-5 Mini 4.3 9.8 33.3% 0 14.09s 1,527 5,760
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Inception: Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
OpenAI: GPT-5 Mini 10.0 10.0 100.0% 0 18.64s 487 1,600

Snelle vergelijking

Vergelijkingspaar wisselen