Urambazaji
AI BENCHY
Advertise here

AI BENCHY Compare

Inception: Mercury 2 vs OpenAI: GPT-5.4 Mini

Muhtasari

Ulinganisho wa benchmark Mercury 2 vs GPT-5.4 Mini: GPT-5.4 Mini inaongoza kwa average score: 5.3 vs 4.6. Mercury 2 ina gharama ya chini ya benchmark: $0.011 vs $0.038. Mercury 2 ni ya haraka zaidi: 653ms vs 1.13s, na pass rates 23.8% vs 30.2%.

Muundo unaopendekezwa: Mercury 2 - Its score stays close to the best score here (4.6 vs 5.3), while costing about 3.6x less than GPT-5.4 Mini.

Benchmark zimetengenezwa kutoka seti za majaribio za AI BENCHY tarehe: 2026-06-18

Kipimo Mercury 2 Mercury 2 none Toleo: 2026-02-24 GPT-5.4 Mini GPT-5.4 Mini none Toleo: 2026-03-17
Alama 4.6 5.3
Nafasi #151 #124
Uaminifu 10.0 10.0
Uthabiti 9.2 8.8
Majaribio sahihi
Kiwango cha kupita kwa kila jaribio 23.8% 30.2%
Majaribio yasiyo thabiti 2 3
Jumla ya uendeshaji 63 63
Gharama kwa matokeo 0.259 0.743
Jumla ya gharama $0.011 $0.038
Bei ya ingizo $0.250 / 1M $0.750 / 1M
Bei ya toleo $0.750 / 1M $4.500 / 1M
Jumla ya tokeni za ingizo 28,113 34,244
Tokeni za matokeo 4,439 2,541
Tokeni za hoja 0 0
Muda wa majibu (wastani) 653ms 1.13s
Muda wa majibu (upeo) 1.43s 2.52s
Muda wa majibu (jumla) 13.72s 23.82s

Onyesho la kizazi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#151 Mercury 2

none
Gharama
$0.002
Muda
1.8s
Tokeni
1,514 tok

#124 GPT-5.4 Mini

none
Gharama
$0.010
Muda
11.7s
Tokeni
2,151 tok

Modeli bora kwa alama

Alama dhidi ya gharama ya jumla

Muda wa majibu (wastani)

Alama vs Muda wa majibu (wastani)

Jumla ya tokeni za matokeo

Alama vs Jumla ya tokeni za matokeo

Mgawanyo wa kategoria

Mbinu za kupinga AI Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za ingizo Tokeni za matokeo Tokeni za hoja
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 606 654 0
Uandishi wa msimbo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za ingizo Tokeni za matokeo Tokeni za hoja
Mercury 2 3.4 9.6 0.0% 0 1.03s 7,229 3,088 0
GPT-5.4 Mini 5.5 10.0 33.3% 0 913ms 7,305 401 0
Mchanganyiko Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za ingizo Tokeni za matokeo Tokeni za hoja
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 11,019 298 0
Uchanganuzi na uchimbaji wa data Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za ingizo Tokeni za matokeo Tokeni za hoja
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 7,140 222 0
Mahususi kwa domeni Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za ingizo Tokeni za matokeo Tokeni za hoja
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 723 88 0
Akili ya jumla Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za ingizo Tokeni za matokeo Tokeni za hoja
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 477 174 0
Ufuataji wa maagizo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za ingizo Tokeni za matokeo Tokeni za hoja
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 660 101 0
Utatuzi wa mafumbo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za ingizo Tokeni za matokeo Tokeni za hoja
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
GPT-5.4 Mini 5.4 10.0 33.3% 0 836ms 642 305 0
Mwito wa zana Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za ingizo Tokeni za matokeo Tokeni za hoja
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 5,477 255 0
Maarifa ya jumla Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za ingizo Tokeni za matokeo Tokeni za hoja
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0
GPT-5.4 Mini 3.0 10.0 0.0% 0 1.33s 195 43 0

Ulinganisho wa haraka

Badilisha jozi ya ulinganisho