Urambazaji
AI BENCHY
Your ad here

AI BENCHY Compare

Inception: Mercury 2 vs OpenAI: GPT-5.4 Nano

Benchmark zimetengenezwa kutoka seti za majaribio za AI BENCHY tarehe: 2026-03-17

Kipimo Mercury 2 Mercury 2 medium Toleo: 2026-02-24 GPT-5.4 Nano GPT-5.4 Nano none Toleo: 2026-03-17
Nafasi #42 #73
Alama 6.3 4.3
Uthabiti 8.5 7.3
Gharama kwa matokeo 0.634 0.404
Jumla ya gharama $0.045 $0.009
Majaribio sahihi
Kiwango cha kupita kwa kila jaribio 51.0% 29.4%
Majaribio yasiyo thabiti 3 6
Jumla ya uendeshaji 51 51
Tokeni za matokeo 3,723 2,185
Tokeni za hoja 46,120 0
Muda wa majibu (wastani) 2.25s 1.39s
Muda wa majibu (upeo) 14.63s 3.84s
Muda wa majibu (jumla) 35.99s 23.70s

Modeli bora kwa alama

Alama dhidi ya gharama ya jumla

Muda wa majibu (wastani)

Alama vs Muda wa majibu (wastani)

Jumla ya tokeni za matokeo

Alama vs Jumla ya tokeni za matokeo

Mgawanyo wa kategoria

Mbinu za kupinga AI Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
GPT-5.4 Nano 3.5 8.0 16.7% 1 1.18s 800 0
Mchanganyiko Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
GPT-5.4 Nano 3.0 10.0 0.0% 0 3.84s 280 0
Uchanganuzi na uchimbaji wa data Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
GPT-5.4 Nano 6.5 10.0 50.0% 0 1.11s 219 0
Mahususi kwa domeni Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
GPT-5.4 Nano 2.9 4.4 22.2% 2 926ms 52 0
Akili ya jumla Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
GPT-5.4 Nano 3.8 2.5 33.3% 1 1.31s 180 0
Ufuataji wa maagizo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
GPT-5.4 Nano 5.0 6.8 33.3% 1 787ms 84 0
Puzzle Solving Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Mercury 2 3.9 7.5 22.2% 1 934ms 354 2,758
GPT-5.4 Nano 3.7 7.3 22.2% 1 1.29s 348 0
Mwito wa zana Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
GPT-5.4 Nano 10.0 10.0 100.0% 0 3.40s 222 0

Ulinganisho wa haraka

Badilisha jozi ya ulinganisho