Urambazaji
AI BENCHY
Your ad here

AI BENCHY Compare

MiniMax: MiniMax M2.5 vs OpenAI: gpt-oss-120b

Benchmark zimetengenezwa kutoka seti za majaribio za AI BENCHY tarehe: 2026-04-11

Kipimo MiniMax M2.5 MiniMax M2.5 medium Toleo: 2026-02-12 Inapatikana bure gpt-oss-120b gpt-oss-120b none Toleo: 2025-08-05 Inapatikana bure
Alama 5.7 5.2
Nafasi #67 #79
Uthabiti 5.6 7.9
Majaribio sahihi
Kiwango cha kupita kwa kila jaribio 57.4% 38.9%
Majaribio yasiyo thabiti 10 5
Jumla ya uendeshaji 54 54
Gharama kwa matokeo 4.987 0.221
Jumla ya gharama $0.250 $0.009
Bei ya ingizo $0.118 / 1M $0.039 / 1M
Bei ya toleo $0.991 / 1M $0.190 / 1M
Tokeni za matokeo 107,044 44,652
Tokeni za hoja 206,422 0
Muda wa majibu (wastani) 39.65s 11.96s
Muda wa majibu (upeo) 237.27s 68.97s
Muda wa majibu (jumla) 396.47s 179.34s

Modeli bora kwa alama

Alama dhidi ya gharama ya jumla

Muda wa majibu (wastani)

Alama vs Muda wa majibu (wastani)

Jumla ya tokeni za matokeo

Alama vs Jumla ya tokeni za matokeo

Mgawanyo wa kategoria

Mbinu za kupinga AI Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
MiniMax M2.5 7.9 6.3 83.3% 2 20.82s 286 45,344
gpt-oss-120b 6.6 8.0 58.3% 1 6.03s 4,867 0
Uandishi wa msimbo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
MiniMax M2.5 3.0 10.0 0.0% 0 0ms 0 0
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
Mchanganyiko Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
MiniMax M2.5 4.5 2.1 66.7% 1 60.39s 740 9,713
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
Uchanganuzi na uchimbaji wa data Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
MiniMax M2.5 4.6 1.7 66.7% 2 7.48s 266 3,835
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
Mahususi kwa domeni Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
MiniMax M2.5 2.9 4.4 22.2% 2 237.27s 105,047 133,487
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
Akili ya jumla Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
MiniMax M2.5 3.8 2.5 33.3% 1 6.63s 25 1,686
gpt-oss-120b 4.6 10.0 0.0% 0 2.83s 586 0
Ufuataji wa maagizo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
MiniMax M2.5 8.1 6.8 83.3% 1 4.64s 252 1,873
gpt-oss-120b 8.4 6.9 83.3% 1 5.10s 1,982 0
Utatuzi wa mafumbo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
MiniMax M2.5 5.3 7.2 44.4% 1 11.54s 159 9,547
gpt-oss-120b 4.5 4.8 44.5% 2 6.86s 3,904 0
Mwito wa zana Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
MiniMax M2.5 10.0 10.0 100.0% 0 15.35s 269 937
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0

Ulinganisho wa haraka

Badilisha jozi ya ulinganisho