Urambazaji
AI BENCHY
Linganisha Chati
❤️ Made by XCS
Your ad here

AI BENCHY Compare

MiniMax: MiniMax M2.5 vs OpenAI: GPT-4o-mini

Jina la modeli:

Benchmark zimetengenezwa kutoka seti za majaribio za AI BENCHY tarehe : 2026-02-27 15:16

Muhtasari

Kipimo MiniMax: MiniMax M2.5 medium Toleo: Tarehe ya kutolewa haijulikani OpenAI: GPT-4o-mini none Toleo: Tarehe ya kutolewa haijulikani
Nafasi #26 #28
Alama 5.64 4.86
Uthabiti 6.12 9.98
Gharama kwa matokeo 4.028 0.056
Jumla ya gharama $0.242 $0.003
Majaribio sahihi
Majaribio yenye makosa 8 9
Kiwango cha kupita kwa kila jaribio 64.3% 35.7%
Majaribio yasiyo thabiti 7 0
Tokeni za matokeo 121,297 949
Tokeni za hoja 203,513 0

Mgawanyo wa kategoria

Mbinu za kupinga AI Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Tokeni za matokeo Tokeni za hoja
MiniMax: MiniMax M2.5 9.33 7.89 88.9% 1 286 45,112
OpenAI: GPT-4o-mini 4.00 10.00 33.3% 0 180 0
Uchanganuzi na uchimbaji wa data Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Tokeni za matokeo Tokeni za hoja
MiniMax: MiniMax M2.5 5.50 5.81 83.3% 1 369 4,952
OpenAI: GPT-4o-mini 10.00 10.00 100.0% 0 183 0
Mahususi kwa domeni Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Tokeni za matokeo Tokeni za hoja
MiniMax: MiniMax M2.5 1.00 4.41 22.2% 2 111,023 139,533
OpenAI: GPT-4o-mini 1.00 10.00 0.0% 0 15 0
Ufuataji wa maagizo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Tokeni za matokeo Tokeni za hoja
MiniMax: MiniMax M2.5 7.00 6.41 66.7% 1 1,121 2,521
OpenAI: GPT-4o-mini 5.50 10.00 50.0% 0 71 0
Puzzle Solving Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Tokeni za matokeo Tokeni za hoja
MiniMax: MiniMax M2.5 4.33 4.79 55.6% 2 8,229 10,458
OpenAI: GPT-4o-mini 4.00 9.92 0.0% 0 295 0
Mwito wa zana Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Tokeni za matokeo Tokeni za hoja
MiniMax: MiniMax M2.5 10.00 10.00 100.0% 0 269 937
OpenAI: GPT-4o-mini 10.00 10.00 100.0% 0 205 0

Badilisha jozi ya ulinganisho