Urambazaji
AI BENCHY
Advertise here

AI BENCHY Compare

xAI: Grok Build 0.1 vs Xiaomi: MiMo-V2.5

Benchmark zimetengenezwa kutoka seti za majaribio za AI BENCHY tarehe: 2026-05-21

Kipimo Grok Build 0.1 Grok Build 0.1 medium Toleo: 2026-05-21 MiMo-V2.5 MiMo-V2.5 medium Toleo: 2026-04-22
Alama 7.8 7.8
Nafasi #41 #37
Uaminifu 10.0 10.0
Uthabiti 8.9 8.6
Majaribio sahihi
Kiwango cha kupita kwa kila jaribio 71.9% 75.9%
Majaribio yasiyo thabiti 3 3
Jumla ya uendeshaji 57 54
Gharama kwa matokeo 4.064 2.101
Jumla ya gharama $0.488 $0.253
Bei ya ingizo $1.000 / 1M $0.400 / 1M
Bei ya toleo $2.000 / 1M $2.000 / 1M
Tokeni za matokeo 1,947 2,821
Tokeni za hoja 223,372 116,207
Muda wa majibu (wastani) 22.28s 14.40s
Muda wa majibu (upeo) 88.28s 86.93s
Muda wa majibu (jumla) 423.30s 259.20s

Modeli bora kwa alama

Alama dhidi ya gharama ya jumla

Muda wa majibu (wastani)

Alama vs Muda wa majibu (wastani)

Jumla ya tokeni za matokeo

Alama vs Jumla ya tokeni za matokeo

Mgawanyo wa kategoria

Mbinu za kupinga AI Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Grok Build 0.1 10.0 10.0 100.0% 0 5.46s 195 9,825
MiMo-V2.5 10.0 10.0 100.0% 0 4.14s 281 1,739
Uandishi wa msimbo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Grok Build 0.1 7.3 3.7 66.7% 1 30.98s 354 17,734
MiMo-V2.5 10.0 10.0 100.0% 0 31.48s 488 14,813
Mchanganyiko Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Grok Build 0.1 10.0 10.0 100.0% 0 30.81s 231 18,779
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
Uchanganuzi na uchimbaji wa data Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Grok Build 0.1 10.0 10.0 100.0% 0 7.76s 180 10,343
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
Mahususi kwa domeni Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Grok Build 0.1 5.3 10.0 33.3% 0 77.75s 501 111,807
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
Akili ya jumla Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Grok Build 0.1 3.8 2.5 33.3% 1 10.14s 78 5,386
MiMo-V2.5 5.4 2.5 66.7% 1 5.37s 121 418
Ufuataji wa maagizo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Grok Build 0.1 9.8 10.0 100.0% 0 9.62s 57 12,436
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
Utatuzi wa mafumbo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Grok Build 0.1 6.2 7.5 55.6% 1 8.67s 161 15,476
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
Mwito wa zana Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Grok Build 0.1 10.0 10.0 100.0% 0 9.40s 180 5,319
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424
Maarifa ya jumla Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Grok Build 0.1 3.0 10.0 0.0% 0 26.07s 10 16,267
MiMo-V2.5 - - - - - - - -

Ulinganisho wa haraka

Badilisha jozi ya ulinganisho