Urambazaji
AI BENCHY
Advertise here

AI BENCHY Compare

Owl Alpha vs xAI: Grok 4.20

Benchmark zimetengenezwa kutoka seti za majaribio za AI BENCHY tarehe: 2026-05-10

Kipimo Owl Alpha Owl Alpha medium Toleo: 2026-04-30 Grok 4.20 Grok 4.20 none Toleo: 2026-03-31
Alama 6.0 5.4
Nafasi #90 #115
Uaminifu 10.0 Haipo
Uthabiti 9.6 9.5
Majaribio sahihi
Kiwango cha kupita kwa kila jaribio 43.9% 35.2%
Majaribio yasiyo thabiti 1 1
Jumla ya uendeshaji 57 54
Gharama kwa matokeo 0.000 1.574
Jumla ya gharama $0.000 $0.095
Bei ya ingizo $0.000 / 1M $1.250 / 1M
Bei ya toleo $0.000 / 1M $2.500 / 1M
Tokeni za matokeo 1,613 1,967
Tokeni za hoja 0 0
Muda wa majibu (wastani) 10.58s 1.11s
Muda wa majibu (upeo) 58.63s 6.04s
Muda wa majibu (jumla) 201.03s 20.02s

Modeli bora kwa alama

Alama dhidi ya gharama ya jumla

Muda wa majibu (wastani)

Alama vs Muda wa majibu (wastani)

Jumla ya tokeni za matokeo

Alama vs Jumla ya tokeni za matokeo

Mgawanyo wa kategoria

Mbinu za kupinga AI Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Owl Alpha 4.8 10.0 25.0% 0 3.97s 87 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
Uandishi wa msimbo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Owl Alpha 10.0 10.0 100.0% 0 7.35s 402 0
Grok 4.20 3.4 9.3 0.0% 0 1.22s 312 0
Mchanganyiko Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Owl Alpha 3.0 10.0 0.0% 0 10.01s 315 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
Uchanganuzi na uchimbaji wa data Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Owl Alpha 10.0 10.0 100.0% 0 21.64s 246 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
Mahususi kwa domeni Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Owl Alpha 5.3 10.0 33.3% 0 8.58s 28 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
Akili ya jumla Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Owl Alpha 4.3 10.0 0.0% 0 58.63s 98 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
Ufuataji wa maagizo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Owl Alpha 6.3 10.0 50.0% 0 9.59s 57 0
Grok 4.20 6.3 10.0 50.0% 0 455ms 60 0
Utatuzi wa mafumbo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Owl Alpha 5.3 7.2 44.4% 1 3.44s 135 0
Grok 4.20 5.3 7.2 44.4% 1 487ms 242 0
Mwito wa zana Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Owl Alpha 10.0 10.0 100.0% 0 8.26s 228 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0
Maarifa ya jumla Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Owl Alpha 3.0 10.0 0.0% 0 2.38s 17 0
Grok 4.20 - - - - - - - -

Ulinganisho wa haraka

Badilisha jozi ya ulinganisho