Urambazaji
AI BENCHY
Linganisha Chati
❤️ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.2 vs xAI: Grok 4.1 Fast

Jina la modeli:

Benchmark zimetengenezwa kutoka seti za majaribio za AI BENCHY tarehe : 2026-02-27 15:16

Muhtasari

Kipimo OpenAI: GPT-5.2 medium Toleo: Tarehe ya kutolewa haijulikani xAI: Grok 4.1 Fast medium Toleo: Tarehe ya kutolewa haijulikani
Nafasi #12 #16
Alama 6.93 6.29
Uthabiti 8.22 8.20
Gharama kwa matokeo 2.780 0.532
Jumla ya gharama $0.251 $0.043
Majaribio sahihi
Majaribio yenye makosa 5 6
Kiwango cha kupita kwa kila jaribio 76.2% 66.7%
Majaribio yasiyo thabiti 3 3
Tokeni za matokeo 1,869 793
Tokeni za hoja 14,190 74,056

Mgawanyo wa kategoria

Mbinu za kupinga AI Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Tokeni za matokeo Tokeni za hoja
OpenAI: GPT-5.2 7.00 7.28 77.8% 1 549 2,002
xAI: Grok 4.1 Fast 10.00 10.00 100.0% 0 102 4,021
Uchanganuzi na uchimbaji wa data Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Tokeni za matokeo Tokeni za hoja
OpenAI: GPT-5.2 10.00 10.00 100.0% 0 234 499
xAI: Grok 4.1 Fast 10.00 10.00 100.0% 0 180 5,472
Mahususi kwa domeni Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Tokeni za matokeo Tokeni za hoja
OpenAI: GPT-5.2 4.00 7.21 55.6% 1 42 9,690
xAI: Grok 4.1 Fast 4.00 7.21 55.6% 1 12 40,547
Ufuataji wa maagizo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Tokeni za matokeo Tokeni za hoja
OpenAI: GPT-5.2 9.50 10.00 100.0% 0 95 587
xAI: Grok 4.1 Fast 5.50 10.00 50.0% 0 48 3,151
Puzzle Solving Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Tokeni za matokeo Tokeni za hoja
OpenAI: GPT-5.2 8.00 10.00 66.7% 0 710 943
xAI: Grok 4.1 Fast 4.67 7.20 44.4% 1 191 9,380
Mwito wa zana Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Tokeni za matokeo Tokeni za hoja
OpenAI: GPT-5.2 1.00 1.62 66.7% 1 239 469
xAI: Grok 4.1 Fast 1.00 1.62 33.3% 1 260 11,485

Badilisha jozi ya ulinganisho