Urambazaji
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs OpenAI: GPT-5.5

Benchmark zimetengenezwa kutoka seti za majaribio za AI BENCHY tarehe: 2026-05-28

Kipimo Claude Opus 4.8 Claude Opus 4.8 medium Toleo: 2026-05-28 GPT-5.5 GPT-5.5 low Toleo: 2026-04-24
Alama 8.7 8.9
Nafasi #12 #8
Uaminifu 10.0 10.0
Uthabiti 9.6 10.0
Majaribio sahihi
Kiwango cha kupita kwa kila jaribio 83.3% 85.0%
Majaribio yasiyo thabiti 1 0
Jumla ya uendeshaji 60 60
Gharama kwa matokeo 6.285 4.833
Jumla ya gharama $1.006 $0.822
Bei ya ingizo $5.000 / 1M $5.000 / 1M
Bei ya toleo $25.000 / 1M $30.000 / 1M
Tokeni za matokeo 23,201 2,025
Tokeni za hoja 5,901 20,092
Muda wa majibu (wastani) 9.34s 9.43s
Muda wa majibu (upeo) 38.03s 56.19s
Muda wa majibu (jumla) 186.84s 188.66s

Modeli bora kwa alama

Alama dhidi ya gharama ya jumla

Muda wa majibu (wastani)

Alama vs Muda wa majibu (wastani)

Jumla ya tokeni za matokeo

Alama vs Jumla ya tokeni za matokeo

Mgawanyo wa kategoria

Mbinu za kupinga AI Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 1,179 478
GPT-5.5 10.0 10.0 100.0% 0 4.41s 238 1,020
Uandishi wa msimbo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Claude Opus 4.8 10.0 10.0 100.0% 0 14.97s 6,651 1,381
GPT-5.5 10.0 10.0 100.0% 0 14.42s 402 4,034
Mchanganyiko Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 5,260 1,588
GPT-5.5 10.0 10.0 100.0% 0 9.56s 303 717
Uchanganuzi na uchimbaji wa data Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 481 312
GPT-5.5 10.0 10.0 100.0% 0 3.28s 228 157
Mahususi kwa domeni Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 7,477 900
GPT-5.5 5.3 10.0 33.3% 0 28.05s 69 11,609
Akili ya jumla Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 237 0
GPT-5.5 10.0 10.0 100.0% 0 5.17s 133 245
Ufuataji wa maagizo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 373 320
GPT-5.5 9.9 10.0 100.0% 0 3.74s 93 415
Utatuzi wa mafumbo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 791 483
GPT-5.5 10.0 10.0 100.0% 0 4.74s 279 954
Mwito wa zana Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 301 225
GPT-5.5 10.0 10.0 100.0% 0 4.96s 250 101
Maarifa ya jumla Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 451 214
GPT-5.5 3.0 10.0 0.0% 0 10.06s 30 840

Ulinganisho wa haraka

Badilisha jozi ya ulinganisho