Urambazaji
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs OpenAI: GPT-5.5

Benchmark zimetengenezwa kutoka seti za majaribio za AI BENCHY tarehe: 2026-04-24

Kipimo Claude Opus 4.7 Claude Opus 4.7 none Toleo: 2026-04-16 GPT-5.5 GPT-5.5 medium Toleo: 2026-04-24
Alama 9.2 9.0
Nafasi #4 #5
Uaminifu Haipo Haipo
Uthabiti 10.0 9.2
Majaribio sahihi
Kiwango cha kupita kwa kila jaribio 88.9% 87.0%
Majaribio yasiyo thabiti 0 2
Jumla ya uendeshaji 54 54
Gharama kwa matokeo 3.155 19.226
Jumla ya gharama $0.505 $2.884
Bei ya ingizo $5.000 / 1M $5.000 / 1M
Bei ya toleo $25.000 / 1M $30.000 / 1M
Tokeni za matokeo 6,326 1,920
Tokeni za hoja 0 89,632
Muda wa majibu (wastani) 3.13s 32.75s
Muda wa majibu (upeo) 18.27s 332.10s
Muda wa majibu (jumla) 56.33s 589.59s

Modeli bora kwa alama

Alama dhidi ya gharama ya jumla

Muda wa majibu (wastani)

Alama vs Muda wa majibu (wastani)

Jumla ya tokeni za matokeo

Alama vs Jumla ya tokeni za matokeo

Mgawanyo wa kategoria

Mbinu za kupinga AI Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Claude Opus 4.7 8.3 10.0 75.0% 0 2.12s 522 0
GPT-5.5 10.0 10.0 100.0% 0 4.66s 250 1,335
Uandishi wa msimbo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Claude Opus 4.7 10.0 10.0 100.0% 0 2.84s 494 0
GPT-5.5 10.0 10.0 100.0% 0 9.09s 318 1,391
Mchanganyiko Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Claude Opus 4.7 9.5 10.0 100.0% 0 18.27s 3,504 0
GPT-5.5 10.0 10.0 100.0% 0 19.29s 312 2,841
Uchanganuzi na uchimbaji wa data Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Claude Opus 4.7 10.0 10.0 100.0% 0 2.15s 324 0
GPT-5.5 10.0 10.0 100.0% 0 4.18s 234 593
Mahususi kwa domeni Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Claude Opus 4.7 7.7 10.0 66.7% 0 1.19s 78 0
GPT-5.5 5.3 7.2 44.4% 1 164.14s 67 79,625
Akili ya jumla Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Claude Opus 4.7 10.0 10.0 100.0% 0 3.47s 257 0
GPT-5.5 10.0 10.0 100.0% 0 4.16s 138 223
Ufuataji wa maagizo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Claude Opus 4.7 10.0 10.0 100.0% 0 1.46s 114 0
GPT-5.5 10.0 10.0 100.0% 0 3.36s 93 538
Utatuzi wa mafumbo Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Claude Opus 4.7 10.0 10.0 100.0% 0 2.58s 661 0
GPT-5.5 8.6 7.9 77.8% 1 6.78s 250 2,254
Mwito wa zana Alama Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Majaribio sahihi Muda wa majibu (wastani) Tokeni za matokeo Tokeni za hoja
Claude Opus 4.7 10.0 10.0 100.0% 0 4.74s 372 0
GPT-5.5 10.0 10.0 100.0% 0 10.57s 258 832

Ulinganisho wa haraka

Badilisha jozi ya ulinganisho