AI BENCHY
Linganisha
❤️ Made by XCS
Your ad here

Jina la modeli

OpenAI: GPT-5.3-Codex

Uchambuzi (medium)

Benchmark zimetengenezwa kutoka seti za majaribio za AI BENCHY tarehe : 24 Feb 2026

Kipimo OpenAI: GPT-5.3-Codex
Nafasi#6
KampuniOpenAI
Score 7.77
Uthabiti 8.75
Gharama kwa matokeo 4.9342
Jumla ya gharama $0.44408
Majaribio sahihi
Kiwango cha kupita kwa kila jaribio 76.9%
Majaribio yasiyo thabiti 2
Tokeni za matokeo 947
Tokeni za hoja 29,564
Muda wa majibu (wastani)17944ms
Muda wa majibu (jumla)233267ms
Muda wa majibu (upeo)100927ms

Mgawanyo wa kategoria

Kategoria Majaribio yaliyopita kikamilifu Score Uthabiti Kiwango cha kupita kwa kila jaribio Majaribio yasiyo thabiti Alama ya hoja Muda wa majibu (wastani) Gharama
Mbinu za kupinga AI 10.00 10.00 100.0% 0 6.00 4687ms $0.02371
Uchanganuzi na uchimbaji wa data 10.00 10.00 100.0% 0 1.25 3180ms $0.02600
Mahususi kwa domeni 4.00 7.21 55.6% 1 1.00 64314ms $0.35664
Ufuataji wa maagizo 9.00 10.00 50.0% 0 1.00 3037ms $0.01216
Puzzle Solving 7.00 7.38 77.8% 1 6.00 4610ms $0.02559

Modeli zilizolinganishwa

Linganisha OpenAI: GPT-5.3-Codex dhidi ya...

#5 · Google

Google: Gemini 3 Flash Preview

Uchambuzi (low)

Score: 8.23

Uthabiti: 8.71

Kiwango cha kupita kwa kila jaribio: 82.0%

Majaribio yasiyo thabiti: 2

Gharama kwa matokeo: 0.6173

Majaribio sahihi:

Jumla ya gharama: $0.06174

Linganisha

#7 · OpenAI

OpenAI: GPT-5.2

Uchambuzi (medium)

Score: 7.38

Uthabiti: 8.73

Kiwango cha kupita kwa kila jaribio: 76.9%

Majaribio yasiyo thabiti: 2

Gharama kwa matokeo: 2.5637

Majaribio sahihi:

Jumla ya gharama: $0.23074

Linganisha

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Uchambuzi (medium)

Score: 8.54

Uthabiti: 9.35

Kiwango cha kupita kwa kila jaribio: 87.2%

Majaribio yasiyo thabiti: 1

Gharama kwa matokeo: 2.1621

Majaribio sahihi:

Jumla ya gharama: $0.23784

Linganisha

Ulinganisho wa haraka

Linganisha OpenAI: GPT-5.3-Codex dhidi ya...