AI BENCHY
Compară Grafice
❤️ Made by XCS
Your ad here

#12

GPT-5.2 Chat

OpenAI · Lansare: 2025-12-11 · openai/gpt-5.2-chat::none

Scor mediu

7.42

Cost per rezultat

2.261

Consistență

9.45

Cost total

$0.227

Teste corecte

10

Un test este considerat trecut complet doar dacă toate rulările lui trec.

Teste greșite

4

Rată de trecere pe încercare: 73.8%

Teste instabile

1

Timp de răspuns: medie 7.16s · total 100.19s · maxim 38.52s

Răspuns greșit: 3 Nu a urmat instrucțiunile: 1

Top modele după scor

Alege primul model, apoi fă clic pe al doilea model pentru a deschide o pagină alăturată.

Comparație rapidă

Defalcare pe categorii

Categorie Scor mediu Consistență Teste corecte
Anti-AI Tricks 10.00 10.00 3/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 4.00 10.00 1/3
Instructions following 5.50 6.13 1/2
Puzzle Solving 7.00 10.00 2/3
Tool Calling 10.00 10.00 1/1