Navigare
AI BENCHY
Compară Grafice
❤️ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3 Coder Next

Compară:

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-05

Metrică OpenAI: GPT-5.4 none Lansare: 2026-03-05 Qwen: Qwen3 Coder Next medium Lansare: 2026-02-03
Rang #44 #51
Scor mediu 46 33
Consistență 89 95
Cost per rezultat 1.496 0.224
Cost total $0.090 $0.007
Timp de răspuns (medie) 1.46s 13.77s
Timp de răspuns (maxim) 2.89s 81.80s
Timp de răspuns (total) 21.86s 123.93s
Teste corecte
Rată de trecere pe încercare 44.4% 24.4%
Teste instabile 2 1
Tokenuri de ieșire 1,635 2,793
Tokenuri de raționament 0 0

Top modele după scor

Timp de răspuns (medie)

Scor vs cost total

Scor mediu vs Timp de răspuns (medie)

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
OpenAI: GPT-5.4 100 73 11.1% 1 1.41s 388 0
Qwen: Qwen3 Coder Next 13 75 22.2% 1 15.28s 1,246 0
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
OpenAI: GPT-5.4 100 100 0.0% 0 2.89s 291 0
Qwen: Qwen3 Coder Next 100 100 0.0% 0 4.28s 317 0
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
OpenAI: GPT-5.4 99 100 100.0% 0 1.04s 222 0
Qwen: Qwen3 Coder Next 54 100 50.0% 0 81.80s 246 0
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
OpenAI: GPT-5.4 40 72 44.4% 1 1.07s 50 0
Qwen: Qwen3 Coder Next 40 100 33.3% 0 638ms 25 0
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
OpenAI: GPT-5.4 55 100 50.0% 0 1.07s 81 0
Qwen: Qwen3 Coder Next 45 100 0.0% 0 7.34s 63 0
Puzzle Solving Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
OpenAI: GPT-5.4 40 98 33.3% 0 1.52s 357 0
Qwen: Qwen3 Coder Next 100 100 0.0% 0 2.30s 641 0
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
OpenAI: GPT-5.4 100 100 100.0% 0 2.75s 246 0
Qwen: Qwen3 Coder Next 100 100 100.0% 0 2.64s 255 0

Comparație rapidă

Schimbă perechea de comparație