Navigasi
AI BENCHY
Bandingkan Grafik
❤️ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3 Coder Next

Bandingkan:

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-03-05

Metrik OpenAI: GPT-5.4 none Rilis: 2026-03-05 Qwen: Qwen3 Coder Next medium Rilis: 2026-02-03
Peringkat #44 #51
Skor Rata-rata 46 33
Konsistensi 89 95
Biaya per hasil 1.496 0.224
Total Biaya $0.090 $0.007
Waktu respons (rata-rata) 1.46s 13.77s
Waktu respons (maks) 2.89s 81.80s
Waktu respons (total) 21.86s 123.93s
Tes benar
Tingkat lulus per percobaan 44.4% 24.4%
Tes tidak stabil 2 1
Token output 1,635 2,793
Token penalaran 0 0

Model teratas berdasarkan skor

Waktu respons (rata-rata)

Skor vs Total Biaya

Skor Rata-rata vs Waktu respons (rata-rata)

Rincian Kategori

Trik anti-AI Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
OpenAI: GPT-5.4 100 73 11.1% 1 1.41s 388 0
Qwen: Qwen3 Coder Next 13 75 22.2% 1 15.28s 1,246 0
Gabungan Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
OpenAI: GPT-5.4 100 100 0.0% 0 2.89s 291 0
Qwen: Qwen3 Coder Next 100 100 0.0% 0 4.28s 317 0
Parsing dan ekstraksi data Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
OpenAI: GPT-5.4 99 100 100.0% 0 1.04s 222 0
Qwen: Qwen3 Coder Next 54 100 50.0% 0 81.80s 246 0
Spesifik domain Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
OpenAI: GPT-5.4 40 72 44.4% 1 1.07s 50 0
Qwen: Qwen3 Coder Next 40 100 33.3% 0 638ms 25 0
Kepatuhan instruksi Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
OpenAI: GPT-5.4 55 100 50.0% 0 1.07s 81 0
Qwen: Qwen3 Coder Next 45 100 0.0% 0 7.34s 63 0
Puzzle Solving Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
OpenAI: GPT-5.4 40 98 33.3% 0 1.52s 357 0
Qwen: Qwen3 Coder Next 100 100 0.0% 0 2.30s 641 0
Pemanggilan alat Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
OpenAI: GPT-5.4 100 100 100.0% 0 2.75s 246 0
Qwen: Qwen3 Coder Next 100 100 100.0% 0 2.64s 255 0

Perbandingan Cepat

Ganti Pasangan Perbandingan