Navigasi
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs OpenAI: GPT-5 Nano

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-04-16

Metrik DeepSeek V3.2 DeepSeek V3.2 none Rilis: 2025-12-01 GPT-5 Nano GPT-5 Nano medium Rilis: 2025-08-07
Skor 6.1 6.3
Peringkat #63 #56
Konsistensi 8.1 6.5
Tes benar
Tingkat lulus per percobaan 50.0% 59.3%
Tes tidak stabil 4 8
Total Run 54 54
Biaya per hasil 0.226 0.942
Total Biaya $0.016 $0.066
Harga input $0.260 / 1M $0.050 / 1M
Harga output $0.380 / 1M $0.400 / 1M
Token output 8,384 4,980
Token penalaran 0 156,288
Waktu respons (rata-rata) 12.09s 44.13s
Waktu respons (maks) 115.89s 204.02s
Waktu respons (total) 217.56s 485.47s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V3.2 3.2 9.8 0.0% 0 7.63s 1,419 0
GPT-5 Nano 6.5 7.9 58.3% 1 25.50s 1,221 21,184
Pemrograman Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V3.2 2.4 1.3 33.3% 1 7.63s 553 0
GPT-5 Nano 6.7 3.5 66.7% 1 40.73s 480 12,992
Gabungan Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 2,887 0
GPT-5 Nano 10.0 10.0 100.0% 0 65.96s 578 17,984
Parsing dan ekstraksi data Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 1,710 0
GPT-5 Nano 3.7 1.7 50.0% 2 21.42s 453 10,560
Spesifik domain Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V3.2 3.6 7.2 22.2% 1 1.61s 24 0
GPT-5 Nano 5.2 4.4 55.6% 2 204.02s 237 64,448
Kecerdasan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V3.2 10.0 10.0 100.0% 0 2.86s 67 0
GPT-5 Nano 4.1 10.0 0.0% 0 17.51s 202 4,608
Kepatuhan instruksi Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 66 0
GPT-5 Nano 8.5 6.8 83.3% 1 11.90s 382 4,096
Pemecahan teka-teki Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V3.2 8.5 7.5 88.9% 1 7.37s 1,136 0
GPT-5 Nano 5.3 7.2 44.4% 1 19.81s 869 13,440
Pemanggilan alat Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 522 0
GPT-5 Nano 10.0 10.0 100.0% 0 33.30s 558 6,976

Perbandingan Cepat

Ganti Pasangan Perbandingan