Navigasi
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.5 Flash vs OpenAI: GPT-5.4

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-05-22

Metrik Gemini 3.5 Flash Gemini 3.5 Flash high Rilis: 2026-05-19 GPT-5.4 GPT-5.4 medium Rilis: 2026-03-05
Skor 9.6 7.9
Peringkat #2 #27
Keandalan 10.0 10.0
Konsistensi 9.6 8.5
Tes benar
Tingkat lulus per percobaan 96.7% 75.0%
Tes tidak stabil 1 4
Total Run 60 60
Biaya per hasil 5.231 8.767
Total Biaya $0.994 $1.140
Harga input $1.500 / 1M $2.500 / 1M
Harga output $9.000 / 1M $15.000 / 1M
Token output 1,969 2,222
Token penalaran 102,679 68,503
Waktu respons (rata-rata) 8.30s 22.31s
Waktu respons (maks) 34.82s 100.41s
Waktu respons (total) 165.92s 446.15s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.57s 174 4,997
GPT-5.4 8.3 10.0 75.0% 0 4.11s 240 1,511
Pemrograman Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.5 Flash 10.0 10.0 100.0% 0 24.62s 450 34,170
GPT-5.4 8.2 6.7 83.3% 1 54.98s 412 19,995
Gabungan Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.37s 351 16,323
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
Parsing dan ekstraksi data Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.43s 279 8,466
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
Spesifik domain Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.5 Flash 7.6 7.2 77.8% 1 14.09s 12 24,721
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
Kecerdasan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.63s 115 1,650
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
Kepatuhan instruksi Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.35s 70 3,799
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Pemecahan teka-teki Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.23s 241 4,940
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
Pemanggilan alat Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.5 Flash 9.8 10.0 100.0% 0 4.96s 265 1,608
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
Pengetahuan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.94s 12 2,005
GPT-5.4 3.0 10.0 0.0% 0 13.95s 30 1,821

Perbandingan Cepat

Ganti Pasangan Perbandingan