Navigasi
AI BENCHY
Bandingkan Grafik Metodologi
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3 Pro Preview vs OpenAI: GPT-5.3 Chat

Bandingkan:

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-03-06

Metrik Google: Gemini 3 Pro Preview medium Rilis: 2025-11-18 OpenAI: GPT-5.3 Chat none Rilis: 2026-03-03
Peringkat #6 #19
Skor Rata-rata 8.2 7.3
Konsistensi 10.0 8.5
Biaya per hasil 1.477 3.163
Total Biaya $0.192 $0.317
Tes benar
Tingkat lulus per percobaan 81.3% 70.8%
Tes tidak stabil 0 3
Total Run 48 (16 x 3) 48 (16 x 3)
Token output 1,502 19,272
Token penalaran 9,706 0
Waktu respons (rata-rata) 7.15s 5.96s
Waktu respons (maks) 11.96s 18.33s
Waktu respons (total) 64.34s 95.30s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor Rata-rata vs Waktu respons (rata-rata)

Rincian Kategori

Trik anti-AI Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Google: Gemini 3 Pro Preview 10.0 10.0 100.0% 0 3.75s 143 1,107
OpenAI: GPT-5.3 Chat 7.3 7.5 77.8% 1 4.72s 3,091 0
Gabungan Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Google: Gemini 3 Pro Preview 10.0 10.0 0.0% 0 10.37s 351 952
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Parsing dan ekstraksi data Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Google: Gemini 3 Pro Preview 9.9 10.0 100.0% 0 10.84s 279 3,156
OpenAI: GPT-5.3 Chat 9.9 10.0 100.0% 0 2.21s 942 0
Spesifik domain Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Google: Gemini 3 Pro Preview 4.0 10.0 33.3% 0 7.01s 15 1,195
OpenAI: GPT-5.3 Chat 10.0 4.4 33.3% 2 13.01s 8,264 0
Kecerdasan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Google: Gemini 3 Pro Preview 10.0 10.0 100.0% 0 9.34s 78 374
OpenAI: GPT-5.3 Chat 4.0 10.0 0.0% 0 1.99s 319 0
Kepatuhan instruksi Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Google: Gemini 3 Pro Preview 9.5 10.0 100.0% 0 3.26s 69 754
OpenAI: GPT-5.3 Chat 9.0 10.0 50.0% 0 3.29s 1,455 0
Puzzle Solving Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Google: Gemini 3 Pro Preview 10.0 10.0 100.0% 0 3.91s 243 1,197
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
Pemanggilan alat Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Google: Gemini 3 Pro Preview 10.0 10.0 100.0% 0 11.96s 324 971
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0

Perbandingan Cepat

Ganti Pasangan Perbandingan