AI BENCHY
Bandingkan
❤️ Made by XCS
Your ad here

Nama Model

Google: Gemini 3 Flash Preview

Penalaran (low)

Benchmark dihasilkan dari suite pengujian AI BENCHY pada : 24 Feb 2026

Metrik Google: Gemini 3 Flash Preview
Peringkat#5
PerusahaanGoogle
Score 8.23
Konsistensi 8.71
Biaya per hasil 0.6173
Total Biaya $0.06174
Tes benar
Tingkat lulus per percobaan 82.0%
Tes tidak stabil 2
Token output 936
Token penalaran 18,071
Waktu respons (rata-rata)6746ms
Waktu respons (total)87697ms
Waktu respons (maks)14717ms

Rincian Kategori

Kategori Tes lulus penuh Score Konsistensi Tingkat lulus per percobaan Tes tidak stabil Skor penalaran Waktu respons (rata-rata) Biaya
Trik anti-AI 10.00 10.00 100.0% 0 6.23 3496ms $0.00844
Parsing dan ekstraksi data 10.00 10.00 100.0% 0 4.73 9460ms $0.01354
Spesifik domain 4.00 4.41 55.5% 2 1.83 8314ms $0.01993
Kepatuhan instruksi 7.50 9.99 50.0% 0 5.00 7016ms $0.00878
Puzzle Solving 10.00 10.00 100.0% 0 7.50 6440ms $0.01105

Model yang Dibandingkan

Bandingkan Google: Gemini 3 Flash Preview dengan...

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Penalaran (medium)

Score: 8.54

Konsistensi: 9.35

Tingkat lulus per percobaan: 87.2%

Tes tidak stabil: 1

Biaya per hasil: 2.1621

Tes benar:

Total Biaya: $0.23784

Bandingkan

#6 · OpenAI

OpenAI: GPT-5.3-Codex

Penalaran (medium)

Score: 7.77

Konsistensi: 8.75

Tingkat lulus per percobaan: 76.9%

Tes tidak stabil: 2

Biaya per hasil: 4.9342

Tes benar:

Total Biaya: $0.44408

Bandingkan

#3 · Google

Google: Gemini 3 Pro Preview

Penalaran (medium)

Score: 8.54

Konsistensi: 10.00

Tingkat lulus per percobaan: 84.6%

Tes tidak stabil: 0

Biaya per hasil: 0.7901

Tes benar:

Total Biaya: $0.08692

Bandingkan

Perbandingan Cepat

Bandingkan Google: Gemini 3 Flash Preview dengan...