Navigasi
AI BENCHY
Bandingkan Grafik
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs OpenAI: GPT-5 Nano

Nama Model:

Benchmark dihasilkan dari suite pengujian AI BENCHY pada : 2026-02-27 15:16

Ringkasan

Metrik Google: Gemini 3 Flash Preview medium Rilis: Tanggal rilis tidak diketahui OpenAI: GPT-5 Nano medium Rilis: Tanggal rilis tidak diketahui
Peringkat #1 #23
Skor 9.93 5.86
Konsistensi 10.00 6.60
Biaya per hasil 0.815 0.519
Total Biaya $0.114 $0.037
Tes benar
Tes Salah 0 7
Tingkat lulus per percobaan 100.0% 69.1%
Tes tidak stabil 0 6
Token output 1,111 3,700
Token penalaran 34,409 85,184

Rincian Kategori

Trik anti-AI Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Token output Token penalaran
Google: Gemini 3 Flash Preview 10.00 10.00 100.0% 0 299 3,127
OpenAI: GPT-5 Nano 7.00 9.99 66.7% 0 1,107 19,968
Parsing dan ekstraksi data Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Token output Token penalaran
Google: Gemini 3 Flash Preview 10.00 10.00 100.0% 0 292 5,467
OpenAI: GPT-5 Nano 5.50 5.81 83.3% 1 426 8,576
Spesifik domain Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Token output Token penalaran
Google: Gemini 3 Flash Preview 10.00 10.00 100.0% 0 12 15,295
OpenAI: GPT-5 Nano 4.00 4.41 55.6% 2 195 33,600
Kepatuhan instruksi Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Token output Token penalaran
Google: Gemini 3 Flash Preview 10.00 10.00 100.0% 0 72 4,092
OpenAI: GPT-5 Nano 7.00 6.41 83.3% 1 360 4,032
Puzzle Solving Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Token output Token penalaran
Google: Gemini 3 Flash Preview 9.67 10.00 100.0% 0 202 5,298
OpenAI: GPT-5 Nano 4.67 4.90 55.6% 2 1,054 12,032
Pemanggilan alat Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Token output Token penalaran
Google: Gemini 3 Flash Preview 10.00 10.00 100.0% 0 234 1,130
OpenAI: GPT-5 Nano 10.00 10.00 100.0% 0 558 6,976

Ganti Pasangan Perbandingan