AI BENCHY Compare

Google: Gemini 3.5 Flash vs OpenAI: GPT-5 Nano

Ringkasan

Perbandingan benchmark Gemini 3.5 Flash vs GPT-5 Nano: Gemini 3.5 Flash unggul dalam skor rata-rata dengan 7.0 vs 6.7. GPT-5 Nano memiliki biaya benchmark lebih rendah di $0.081 vs $1.079. Gemini 3.5 Flash lebih cepat di 9.93s vs 42.51s, dengan tingkat keberhasilan 77.8% vs 57.1%.

Model yang direkomendasikan: Gemini 3.5 Flash - It has the best score here (7.0), while responding about 4.3x faster than GPT-5 Nano.

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-06-12

Metrik	Gemini 3.5 Flash Gemini 3.5 Flash none Rilis: 2026-05-19	GPT-5 Nano GPT-5 Nano medium Rilis: 2025-08-07

Metrik	Gemini 3.5 Flash Gemini 3.5 Flash none Rilis: 2026-05-19	GPT-5 Nano GPT-5 Nano medium Rilis: 2025-08-07
Skor	7.0	6.7
Peringkat	#66	#79
Keandalan	10.0	10.0
Konsistensi	8.9	7.3
Tes benar
Tingkat lulus per percobaan	77.8%	57.1%
Tes tidak stabil	3	7
Total Run	63	63
Biaya per hasil	7.190	0.897
Total Biaya	$1.079	$0.081
Harga input	$1.500 / 1M	$0.050 / 1M
Harga output	$9.000 / 1M	$0.400 / 1M
Total token input	13,843	34,108
Token output	117,518	5,464
Token penalaran	0	192,064
Waktu respons (rata-rata)	9.93s	42.51s
Waktu respons (maks)	64.36s	204.02s
Waktu respons (total)	178.68s	595.09s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#66 Gemini 3.5 Flash

none

Cost: $0.225
Time: 125.5s
Tokens: 25,004 tok

#79 GPT-5 Nano

medium

Cost: $0.006
Time: 108.5s
Tokens: 13,209 tok

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.53s	492	5,101	0
GPT-5 Nano	6.5	7.9	58.3%	1		25.50s	606	1,221	21,184

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	8.8	7.8	88.9%	1		34.69s	8,122	75,927	0
GPT-5 Nano	7.0	7.7	55.6%	1		41.62s	7,305	740	41,152

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0
GPT-5 Nano	10.0	10.0	100.0%	0		65.96s	11,019	578	17,984

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	6.5	10.0	50.0%	0		8.10s	2,781	5,895	0
GPT-5 Nano	3.7	1.7	50.0%	2		21.42s	7,140	453	10,560

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	7.6	7.2	77.8%	1		10.64s	633	17,910	0
GPT-5 Nano	5.2	4.4	55.6%	2		204.02s	619	237	64,448

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.46s	486	1,620	0
GPT-5 Nano	4.1	10.0	0.0%	0		17.51s	477	202	4,608

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	9.8	10.0	100.0%	0		3.38s	615	3,928	0
GPT-5 Nano	9.8	10.0	100.0%	0		15.64s	660	312	4,736

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.13s	558	4,640	0
GPT-5 Nano	5.3	7.2	44.4%	1		20.63s	642	929	14,272

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0
GPT-5 Nano	10.0	10.0	100.0%	0		33.30s	5,445	558	6,976

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.5 Flash	2.8	1.6	33.3%	1		4.87s	156	2,497	0
GPT-5 Nano	3.0	10.0	0.0%	0		20.13s	195	234	6,144

Perbandingan Cepat

Ganti Pasangan Perbandingan

Gemini 3.5 FlashnonevsKimi K2.7 Codemedium Gemini 3.5 FlashnonevsStep 3.5 Flashmedium Gemini 3.5 FlashnonevsGLM 5.1medium Gemini 3.5 FlashnonevsStep 3.7 Flashhigh Gemini 3.5 FlashnonevsMiMo-V2-Flashmedium Gemini 3.5 FlashnonevsQwen3.5-Flashmedium Gemini 3.1 Flash Lite PreviewlowvsGPT-5 Nanomedium Gemini 3.5 FlashminimalvsGPT-5 Nanomedium Gemini 3.5 FlashnonevsRing-2.6-1Tmedium GPT-5 NanomediumvsQwen3.7 Maxnone Gemini 3.1 Flash Lite PreviewnonevsGPT-5 Nanomedium Gemini 3.1 Flash LitelowvsGPT-5 Nanomedium