#16
Gemini 2.5 Flash
Google ยท Rilis: 2025-06-17 ยท google/gemini-2.5-flash::medium
Skor Rata-rata
7.06
Biaya per hasil
2.762
Konsistensi
9.39
Total Biaya
$0.249
Tes benar
9
Tes dianggap lulus penuh hanya jika semua run-nya lulus.
Tes Salah
5
Tingkat lulus per percobaan: 69.1%
Tes tidak stabil
1
Waktu respons: rata-rata 11.74s ยท total 164.33s ยท maks 95.48s
Jawaban salah: 4
Tidak mengikuti instruksi: 1
Model teratas berdasarkan skor
Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.
Perbandingan Cepat
Gemini 2.5 FlashmediumvsGemini 3 Flash PreviewnoneGemini 2.5 FlashmediumvsStep 3.5 FlashmediumTersedia gratisGemini 2.5 FlashmediumvsGPT-5.3 ChatnoneGemini 2.5 FlashmediumvsDeepSeek V3.2mediumGemini 2.5 FlashmediumvsGLM 5mediumGemini 2.5 FlashmediumvsGPT-5.2mediumGemini 2.5 FlashmediumvsGemini 3 Flash PreviewmediumGemini 2.5 FlashmediumvsGemini 3.1 Pro Previewmedium
Rincian Kategori
| Kategori | Skor Rata-rata | Konsistensi | Tes benar |
|---|---|---|---|
| Anti-AI Tricks | 7.34 | 10.00 | 2/3 |
| Data parsing and extraction | 9.88 | 10.00 | 2/2 |
| Domain specific | 4.00 | 7.21 | 1/3 |
| Instructions following | 7.00 | 9.91 | 1/2 |
| Puzzle Solving | 7.00 | 10.00 | 2/3 |
| Tool Calling | 10.00 | 10.00 | 1/1 |