#36
Gemini 2.5 Flash
Google ยท Rilis: 2025-06-17 ยท google/gemini-2.5-flash::none
Skor Rata-rata
5.34
Biaya per hasil
0.107
Konsistensi
9.40
Total Biaya
$0.007
Tes benar
6
Tes dianggap lulus penuh hanya jika semua run-nya lulus.
Tes Salah
8
Tingkat lulus per percobaan: 47.6%
Tes tidak stabil
1
Waktu respons: rata-rata 698ms ยท total 9.78s ยท maks 1.91s
Jawaban salah: 6
Tidak mengikuti instruksi: 2
Model teratas berdasarkan skor
Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.
Perbandingan Cepat
Gemini 2.5 FlashnonevsMiniMax M2.5mediumGemini 2.5 FlashnonevsQwen3.5-122B-A10BnoneGemini 2.5 Flashnonevsgpt-oss-120bmediumTersedia gratisGemini 2.5 FlashnonevsGPT-4o-mininoneGemini 2.5 FlashnonevsGPT-5 MinimediumGemini 2.5 FlashnonevsDeepSeek V3.2noneGemini 2.5 FlashnonevsGemini 3 Flash PreviewmediumGemini 2.5 FlashnonevsGemini 3.1 Pro PreviewmediumGemini 2.5 FlashnonevsStep 3.5 FlashmediumTersedia gratis
Rincian Kategori
| Kategori | Skor Rata-rata | Konsistensi | Tes benar |
|---|---|---|---|
| Anti-AI Tricks | 1.00 | 10.00 | 0/3 |
| Data parsing and extraction | 9.88 | 10.00 | 2/2 |
| Domain specific | 4.00 | 7.21 | 1/3 |
| Instructions following | 8.00 | 9.99 | 1/2 |
| Puzzle Solving | 4.67 | 10.00 | 1/3 |
| Tool Calling | 10.00 | 10.00 | 1/1 |