Navigasi
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Google: Gemini 3 Flash Preview

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-05-26

Metrik DeepSeek V4 Flash DeepSeek V4 Flash high Rilis: 2026-04-24 Tersedia gratis Gemini 3 Flash Preview Gemini 3 Flash Preview none Rilis: 2025-12-17
Skor 7.6 7.7
Peringkat #44 #41
Keandalan 10.0 10.0
Konsistensi 8.4 9.2
Tes benar
Tingkat lulus per percobaan 73.3% 70.0%
Tes tidak stabil 4 2
Total Run 98 98
Biaya per hasil 0.329 0.196
Total Biaya $0.040 $0.026
Harga input $0.112 / 1M $0.500 / 1M
Harga output $0.224 / 1M $3.000 / 1M
Token output 11,480 2,449
Token penalaran 122,086 0
Waktu respons (rata-rata) 46.36s 1.70s
Waktu respons (maks) 218.13s 3.56s
Waktu respons (total) 927.27s 22.05s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 140 7,770
Gemini 3 Flash Preview 8.3 10.0 75.0% 0 1.25s 214 0
Pemrograman Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V4 Flash 6.8 10.0 50.0% 0 58.13s 387 27,101
Gemini 3 Flash Preview 6.8 10.0 50.0% 0 2.19s 447 0
Gabungan Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 465 7,347
Gemini 3 Flash Preview 4.7 1.6 66.7% 1 3.56s 350 0
Parsing dan ekstraksi data Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 201 1,179
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 1.41s 279 0
Spesifik domain Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V4 Flash 4.1 4.4 44.5% 2 100.31s 27 59,249
Gemini 3 Flash Preview 7.7 10.0 66.7% 0 963ms 18 0
Kecerdasan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 79 632
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 1.13s 104 0
Kepatuhan instruksi Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 63 1,622
Gemini 3 Flash Preview 6.4 5.8 66.7% 1 1.58s 74 0
Pemecahan teka-teki Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V4 Flash 8.2 7.2 88.9% 1 26.11s 1,374 8,113
Gemini 3 Flash Preview 7.7 10.0 66.7% 0 1.05s 714 0
Pemanggilan alat Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 228 542
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.35s 234 0
Pengetahuan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
DeepSeek V4 Flash 3.0 10.0 0.0% 0 54.46s 8,516 8,531
Gemini 3 Flash Preview 3.0 10.0 0.0% 0 1.07s 15 0

Perbandingan Cepat

Ganti Pasangan Perbandingan