Navigasi
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

StepFun: Step 3.5 Flash vs xAI: Grok 4.1 Fast

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-04-11

Metrik Step 3.5 Flash Step 3.5 Flash none Rilis: 2026-02-01 Grok 4.1 Fast Grok 4.1 Fast none Rilis: 2025-11-19
Skor 3.0 4.5
Peringkat #93 #89
Konsistensi 10.0 8.7
Tes benar
Tingkat lulus per percobaan 0.0% 24.1%
Tes tidak stabil 0 3
Total Run 3 54
Biaya per hasil 0.000 0.269
Total Biaya $0.000 $0.009
Harga input $0.100 / 1M $0.200 / 1M
Harga output $0.300 / 1M $0.500 / 1M
Token output 0 1,721
Token penalaran 0 0
Waktu respons (rata-rata) 0ms 1.76s
Waktu respons (maks) 0ms 5.51s
Waktu respons (total) 0ms 19.35s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Pemrograman Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Step 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0
Grok 4.1 Fast 5.3 3.4 33.3% 1 1.79s 567 0
Trik anti-AI Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Step 3.5 Flash - - - - - - - -
Grok 4.1 Fast 3.2 10.0 0.0% 0 1.07s 235 0
Gabungan Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Step 3.5 Flash - - - - - - - -
Grok 4.1 Fast 3.0 10.0 0.0% 0 3.33s 105 0
Parsing dan ekstraksi data Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Step 3.5 Flash - - - - - - - -
Grok 4.1 Fast 10.0 10.0 100.0% 0 943ms 180 0
Spesifik domain Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Step 3.5 Flash - - - - - - - -
Grok 4.1 Fast 5.9 7.2 55.6% 1 1.06s 15 0
Kecerdasan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Step 3.5 Flash - - - - - - - -
Grok 4.1 Fast 4.4 9.9 0.0% 0 1.08s 112 0
Kepatuhan instruksi Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Step 3.5 Flash - - - - - - - -
Grok 4.1 Fast 3.0 10.0 0.0% 0 923ms 56 0
Pemecahan teka-teki Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Step 3.5 Flash - - - - - - - -
Grok 4.1 Fast 3.2 10.0 0.0% 0 1.28s 243 0
Pemanggilan alat Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Step 3.5 Flash - - - - - - - -
Grok 4.1 Fast 2.8 1.6 33.3% 1 5.51s 208 0

Perbandingan Cepat

Ganti Pasangan Perbandingan