Navigasi
AI BENCHY
Bandingkan Grafik Metodologi
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Trinity Large Preview vs Google: Gemini 3 Flash Preview

Bandingkan:

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-03-06

Metrik Trinity Large Preview none Rilis: 2026-01-27 Tersedia gratis Google: Gemini 3 Flash Preview medium Rilis: 2025-12-17
Peringkat #45 #1
Skor Rata-rata 4.2 10.0
Konsistensi 9.6 10.0
Biaya per hasil 0.000 1.025
Total Biaya $0.000 $0.164
Tes benar
Tingkat lulus per percobaan 33.3% 100.0%
Tes tidak stabil 1 0
Total Run 48 (16 x 3) 48 (16 x 3)
Token output 1,837 1,634
Token penalaran 0 47,907
Waktu respons (rata-rata) 3.15s 12.36s
Waktu respons (maks) 8.91s 50.16s
Waktu respons (total) 50.46s 111.21s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor Rata-rata vs Waktu respons (rata-rata)

Rincian Kategori

Trik anti-AI Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Trinity Large Preview 10.0 10.0 0.0% 0 3.59s 587 0
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.61s 299 3,127
Gabungan Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Trinity Large Preview 10.0 10.0 0.0% 0 8.91s 294 0
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 50.16s 351 12,645
Parsing dan ekstraksi data Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Trinity Large Preview 9.9 10.0 100.0% 0 3.26s 186 0
Google: Gemini 3 Flash Preview 9.9 10.0 100.0% 0 4.72s 279 5,333
Spesifik domain Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Trinity Large Preview 4.0 10.0 33.3% 0 877ms 25 0
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 21.12s 12 14,908
Kecerdasan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Trinity Large Preview 3.0 9.9 0.0% 0 2.86s 124 0
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.09s 111 1,285
Kepatuhan instruksi Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Trinity Large Preview 3.5 6.7 16.7% 1 1.09s 63 0
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.10s 72 4,558
Puzzle Solving Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Trinity Large Preview 4.0 10.0 33.3% 0 3.30s 291 0
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.43s 276 4,921
Pemanggilan alat Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 10.55s 234 1,130

Perbandingan Cepat

Ganti Pasangan Perbandingan