Navigasi
AI BENCHY
Your ad here

AI BENCHY Compare

Trinity Large Preview vs Z.ai: GLM 4.7 Flash

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-04-16

Metrik Trinity Large Preview Trinity Large Preview none Rilis: 2026-01-27 Tersedia gratis GLM 4.7 Flash GLM 4.7 Flash none Rilis: 2026-01-19
Skor 5.3 5.6
Peringkat #76 #72
Konsistensi 9.6 8.6
Tes benar
Tingkat lulus per percobaan 29.6% 37.0%
Tes tidak stabil 1 3
Total Run 52 54
Biaya per hasil 0.000 0.059
Total Biaya $0.000 $0.003
Harga input $0.000 / 1M $0.060 / 1M
Harga output $0.000 / 1M $0.400 / 1M
Token output 1,985 2,489
Token penalaran 0 0
Waktu respons (rata-rata) 5.07s 3.35s
Waktu respons (maks) 39.47s 7.05s
Waktu respons (total) 91.23s 36.90s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Trinity Large Preview 3.0 10.0 0.0% 0 3.02s 593 0
GLM 4.7 Flash 5.2 7.9 41.7% 1 5.51s 438 0
Pemrograman Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Trinity Large Preview 6.3 10.0 0.0% 0 39.47s 142 0
GLM 4.7 Flash 6.4 9.9 0.0% 0 5.57s 626 0
Gabungan Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Trinity Large Preview 3.0 10.0 0.0% 0 8.91s 294 0
GLM 4.7 Flash 3.0 10.0 0.0% 0 3.22s 704 0
Parsing dan ekstraksi data Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Trinity Large Preview 10.0 10.0 100.0% 0 3.26s 186 0
GLM 4.7 Flash 7.3 5.8 83.3% 1 4.82s 196 0
Spesifik domain Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Trinity Large Preview 5.3 10.0 33.3% 0 877ms 25 0
GLM 4.7 Flash 7.7 10.0 66.7% 0 744ms 19 0
Kecerdasan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Trinity Large Preview 4.4 9.9 0.0% 0 2.86s 124 0
GLM 4.7 Flash 4.0 10.0 0.0% 0 1.59s 134 0
Kepatuhan instruksi Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Trinity Large Preview 4.1 6.7 16.7% 1 1.09s 63 0
GLM 4.7 Flash 6.5 10.0 50.0% 0 888ms 62 0
Pemecahan teka-teki Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Trinity Large Preview 5.4 10.0 33.3% 0 3.30s 291 0
GLM 4.7 Flash 4.4 10.0 0.0% 0 1.00s 98 0
Pemanggilan alat Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
GLM 4.7 Flash 2.8 1.6 33.3% 1 7.05s 212 0

Perbandingan Cepat

Ganti Pasangan Perbandingan