Navigasi
AI BENCHY
Bandingkan Grafik
❤️ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 vs Z.ai: GLM 4.7 Flash

Bandingkan:

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-03-05

Metrik OpenAI: GPT-5.4 none Rilis: 2026-03-05 Z.ai: GLM 4.7 Flash medium Rilis: 2026-01-19
Peringkat #44 #52
Skor Rata-rata 46 33
Konsistensi 89 61
Biaya per hasil 1.496 1.018
Total Biaya $0.090 $0.041
Waktu respons (rata-rata) 1.46s 39.18s
Waktu respons (maks) 2.89s 174.55s
Waktu respons (total) 21.86s 313.44s
Tes benar
Tingkat lulus per percobaan 44.4% 44.4%
Tes tidak stabil 2 7
Token output 1,635 38,664
Token penalaran 0 62,814

Model teratas berdasarkan skor

Waktu respons (rata-rata)

Skor vs Total Biaya

Skor Rata-rata vs Waktu respons (rata-rata)

Rincian Kategori

Trik anti-AI Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
OpenAI: GPT-5.4 100 73 11.1% 1 1.41s 388 0
Z.ai: GLM 4.7 Flash 40 45 55.6% 2 27.09s 1,085 5,597
Gabungan Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
OpenAI: GPT-5.4 100 100 0.0% 0 2.89s 291 0
Z.ai: GLM 4.7 Flash 100 21 33.3% 1 65.57s 2,585 20,648
Parsing dan ekstraksi data Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
OpenAI: GPT-5.4 99 100 100.0% 0 1.04s 222 0
Z.ai: GLM 4.7 Flash 50 100 50.0% 0 1.51s 584 2,755
Spesifik domain Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
OpenAI: GPT-5.4 40 72 44.4% 1 1.07s 50 0
Z.ai: GLM 4.7 Flash 100 44 33.3% 2 174.55s 33,000 25,394
Kepatuhan instruksi Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
OpenAI: GPT-5.4 55 100 50.0% 0 1.07s 81 0
Z.ai: GLM 4.7 Flash 50 58 66.7% 1 2.97s 388 2,181
Puzzle Solving Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
OpenAI: GPT-5.4 40 98 33.3% 0 1.52s 357 0
Z.ai: GLM 4.7 Flash 100 72 11.1% 1 12.90s 798 5,225
Pemanggilan alat Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
OpenAI: GPT-5.4 100 100 100.0% 0 2.75s 246 0
Z.ai: GLM 4.7 Flash 100 100 100.0% 0 15.95s 224 1,014

Perbandingan Cepat

Ganti Pasangan Perbandingan