Trik anti-AI
: 2.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)471msWaktu respons (maks)872msWaktu respons (total)1.41s
Pemrograman
: 0.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Parsing dan ekstraksi data
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)714msWaktu respons (maks)987msWaktu respons (total)1.43s
Spesifik domain
: 5.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Jawaban salah: 1Waktu respons (rata-rata)287msWaktu respons (maks)334msWaktu respons (total)860ms
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)395msWaktu respons (maks)395msWaktu respons (total)395ms
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)752msWaktu respons (maks)1.22sWaktu respons (total)1.50s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Pengetahuan umum
: 0.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)34.99sWaktu respons (maks)109.60sWaktu respons (total)139.95s
Pemrograman
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Parsing dan ekstraksi data
: 1.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Spesifik domain
: 3.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)34.54sWaktu respons (maks)34.54sWaktu respons (total)34.54s
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)14.37sWaktu respons (maks)14.37sWaktu respons (total)14.37s
Kepatuhan instruksi
: 5.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.30sWaktu respons (maks)9.30sWaktu respons (total)9.30s
Pemecahan teka-teki
: 0.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)114.12sWaktu respons (maks)114.12sWaktu respons (total)114.12s
Trik anti-AI
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Kesalahan API: 1Waktu respons (rata-rata)584msWaktu respons (maks)772msWaktu respons (total)1.75s
Pemrograman
: 3.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.27sWaktu respons (maks)1.27sWaktu respons (total)1.27s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Parsing dan ekstraksi data
: 3.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)1.42sWaktu respons (maks)2.21sWaktu respons (total)2.84s
Spesifik domain
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)489msWaktu respons (maks)513msWaktu respons (total)1.47s
Kecerdasan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Trik anti-AI
: 6.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Jawaban salah: 1Waktu respons (rata-rata)1.20sWaktu respons (maks)1.48sWaktu respons (total)3.59s
Pemrograman
: 1.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)38.09sWaktu respons (maks)38.09sWaktu respons (total)38.09s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.72sWaktu respons (maks)3.88sWaktu respons (total)5.43s
Kecerdasan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Kepatuhan instruksi
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.37sWaktu respons (maks)1.56sWaktu respons (total)2.74s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Trik anti-AI
: 5.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 2Jawaban salah: 1Waktu respons (rata-rata)34.44sWaktu respons (maks)57.86sWaktu respons (total)103.31s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Spesifik domain
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 3Waktu respons (rata-rata)137.75sWaktu respons (maks)202.61sWaktu respons (total)413.24s
Kecerdasan umum
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Waktu respons (rata-rata)226.38sWaktu respons (maks)226.38sWaktu respons (total)226.38s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)5.75sWaktu respons (maks)5.75sWaktu respons (total)5.75s
Pemecahan teka-teki
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 2Jawaban salah: 1Waktu respons (rata-rata)32.27sWaktu respons (maks)47.31sWaktu respons (total)96.80s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.31sWaktu respons (maks)4.31sWaktu respons (total)4.31s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)177.02sWaktu respons (maks)177.02sWaktu respons (total)177.02s
Pemrograman
: 1.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)9.57sWaktu respons (maks)9.57sWaktu respons (total)9.57s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)7.12sWaktu respons (maks)7.12sWaktu respons (total)7.12s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)34.98sWaktu respons (maks)68.97sWaktu respons (total)104.94s
Kecerdasan umum
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)10.79sWaktu respons (maks)10.79sWaktu respons (total)10.79s
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.06sWaktu respons (maks)5.85sWaktu respons (total)10.12s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)47.29sWaktu respons (maks)47.29sWaktu respons (total)47.29s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)1.88sWaktu respons (maks)1.88sWaktu respons (total)1.88s
Parsing dan ekstraksi data
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)575msWaktu respons (maks)583msWaktu respons (total)1.15s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)357msWaktu respons (maks)463msWaktu respons (total)1.07s
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)499msWaktu respons (maks)499msWaktu respons (total)499ms
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.17sWaktu respons (maks)2.17sWaktu respons (total)2.17s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)306msWaktu respons (maks)306msWaktu respons (total)306ms
Pemrograman
: 8.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.96sWaktu respons (maks)1.96sWaktu respons (total)1.96s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.01sWaktu respons (maks)2.01sWaktu respons (total)2.01s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)646msWaktu respons (maks)658msWaktu respons (total)1.29s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)371msWaktu respons (maks)419msWaktu respons (total)1.11s
Kecerdasan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)439msWaktu respons (maks)448msWaktu respons (total)878ms
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)1.93sWaktu respons (maks)1.93sWaktu respons (total)1.93s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 13Tidak mengikuti instruksi: 3Waktu respons (rata-rata)1.62sWaktu respons (maks)5.51sWaktu respons (total)19.48s…
Pemrograman
: 1.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.79sWaktu respons (maks)1.79sWaktu respons (total)1.79s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.33sWaktu respons (maks)3.33sWaktu respons (total)3.33s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)943msWaktu respons (maks)943msWaktu respons (total)943ms
Spesifik domain
: 5.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)1.06sWaktu respons (maks)1.06sWaktu respons (total)1.06s
Kecerdasan umum
: 4.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.08sWaktu respons (maks)1.08sWaktu respons (total)1.08s
Pemecahan teka-teki
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)1.10sWaktu respons (maks)1.36sWaktu respons (total)2.21s
Pemanggilan alat
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)5.51sWaktu respons (maks)5.51sWaktu respons (total)5.51s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)731msWaktu respons (maks)731msWaktu respons (total)731ms
Trik anti-AI
: 8.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)6.30sWaktu respons (maks)9.80sWaktu respons (total)25.20s
Pemrograman
: 3.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)21.41sWaktu respons (maks)21.41sWaktu respons (total)21.41s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Kecerdasan umum
: 4.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)12.47sWaktu respons (maks)12.47sWaktu respons (total)12.47s
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.36sWaktu respons (maks)11.05sWaktu respons (total)14.73s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)36.09sWaktu respons (maks)36.09sWaktu respons (total)36.09s
Trik anti-AI
: 3.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)1.19sWaktu respons (maks)2.73sWaktu respons (total)4.76s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.87sWaktu respons (maks)2.87sWaktu respons (total)2.87s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)564msWaktu respons (maks)564msWaktu respons (total)564ms
Kecerdasan umum
: 4.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.67sWaktu respons (maks)1.67sWaktu respons (total)1.67s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)857msWaktu respons (maks)955msWaktu respons (total)1.71s
Pemecahan teka-teki
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)1.86sWaktu respons (maks)2.70sWaktu respons (total)3.71s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.28sWaktu respons (maks)2.28sWaktu respons (total)2.28s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.82sWaktu respons (maks)1.82sWaktu respons (total)1.82s
Pemrograman
: 2.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 2Jawaban salah: 1Waktu respons (rata-rata)4.56sWaktu respons (maks)4.56sWaktu respons (total)4.56s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)35.84sWaktu respons (maks)35.84sWaktu respons (total)35.84s
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)2.85sWaktu respons (maks)2.85sWaktu respons (total)2.85s
Spesifik domain
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Kesalahan API: 1Waktu respons (rata-rata)17.61sWaktu respons (maks)25.68sWaktu respons (total)52.82s
Kecerdasan umum
: 4.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)16.07sWaktu respons (maks)16.07sWaktu respons (total)16.07s
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 1Waktu respons (rata-rata)12.98sWaktu respons (maks)23.51sWaktu respons (total)25.95s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)33.76sWaktu respons (maks)33.76sWaktu respons (total)33.76s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.71sWaktu respons (maks)2.71sWaktu respons (total)2.71s
Pemrograman
: 3.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 2Tidak ada jawaban: 1Waktu respons (rata-rata)55.33sWaktu respons (maks)89.40sWaktu respons (total)110.66s
Gabungan
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)65.57sWaktu respons (maks)65.57sWaktu respons (total)65.57s
Parsing dan ekstraksi data
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)1.51sWaktu respons (maks)1.51sWaktu respons (total)1.51s
Kecerdasan umum
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)18.14sWaktu respons (maks)18.14sWaktu respons (total)18.14s
Kepatuhan instruksi
: 6.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.97sWaktu respons (maks)2.97sWaktu respons (total)2.97s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)15.95sWaktu respons (maks)15.95sWaktu respons (total)15.95s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)11.13sWaktu respons (maks)11.13sWaktu respons (total)11.13s
Trik anti-AI
: 6.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Jawaban salah: 1Waktu respons (rata-rata)2.68sWaktu respons (maks)3.09sWaktu respons (total)8.04s
Pemrograman
: 2.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)14.36sWaktu respons (maks)14.36sWaktu respons (total)14.36s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)15.92sWaktu respons (maks)15.92sWaktu respons (total)15.92s
Parsing dan ekstraksi data
: 7.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)9.34sWaktu respons (maks)16.71sWaktu respons (total)18.68s
Kecerdasan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.68sWaktu respons (maks)2.03sWaktu respons (total)3.36s
Pemanggilan alat
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)3.39sWaktu respons (maks)3.39sWaktu respons (total)3.39s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Trik anti-AI
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)501msWaktu respons (maks)839msWaktu respons (total)2.01s
Pemrograman
: 1.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.22sWaktu respons (maks)1.22sWaktu respons (total)1.22s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)6.04sWaktu respons (maks)6.04sWaktu respons (total)6.04s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)522msWaktu respons (maks)537msWaktu respons (total)1.04s
Kecerdasan umum
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)659msWaktu respons (maks)659msWaktu respons (total)659ms
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)445msWaktu respons (maks)505msWaktu respons (total)889ms
Pemecahan teka-teki
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)473msWaktu respons (maks)502msWaktu respons (total)1.42s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.63sWaktu respons (maks)4.63sWaktu respons (total)4.63s
Pengetahuan umum
: 0.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Trik anti-AI
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)3.81sWaktu respons (maks)6.85sWaktu respons (total)15.23s
Pemrograman
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)15.17sWaktu respons (maks)15.17sWaktu respons (total)15.17s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)8.49sWaktu respons (maks)14.02sWaktu respons (total)16.98s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)2.33sWaktu respons (maks)2.94sWaktu respons (total)6.99s
Kecerdasan umum
: 6.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.71sWaktu respons (maks)2.71sWaktu respons (total)2.71s
Kepatuhan instruksi
: 6.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.82sWaktu respons (maks)2.92sWaktu respons (total)5.65s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.02sWaktu respons (maks)6.02sWaktu respons (total)6.02s
Pengetahuan umum
: 0.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Trik anti-AI
: 6.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)1.19sWaktu respons (maks)2.04sWaktu respons (total)4.75s
Pemrograman
: 3.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 2Jawaban salah: 1Waktu respons (rata-rata)1.30sWaktu respons (maks)1.30sWaktu respons (total)1.30s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.70sWaktu respons (maks)3.70sWaktu respons (total)3.70s
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)979msWaktu respons (maks)1.02sWaktu respons (total)1.96s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)925msWaktu respons (maks)1.16sWaktu respons (total)2.77s
Kecerdasan umum
: 4.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)920msWaktu respons (maks)920msWaktu respons (total)920ms
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)987msWaktu respons (maks)1.13sWaktu respons (total)1.97s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)2.83sWaktu respons (maks)2.83sWaktu respons (total)2.83s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Pemrograman
: 4.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 2Jawaban salah: 1Waktu respons (rata-rata)1.39sWaktu respons (maks)1.39sWaktu respons (total)1.39s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.81sWaktu respons (maks)3.81sWaktu respons (total)3.81s
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.04sWaktu respons (maks)1.05sWaktu respons (total)2.08s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)927msWaktu respons (maks)1.17sWaktu respons (total)2.78s
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)854msWaktu respons (maks)854msWaktu respons (total)854ms
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.03sWaktu respons (maks)1.17sWaktu respons (total)2.07s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)2.79sWaktu respons (maks)2.79sWaktu respons (total)2.79s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 16Tidak mengikuti instruksi: 1Waktu respons (rata-rata)653msWaktu respons (maks)1.43sWaktu respons (total)13.72s…
Trik anti-AI
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)483msWaktu respons (maks)716msWaktu respons (total)1.93s
Pemrograman
: 3.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)1.03sWaktu respons (maks)1.43sWaktu respons (total)3.10s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)606msWaktu respons (maks)606msWaktu respons (total)606ms
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)667msWaktu respons (maks)819msWaktu respons (total)1.33s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)534msWaktu respons (maks)733msWaktu respons (total)1.60s
Kecerdasan umum
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)628msWaktu respons (maks)628msWaktu respons (total)628ms
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)551msWaktu respons (maks)622msWaktu respons (total)1.10s
Pemecahan teka-teki
: 3.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)535msWaktu respons (maks)642msWaktu respons (total)1.60s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.27sWaktu respons (maks)1.27sWaktu respons (total)1.27s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)548msWaktu respons (maks)548msWaktu respons (total)548ms
Trik anti-AI
: 3.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Kesalahan API: 1Waktu respons (rata-rata)705msWaktu respons (maks)975msWaktu respons (total)2.12s
Pemrograman
: 2.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.93sWaktu respons (maks)2.93sWaktu respons (total)2.93s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)4.32sWaktu respons (maks)4.32sWaktu respons (total)4.32s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.37sWaktu respons (maks)5.76sWaktu respons (total)6.73s
Spesifik domain
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)5.50sWaktu respons (maks)15.42sWaktu respons (total)16.50s
Kecerdasan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)683msWaktu respons (maks)691msWaktu respons (total)1.37s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.54sWaktu respons (maks)7.54sWaktu respons (total)7.54s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Trik anti-AI
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)597msWaktu respons (maks)866msWaktu respons (total)2.39s
Pemrograman
: 1.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.14sWaktu respons (maks)1.14sWaktu respons (total)1.14s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)6.48sWaktu respons (maks)6.48sWaktu respons (total)6.48s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)601msWaktu respons (maks)634msWaktu respons (total)1.20s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)611msWaktu respons (maks)616msWaktu respons (total)1.83s
Kecerdasan umum
: 5.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)541msWaktu respons (maks)541msWaktu respons (total)541ms
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)649msWaktu respons (maks)952msWaktu respons (total)1.30s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)586msWaktu respons (maks)813msWaktu respons (total)1.76s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.79sWaktu respons (maks)4.79sWaktu respons (total)4.79s
Pengetahuan umum
: 0.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Pemrograman
: 3.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Kedaluwarsa: 1Waktu respons (rata-rata)924msWaktu respons (maks)1.69sWaktu respons (total)2.77s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.28sWaktu respons (maks)4.28sWaktu respons (total)4.28s
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)81.80sWaktu respons (maks)81.80sWaktu respons (total)81.80s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)638msWaktu respons (maks)638msWaktu respons (total)638ms
Kecerdasan umum
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.39sWaktu respons (maks)1.39sWaktu respons (total)1.39s
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)7.49sWaktu respons (maks)13.67sWaktu respons (total)14.99s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.64sWaktu respons (maks)2.64sWaktu respons (total)2.64s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)399msWaktu respons (maks)399msWaktu respons (total)399ms
Trik anti-AI
: 3.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)6.55sWaktu respons (maks)9.41sWaktu respons (total)26.19s
Pemrograman
: 3.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 2Jawaban salah: 1Waktu respons (rata-rata)10.57sWaktu respons (maks)10.57sWaktu respons (total)10.57s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)23.53sWaktu respons (maks)23.53sWaktu respons (total)23.53s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.37sWaktu respons (maks)1.37sWaktu respons (total)2.73s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)1.04sWaktu respons (maks)1.08sWaktu respons (total)3.11s
Kecerdasan umum
: 5.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)20.34sWaktu respons (maks)20.34sWaktu respons (total)20.34s
Kepatuhan instruksi
: 6.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)5.36sWaktu respons (maks)9.81sWaktu respons (total)10.73s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)25.72sWaktu respons (maks)25.72sWaktu respons (total)25.72s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Gabungan
: 4.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)60.39sWaktu respons (maks)60.39sWaktu respons (total)60.39s
Parsing dan ekstraksi data
: 4.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)7.48sWaktu respons (maks)7.48sWaktu respons (total)7.48s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Kedaluwarsa: 1Waktu respons (rata-rata)237.27sWaktu respons (maks)237.27sWaktu respons (total)237.27s
Kecerdasan umum
: 3.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)6.63sWaktu respons (maks)6.63sWaktu respons (total)6.63s
Kepatuhan instruksi
: 7.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)621msWaktu respons (maks)621msWaktu respons (total)621ms
Pemecahan teka-teki
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)11.21sWaktu respons (maks)17.37sWaktu respons (total)22.43s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)15.35sWaktu respons (maks)15.35sWaktu respons (total)15.35s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)80.79sWaktu respons (maks)80.79sWaktu respons (total)80.79s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 15Tidak mengikuti instruksi: 2Waktu respons (rata-rata)1.48sWaktu respons (maks)4.47sWaktu respons (total)31.01s…
Trik anti-AI
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)1.18sWaktu respons (maks)1.81sWaktu respons (total)4.70s
Pemrograman
: 4.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)2.22sWaktu respons (maks)4.47sWaktu respons (total)6.65s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.84sWaktu respons (maks)3.84sWaktu respons (total)3.84s
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.11sWaktu respons (maks)1.25sWaktu respons (total)2.23s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)926msWaktu respons (maks)959msWaktu respons (total)2.78s
Kecerdasan umum
: 3.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.31sWaktu respons (maks)1.31sWaktu respons (total)1.31s
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)784msWaktu respons (maks)859msWaktu respons (total)1.57s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.40sWaktu respons (maks)3.40sWaktu respons (total)3.40s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)773msWaktu respons (maks)773msWaktu respons (total)773ms
Trik anti-AI
: 9.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)43.33sWaktu respons (maks)71.76sWaktu respons (total)173.31s
Pemrograman
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 2Waktu respons (rata-rata)143.82sWaktu respons (maks)143.82sWaktu respons (total)143.82s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)73.40sWaktu respons (maks)90.09sWaktu respons (total)220.20s
Kecerdasan umum
: 4.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)15.63sWaktu respons (maks)15.63sWaktu respons (total)15.63s
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)27.36sWaktu respons (maks)40.24sWaktu respons (total)54.72s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)31.47sWaktu respons (maks)46.84sWaktu respons (total)94.41s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)133.60sWaktu respons (maks)133.60sWaktu respons (total)133.60s
Pemrograman
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 2Waktu respons (rata-rata)11.21sWaktu respons (maks)11.21sWaktu respons (total)11.21s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)35.34sWaktu respons (maks)35.34sWaktu respons (total)35.34s
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)8.48sWaktu respons (maks)12.71sWaktu respons (total)16.96s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)4.95sWaktu respons (maks)7.65sWaktu respons (total)14.84s
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.45sWaktu respons (maks)1.45sWaktu respons (total)1.45s
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.52sWaktu respons (maks)8.19sWaktu respons (total)11.04s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)18.80sWaktu respons (maks)18.80sWaktu respons (total)18.80s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.06sWaktu respons (maks)1.06sWaktu respons (total)1.06s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 14Tidak mengikuti instruksi: 2Waktu respons (rata-rata)5.30sWaktu respons (maks)16.45sWaktu respons (total)111.31s…
Trik anti-AI
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)4.46sWaktu respons (maks)9.94sWaktu respons (total)17.83s
Pemrograman
: 3.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)2.64sWaktu respons (maks)3.05sWaktu respons (total)7.92s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)16.45sWaktu respons (maks)16.45sWaktu respons (total)16.45s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.92sWaktu respons (maks)13.23sWaktu respons (total)15.84s
Spesifik domain
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)6.23sWaktu respons (maks)14.38sWaktu respons (total)18.70s
Kecerdasan umum
: 4.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)950msWaktu respons (maks)950msWaktu respons (total)950ms
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)804msWaktu respons (maks)921msWaktu respons (total)1.61s
Pemanggilan alat
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)16.00sWaktu respons (maks)16.00sWaktu respons (total)16.00s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)8.94sWaktu respons (maks)8.94sWaktu respons (total)8.94s
Trik anti-AI
: 5.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)5.51sWaktu respons (maks)6.59sWaktu respons (total)11.02s
Pemrograman
: 4.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)2.54sWaktu respons (maks)5.57sWaktu respons (total)7.62s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)3.22sWaktu respons (maks)3.22sWaktu respons (total)3.22s
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.82sWaktu respons (maks)4.82sWaktu respons (total)4.82s
Spesifik domain
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)744msWaktu respons (maks)744msWaktu respons (total)744ms
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.59sWaktu respons (maks)1.59sWaktu respons (total)1.59s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)888msWaktu respons (maks)888msWaktu respons (total)888ms
Pemanggilan alat
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)7.05sWaktu respons (maks)7.05sWaktu respons (total)7.05s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)692msWaktu respons (maks)692msWaktu respons (total)692ms
Trik anti-AI
: 8.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)10.00sWaktu respons (maks)11.53sWaktu respons (total)39.99s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)47.38sWaktu respons (maks)47.38sWaktu respons (total)47.38s
Parsing dan ekstraksi data
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)17.36sWaktu respons (maks)26.57sWaktu respons (total)34.71s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)128.15sWaktu respons (maks)309.02sWaktu respons (total)384.46s
Kecerdasan umum
: 4.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)23.23sWaktu respons (maks)23.23sWaktu respons (total)23.23s
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)11.60sWaktu respons (maks)14.49sWaktu respons (total)23.20s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)11.19sWaktu respons (maks)11.19sWaktu respons (total)11.19s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)36.98sWaktu respons (maks)36.98sWaktu respons (total)36.98s