Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)5.81sWaktu respons (maks)14.72sWaktu respons (total)116.25s…
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.48sWaktu respons (maks)4.31sWaktu respons (total)13.94s
Pemrograman
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)6.66sWaktu respons (maks)6.94sWaktu respons (total)13.31s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.27sWaktu respons (maks)3.27sWaktu respons (total)3.27s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.40sWaktu respons (maks)14.72sWaktu respons (total)18.80s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)8.05sWaktu respons (maks)14.40sWaktu respons (total)24.15s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.68sWaktu respons (maks)3.68sWaktu respons (total)3.68s
Kepatuhan instruksi
: 9.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.02sWaktu respons (maks)7.35sWaktu respons (total)14.03s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.77sWaktu respons (maks)10.27sWaktu respons (total)17.32s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.99sWaktu respons (maks)4.99sWaktu respons (total)4.99s
Pengetahuan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.75sWaktu respons (maks)2.75sWaktu respons (total)2.75s
Pemrograman
: 6.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)54.73sWaktu respons (maks)91.27sWaktu respons (total)109.46s
Gabungan
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)41.03sWaktu respons (maks)41.03sWaktu respons (total)41.03s
Parsing dan ekstraksi data
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)21.95sWaktu respons (maks)24.88sWaktu respons (total)43.89s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 2Jawaban salah: 1Waktu respons (rata-rata)19.00sWaktu respons (maks)21.63sWaktu respons (total)38.01s
Kecerdasan umum
: 3.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)38.70sWaktu respons (maks)38.70sWaktu respons (total)38.70s
Pemanggilan alat
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)12.05sWaktu respons (maks)12.05sWaktu respons (total)12.05s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)22.77sWaktu respons (maks)22.77sWaktu respons (total)22.77s
Trik anti-AI
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)892msWaktu respons (maks)1.38sWaktu respons (total)3.57s
Pemrograman
: 7.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)3.39sWaktu respons (maks)5.51sWaktu respons (total)6.79s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)3.56sWaktu respons (maks)3.56sWaktu respons (total)3.56s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.66sWaktu respons (maks)2.11sWaktu respons (total)3.32s
Spesifik domain
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)899msWaktu respons (maks)1.04sWaktu respons (total)2.70s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)922msWaktu respons (maks)922msWaktu respons (total)922ms
Kepatuhan instruksi
: 6.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)893msWaktu respons (maks)964msWaktu respons (total)1.79s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.45sWaktu respons (maks)2.30sWaktu respons (total)4.36s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.79sWaktu respons (maks)2.79sWaktu respons (total)2.79s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.76sWaktu respons (maks)1.76sWaktu respons (total)1.76s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 7Tidak mengikuti instruksi: 2Waktu respons (rata-rata)11.79sWaktu respons (maks)94.06sWaktu respons (total)235.81s…
Trik anti-AI
: 8.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.52sWaktu respons (maks)7.74sWaktu respons (total)18.10s
Pemrograman
: 6.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)21.10sWaktu respons (maks)28.80sWaktu respons (total)42.21s
Gabungan
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)24.13sWaktu respons (maks)24.13sWaktu respons (total)24.13s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.54sWaktu respons (maks)3.33sWaktu respons (total)5.08s
Spesifik domain
: 5.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)38.18sWaktu respons (maks)94.06sWaktu respons (total)114.53s
Kecerdasan umum
: 4.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.15sWaktu respons (maks)4.15sWaktu respons (total)4.15s
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.88sWaktu respons (maks)2.61sWaktu respons (total)3.75s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.71sWaktu respons (maks)7.71sWaktu respons (total)7.71s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.81sWaktu respons (maks)4.81sWaktu respons (total)4.81s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.26sWaktu respons (maks)6.38sWaktu respons (total)13.06s
Pemrograman
: 7.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 1Waktu respons (rata-rata)81.67sWaktu respons (maks)130.77sWaktu respons (total)163.34s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)53.36sWaktu respons (maks)53.36sWaktu respons (total)53.36s
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)18.81sWaktu respons (maks)20.29sWaktu respons (total)37.61s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 2Waktu respons (rata-rata)37.87sWaktu respons (maks)84.22sWaktu respons (total)113.60s
Kecerdasan umum
: 5.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.02sWaktu respons (maks)4.02sWaktu respons (total)4.02s
Kepatuhan instruksi
: 9.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.77sWaktu respons (maks)3.21sWaktu respons (total)5.54s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)16.87sWaktu respons (maks)16.87sWaktu respons (total)16.87s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)12.46sWaktu respons (maks)12.46sWaktu respons (total)12.46s
Trik anti-AI
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)597msWaktu respons (maks)866msWaktu respons (total)2.39s
Pemrograman
: 5.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.14sWaktu respons (maks)1.14sWaktu respons (total)1.14s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)6.48sWaktu respons (maks)6.48sWaktu respons (total)6.48s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)601msWaktu respons (maks)634msWaktu respons (total)1.20s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)611msWaktu respons (maks)616msWaktu respons (total)1.83s
Kecerdasan umum
: 5.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)541msWaktu respons (maks)541msWaktu respons (total)541ms
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)649msWaktu respons (maks)952msWaktu respons (total)1.30s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)586msWaktu respons (maks)813msWaktu respons (total)1.76s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.79sWaktu respons (maks)4.79sWaktu respons (total)4.79s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 10Tidak mengikuti instruksi: 3Waktu respons (rata-rata)13.82sWaktu respons (maks)238.89sWaktu respons (total)276.39s…
Trik anti-AI
: 4.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)1.39sWaktu respons (maks)2.96sWaktu respons (total)5.56s
Pemrograman
: 6.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)122.77sWaktu respons (maks)238.89sWaktu respons (total)245.54s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.38sWaktu respons (maks)3.38sWaktu respons (total)3.38s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.32sWaktu respons (maks)1.39sWaktu respons (total)2.64s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)1.48sWaktu respons (maks)1.85sWaktu respons (total)4.45s
Kecerdasan umum
: 5.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.55sWaktu respons (maks)1.55sWaktu respons (total)1.55s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.64sWaktu respons (maks)1.80sWaktu respons (total)3.28s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.46sWaktu respons (maks)4.46sWaktu respons (total)4.46s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.36sWaktu respons (maks)1.36sWaktu respons (total)1.36s
Trik anti-AI
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)25.50sWaktu respons (maks)37.73sWaktu respons (total)51.00s
Pemrograman
: 5.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)47.80sWaktu respons (maks)54.86sWaktu respons (total)95.59s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)65.96sWaktu respons (maks)65.96sWaktu respons (total)65.96s
Parsing dan ekstraksi data
: 3.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)21.42sWaktu respons (maks)21.42sWaktu respons (total)21.42s
Spesifik domain
: 5.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)204.02sWaktu respons (maks)204.02sWaktu respons (total)204.02s
Kecerdasan umum
: 4.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)17.51sWaktu respons (maks)17.51sWaktu respons (total)17.51s
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)15.64sWaktu respons (maks)15.64sWaktu respons (total)15.64s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)33.30sWaktu respons (maks)33.30sWaktu respons (total)33.30s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)20.13sWaktu respons (maks)20.13sWaktu respons (total)20.13s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)59.11sWaktu respons (maks)168.31sWaktu respons (total)236.44s
Pemrograman
: 4.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)54.23sWaktu respons (maks)62.72sWaktu respons (total)108.47s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)17.78sWaktu respons (maks)17.78sWaktu respons (total)17.78s
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)56.99sWaktu respons (maks)80.14sWaktu respons (total)113.98s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)146.50sWaktu respons (maks)234.29sWaktu respons (total)439.49s
Kecerdasan umum
: 6.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)40.05sWaktu respons (maks)40.05sWaktu respons (total)40.05s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)63.49sWaktu respons (maks)111.61sWaktu respons (total)126.98s
Pemecahan teka-teki
: 8.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Waktu respons (rata-rata)27.61sWaktu respons (maks)31.84sWaktu respons (total)55.21s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)10.33sWaktu respons (maks)10.33sWaktu respons (total)10.33s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)48.98sWaktu respons (maks)48.98sWaktu respons (total)48.98s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 9Waktu respons (rata-rata)3.31sWaktu respons (maks)20.51sWaktu respons (total)66.17s…
Trik anti-AI
: 5.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)2.63sWaktu respons (maks)5.57sWaktu respons (total)10.53s
Pemrograman
: 4.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)3.06sWaktu respons (maks)3.45sWaktu respons (total)6.12s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)20.51sWaktu respons (maks)20.51sWaktu respons (total)20.51s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.87sWaktu respons (maks)3.54sWaktu respons (total)5.74s
Spesifik domain
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.22sWaktu respons (maks)1.25sWaktu respons (total)3.67s
Kecerdasan umum
: 4.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.62sWaktu respons (maks)1.62sWaktu respons (total)1.62s
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.40sWaktu respons (maks)1.46sWaktu respons (total)2.79s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.65sWaktu respons (maks)3.59sWaktu respons (total)7.94s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.27sWaktu respons (maks)5.27sWaktu respons (total)5.27s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.97sWaktu respons (maks)1.97sWaktu respons (total)1.97s
Trik anti-AI
: 8.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.81sWaktu respons (maks)5.65sWaktu respons (total)7.62s
Pemrograman
: 2.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)23.58sWaktu respons (maks)23.58sWaktu respons (total)23.58s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)37.64sWaktu respons (maks)37.64sWaktu respons (total)37.64s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.63sWaktu respons (maks)6.63sWaktu respons (total)6.63s
Spesifik domain
: 5.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)121.79sWaktu respons (maks)121.79sWaktu respons (total)121.79s
Kecerdasan umum
: 4.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)16.25sWaktu respons (maks)16.25sWaktu respons (total)16.25s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.63sWaktu respons (maks)4.63sWaktu respons (total)4.63s
Pemanggilan alat
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)27.71sWaktu respons (maks)27.71sWaktu respons (total)27.71s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)25.52sWaktu respons (maks)25.52sWaktu respons (total)25.52s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 6Tidak mengikuti instruksi: 1Waktu respons (rata-rata)3.18sWaktu respons (maks)10.87sWaktu respons (total)63.55s…
Trik anti-AI
: 9.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.39sWaktu respons (maks)3.58sWaktu respons (total)9.57s
Pemrograman
: 6.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.59sWaktu respons (maks)3.93sWaktu respons (total)7.19s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)10.87sWaktu respons (maks)10.87sWaktu respons (total)10.87s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.60sWaktu respons (maks)2.69sWaktu respons (total)5.19s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)3.16sWaktu respons (maks)3.89sWaktu respons (total)9.49s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.60sWaktu respons (maks)2.60sWaktu respons (total)2.60s
Kepatuhan instruksi
: 9.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.59sWaktu respons (maks)3.04sWaktu respons (total)5.17s
Pemecahan teka-teki
: 7.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.95sWaktu respons (maks)2.48sWaktu respons (total)5.84s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.55sWaktu respons (maks)4.55sWaktu respons (total)4.55s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.08sWaktu respons (maks)3.08sWaktu respons (total)3.08s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 6Tidak mengikuti instruksi: 1Waktu respons (rata-rata)3.94sWaktu respons (maks)14.93sWaktu respons (total)78.74s…
Trik anti-AI
: 9.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.33sWaktu respons (maks)3.89sWaktu respons (total)9.30s
Pemrograman
: 6.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.98sWaktu respons (maks)4.34sWaktu respons (total)7.95s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)14.93sWaktu respons (maks)14.93sWaktu respons (total)14.93s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.29sWaktu respons (maks)2.31sWaktu respons (total)4.59s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)4.21sWaktu respons (maks)5.86sWaktu respons (total)12.62s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.16sWaktu respons (maks)3.16sWaktu respons (total)3.16s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.91sWaktu respons (maks)1.93sWaktu respons (total)3.82s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)5.30sWaktu respons (maks)9.55sWaktu respons (total)15.89s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.80sWaktu respons (maks)3.80sWaktu respons (total)3.80s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.68sWaktu respons (maks)2.68sWaktu respons (total)2.68s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)40.57sWaktu respons (maks)110.43sWaktu respons (total)121.72s
Pemrograman
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)62.83sWaktu respons (maks)62.83sWaktu respons (total)62.83s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)29.57sWaktu respons (maks)29.57sWaktu respons (total)29.57s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)15.01sWaktu respons (maks)15.01sWaktu respons (total)15.01s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)170.45sWaktu respons (maks)170.45sWaktu respons (total)170.45s
Kecerdasan umum
: 5.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)22.39sWaktu respons (maks)22.39sWaktu respons (total)22.39s
Kepatuhan instruksi
: 8.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.78sWaktu respons (maks)4.78sWaktu respons (total)4.78s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)11.91sWaktu respons (maks)11.91sWaktu respons (total)11.91s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)108.45sWaktu respons (maks)108.45sWaktu respons (total)108.45s
Trik anti-AI
: 6.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Jawaban salah: 1Waktu respons (rata-rata)16.53sWaktu respons (maks)39.91sWaktu respons (total)66.11s
Pemrograman
: 2.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Kedaluwarsa: 1Waktu respons (rata-rata)51.77sWaktu respons (maks)51.77sWaktu respons (total)51.77s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)65.02sWaktu respons (maks)65.02sWaktu respons (total)65.02s
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)23.62sWaktu respons (maks)36.44sWaktu respons (total)47.24s
Kecerdasan umum
: 6.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)25.09sWaktu respons (maks)25.09sWaktu respons (total)25.09s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)41.16sWaktu respons (maks)43.56sWaktu respons (total)82.32s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)21.33sWaktu respons (maks)21.33sWaktu respons (total)21.33s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)39.14sWaktu respons (maks)39.14sWaktu respons (total)39.14s
Trik anti-AI
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)501msWaktu respons (maks)839msWaktu respons (total)2.01s
Pemrograman
: 3.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.22sWaktu respons (maks)1.22sWaktu respons (total)1.22s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)6.04sWaktu respons (maks)6.04sWaktu respons (total)6.04s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)522msWaktu respons (maks)537msWaktu respons (total)1.04s
Kecerdasan umum
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)659msWaktu respons (maks)659msWaktu respons (total)659ms
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)445msWaktu respons (maks)505msWaktu respons (total)889ms
Pemecahan teka-teki
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)473msWaktu respons (maks)502msWaktu respons (total)1.42s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.63sWaktu respons (maks)4.63sWaktu respons (total)4.63s
Trik anti-AI
: 5.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)2.67sWaktu respons (maks)5.03sWaktu respons (total)10.66s
Pemrograman
: 5.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)44.82sWaktu respons (maks)59.15sWaktu respons (total)89.64s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)25.25sWaktu respons (maks)25.25sWaktu respons (total)25.25s
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)1.23sWaktu respons (maks)1.96sWaktu respons (total)2.46s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Jawaban salah: 1Waktu respons (rata-rata)6.11sWaktu respons (maks)13.72sWaktu respons (total)18.34s
Kecerdasan umum
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.05sWaktu respons (maks)2.05sWaktu respons (total)2.05s
Kepatuhan instruksi
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.38sWaktu respons (maks)1.61sWaktu respons (total)2.75s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.50sWaktu respons (maks)3.50sWaktu respons (total)3.50s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)5.92sWaktu respons (maks)5.92sWaktu respons (total)5.92s
Trik anti-AI
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)2.11sWaktu respons (maks)3.94sWaktu respons (total)8.46s
Pemrograman
: 4.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)6.33sWaktu respons (maks)9.79sWaktu respons (total)12.65s
Gabungan
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)32.57sWaktu respons (maks)32.57sWaktu respons (total)32.57s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.08sWaktu respons (maks)1.62sWaktu respons (total)2.15s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)1.99sWaktu respons (maks)3.99sWaktu respons (total)5.98s
Kecerdasan umum
: 5.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)790msWaktu respons (maks)790msWaktu respons (total)790ms
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.98sWaktu respons (maks)2.28sWaktu respons (total)3.97s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.45sWaktu respons (maks)2.09sWaktu respons (total)4.36s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)10.68sWaktu respons (maks)10.68sWaktu respons (total)10.68s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.34sWaktu respons (maks)2.34sWaktu respons (total)2.34s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 8Tidak mengikuti instruksi: 3Waktu respons (rata-rata)2.27sWaktu respons (maks)14.63sWaktu respons (total)43.20s…
Pemrograman
: 7.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.29sWaktu respons (maks)3.06sWaktu respons (total)4.58s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.28sWaktu respons (maks)3.28sWaktu respons (total)3.28s
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.11sWaktu respons (maks)1.47sWaktu respons (total)2.21s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)6.48sWaktu respons (maks)14.63sWaktu respons (total)19.43s
Kecerdasan umum
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)821msWaktu respons (maks)821msWaktu respons (total)821ms
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.07sWaktu respons (maks)1.07sWaktu respons (total)1.07s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.89sWaktu respons (maks)1.89sWaktu respons (total)1.89s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.58sWaktu respons (maks)2.58sWaktu respons (total)2.58s
Pemrograman
: 3.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Kedaluwarsa: 1Waktu respons (rata-rata)55.33sWaktu respons (maks)89.40sWaktu respons (total)110.66s
Gabungan
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)65.57sWaktu respons (maks)65.57sWaktu respons (total)65.57s
Parsing dan ekstraksi data
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)1.51sWaktu respons (maks)1.51sWaktu respons (total)1.51s
Kecerdasan umum
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)18.14sWaktu respons (maks)18.14sWaktu respons (total)18.14s
Kepatuhan instruksi
: 6.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.97sWaktu respons (maks)2.97sWaktu respons (total)2.97s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)15.95sWaktu respons (maks)15.95sWaktu respons (total)15.95s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)11.13sWaktu respons (maks)11.13sWaktu respons (total)11.13s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.14sWaktu respons (maks)12.41sWaktu respons (total)16.57s
Pemrograman
: 6.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)64.48sWaktu respons (maks)97.49sWaktu respons (total)128.97s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)16.86sWaktu respons (maks)16.86sWaktu respons (total)16.86s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 1Jawaban salah: 1Waktu respons (rata-rata)34.53sWaktu respons (maks)86.93sWaktu respons (total)103.59s
Kecerdasan umum
: 5.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)5.37sWaktu respons (maks)5.37sWaktu respons (total)5.37s
Kepatuhan instruksi
: 9.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.80sWaktu respons (maks)1.81sWaktu respons (total)3.60s
Pemecahan teka-teki
: 8.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)20.25sWaktu respons (maks)57.93sWaktu respons (total)60.76s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.29sWaktu respons (maks)7.29sWaktu respons (total)7.29s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)51.29sWaktu respons (maks)51.29sWaktu respons (total)51.29s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 6Waktu respons (rata-rata)1.30sWaktu respons (maks)3.92sWaktu respons (total)25.95s…
Trik anti-AI
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)1.08sWaktu respons (maks)1.39sWaktu respons (total)4.30s
Pemrograman
: 6.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.39sWaktu respons (maks)1.63sWaktu respons (total)2.78s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.17sWaktu respons (maks)2.17sWaktu respons (total)2.17s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.35sWaktu respons (maks)1.43sWaktu respons (total)2.69s
Spesifik domain
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)975msWaktu respons (maks)1.08sWaktu respons (total)2.92s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.04sWaktu respons (maks)1.04sWaktu respons (total)1.04s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)943msWaktu respons (maks)974msWaktu respons (total)1.89s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.13sWaktu respons (maks)1.29sWaktu respons (total)3.40s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.92sWaktu respons (maks)3.92sWaktu respons (total)3.92s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)856msWaktu respons (maks)856msWaktu respons (total)856ms
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 10Tidak mengikuti instruksi: 2Waktu respons (rata-rata)3.04sWaktu respons (maks)6.51sWaktu respons (total)60.88s…
Trik anti-AI
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)3.13sWaktu respons (maks)5.90sWaktu respons (total)12.50s
Pemrograman
: 6.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.77sWaktu respons (maks)5.30sWaktu respons (total)7.54s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)6.51sWaktu respons (maks)6.51sWaktu respons (total)6.51s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.81sWaktu respons (maks)5.69sWaktu respons (total)7.62s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)2.09sWaktu respons (maks)2.39sWaktu respons (total)6.26s
Kecerdasan umum
: 4.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.22sWaktu respons (maks)2.22sWaktu respons (total)2.22s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.97sWaktu respons (maks)2.43sWaktu respons (total)3.93s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.86sWaktu respons (maks)4.86sWaktu respons (total)4.86s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.23sWaktu respons (maks)2.23sWaktu respons (total)2.23s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 6Jawaban salah: 3Waktu respons (rata-rata)56.57sWaktu respons (maks)149.94sWaktu respons (total)848.59s…
Trik anti-AI
: 6.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 2Waktu respons (rata-rata)15.12sWaktu respons (maks)19.99sWaktu respons (total)45.37s
Pemrograman
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)99.76sWaktu respons (maks)99.76sWaktu respons (total)99.76s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)113.09sWaktu respons (maks)113.09sWaktu respons (total)113.09s
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)12.11sWaktu respons (maks)12.11sWaktu respons (total)12.11s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)109.04sWaktu respons (maks)149.94sWaktu respons (total)327.11s
Kecerdasan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)34.36sWaktu respons (maks)41.83sWaktu respons (total)68.73s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)27.94sWaktu respons (maks)45.06sWaktu respons (total)55.89s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)78.83sWaktu respons (maks)78.83sWaktu respons (total)78.83s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)47.71sWaktu respons (maks)47.71sWaktu respons (total)47.71s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 11Tidak mengikuti instruksi: 2Waktu respons (rata-rata)2.27sWaktu respons (maks)6.58sWaktu respons (total)45.50s…
Trik anti-AI
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)1.80sWaktu respons (maks)2.62sWaktu respons (total)7.19s
Pemrograman
: 6.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.65sWaktu respons (maks)3.82sWaktu respons (total)5.30s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)6.58sWaktu respons (maks)6.58sWaktu respons (total)6.58s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.39sWaktu respons (maks)1.42sWaktu respons (total)2.78s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)1.78sWaktu respons (maks)2.49sWaktu respons (total)5.34s
Kecerdasan umum
: 4.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.44sWaktu respons (maks)2.44sWaktu respons (total)2.44s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.51sWaktu respons (maks)2.95sWaktu respons (total)5.02s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.39sWaktu respons (maks)4.39sWaktu respons (total)4.39s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.63sWaktu respons (maks)1.63sWaktu respons (total)1.63s
Trik anti-AI
: 6.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)74.75sWaktu respons (maks)182.10sWaktu respons (total)298.98s
Pemrograman
: 6.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)220.48sWaktu respons (maks)243.66sWaktu respons (total)440.97s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)262.83sWaktu respons (maks)262.83sWaktu respons (total)262.83s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)24.27sWaktu respons (maks)27.52sWaktu respons (total)48.54s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 3Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Kecerdasan umum
: 5.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)36.65sWaktu respons (maks)36.65sWaktu respons (total)36.65s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)17.47sWaktu respons (maks)19.46sWaktu respons (total)34.93s
Pemecahan teka-teki
: 8.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)31.79sWaktu respons (maks)50.78sWaktu respons (total)95.38s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)88.68sWaktu respons (maks)88.68sWaktu respons (total)88.68s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)56.76sWaktu respons (maks)56.76sWaktu respons (total)56.76s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 12Tidak mengikuti instruksi: 2Waktu respons (rata-rata)2.86sWaktu respons (maks)8.21sWaktu respons (total)57.24s…
Trik anti-AI
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)2.84sWaktu respons (maks)4.15sWaktu respons (total)11.35s
Pemrograman
: 4.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)2.58sWaktu respons (maks)3.93sWaktu respons (total)5.16s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.89sWaktu respons (maks)4.89sWaktu respons (total)4.89s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.47sWaktu respons (maks)2.48sWaktu respons (total)4.95s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)1.97sWaktu respons (maks)2.65sWaktu respons (total)5.92s
Kecerdasan umum
: 4.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.18sWaktu respons (maks)2.18sWaktu respons (total)2.18s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.13sWaktu respons (maks)2.53sWaktu respons (total)4.27s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)8.21sWaktu respons (maks)8.21sWaktu respons (total)8.21s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.37sWaktu respons (maks)2.37sWaktu respons (total)2.37s
Trik anti-AI
: 8.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 1Waktu respons (rata-rata)15.85sWaktu respons (maks)20.83sWaktu respons (total)47.55s
Pemrograman
: 4.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)7.20sWaktu respons (maks)13.03sWaktu respons (total)14.41s
Gabungan
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)75.68sWaktu respons (maks)75.68sWaktu respons (total)75.68s
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Spesifik domain
: 5.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)96.01sWaktu respons (maks)96.01sWaktu respons (total)96.01s
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.20sWaktu respons (maks)4.20sWaktu respons (total)4.20s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.28sWaktu respons (maks)7.37sWaktu respons (total)8.55s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.87sWaktu respons (maks)5.26sWaktu respons (total)7.74s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)27.78sWaktu respons (maks)27.78sWaktu respons (total)27.78s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.96sWaktu respons (maks)1.96sWaktu respons (total)1.96s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.20sWaktu respons (maks)9.64sWaktu respons (total)24.78s
Pemrograman
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Kedaluwarsa: 1Waktu respons (rata-rata)258.40sWaktu respons (maks)369.32sWaktu respons (total)516.79s
Gabungan
: 9.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)73.55sWaktu respons (maks)73.55sWaktu respons (total)73.55s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)16.51sWaktu respons (maks)20.57sWaktu respons (total)33.02s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Kedaluwarsa: 1Waktu respons (rata-rata)23.62sWaktu respons (maks)27.00sWaktu respons (total)47.23s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)29.76sWaktu respons (maks)29.76sWaktu respons (total)29.76s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)17.54sWaktu respons (maks)21.25sWaktu respons (total)35.08s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.79sWaktu respons (maks)6.85sWaktu respons (total)17.36s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.01sWaktu respons (maks)9.01sWaktu respons (total)9.01s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)180.87sWaktu respons (maks)180.87sWaktu respons (total)180.87s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 12Tidak mengikuti instruksi: 3Waktu respons (rata-rata)1.15sWaktu respons (maks)2.52sWaktu respons (total)23.09s…
Trik anti-AI
: 3.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)929msWaktu respons (maks)1.55sWaktu respons (total)3.72s
Pemrograman
: 6.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.01sWaktu respons (maks)1.19sWaktu respons (total)2.02s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.52sWaktu respons (maks)2.52sWaktu respons (total)2.52s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.30sWaktu respons (maks)1.58sWaktu respons (total)2.61s
Spesifik domain
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)937msWaktu respons (maks)1.25sWaktu respons (total)2.81s
Kecerdasan umum
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.82sWaktu respons (maks)1.82sWaktu respons (total)1.82s
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)728msWaktu respons (maks)731msWaktu respons (total)1.46s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.32sWaktu respons (maks)2.32sWaktu respons (total)2.32s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.33sWaktu respons (maks)1.33sWaktu respons (total)1.33s