Trik anti-AI
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)20.18sWaktu respons (maks)26.54sWaktu respons (total)80.73s
Pemrograman
: 4.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)17.13sWaktu respons (maks)24.90sWaktu respons (total)51.40s
Gabungan
: 4.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)111.96sWaktu respons (maks)111.96sWaktu respons (total)111.96s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)23.79sWaktu respons (maks)23.85sWaktu respons (total)47.57s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)19.73sWaktu respons (maks)27.66sWaktu respons (total)59.18s
Kecerdasan umum
: 4.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)23.74sWaktu respons (maks)23.74sWaktu respons (total)23.74s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 1Waktu respons (rata-rata)17.54sWaktu respons (maks)18.51sWaktu respons (total)35.08s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)77.93sWaktu respons (maks)77.93sWaktu respons (total)77.93s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.07sWaktu respons (maks)3.07sWaktu respons (total)3.07s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 15Waktu respons (rata-rata)13.18sWaktu respons (maks)42.13sWaktu respons (total)184.47sโฆ
Trik anti-AI
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)6.24sWaktu respons (maks)11.38sWaktu respons (total)12.48s
Pemrograman
: 5.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)24.56sWaktu respons (maks)38.78sWaktu respons (total)73.69s
Gabungan
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)19.16sWaktu respons (maks)19.16sWaktu respons (total)19.16s
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)42.13sWaktu respons (maks)42.13sWaktu respons (total)42.13s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)4.38sWaktu respons (maks)4.38sWaktu respons (total)4.38s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.00sWaktu respons (maks)4.00sWaktu respons (total)4.00s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.67sWaktu respons (maks)2.67sWaktu respons (total)2.67s
Pemecahan teka-teki
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)4.04sWaktu respons (maks)7.81sWaktu respons (total)8.08s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)13.99sWaktu respons (maks)13.99sWaktu respons (total)13.99s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.90sWaktu respons (maks)3.90sWaktu respons (total)3.90s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 11Tidak mengikuti instruksi: 4Waktu respons (rata-rata)1.78sWaktu respons (maks)8.32sWaktu respons (total)37.42sโฆ
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)3.54sWaktu respons (maks)3.54sWaktu respons (total)3.54s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.32sWaktu respons (maks)1.42sWaktu respons (total)2.64s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)877msWaktu respons (maks)904msWaktu respons (total)2.63s
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.58sWaktu respons (maks)2.58sWaktu respons (total)2.58s
Kepatuhan instruksi
: 6.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.03sWaktu respons (maks)1.10sWaktu respons (total)2.06s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.30sWaktu respons (maks)3.30sWaktu respons (total)3.30s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.89sWaktu respons (maks)1.89sWaktu respons (total)1.89s
Trik anti-AI
: 3.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)2.83sWaktu respons (maks)7.62sWaktu respons (total)11.33s
Pemrograman
: 5.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)4.16sWaktu respons (maks)10.18sWaktu respons (total)12.49s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)9.95sWaktu respons (maks)9.95sWaktu respons (total)9.95s
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.06sWaktu respons (maks)2.39sWaktu respons (total)4.11s
Spesifik domain
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.03sWaktu respons (maks)4.83sWaktu respons (total)9.08s
Kecerdasan umum
: 5.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.07sWaktu respons (maks)1.07sWaktu respons (total)1.07s
Kepatuhan instruksi
: 6.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.92sWaktu respons (maks)1.94sWaktu respons (total)3.83s
Pemanggilan alat
: 9.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.74sWaktu respons (maks)6.74sWaktu respons (total)6.74s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.03sWaktu respons (maks)4.03sWaktu respons (total)4.03s
Trik anti-AI
: 8.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.28sWaktu respons (maks)2.09sWaktu respons (total)5.13s
Pemrograman
: 3.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Kedaluwarsa: 1Waktu respons (rata-rata)4.16sWaktu respons (maks)7.07sWaktu respons (total)12.48s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)30.53sWaktu respons (maks)30.53sWaktu respons (total)30.53s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.70sWaktu respons (maks)2.21sWaktu respons (total)3.41s
Spesifik domain
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)2.49sWaktu respons (maks)4.23sWaktu respons (total)7.48s
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)3.54sWaktu respons (maks)3.54sWaktu respons (total)3.54s
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)690msWaktu respons (maks)878msWaktu respons (total)1.38s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)57.10sWaktu respons (maks)57.10sWaktu respons (total)57.10s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)778msWaktu respons (maks)778msWaktu respons (total)778ms
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 12Tidak mengikuti instruksi: 2Waktu respons (rata-rata)4.39sWaktu respons (maks)33.34sWaktu respons (total)92.26sโฆ
Trik anti-AI
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)1.88sWaktu respons (maks)4.81sWaktu respons (total)7.53s
Gabungan
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)13.32sWaktu respons (maks)13.32sWaktu respons (total)13.32s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.82sWaktu respons (maks)3.86sWaktu respons (total)5.65s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)4.43sWaktu respons (maks)10.83sWaktu respons (total)13.28s
Kecerdasan umum
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.41sWaktu respons (maks)1.41sWaktu respons (total)1.41s
Kepatuhan instruksi
: 6.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.17sWaktu respons (maks)1.33sWaktu respons (total)2.35s
Pemecahan teka-teki
: 6.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)1.97sWaktu respons (maks)3.43sWaktu respons (total)5.91s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.42sWaktu respons (maks)4.42sWaktu respons (total)4.42s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)33.34sWaktu respons (maks)33.34sWaktu respons (total)33.34s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 13Tidak mengikuti instruksi: 2Waktu respons (rata-rata)2.82sWaktu respons (maks)8.21sWaktu respons (total)59.29sโฆ
Trik anti-AI
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)2.84sWaktu respons (maks)4.15sWaktu respons (total)11.35s
Pemrograman
: 3.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)2.41sWaktu respons (maks)3.93sWaktu respons (total)7.22s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.89sWaktu respons (maks)4.89sWaktu respons (total)4.89s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.47sWaktu respons (maks)2.48sWaktu respons (total)4.95s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)1.97sWaktu respons (maks)2.65sWaktu respons (total)5.92s
Kecerdasan umum
: 4.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.18sWaktu respons (maks)2.18sWaktu respons (total)2.18s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.13sWaktu respons (maks)2.53sWaktu respons (total)4.27s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)8.21sWaktu respons (maks)8.21sWaktu respons (total)8.21s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.37sWaktu respons (maks)2.37sWaktu respons (total)2.37s
Pemrograman
: 4.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)623msWaktu respons (maks)1.34sWaktu respons (total)1.87s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.76sWaktu respons (maks)1.76sWaktu respons (total)1.76s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)768msWaktu respons (maks)824msWaktu respons (total)1.54s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)364msWaktu respons (maks)382msWaktu respons (total)1.09s
Kecerdasan umum
: 5.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)529msWaktu respons (maks)529msWaktu respons (total)529ms
Pemecahan teka-teki
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)1.01sWaktu respons (maks)1.92sWaktu respons (total)3.02s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.36sWaktu respons (maks)1.36sWaktu respons (total)1.36s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)254msWaktu respons (maks)254msWaktu respons (total)254ms
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 13Tidak mengikuti instruksi: 3Waktu respons (rata-rata)1.13sWaktu respons (maks)2.52sWaktu respons (total)23.82sโฆ
Trik anti-AI
: 3.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)929msWaktu respons (maks)1.55sWaktu respons (total)3.72s
Pemrograman
: 5.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)913msWaktu respons (maks)1.19sWaktu respons (total)2.74s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.52sWaktu respons (maks)2.52sWaktu respons (total)2.52s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.30sWaktu respons (maks)1.58sWaktu respons (total)2.61s
Spesifik domain
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)937msWaktu respons (maks)1.25sWaktu respons (total)2.81s
Kecerdasan umum
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.82sWaktu respons (maks)1.82sWaktu respons (total)1.82s
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)728msWaktu respons (maks)731msWaktu respons (total)1.46s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.32sWaktu respons (maks)2.32sWaktu respons (total)2.32s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.33sWaktu respons (maks)1.33sWaktu respons (total)1.33s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 13Tidak mengikuti instruksi: 2Waktu respons (rata-rata)3.41sWaktu respons (maks)46.00sWaktu respons (total)71.59sโฆ
Trik anti-AI
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)1.59sWaktu respons (maks)3.60sWaktu respons (total)6.38s
Pemrograman
: 3.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)2.77sWaktu respons (maks)4.03sWaktu respons (total)8.32s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)46.00sWaktu respons (maks)46.00sWaktu respons (total)46.00s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.01sWaktu respons (maks)1.06sWaktu respons (total)2.02s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)465msWaktu respons (maks)492msWaktu respons (total)1.39s
Kecerdasan umum
: 5.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.12sWaktu respons (maks)1.12sWaktu respons (total)1.12s
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)513msWaktu respons (maks)570msWaktu respons (total)1.03s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.04sWaktu respons (maks)2.04sWaktu respons (total)2.04s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)295msWaktu respons (maks)295msWaktu respons (total)295ms
Gabungan
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)115.89sWaktu respons (maks)115.89sWaktu respons (total)115.89s
Parsing dan ekstraksi data
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)9.42sWaktu respons (maks)16.20sWaktu respons (total)18.84s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Kesalahan API: 1Waktu respons (rata-rata)4.17sWaktu respons (maks)9.09sWaktu respons (total)12.51s
Kecerdasan umum
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)9.32sWaktu respons (maks)9.32sWaktu respons (total)9.32s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.52sWaktu respons (maks)1.99sWaktu respons (total)3.04s
Pemecahan teka-teki
: 7.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)6.91sWaktu respons (maks)10.09sWaktu respons (total)20.74s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)11.85sWaktu respons (maks)11.85sWaktu respons (total)11.85s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)17.23sWaktu respons (maks)17.23sWaktu respons (total)17.23s
Pemrograman
: 5.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Tidak ada jawaban: 1Waktu respons (rata-rata)101.89sWaktu respons (maks)196.21sWaktu respons (total)305.67s
Gabungan
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)41.03sWaktu respons (maks)41.03sWaktu respons (total)41.03s
Parsing dan ekstraksi data
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)21.95sWaktu respons (maks)24.88sWaktu respons (total)43.89s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 2Jawaban salah: 1Waktu respons (rata-rata)19.00sWaktu respons (maks)21.63sWaktu respons (total)38.01s
Kecerdasan umum
: 3.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)38.70sWaktu respons (maks)38.70sWaktu respons (total)38.70s
Pemanggilan alat
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)12.05sWaktu respons (maks)12.05sWaktu respons (total)12.05s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)22.77sWaktu respons (maks)22.77sWaktu respons (total)22.77s
Trik anti-AI
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)2.10sWaktu respons (maks)6.15sWaktu respons (total)8.41s
Pemrograman
: 5.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)8.77sWaktu respons (maks)22.52sWaktu respons (total)26.32s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.46sWaktu respons (maks)2.03sWaktu respons (total)2.93s
Spesifik domain
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)7.45sWaktu respons (maks)12.46sWaktu respons (total)22.35s
Kecerdasan umum
: 4.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.51sWaktu respons (maks)3.51sWaktu respons (total)3.51s
Kepatuhan instruksi
: 6.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.86sWaktu respons (maks)2.83sWaktu respons (total)3.73s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)414msWaktu respons (maks)414msWaktu respons (total)414ms
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 15Tidak mengikuti instruksi: 1Waktu respons (rata-rata)630msWaktu respons (maks)1.72sWaktu respons (total)13.22sโฆ
Trik anti-AI
: 3.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)395msWaktu respons (maks)769msWaktu respons (total)1.58s
Pemrograman
: 3.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)901msWaktu respons (maks)1.28sWaktu respons (total)2.70s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.72sWaktu respons (maks)1.72sWaktu respons (total)1.72s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)822msWaktu respons (maks)1.08sWaktu respons (total)1.64s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)367msWaktu respons (maks)388msWaktu respons (total)1.10s
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)729msWaktu respons (maks)729msWaktu respons (total)729ms
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)380msWaktu respons (maks)380msWaktu respons (total)759ms
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.40sWaktu respons (maks)1.40sWaktu respons (total)1.40s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)397msWaktu respons (maks)397msWaktu respons (total)397ms
Pemrograman
: 4.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)2.22sWaktu respons (maks)3.14sWaktu respons (total)6.67s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)45.14sWaktu respons (maks)45.14sWaktu respons (total)45.14s
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.32sWaktu respons (maks)1.32sWaktu respons (total)1.32s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)962msWaktu respons (maks)962msWaktu respons (total)962ms
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.34sWaktu respons (maks)1.34sWaktu respons (total)1.34s
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)7.78sWaktu respons (maks)14.65sWaktu respons (total)15.56s
Pemecahan teka-teki
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)24.34sWaktu respons (maks)42.58sWaktu respons (total)48.69s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.47sWaktu respons (maks)2.47sWaktu respons (total)2.47s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)601msWaktu respons (maks)601msWaktu respons (total)601ms
Trik anti-AI
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 2Jawaban salah: 2Waktu respons (rata-rata)22.48sWaktu respons (maks)51.34sWaktu respons (total)89.90s
Pemrograman
: 3.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)21.96sWaktu respons (maks)44.81sWaktu respons (total)65.89s
Gabungan
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)159.85sWaktu respons (maks)159.85sWaktu respons (total)159.85s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)28.00sWaktu respons (maks)42.87sWaktu respons (total)55.99s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)14.73sWaktu respons (maks)32.97sWaktu respons (total)44.19s
Kecerdasan umum
: 3.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)34.77sWaktu respons (maks)34.77sWaktu respons (total)34.77s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)30.68sWaktu respons (maks)37.37sWaktu respons (total)61.35s
Pemanggilan alat
: 9.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.64sWaktu respons (maks)3.64sWaktu respons (total)3.64s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)37.37sWaktu respons (maks)37.37sWaktu respons (total)37.37s
Trik anti-AI
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)4.75sWaktu respons (maks)7.62sWaktu respons (total)19.00s
Pemrograman
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Gabungan
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Waktu respons (rata-rata)30.53sWaktu respons (maks)30.53sWaktu respons (total)30.53s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)23.16sWaktu respons (maks)26.55sWaktu respons (total)46.33s
Kecerdasan umum
: 7.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)6.44sWaktu respons (maks)6.44sWaktu respons (total)6.44s
Kepatuhan instruksi
: 9.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.18sWaktu respons (maks)4.46sWaktu respons (total)8.36s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)17.33sWaktu respons (maks)17.33sWaktu respons (total)17.33s
Pengetahuan umum
: 0.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Trik anti-AI
: 5.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)2.67sWaktu respons (maks)5.03sWaktu respons (total)10.66s
Pemrograman
: 4.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)39.98sWaktu respons (maks)59.15sWaktu respons (total)119.95s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)25.25sWaktu respons (maks)25.25sWaktu respons (total)25.25s
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)1.23sWaktu respons (maks)1.96sWaktu respons (total)2.46s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Jawaban salah: 1Waktu respons (rata-rata)6.11sWaktu respons (maks)13.72sWaktu respons (total)18.34s
Kecerdasan umum
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.05sWaktu respons (maks)2.05sWaktu respons (total)2.05s
Kepatuhan instruksi
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.38sWaktu respons (maks)1.61sWaktu respons (total)2.75s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.50sWaktu respons (maks)3.50sWaktu respons (total)3.50s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)5.92sWaktu respons (maks)5.92sWaktu respons (total)5.92s
Trik anti-AI
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)2.19sWaktu respons (maks)6.85sWaktu respons (total)8.74s
Pemrograman
: 5.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)3.24sWaktu respons (maks)5.52sWaktu respons (total)9.72s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.36sWaktu respons (maks)2.36sWaktu respons (total)2.36s
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 1Waktu respons (rata-rata)1.01sWaktu respons (maks)1.18sWaktu respons (total)2.03s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)756msWaktu respons (maks)877msWaktu respons (total)2.27s
Kecerdasan umum
: 4.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)6.86sWaktu respons (maks)6.86sWaktu respons (total)6.86s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)751msWaktu respons (maks)821msWaktu respons (total)1.50s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.43sWaktu respons (maks)2.43sWaktu respons (total)2.43s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.89sWaktu respons (maks)3.89sWaktu respons (total)3.89s
Trik anti-AI
: 3.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)1.71sWaktu respons (maks)3.79sWaktu respons (total)6.84s
Pemrograman
: 3.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)5.60sWaktu respons (maks)6.03sWaktu respons (total)16.81s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)5.91sWaktu respons (maks)5.91sWaktu respons (total)5.91s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)847msWaktu respons (maks)1.09sWaktu respons (total)1.69s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)464msWaktu respons (maks)622msWaktu respons (total)1.39s
Kecerdasan umum
: 4.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)552msWaktu respons (maks)552msWaktu respons (total)552ms
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)514msWaktu respons (maks)582msWaktu respons (total)1.03s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.27sWaktu respons (maks)1.27sWaktu respons (total)1.27s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.32sWaktu respons (maks)2.32sWaktu respons (total)2.32s
Trik anti-AI
: 6.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 1Jawaban salah: 1Waktu respons (rata-rata)3.46sWaktu respons (maks)4.38sWaktu respons (total)13.86s
Pemrograman
: 3.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)27.11sWaktu respons (maks)27.11sWaktu respons (total)27.11s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.54sWaktu respons (maks)7.51sWaktu respons (total)11.08s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Format tambahan: 1Waktu respons (rata-rata)24.67sWaktu respons (maks)35.28sWaktu respons (total)74.02s
Kecerdasan umum
: 5.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)6.40sWaktu respons (maks)6.40sWaktu respons (total)6.40s
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.52sWaktu respons (maks)3.80sWaktu respons (total)7.04s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Pengetahuan umum
: 0.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Trik anti-AI
: 3.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)2.07sWaktu respons (maks)4.40sWaktu respons (total)8.30s
Pemrograman
: 3.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 2Jawaban salah: 1Waktu respons (rata-rata)14.34sWaktu respons (maks)14.34sWaktu respons (total)14.34s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)8.91sWaktu respons (maks)8.91sWaktu respons (total)8.91s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.26sWaktu respons (maks)4.66sWaktu respons (total)6.52s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)877msWaktu respons (maks)894msWaktu respons (total)2.63s
Kecerdasan umum
: 4.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)873msWaktu respons (maks)873msWaktu respons (total)873ms
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.67sWaktu respons (maks)6.67sWaktu respons (total)6.67s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)777msWaktu respons (maks)777msWaktu respons (total)777ms
Trik anti-AI
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Jawaban salah: 1Waktu respons (rata-rata)4.87sWaktu respons (maks)6.30sWaktu respons (total)14.62s
Pemrograman
: 1.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)35.61sWaktu respons (maks)35.61sWaktu respons (total)35.61s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)53.14sWaktu respons (maks)53.14sWaktu respons (total)53.14s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.93sWaktu respons (maks)5.03sWaktu respons (total)9.86s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)24.14sWaktu respons (maks)45.83sWaktu respons (total)72.43s
Kecerdasan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.30sWaktu respons (maks)6.00sWaktu respons (total)8.59s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.31sWaktu respons (maks)6.31sWaktu respons (total)6.31s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 15Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.77sWaktu respons (maks)7.58sWaktu respons (total)24.80sโฆ
Trik anti-AI
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)1.34sWaktu respons (maks)1.83sWaktu respons (total)2.67s
Pemrograman
: 3.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)1.63sWaktu respons (maks)2.55sWaktu respons (total)4.90s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)7.58sWaktu respons (maks)7.58sWaktu respons (total)7.58s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.27sWaktu respons (maks)1.27sWaktu respons (total)1.27s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)637msWaktu respons (maks)637msWaktu respons (total)637ms
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)909msWaktu respons (maks)909msWaktu respons (total)909ms
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.11sWaktu respons (maks)1.11sWaktu respons (total)1.11s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.51sWaktu respons (maks)2.51sWaktu respons (total)2.51s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)794msWaktu respons (maks)794msWaktu respons (total)794ms
Trik anti-AI
: 8.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)10.00sWaktu respons (maks)11.53sWaktu respons (total)39.99s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)47.38sWaktu respons (maks)47.38sWaktu respons (total)47.38s
Parsing dan ekstraksi data
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)17.36sWaktu respons (maks)26.57sWaktu respons (total)34.71s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)128.15sWaktu respons (maks)309.02sWaktu respons (total)384.46s
Kecerdasan umum
: 4.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)23.23sWaktu respons (maks)23.23sWaktu respons (total)23.23s
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)11.60sWaktu respons (maks)14.49sWaktu respons (total)23.20s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)11.19sWaktu respons (maks)11.19sWaktu respons (total)11.19s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)36.98sWaktu respons (maks)36.98sWaktu respons (total)36.98s
Trik anti-AI
: 5.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)5.51sWaktu respons (maks)6.59sWaktu respons (total)11.02s
Pemrograman
: 4.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)2.54sWaktu respons (maks)5.57sWaktu respons (total)7.62s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)3.22sWaktu respons (maks)3.22sWaktu respons (total)3.22s
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.82sWaktu respons (maks)4.82sWaktu respons (total)4.82s
Spesifik domain
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)744msWaktu respons (maks)744msWaktu respons (total)744ms
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.59sWaktu respons (maks)1.59sWaktu respons (total)1.59s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)888msWaktu respons (maks)888msWaktu respons (total)888ms
Pemanggilan alat
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)7.05sWaktu respons (maks)7.05sWaktu respons (total)7.05s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)692msWaktu respons (maks)692msWaktu respons (total)692ms
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 14Tidak mengikuti instruksi: 2Waktu respons (rata-rata)5.30sWaktu respons (maks)16.45sWaktu respons (total)111.31sโฆ
Trik anti-AI
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)4.46sWaktu respons (maks)9.94sWaktu respons (total)17.83s
Pemrograman
: 3.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)2.64sWaktu respons (maks)3.05sWaktu respons (total)7.92s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)16.45sWaktu respons (maks)16.45sWaktu respons (total)16.45s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.92sWaktu respons (maks)13.23sWaktu respons (total)15.84s
Spesifik domain
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)6.23sWaktu respons (maks)14.38sWaktu respons (total)18.70s
Kecerdasan umum
: 4.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)950msWaktu respons (maks)950msWaktu respons (total)950ms
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)804msWaktu respons (maks)921msWaktu respons (total)1.61s
Pemanggilan alat
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)16.00sWaktu respons (maks)16.00sWaktu respons (total)16.00s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)8.94sWaktu respons (maks)8.94sWaktu respons (total)8.94s
Pemrograman
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 2Waktu respons (rata-rata)11.21sWaktu respons (maks)11.21sWaktu respons (total)11.21s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)35.34sWaktu respons (maks)35.34sWaktu respons (total)35.34s
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)8.48sWaktu respons (maks)12.71sWaktu respons (total)16.96s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)4.95sWaktu respons (maks)7.65sWaktu respons (total)14.84s
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.45sWaktu respons (maks)1.45sWaktu respons (total)1.45s
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.52sWaktu respons (maks)8.19sWaktu respons (total)11.04s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)18.80sWaktu respons (maks)18.80sWaktu respons (total)18.80s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.06sWaktu respons (maks)1.06sWaktu respons (total)1.06s
Trik anti-AI
: 9.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)43.33sWaktu respons (maks)71.76sWaktu respons (total)173.31s
Pemrograman
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 2Waktu respons (rata-rata)143.82sWaktu respons (maks)143.82sWaktu respons (total)143.82s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)73.40sWaktu respons (maks)90.09sWaktu respons (total)220.20s
Kecerdasan umum
: 4.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)15.63sWaktu respons (maks)15.63sWaktu respons (total)15.63s
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)27.36sWaktu respons (maks)40.24sWaktu respons (total)54.72s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)31.47sWaktu respons (maks)46.84sWaktu respons (total)94.41s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)133.60sWaktu respons (maks)133.60sWaktu respons (total)133.60s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 15Tidak mengikuti instruksi: 2Waktu respons (rata-rata)1.48sWaktu respons (maks)4.47sWaktu respons (total)31.01sโฆ
Trik anti-AI
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)1.18sWaktu respons (maks)1.81sWaktu respons (total)4.70s
Pemrograman
: 4.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)2.22sWaktu respons (maks)4.47sWaktu respons (total)6.65s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.84sWaktu respons (maks)3.84sWaktu respons (total)3.84s
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.11sWaktu respons (maks)1.25sWaktu respons (total)2.23s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)926msWaktu respons (maks)959msWaktu respons (total)2.78s
Kecerdasan umum
: 3.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.31sWaktu respons (maks)1.31sWaktu respons (total)1.31s
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)784msWaktu respons (maks)859msWaktu respons (total)1.57s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.40sWaktu respons (maks)3.40sWaktu respons (total)3.40s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)773msWaktu respons (maks)773msWaktu respons (total)773ms