Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)34.99sWaktu respons (maks)109.60sWaktu respons (total)139.95s
Pemrograman
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Parsing dan ekstraksi data
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Spesifik domain
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)34.54sWaktu respons (maks)34.54sWaktu respons (total)34.54s
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)14.37sWaktu respons (maks)14.37sWaktu respons (total)14.37s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.30sWaktu respons (maks)9.30sWaktu respons (total)9.30s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)114.12sWaktu respons (maks)114.12sWaktu respons (total)114.12s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)37.88sWaktu respons (maks)332.10sWaktu respons (total)757.66s…
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.66sWaktu respons (maks)6.74sWaktu respons (total)18.65s
Pemrograman
: 8.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)69.68sWaktu respons (maks)130.26sWaktu respons (total)139.35s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)19.29sWaktu respons (maks)19.29sWaktu respons (total)19.29s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.18sWaktu respons (maks)4.35sWaktu respons (total)8.36s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)164.14sWaktu respons (maks)332.10sWaktu respons (total)492.41s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.16sWaktu respons (maks)4.16sWaktu respons (total)4.16s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.36sWaktu respons (maks)3.46sWaktu respons (total)6.73s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.76sWaktu respons (maks)10.54sWaktu respons (total)20.28s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)10.57sWaktu respons (maks)10.57sWaktu respons (total)10.57s
Pengetahuan umum
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)37.86sWaktu respons (maks)37.86sWaktu respons (total)37.86s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Kedaluwarsa: 1Waktu respons (rata-rata)36.84sWaktu respons (maks)178.04sWaktu respons (total)736.86s…
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)8.58sWaktu respons (maks)12.75sWaktu respons (total)34.33s
Pemrograman
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Waktu respons (rata-rata)122.40sWaktu respons (maks)178.04sWaktu respons (total)244.81s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)65.24sWaktu respons (maks)65.24sWaktu respons (total)65.24s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)21.75sWaktu respons (maks)23.18sWaktu respons (total)43.49s
Spesifik domain
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)45.35sWaktu respons (maks)88.89sWaktu respons (total)136.04s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)25.48sWaktu respons (maks)25.48sWaktu respons (total)25.48s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)16.13sWaktu respons (maks)17.18sWaktu respons (total)32.26s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)16.38sWaktu respons (maks)19.42sWaktu respons (total)49.14s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)15.02sWaktu respons (maks)15.02sWaktu respons (total)15.02s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)91.07sWaktu respons (maks)91.07sWaktu respons (total)91.07s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 5Tidak mengikuti instruksi: 2Waktu respons (rata-rata)36.67sWaktu respons (maks)168.71sWaktu respons (total)733.46s…
Trik anti-AI
: 8.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)17.99sWaktu respons (maks)48.33sWaktu respons (total)71.98s
Pemrograman
: 7.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)107.65sWaktu respons (maks)140.81sWaktu respons (total)215.30s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)37.67sWaktu respons (maks)37.67sWaktu respons (total)37.67s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.07sWaktu respons (maks)12.19sWaktu respons (total)18.14s
Spesifik domain
: 5.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)88.74sWaktu respons (maks)168.71sWaktu respons (total)266.21s
Kecerdasan umum
: 6.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)18.25sWaktu respons (maks)18.25sWaktu respons (total)18.25s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.26sWaktu respons (maks)9.02sWaktu respons (total)14.52s
Pemecahan teka-teki
: 9.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)10.23sWaktu respons (maks)11.54sWaktu respons (total)30.68s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)12.38sWaktu respons (maks)12.38sWaktu respons (total)12.38s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)48.32sWaktu respons (maks)48.32sWaktu respons (total)48.32s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)12.89sWaktu respons (maks)26.66sWaktu respons (total)51.55s
Pemrograman
: 4.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Kedaluwarsa: 1Waktu respons (rata-rata)110.94sWaktu respons (maks)150.90sWaktu respons (total)221.87s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)21.11sWaktu respons (maks)21.94sWaktu respons (total)42.21s
Spesifik domain
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)38.48sWaktu respons (maks)68.92sWaktu respons (total)115.43s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.57sWaktu respons (maks)9.57sWaktu respons (total)9.57s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)12.76sWaktu respons (maks)17.53sWaktu respons (total)25.52s
Pemecahan teka-teki
: 9.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)26.91sWaktu respons (maks)61.08sWaktu respons (total)80.72s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)90.14sWaktu respons (maks)90.14sWaktu respons (total)90.14s
Pemrograman
: 3.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Kedaluwarsa: 1Waktu respons (rata-rata)55.33sWaktu respons (maks)89.40sWaktu respons (total)110.66s
Gabungan
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)65.57sWaktu respons (maks)65.57sWaktu respons (total)65.57s
Parsing dan ekstraksi data
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)1.51sWaktu respons (maks)1.51sWaktu respons (total)1.51s
Kecerdasan umum
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)18.14sWaktu respons (maks)18.14sWaktu respons (total)18.14s
Kepatuhan instruksi
: 6.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.97sWaktu respons (maks)2.97sWaktu respons (total)2.97s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)15.95sWaktu respons (maks)15.95sWaktu respons (total)15.95s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)11.13sWaktu respons (maks)11.13sWaktu respons (total)11.13s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)8.31sWaktu respons (maks)14.20sWaktu respons (total)33.24s
Pemrograman
: 4.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Kedaluwarsa: 1Waktu respons (rata-rata)145.56sWaktu respons (maks)172.60sWaktu respons (total)291.12s
Gabungan
: 9.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)43.11sWaktu respons (maks)43.11sWaktu respons (total)43.11s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.33sWaktu respons (maks)9.40sWaktu respons (total)18.66s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)29.77sWaktu respons (maks)32.22sWaktu respons (total)89.30s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)20.95sWaktu respons (maks)20.95sWaktu respons (total)20.95s
Kepatuhan instruksi
: 6.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)7.47sWaktu respons (maks)10.16sWaktu respons (total)14.94s
Pemecahan teka-teki
: 8.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)31.64sWaktu respons (maks)46.04sWaktu respons (total)94.91s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)29.40sWaktu respons (maks)29.40sWaktu respons (total)29.40s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)23.66sWaktu respons (maks)25.06sWaktu respons (total)47.32s
Pemrograman
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)89.47sWaktu respons (maks)99.85sWaktu respons (total)178.93s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)28.96sWaktu respons (maks)28.96sWaktu respons (total)28.96s
Parsing dan ekstraksi data
: 7.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)8.90sWaktu respons (maks)8.90sWaktu respons (total)8.90s
Spesifik domain
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Kedaluwarsa: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Kecerdasan umum
: 6.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)14.69sWaktu respons (maks)14.69sWaktu respons (total)14.69s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.25sWaktu respons (maks)7.25sWaktu respons (total)7.25s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)11.33sWaktu respons (maks)16.34sWaktu respons (total)22.66s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)15.93sWaktu respons (maks)15.93sWaktu respons (total)15.93s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)67.37sWaktu respons (maks)67.37sWaktu respons (total)67.37s
Pemrograman
: 6.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)54.73sWaktu respons (maks)91.27sWaktu respons (total)109.46s
Gabungan
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)41.03sWaktu respons (maks)41.03sWaktu respons (total)41.03s
Parsing dan ekstraksi data
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)21.95sWaktu respons (maks)24.88sWaktu respons (total)43.89s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 2Jawaban salah: 1Waktu respons (rata-rata)19.00sWaktu respons (maks)21.63sWaktu respons (total)38.01s
Kecerdasan umum
: 3.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)38.70sWaktu respons (maks)38.70sWaktu respons (total)38.70s
Pemanggilan alat
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)12.05sWaktu respons (maks)12.05sWaktu respons (total)12.05s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)22.77sWaktu respons (maks)22.77sWaktu respons (total)22.77s
Trik anti-AI
: 8.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)6.30sWaktu respons (maks)9.80sWaktu respons (total)25.20s
Pemrograman
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)21.41sWaktu respons (maks)21.41sWaktu respons (total)21.41s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Kecerdasan umum
: 4.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)12.47sWaktu respons (maks)12.47sWaktu respons (total)12.47s
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.36sWaktu respons (maks)11.05sWaktu respons (total)14.73s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)36.09sWaktu respons (maks)36.09sWaktu respons (total)36.09s
Trik anti-AI
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)20.18sWaktu respons (maks)26.54sWaktu respons (total)80.73s
Pemrograman
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)24.47sWaktu respons (maks)24.90sWaktu respons (total)48.94s
Gabungan
: 4.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)111.96sWaktu respons (maks)111.96sWaktu respons (total)111.96s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)23.79sWaktu respons (maks)23.85sWaktu respons (total)47.57s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)19.73sWaktu respons (maks)27.66sWaktu respons (total)59.18s
Kecerdasan umum
: 4.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)23.74sWaktu respons (maks)23.74sWaktu respons (total)23.74s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 1Waktu respons (rata-rata)17.54sWaktu respons (maks)18.51sWaktu respons (total)35.08s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)77.93sWaktu respons (maks)77.93sWaktu respons (total)77.93s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.07sWaktu respons (maks)3.07sWaktu respons (total)3.07s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.90sWaktu respons (maks)19.37sWaktu respons (total)39.60s
Pemrograman
: 4.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Jawaban salah: 1Waktu respons (rata-rata)201.68sWaktu respons (maks)201.68sWaktu respons (total)201.68s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)34.95sWaktu respons (maks)34.95sWaktu respons (total)34.95s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)14.95sWaktu respons (maks)15.40sWaktu respons (total)29.90s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)29.59sWaktu respons (maks)43.55sWaktu respons (total)88.77s
Kecerdasan umum
: 5.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)27.05sWaktu respons (maks)27.05sWaktu respons (total)27.05s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.54sWaktu respons (maks)11.67sWaktu respons (total)15.07s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.34sWaktu respons (maks)7.52sWaktu respons (total)19.03s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.87sWaktu respons (maks)5.87sWaktu respons (total)5.87s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)47.51sWaktu respons (maks)47.51sWaktu respons (total)47.51s
Trik anti-AI
: 6.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 2Waktu respons (rata-rata)7.45sWaktu respons (maks)11.88sWaktu respons (total)14.90s
Pemrograman
: 7.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)29.37sWaktu respons (maks)35.63sWaktu respons (total)58.74s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)76.66sWaktu respons (maks)76.66sWaktu respons (total)76.66s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.37sWaktu respons (maks)7.37sWaktu respons (total)7.37s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 2Jawaban salah: 1Waktu respons (rata-rata)83.40sWaktu respons (maks)83.40sWaktu respons (total)83.40s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.04sWaktu respons (maks)5.04sWaktu respons (total)5.04s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.43sWaktu respons (maks)2.43sWaktu respons (total)2.43s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.71sWaktu respons (maks)4.75sWaktu respons (total)9.41s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.73sWaktu respons (maks)9.73sWaktu respons (total)9.73s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)63.24sWaktu respons (maks)63.24sWaktu respons (total)63.24s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 6Jawaban salah: 4Waktu respons (rata-rata)24.56sWaktu respons (maks)78.74sWaktu respons (total)368.35s…
Trik anti-AI
: 8.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)9.32sWaktu respons (maks)12.36sWaktu respons (total)27.96s
Pemrograman
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)27.94sWaktu respons (maks)27.94sWaktu respons (total)27.94s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)78.74sWaktu respons (maks)78.74sWaktu respons (total)78.74s
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)5.85sWaktu respons (maks)5.85sWaktu respons (total)5.85s
Spesifik domain
: 5.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)40.44sWaktu respons (maks)46.32sWaktu respons (total)121.31s
Kecerdasan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)15.98sWaktu respons (maks)22.24sWaktu respons (total)31.97s
Pemanggilan alat
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)17.84sWaktu respons (maks)17.84sWaktu respons (total)17.84s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)41.74sWaktu respons (maks)41.74sWaktu respons (total)41.74s
Trik anti-AI
: 8.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.81sWaktu respons (maks)5.65sWaktu respons (total)7.62s
Pemrograman
: 2.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)23.58sWaktu respons (maks)23.58sWaktu respons (total)23.58s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)37.64sWaktu respons (maks)37.64sWaktu respons (total)37.64s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.63sWaktu respons (maks)6.63sWaktu respons (total)6.63s
Spesifik domain
: 5.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)121.79sWaktu respons (maks)121.79sWaktu respons (total)121.79s
Kecerdasan umum
: 4.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)16.25sWaktu respons (maks)16.25sWaktu respons (total)16.25s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.63sWaktu respons (maks)4.63sWaktu respons (total)4.63s
Pemanggilan alat
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)27.71sWaktu respons (maks)27.71sWaktu respons (total)27.71s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)25.52sWaktu respons (maks)25.52sWaktu respons (total)25.52s
Pemrograman
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)30.74sWaktu respons (maks)38.31sWaktu respons (total)61.49s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)88.15sWaktu respons (maks)88.15sWaktu respons (total)88.15s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)12.58sWaktu respons (maks)13.87sWaktu respons (total)25.16s
Spesifik domain
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Kedaluwarsa: 1Waktu respons (rata-rata)44.63sWaktu respons (maks)82.55sWaktu respons (total)133.89s
Kecerdasan umum
: 4.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)13.50sWaktu respons (maks)13.50sWaktu respons (total)13.50s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)11.59sWaktu respons (maks)13.66sWaktu respons (total)23.18s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)18.64sWaktu respons (maks)18.64sWaktu respons (total)18.64s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)9.99sWaktu respons (maks)9.99sWaktu respons (total)9.99s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.82sWaktu respons (maks)7.69sWaktu respons (total)19.26s
Pemrograman
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)53.92sWaktu respons (maks)95.57sWaktu respons (total)107.83s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)13.88sWaktu respons (maks)13.88sWaktu respons (total)13.88s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.19sWaktu respons (maks)6.42sWaktu respons (total)12.38s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Kedaluwarsa: 1Waktu respons (rata-rata)71.07sWaktu respons (maks)194.23sWaktu respons (total)213.22s
Kecerdasan umum
: 6.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)10.05sWaktu respons (maks)10.05sWaktu respons (total)10.05s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.38sWaktu respons (maks)5.70sWaktu respons (total)10.77s
Pemecahan teka-teki
: 8.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)5.23sWaktu respons (maks)7.26sWaktu respons (total)15.69s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.84sWaktu respons (maks)9.84sWaktu respons (total)9.84s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)40.17sWaktu respons (maks)40.17sWaktu respons (total)40.17s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 9Tidak mengikuti instruksi: 3Waktu respons (rata-rata)22.41sWaktu respons (maks)68.16sWaktu respons (total)291.35s…
Pemrograman
: 3.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)47.24sWaktu respons (maks)68.16sWaktu respons (total)94.49s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)31.18sWaktu respons (maks)31.18sWaktu respons (total)31.18s
Parsing dan ekstraksi data
: 6.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.98sWaktu respons (maks)1.98sWaktu respons (total)1.98s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)50.92sWaktu respons (maks)50.92sWaktu respons (total)50.92s
Kecerdasan umum
: 4.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)7.90sWaktu respons (maks)7.90sWaktu respons (total)7.90s
Kepatuhan instruksi
: 9.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.63sWaktu respons (maks)7.63sWaktu respons (total)7.63s
Pemanggilan alat
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.91sWaktu respons (maks)6.91sWaktu respons (total)6.91s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)26.51sWaktu respons (maks)26.51sWaktu respons (total)26.51s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 5Tidak mengikuti instruksi: 2Waktu respons (rata-rata)22.31sWaktu respons (maks)100.41sWaktu respons (total)446.17s…
Trik anti-AI
: 8.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.11sWaktu respons (maks)6.42sWaktu respons (total)16.42s
Pemrograman
: 8.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)54.98sWaktu respons (maks)96.94sWaktu respons (total)109.96s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)20.57sWaktu respons (maks)20.57sWaktu respons (total)20.57s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.32sWaktu respons (maks)5.40sWaktu respons (total)10.64s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)74.27sWaktu respons (maks)100.41sWaktu respons (total)222.80s
Kecerdasan umum
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.92sWaktu respons (maks)4.92sWaktu respons (total)4.92s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.11sWaktu respons (maks)3.68sWaktu respons (total)6.22s
Pemecahan teka-teki
: 8.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)9.14sWaktu respons (maks)18.14sWaktu respons (total)27.41s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)13.28sWaktu respons (maks)13.28sWaktu respons (total)13.28s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)13.95sWaktu respons (maks)13.95sWaktu respons (total)13.95s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.86sWaktu respons (maks)3.92sWaktu respons (total)11.45s
Pemrograman
: 7.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)94.21sWaktu respons (maks)136.29sWaktu respons (total)188.41s
Gabungan
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)64.71sWaktu respons (maks)64.71sWaktu respons (total)64.71s
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)17.20sWaktu respons (maks)17.44sWaktu respons (total)34.40s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)8.82sWaktu respons (maks)14.48sWaktu respons (total)26.47s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.92sWaktu respons (maks)4.92sWaktu respons (total)4.92s
Kepatuhan instruksi
: 9.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.36sWaktu respons (maks)4.35sWaktu respons (total)6.72s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)8.19sWaktu respons (maks)8.19sWaktu respons (total)8.19s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)82.71sWaktu respons (maks)82.71sWaktu respons (total)82.71s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 6Tidak mengikuti instruksi: 3Waktu respons (rata-rata)22.10sWaktu respons (maks)138.75sWaktu respons (total)442.09s…
Trik anti-AI
: 8.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.05sWaktu respons (maks)6.69sWaktu respons (total)16.20s
Pemrograman
: 7.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)73.25sWaktu respons (maks)138.75sWaktu respons (total)146.51s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)17.81sWaktu respons (maks)17.81sWaktu respons (total)17.81s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.43sWaktu respons (maks)3.39sWaktu respons (total)4.87s
Spesifik domain
: 4.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)65.31sWaktu respons (maks)102.91sWaktu respons (total)195.92s
Kecerdasan umum
: 4.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)3.72sWaktu respons (maks)3.72sWaktu respons (total)3.72s
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.13sWaktu respons (maks)2.45sWaktu respons (total)4.25s
Pemecahan teka-teki
: 7.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.37sWaktu respons (maks)7.27sWaktu respons (total)13.11s
Pemanggilan alat
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)9.62sWaktu respons (maks)9.62sWaktu respons (total)9.62s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)30.10sWaktu respons (maks)30.10sWaktu respons (total)30.10s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.26sWaktu respons (maks)6.38sWaktu respons (total)13.06s
Pemrograman
: 7.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 1Waktu respons (rata-rata)81.67sWaktu respons (maks)130.77sWaktu respons (total)163.34s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)53.36sWaktu respons (maks)53.36sWaktu respons (total)53.36s
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)18.81sWaktu respons (maks)20.29sWaktu respons (total)37.61s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 2Waktu respons (rata-rata)37.87sWaktu respons (maks)84.22sWaktu respons (total)113.60s
Kecerdasan umum
: 5.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.02sWaktu respons (maks)4.02sWaktu respons (total)4.02s
Kepatuhan instruksi
: 9.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.77sWaktu respons (maks)3.21sWaktu respons (total)5.54s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)16.87sWaktu respons (maks)16.87sWaktu respons (total)16.87s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)12.46sWaktu respons (maks)12.46sWaktu respons (total)12.46s
Pemrograman
: 4.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)9.57sWaktu respons (maks)9.57sWaktu respons (total)9.57s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)7.12sWaktu respons (maks)7.12sWaktu respons (total)7.12s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)34.98sWaktu respons (maks)68.97sWaktu respons (total)104.94s
Kecerdasan umum
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)10.79sWaktu respons (maks)10.79sWaktu respons (total)10.79s
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.06sWaktu respons (maks)5.85sWaktu respons (total)10.12s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)47.29sWaktu respons (maks)47.29sWaktu respons (total)47.29s
Trik anti-AI
: 8.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)7.85sWaktu respons (maks)22.30sWaktu respons (total)31.40s
Pemrograman
: 3.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 2Waktu respons (rata-rata)62.38sWaktu respons (maks)62.38sWaktu respons (total)62.38s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)87.80sWaktu respons (maks)87.80sWaktu respons (total)87.80s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)18.16sWaktu respons (maks)20.65sWaktu respons (total)36.33s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Kedaluwarsa: 1Waktu respons (rata-rata)16.19sWaktu respons (maks)21.56sWaktu respons (total)32.39s
Kecerdasan umum
: 4.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)6.91sWaktu respons (maks)6.91sWaktu respons (total)6.91s
Kepatuhan instruksi
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)6.97sWaktu respons (maks)11.23sWaktu respons (total)13.95s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)39.75sWaktu respons (maks)39.75sWaktu respons (total)39.75s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)55.32sWaktu respons (maks)55.32sWaktu respons (total)55.32s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)20.77sWaktu respons (maks)88.68sWaktu respons (total)269.96s…
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.90sWaktu respons (maks)9.52sWaktu respons (total)15.80s
Pemrograman
: 7.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)54.28sWaktu respons (maks)88.68sWaktu respons (total)108.56s
Gabungan
: 9.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)40.61sWaktu respons (maks)40.61sWaktu respons (total)40.61s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.72sWaktu respons (maks)7.72sWaktu respons (total)7.72s
Spesifik domain
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)32.73sWaktu respons (maks)32.73sWaktu respons (total)32.73s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)11.77sWaktu respons (maks)11.77sWaktu respons (total)11.77s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.56sWaktu respons (maks)9.56sWaktu respons (total)9.56s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.90sWaktu respons (maks)8.49sWaktu respons (total)13.79s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)23.15sWaktu respons (maks)23.15sWaktu respons (total)23.15s
Pengetahuan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.27sWaktu respons (maks)6.27sWaktu respons (total)6.27s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.14sWaktu respons (maks)12.41sWaktu respons (total)16.57s
Pemrograman
: 6.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)64.48sWaktu respons (maks)97.49sWaktu respons (total)128.97s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)16.86sWaktu respons (maks)16.86sWaktu respons (total)16.86s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 1Jawaban salah: 1Waktu respons (rata-rata)34.53sWaktu respons (maks)86.93sWaktu respons (total)103.59s
Kecerdasan umum
: 5.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)5.37sWaktu respons (maks)5.37sWaktu respons (total)5.37s
Kepatuhan instruksi
: 9.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.80sWaktu respons (maks)1.81sWaktu respons (total)3.60s
Pemecahan teka-teki
: 8.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)20.25sWaktu respons (maks)57.93sWaktu respons (total)60.76s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.29sWaktu respons (maks)7.29sWaktu respons (total)7.29s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)51.29sWaktu respons (maks)51.29sWaktu respons (total)51.29s
Trik anti-AI
: 8.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 1Waktu respons (rata-rata)15.85sWaktu respons (maks)20.83sWaktu respons (total)47.55s
Pemrograman
: 4.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)7.20sWaktu respons (maks)13.03sWaktu respons (total)14.41s
Gabungan
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)75.68sWaktu respons (maks)75.68sWaktu respons (total)75.68s
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Spesifik domain
: 5.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)96.01sWaktu respons (maks)96.01sWaktu respons (total)96.01s
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.20sWaktu respons (maks)4.20sWaktu respons (total)4.20s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.28sWaktu respons (maks)7.37sWaktu respons (total)8.55s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.87sWaktu respons (maks)5.26sWaktu respons (total)7.74s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)27.78sWaktu respons (maks)27.78sWaktu respons (total)27.78s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.96sWaktu respons (maks)1.96sWaktu respons (total)1.96s
Pemrograman
: 6.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)54.83sWaktu respons (maks)95.88sWaktu respons (total)109.65s
Gabungan
: 6.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)15.06sWaktu respons (maks)15.06sWaktu respons (total)15.06s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.60sWaktu respons (maks)9.92sWaktu respons (total)19.19s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)38.15sWaktu respons (maks)67.08sWaktu respons (total)114.45s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)11.09sWaktu respons (maks)11.09sWaktu respons (total)11.09s
Kepatuhan instruksi
: 9.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.74sWaktu respons (maks)5.23sWaktu respons (total)7.47s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)10.24sWaktu respons (maks)16.95sWaktu respons (total)30.72s
Pemanggilan alat
: 7.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)12.53sWaktu respons (maks)12.53sWaktu respons (total)12.53s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)40.96sWaktu respons (maks)40.96sWaktu respons (total)40.96s
Trik anti-AI
: 8.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.95sWaktu respons (maks)5.68sWaktu respons (total)15.80s
Pemrograman
: 4.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)65.07sWaktu respons (maks)105.80sWaktu respons (total)130.13s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)17.40sWaktu respons (maks)17.40sWaktu respons (total)17.40s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.17sWaktu respons (maks)5.02sWaktu respons (total)8.34s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 1Jawaban salah: 1Waktu respons (rata-rata)27.03sWaktu respons (maks)29.87sWaktu respons (total)81.10s
Kecerdasan umum
: 3.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)24.48sWaktu respons (maks)24.48sWaktu respons (total)24.48s
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.26sWaktu respons (maks)4.46sWaktu respons (total)8.52s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)6.22sWaktu respons (maks)11.63sWaktu respons (total)18.66s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)13.68sWaktu respons (maks)13.68sWaktu respons (total)13.68s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)63.48sWaktu respons (maks)63.48sWaktu respons (total)63.48s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 7Tidak mengikuti instruksi: 1Waktu respons (rata-rata)18.97sWaktu respons (maks)122.87sWaktu respons (total)379.49s…
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.10sWaktu respons (maks)9.60sWaktu respons (total)24.39s
Pemrograman
: 5.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)51.92sWaktu respons (maks)78.01sWaktu respons (total)103.85s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)20.28sWaktu respons (maks)20.28sWaktu respons (total)20.28s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.65sWaktu respons (maks)10.35sWaktu respons (total)19.31s
Spesifik domain
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)14.65sWaktu respons (maks)26.85sWaktu respons (total)43.95s
Kecerdasan umum
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)9.88sWaktu respons (maks)9.88sWaktu respons (total)9.88s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.05sWaktu respons (maks)6.94sWaktu respons (total)12.10s
Pemecahan teka-teki
: 8.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)6.29sWaktu respons (maks)8.18sWaktu respons (total)18.87s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.00sWaktu respons (maks)4.00sWaktu respons (total)4.00s
Pengetahuan umum
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)122.87sWaktu respons (maks)122.87sWaktu respons (total)122.87s