Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)11.39sWaktu respons (maks)50.16sWaktu respons (total)113.86sโฆ
Total Tes: 17Tes Salah: 0Tingkat lulus per percobaan: 100.0%Tes tidak stabil: 0โฆToken output: 1,640Token penalaran: 48,270Waktu respons: rata-rata 11.39s ยท total 113.86s ยท maks 50.16s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.13sWaktu respons (maks)5.61sWaktu respons (total)8.26s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)50.16sWaktu respons (maks)50.16sWaktu respons (total)50.16s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.72sWaktu respons (maks)4.72sWaktu respons (total)4.72s
Spesifik domain
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)21.12sWaktu respons (maks)21.12sWaktu respons (total)21.12s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.09sWaktu respons (maks)4.09sWaktu respons (total)4.09s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.10sWaktu respons (maks)6.10sWaktu respons (total)6.10s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.43sWaktu respons (maks)4.68sWaktu respons (total)8.85s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)10.55sWaktu respons (maks)10.55sWaktu respons (total)10.55s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)15.56sWaktu respons (maks)40.61sWaktu respons (total)155.64sโฆ
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.90sWaktu respons (maks)9.52sWaktu respons (total)15.80s
Gabungan
: 9.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)40.61sWaktu respons (maks)40.61sWaktu respons (total)40.61s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.72sWaktu respons (maks)7.72sWaktu respons (total)7.72s
Spesifik domain
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)32.73sWaktu respons (maks)32.73sWaktu respons (total)32.73s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)11.77sWaktu respons (maks)11.77sWaktu respons (total)11.77s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.56sWaktu respons (maks)9.56sWaktu respons (total)9.56s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.15sWaktu respons (maks)8.49sWaktu respons (total)14.30s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)23.15sWaktu respons (maks)23.15sWaktu respons (total)23.15s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)5.95sWaktu respons (maks)14.72sWaktu respons (total)101.19sโฆ
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.48sWaktu respons (maks)4.31sWaktu respons (total)13.94s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.27sWaktu respons (maks)3.27sWaktu respons (total)3.27s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.40sWaktu respons (maks)14.72sWaktu respons (total)18.80s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)8.05sWaktu respons (maks)14.40sWaktu respons (total)24.15s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.68sWaktu respons (maks)3.68sWaktu respons (total)3.68s
Kepatuhan instruksi
: 9.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.02sWaktu respons (maks)7.35sWaktu respons (total)14.03s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.11sWaktu respons (maks)10.27sWaktu respons (total)18.32s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.99sWaktu respons (maks)4.99sWaktu respons (total)4.99s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)9.06sWaktu respons (maks)26.24sWaktu respons (total)90.58sโฆ
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)14.99sWaktu respons (maks)26.24sWaktu respons (total)29.99s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)10.37sWaktu respons (maks)10.37sWaktu respons (total)10.37s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)10.84sWaktu respons (maks)10.84sWaktu respons (total)10.84s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)7.01sWaktu respons (maks)7.01sWaktu respons (total)7.01s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.34sWaktu respons (maks)9.34sWaktu respons (total)9.34s
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.26sWaktu respons (maks)3.26sWaktu respons (total)3.26s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.91sWaktu respons (maks)4.23sWaktu respons (total)7.81s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)11.96sWaktu respons (maks)11.96sWaktu respons (total)11.96s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Tidak mengikuti instruksi: 2Waktu respons (rata-rata)27.78sWaktu respons (maks)168.71sWaktu respons (total)472.24sโฆ
Trik anti-AI
: 8.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)17.99sWaktu respons (maks)48.33sWaktu respons (total)71.98s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)37.67sWaktu respons (maks)37.67sWaktu respons (total)37.67s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.07sWaktu respons (maks)12.19sWaktu respons (total)18.14s
Spesifik domain
: 5.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)88.74sWaktu respons (maks)168.71sWaktu respons (total)266.21s
Kecerdasan umum
: 6.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)18.25sWaktu respons (maks)18.25sWaktu respons (total)18.25s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.26sWaktu respons (maks)9.02sWaktu respons (total)14.52s
Pemecahan teka-teki
: 9.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)11.03sWaktu respons (maks)13.85sWaktu respons (total)33.09s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)12.38sWaktu respons (maks)12.38sWaktu respons (total)12.38s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Tidak mengikuti instruksi: 1Waktu respons (rata-rata)13.94sWaktu respons (maks)43.55sWaktu respons (total)237.01sโฆ
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.90sWaktu respons (maks)19.37sWaktu respons (total)39.60s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)34.95sWaktu respons (maks)34.95sWaktu respons (total)34.95s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)14.95sWaktu respons (maks)15.40sWaktu respons (total)29.90s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)22.08sWaktu respons (maks)43.55sWaktu respons (total)66.23s
Kecerdasan umum
: 5.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)27.05sWaktu respons (maks)27.05sWaktu respons (total)27.05s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.54sWaktu respons (maks)11.67sWaktu respons (total)15.07s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.11sWaktu respons (maks)7.52sWaktu respons (total)18.34s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.87sWaktu respons (maks)5.87sWaktu respons (total)5.87s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Tidak mengikuti instruksi: 2Waktu respons (rata-rata)15.76sWaktu respons (maks)100.93sWaktu respons (total)267.97sโฆ
Trik anti-AI
: 8.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.16sWaktu respons (maks)6.68sWaktu respons (total)16.63s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)19.56sWaktu respons (maks)19.56sWaktu respons (total)19.56s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.07sWaktu respons (maks)3.59sWaktu respons (total)6.15s
Spesifik domain
: 5.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)64.31sWaktu respons (maks)100.93sWaktu respons (total)192.94s
Kecerdasan umum
: 4.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.87sWaktu respons (maks)4.87sWaktu respons (total)4.87s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.04sWaktu respons (maks)3.44sWaktu respons (total)6.07s
Pemecahan teka-teki
: 9.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)5.12sWaktu respons (maks)8.73sWaktu respons (total)15.37s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.37sWaktu respons (maks)6.37sWaktu respons (total)6.37s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Tidak mengikuti instruksi: 1Waktu respons (rata-rata)68.83sWaktu respons (maks)280.52sWaktu respons (total)1101.32sโฆ
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)43.87sWaktu respons (maks)121.88sWaktu respons (total)131.62s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)280.52sWaktu respons (maks)280.52sWaktu respons (total)280.52s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.16sWaktu respons (maks)8.54sWaktu respons (total)14.31s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)127.58sWaktu respons (maks)133.93sWaktu respons (total)382.74s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.25sWaktu respons (maks)5.25sWaktu respons (total)5.25s
Kepatuhan instruksi
: 7.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)70.07sWaktu respons (maks)136.53sWaktu respons (total)140.14s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)46.33sWaktu respons (maks)134.22sWaktu respons (total)139.00s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.73sWaktu respons (maks)7.73sWaktu respons (total)7.73s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 2Jawaban salah: 2Waktu respons (rata-rata)39.13sWaktu respons (maks)81.20sWaktu respons (total)391.29sโฆ
Trik anti-AI
: 8.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)45.78sWaktu respons (maks)81.20sWaktu respons (total)91.57s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)46.85sWaktu respons (maks)46.85sWaktu respons (total)46.85s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)46.91sWaktu respons (maks)46.91sWaktu respons (total)46.91s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)17.50sWaktu respons (maks)17.50sWaktu respons (total)17.50s
Kecerdasan umum
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Waktu respons (rata-rata)79.86sWaktu respons (maks)79.86sWaktu respons (total)79.86s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)31.93sWaktu respons (maks)31.93sWaktu respons (total)31.93s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)34.57sWaktu respons (maks)49.12sWaktu respons (total)69.13s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.54sWaktu respons (maks)7.54sWaktu respons (total)7.54s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Kedaluwarsa: 1Waktu respons (rata-rata)29.05sWaktu respons (maks)119.29sWaktu respons (total)493.86sโฆ
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.75sWaktu respons (maks)18.03sWaktu respons (total)39.01s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)107.79sWaktu respons (maks)107.79sWaktu respons (total)107.79s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)23.41sWaktu respons (maks)29.79sWaktu respons (total)46.83s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)63.40sWaktu respons (maks)119.29sWaktu respons (total)190.20s
Kecerdasan umum
: 3.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Waktu respons (rata-rata)34.11sWaktu respons (maks)34.11sWaktu respons (total)34.11s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.88sWaktu respons (maks)15.44sWaktu respons (total)19.76s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)17.18sWaktu respons (maks)31.99sWaktu respons (total)51.55s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.60sWaktu respons (maks)4.60sWaktu respons (total)4.60s
Trik anti-AI
: 8.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 1Waktu respons (rata-rata)19.75sWaktu respons (maks)49.95sWaktu respons (total)79.01s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)163.96sWaktu respons (maks)163.96sWaktu respons (total)163.96s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)30.26sWaktu respons (maks)32.03sWaktu respons (total)60.52s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)79.53sWaktu respons (maks)95.52sWaktu respons (total)238.59s
Kecerdasan umum
: 6.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)101.41sWaktu respons (maks)101.41sWaktu respons (total)101.41s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)19.66sWaktu respons (maks)32.25sWaktu respons (total)39.32s
Pemecahan teka-teki
: 8.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)64.61sWaktu respons (maks)123.57sWaktu respons (total)193.84s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.45sWaktu respons (maks)7.45sWaktu respons (total)7.45s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)23.66sWaktu respons (maks)25.06sWaktu respons (total)47.32s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)28.96sWaktu respons (maks)28.96sWaktu respons (total)28.96s
Parsing dan ekstraksi data
: 7.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)8.90sWaktu respons (maks)8.90sWaktu respons (total)8.90s
Spesifik domain
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Kedaluwarsa: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Kecerdasan umum
: 6.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)14.69sWaktu respons (maks)14.69sWaktu respons (total)14.69s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.25sWaktu respons (maks)7.25sWaktu respons (total)7.25s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)15.64sWaktu respons (maks)16.34sWaktu respons (total)31.27s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)15.93sWaktu respons (maks)15.93sWaktu respons (total)15.93s
Trik anti-AI
: 8.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)30.72sWaktu respons (maks)44.23sWaktu respons (total)122.88s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)93.11sWaktu respons (maks)93.11sWaktu respons (total)93.11s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)36.09sWaktu respons (maks)39.12sWaktu respons (total)72.18s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)39.32sWaktu respons (maks)79.03sWaktu respons (total)117.95s
Kecerdasan umum
: 5.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)31.30sWaktu respons (maks)31.30sWaktu respons (total)31.30s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)35.78sWaktu respons (maks)47.30sWaktu respons (total)71.56s
Pemecahan teka-teki
: 8.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)36.87sWaktu respons (maks)59.22sWaktu respons (total)110.62s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)34.81sWaktu respons (maks)34.81sWaktu respons (total)34.81s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Tidak mengikuti instruksi: 1Waktu respons (rata-rata)11.88sWaktu respons (maks)95.48sWaktu respons (total)201.89sโฆ
Trik anti-AI
: 8.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)6.30sWaktu respons (maks)15.56sWaktu respons (total)25.21s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)28.44sWaktu respons (maks)28.44sWaktu respons (total)28.44s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.06sWaktu respons (maks)5.06sWaktu respons (total)8.11s
Spesifik domain
: 5.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)37.34sWaktu respons (maks)95.48sWaktu respons (total)112.01s
Kecerdasan umum
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.86sWaktu respons (maks)4.86sWaktu respons (total)4.86s
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.62sWaktu respons (maks)2.78sWaktu respons (total)5.24s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.94sWaktu respons (maks)6.33sWaktu respons (total)11.83s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.20sWaktu respons (maks)6.20sWaktu respons (total)6.20s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Tidak mengikuti instruksi: 1Waktu respons (rata-rata)3.70sWaktu respons (maks)14.93sWaktu respons (total)62.97sโฆ
Trik anti-AI
: 9.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.33sWaktu respons (maks)3.89sWaktu respons (total)9.30s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)14.93sWaktu respons (maks)14.93sWaktu respons (total)14.93s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.29sWaktu respons (maks)2.31sWaktu respons (total)4.59s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)4.21sWaktu respons (maks)5.86sWaktu respons (total)12.62s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.16sWaktu respons (maks)3.16sWaktu respons (total)3.16s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.91sWaktu respons (maks)1.93sWaktu respons (total)3.82s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.58sWaktu respons (maks)4.41sWaktu respons (total)10.75s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.80sWaktu respons (maks)3.80sWaktu respons (total)3.80s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Tidak mengikuti instruksi: 2Waktu respons (rata-rata)18.95sWaktu respons (maks)100.41sWaktu respons (total)322.23sโฆ
Trik anti-AI
: 8.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.11sWaktu respons (maks)6.42sWaktu respons (total)16.42s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)20.57sWaktu respons (maks)20.57sWaktu respons (total)20.57s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.32sWaktu respons (maks)5.40sWaktu respons (total)10.64s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)74.27sWaktu respons (maks)100.41sWaktu respons (total)222.80s
Kecerdasan umum
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.92sWaktu respons (maks)4.92sWaktu respons (total)4.92s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.11sWaktu respons (maks)3.68sWaktu respons (total)6.22s
Pemecahan teka-teki
: 8.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)9.13sWaktu respons (maks)18.14sWaktu respons (total)27.39s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)13.28sWaktu respons (maks)13.28sWaktu respons (total)13.28s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.82sWaktu respons (maks)7.69sWaktu respons (total)19.26s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)13.88sWaktu respons (maks)13.88sWaktu respons (total)13.88s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.19sWaktu respons (maks)6.42sWaktu respons (total)12.38s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Kedaluwarsa: 1Waktu respons (rata-rata)71.07sWaktu respons (maks)194.23sWaktu respons (total)213.22s
Kecerdasan umum
: 6.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)10.05sWaktu respons (maks)10.05sWaktu respons (total)10.05s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.38sWaktu respons (maks)5.70sWaktu respons (total)10.77s
Pemecahan teka-teki
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 2Waktu respons (rata-rata)5.44sWaktu respons (maks)7.26sWaktu respons (total)16.32s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.84sWaktu respons (maks)9.84sWaktu respons (total)9.84s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Tidak mengikuti instruksi: 1Waktu respons (rata-rata)3.28sWaktu respons (maks)11.91sWaktu respons (total)55.80sโฆ
Trik anti-AI
: 8.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.12sWaktu respons (maks)3.18sWaktu respons (total)8.50s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)11.91sWaktu respons (maks)11.91sWaktu respons (total)11.91s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.00sWaktu respons (maks)3.74sWaktu respons (total)5.99s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)2.36sWaktu respons (maks)3.51sWaktu respons (total)7.07s
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.54sWaktu respons (maks)1.54sWaktu respons (total)1.54s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.49sWaktu respons (maks)1.66sWaktu respons (total)2.99s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.76sWaktu respons (maks)5.08sWaktu respons (total)8.27s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.54sWaktu respons (maks)9.54sWaktu respons (total)9.54s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 5Waktu respons (rata-rata)1.66sWaktu respons (maks)3.56sWaktu respons (total)16.61sโฆ
Trik anti-AI
: 8.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.25sWaktu respons (maks)1.59sWaktu respons (total)2.49s
Gabungan
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.56sWaktu respons (maks)3.56sWaktu respons (total)3.56s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.41sWaktu respons (maks)1.41sWaktu respons (total)1.41s
Spesifik domain
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)963msWaktu respons (maks)963msWaktu respons (total)963ms
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.13sWaktu respons (maks)1.13sWaktu respons (total)1.13s
Kepatuhan instruksi
: 6.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.58sWaktu respons (maks)1.58sWaktu respons (total)1.58s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.06sWaktu respons (maks)1.06sWaktu respons (total)2.12s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.35sWaktu respons (maks)3.35sWaktu respons (total)3.35s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)59.11sWaktu respons (maks)168.31sWaktu respons (total)236.44s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)17.78sWaktu respons (maks)17.78sWaktu respons (total)17.78s
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)56.99sWaktu respons (maks)80.14sWaktu respons (total)113.98s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)146.50sWaktu respons (maks)234.29sWaktu respons (total)439.49s
Kecerdasan umum
: 6.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)40.05sWaktu respons (maks)40.05sWaktu respons (total)40.05s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)63.49sWaktu respons (maks)111.61sWaktu respons (total)126.98s
Pemecahan teka-teki
: 6.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 2Waktu respons (rata-rata)56.74sWaktu respons (maks)115.01sWaktu respons (total)170.23s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)10.33sWaktu respons (maks)10.33sWaktu respons (total)10.33s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.06sWaktu respons (maks)4.70sWaktu respons (total)12.23s
Gabungan
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)64.71sWaktu respons (maks)64.71sWaktu respons (total)64.71s
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)17.20sWaktu respons (maks)17.44sWaktu respons (total)34.40s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)6.00sWaktu respons (maks)6.14sWaktu respons (total)12.01s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.06sWaktu respons (maks)4.06sWaktu respons (total)4.06s
Kepatuhan instruksi
: 9.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.36sWaktu respons (maks)4.35sWaktu respons (total)6.72s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)8.19sWaktu respons (maks)8.19sWaktu respons (total)8.19s
Trik anti-AI
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 1Jawaban salah: 1Waktu respons (rata-rata)2.98sWaktu respons (maks)4.95sWaktu respons (total)5.97s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)46.35sWaktu respons (maks)46.35sWaktu respons (total)46.35s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)13.90sWaktu respons (maks)13.90sWaktu respons (total)13.90s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.94sWaktu respons (maks)4.94sWaktu respons (total)4.94s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.61sWaktu respons (maks)2.61sWaktu respons (total)2.61s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.80sWaktu respons (maks)5.22sWaktu respons (total)9.60s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.48sWaktu respons (maks)7.48sWaktu respons (total)7.48s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.11sWaktu respons (maks)3.43sWaktu respons (total)8.43s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)19.29sWaktu respons (maks)19.29sWaktu respons (total)19.29s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.29sWaktu respons (maks)2.62sWaktu respons (total)4.58s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.86sWaktu respons (maks)2.86sWaktu respons (total)2.86s
Kepatuhan instruksi
: 8.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.92sWaktu respons (maks)7.14sWaktu respons (total)9.83s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)11.07sWaktu respons (maks)11.07sWaktu respons (total)11.07s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 3Jawaban salah: 3Waktu respons (rata-rata)8.54sWaktu respons (maks)24.21sWaktu respons (total)145.26sโฆ
Trik anti-AI
: 8.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.16sWaktu respons (maks)3.44sWaktu respons (total)12.65s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)20.93sWaktu respons (maks)20.93sWaktu respons (total)20.93s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.01sWaktu respons (maks)4.27sWaktu respons (total)8.02s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)21.33sWaktu respons (maks)24.21sWaktu respons (total)64.00s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.78sWaktu respons (maks)5.78sWaktu respons (total)5.78s
Kepatuhan instruksi
: 8.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.97sWaktu respons (maks)6.05sWaktu respons (total)9.94s
Pemecahan teka-teki
: 8.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)3.85sWaktu respons (maks)4.53sWaktu respons (total)11.55s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)12.39sWaktu respons (maks)12.39sWaktu respons (total)12.39s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 3Jawaban salah: 3Waktu respons (rata-rata)26.78sWaktu respons (maks)170.45sWaktu respons (total)294.58sโฆ
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)13.56sWaktu respons (maks)32.30sWaktu respons (total)40.68s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)29.57sWaktu respons (maks)29.57sWaktu respons (total)29.57s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)15.01sWaktu respons (maks)15.01sWaktu respons (total)15.01s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)170.45sWaktu respons (maks)170.45sWaktu respons (total)170.45s
Kecerdasan umum
: 5.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)6.54sWaktu respons (maks)6.54sWaktu respons (total)6.54s
Kepatuhan instruksi
: 8.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.98sWaktu respons (maks)4.98sWaktu respons (total)4.98s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)11.91sWaktu respons (maks)11.91sWaktu respons (total)11.91s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Tidak mengikuti instruksi: 2Waktu respons (rata-rata)1.29sWaktu respons (maks)3.39sWaktu respons (total)21.95sโฆ
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.20sWaktu respons (maks)3.20sWaktu respons (total)3.20s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.22sWaktu respons (maks)1.33sWaktu respons (total)2.44s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)942msWaktu respons (maks)1.12sWaktu respons (total)2.83s
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)741msWaktu respons (maks)741msWaktu respons (total)741ms
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.13sWaktu respons (maks)1.14sWaktu respons (total)2.27s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)972msWaktu respons (maks)1.13sWaktu respons (total)2.92s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.39sWaktu respons (maks)3.39sWaktu respons (total)3.39s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 5Tidak mengikuti instruksi: 1Waktu respons (rata-rata)6.72sWaktu respons (maks)38.52sWaktu respons (total)114.20sโฆ
Trik anti-AI
: 8.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.40sWaktu respons (maks)4.78sWaktu respons (total)13.59s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.12sWaktu respons (maks)9.12sWaktu respons (total)9.12s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.05sWaktu respons (maks)3.33sWaktu respons (total)6.10s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)17.78sWaktu respons (maks)38.52sWaktu respons (total)53.33s
Kecerdasan umum
: 4.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)3.20sWaktu respons (maks)3.20sWaktu respons (total)3.20s
Kepatuhan instruksi
: 7.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)5.46sWaktu respons (maks)6.45sWaktu respons (total)10.92s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.42sWaktu respons (maks)5.04sWaktu respons (total)13.27s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.68sWaktu respons (maks)4.68sWaktu respons (total)4.68s
Trik anti-AI
: 8.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 1Waktu respons (rata-rata)15.85sWaktu respons (maks)20.83sWaktu respons (total)47.55s
Gabungan
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)75.68sWaktu respons (maks)75.68sWaktu respons (total)75.68s
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Spesifik domain
: 5.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)96.01sWaktu respons (maks)96.01sWaktu respons (total)96.01s
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.20sWaktu respons (maks)4.20sWaktu respons (total)4.20s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.28sWaktu respons (maks)7.37sWaktu respons (total)8.55s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.77sWaktu respons (maks)5.26sWaktu respons (total)7.55s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)27.78sWaktu respons (maks)27.78sWaktu respons (total)27.78s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 5Tidak mengikuti instruksi: 2Waktu respons (rata-rata)5.68sWaktu respons (maks)18.33sWaktu respons (total)96.58sโฆ
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)11.96sWaktu respons (maks)11.96sWaktu respons (total)11.96s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.21sWaktu respons (maks)2.52sWaktu respons (total)4.42s
Spesifik domain
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)13.01sWaktu respons (maks)18.33sWaktu respons (total)39.04s
Kecerdasan umum
: 4.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.99sWaktu respons (maks)1.99sWaktu respons (total)1.99s
Kepatuhan instruksi
: 8.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.29sWaktu respons (maks)4.18sWaktu respons (total)6.59s
Pemecahan teka-teki
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.93sWaktu respons (maks)3.05sWaktu respons (total)8.78s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)8.36sWaktu respons (maks)8.36sWaktu respons (total)8.36s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 4Jawaban salah: 2Waktu respons (rata-rata)20.87sWaktu respons (maks)83.40sWaktu respons (total)208.73sโฆ
Trik anti-AI
: 6.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 2Waktu respons (rata-rata)7.45sWaktu respons (maks)11.88sWaktu respons (total)14.90s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)76.66sWaktu respons (maks)76.66sWaktu respons (total)76.66s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.37sWaktu respons (maks)7.37sWaktu respons (total)7.37s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 2Jawaban salah: 1Waktu respons (rata-rata)83.40sWaktu respons (maks)83.40sWaktu respons (total)83.40s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.04sWaktu respons (maks)5.04sWaktu respons (total)5.04s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.43sWaktu respons (maks)2.43sWaktu respons (total)2.43s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.60sWaktu respons (maks)4.66sWaktu respons (total)9.20s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)9.73sWaktu respons (maks)9.73sWaktu respons (total)9.73s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Tidak mengikuti instruksi: 3Waktu respons (rata-rata)11.08sWaktu respons (maks)94.06sWaktu respons (total)188.39sโฆ
Trik anti-AI
: 8.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.52sWaktu respons (maks)7.74sWaktu respons (total)18.10s
Gabungan
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)24.13sWaktu respons (maks)24.13sWaktu respons (total)24.13s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.54sWaktu respons (maks)3.33sWaktu respons (total)5.08s
Spesifik domain
: 5.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)38.18sWaktu respons (maks)94.06sWaktu respons (total)114.53s
Kecerdasan umum
: 4.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.15sWaktu respons (maks)4.15sWaktu respons (total)4.15s
Kepatuhan instruksi
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.88sWaktu respons (maks)2.61sWaktu respons (total)3.75s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.71sWaktu respons (maks)7.71sWaktu respons (total)7.71s
Trik anti-AI
: 6.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)74.75sWaktu respons (maks)182.10sWaktu respons (total)298.98s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)262.83sWaktu respons (maks)262.83sWaktu respons (total)262.83s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)24.27sWaktu respons (maks)27.52sWaktu respons (total)48.54s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 3Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Kecerdasan umum
: 5.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)36.65sWaktu respons (maks)36.65sWaktu respons (total)36.65s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)17.47sWaktu respons (maks)19.46sWaktu respons (total)34.93s
Pemecahan teka-teki
: 8.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)25.85sWaktu respons (maks)32.95sWaktu respons (total)77.55s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)88.68sWaktu respons (maks)88.68sWaktu respons (total)88.68s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)14.06sWaktu respons (maks)14.06sWaktu respons (total)14.06s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.15sWaktu respons (maks)3.15sWaktu respons (total)3.15s
Spesifik domain
: 5.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)77.80sWaktu respons (maks)77.80sWaktu respons (total)77.80s
Kecerdasan umum
: 3.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.32sWaktu respons (maks)4.32sWaktu respons (total)4.32s
Kepatuhan instruksi
: 9.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.12sWaktu respons (maks)3.12sWaktu respons (total)3.12s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)5.47sWaktu respons (maks)6.45sWaktu respons (total)10.94s
Pemanggilan alat
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)10.30sWaktu respons (maks)10.30sWaktu respons (total)10.30s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)21.13sWaktu respons (maks)34.96sWaktu respons (total)84.53s
Gabungan
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)75.34sWaktu respons (maks)75.34sWaktu respons (total)75.34s
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)59.33sWaktu respons (maks)97.12sWaktu respons (total)118.65s
Spesifik domain
: 4.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 2Jawaban salah: 1Waktu respons (rata-rata)88.34sWaktu respons (maks)106.00sWaktu respons (total)265.01s
Kecerdasan umum
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Waktu respons (rata-rata)30.30sWaktu respons (maks)30.30sWaktu respons (total)30.30s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)24.45sWaktu respons (maks)43.36sWaktu respons (total)48.89s
Pemecahan teka-teki
: 6.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)31.58sWaktu respons (maks)60.18sWaktu respons (total)94.75s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.65sWaktu respons (maks)4.65sWaktu respons (total)4.65s
Trik anti-AI
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 2Jawaban salah: 1Waktu respons (rata-rata)2.94sWaktu respons (maks)4.83sWaktu respons (total)5.88s
Gabungan
: 9.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)23.84sWaktu respons (maks)23.84sWaktu respons (total)23.84s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.43sWaktu respons (maks)3.43sWaktu respons (total)3.43s
Spesifik domain
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.54sWaktu respons (maks)3.54sWaktu respons (total)3.54s
Kecerdasan umum
: 6.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.56sWaktu respons (maks)2.56sWaktu respons (total)2.56s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.96sWaktu respons (maks)1.96sWaktu respons (total)1.96s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 1Waktu respons (rata-rata)2.92sWaktu respons (maks)3.33sWaktu respons (total)5.84s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.11sWaktu respons (maks)4.11sWaktu respons (total)4.11s
Trik anti-AI
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Jawaban salah: 1Waktu respons (rata-rata)51.38sWaktu respons (maks)85.28sWaktu respons (total)102.75s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)71.37sWaktu respons (maks)71.37sWaktu respons (total)71.37s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)49.78sWaktu respons (maks)49.78sWaktu respons (total)49.78s
Spesifik domain
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Kedaluwarsa: 1Waktu respons (rata-rata)137.29sWaktu respons (maks)137.29sWaktu respons (total)137.29s
Kecerdasan umum
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)69.73sWaktu respons (maks)69.73sWaktu respons (total)69.73s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)92.47sWaktu respons (maks)92.47sWaktu respons (total)92.47s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)31.74sWaktu respons (maks)31.74sWaktu respons (total)31.74s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 5Jawaban salah: 4Waktu respons (rata-rata)15.66sWaktu respons (maks)102.91sWaktu respons (total)266.14sโฆ
Trik anti-AI
: 8.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.05sWaktu respons (maks)6.69sWaktu respons (total)16.20s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)17.81sWaktu respons (maks)17.81sWaktu respons (total)17.81s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.43sWaktu respons (maks)3.39sWaktu respons (total)4.87s
Spesifik domain
: 4.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)65.31sWaktu respons (maks)102.91sWaktu respons (total)195.92s
Kecerdasan umum
: 4.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)3.72sWaktu respons (maks)3.72sWaktu respons (total)3.72s
Kepatuhan instruksi
: 7.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.50sWaktu respons (maks)2.55sWaktu respons (total)5.00s
Pemecahan teka-teki
: 6.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 2Waktu respons (rata-rata)4.33sWaktu respons (maks)7.27sWaktu respons (total)13.00s
Pemanggilan alat
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)9.62sWaktu respons (maks)9.62sWaktu respons (total)9.62s
Trik anti-AI
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)4.75sWaktu respons (maks)7.62sWaktu respons (total)19.00s
Gabungan
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Waktu respons (rata-rata)30.53sWaktu respons (maks)30.53sWaktu respons (total)30.53s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)23.16sWaktu respons (maks)26.55sWaktu respons (total)46.33s
Kecerdasan umum
: 7.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)6.44sWaktu respons (maks)6.44sWaktu respons (total)6.44s
Kepatuhan instruksi
: 9.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.18sWaktu respons (maks)4.46sWaktu respons (total)8.36s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)17.33sWaktu respons (maks)17.33sWaktu respons (total)17.33s
Trik anti-AI
: 8.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.81sWaktu respons (maks)5.65sWaktu respons (total)7.62s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)37.64sWaktu respons (maks)37.64sWaktu respons (total)37.64s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.63sWaktu respons (maks)6.63sWaktu respons (total)6.63s
Spesifik domain
: 5.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)121.79sWaktu respons (maks)121.79sWaktu respons (total)121.79s
Kecerdasan umum
: 4.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)16.25sWaktu respons (maks)16.25sWaktu respons (total)16.25s
Kepatuhan instruksi
: 6.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)5.30sWaktu respons (maks)5.30sWaktu respons (total)5.30s
Pemanggilan alat
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)27.71sWaktu respons (maks)27.71sWaktu respons (total)27.71s
Trik anti-AI
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)10.08sWaktu respons (maks)22.30sWaktu respons (total)40.30s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)87.80sWaktu respons (maks)87.80sWaktu respons (total)87.80s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)18.16sWaktu respons (maks)20.65sWaktu respons (total)36.33s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Kedaluwarsa: 1Waktu respons (rata-rata)16.19sWaktu respons (maks)21.56sWaktu respons (total)32.39s
Kecerdasan umum
: 3.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)27.86sWaktu respons (maks)27.86sWaktu respons (total)27.86s
Kepatuhan instruksi
: 7.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)7.72sWaktu respons (maks)11.23sWaktu respons (total)15.45s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)39.75sWaktu respons (maks)39.75sWaktu respons (total)39.75s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)88.15sWaktu respons (maks)88.15sWaktu respons (total)88.15s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)12.58sWaktu respons (maks)13.87sWaktu respons (total)25.16s
Spesifik domain
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Kedaluwarsa: 1Waktu respons (rata-rata)44.63sWaktu respons (maks)82.55sWaktu respons (total)133.89s
Kecerdasan umum
: 4.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)13.50sWaktu respons (maks)13.50sWaktu respons (total)13.50s
Kepatuhan instruksi
: 8.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)15.66sWaktu respons (maks)21.80sWaktu respons (total)31.32s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)18.64sWaktu respons (maks)18.64sWaktu respons (total)18.64s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 8Waktu respons (rata-rata)2.51sWaktu respons (maks)6.65sWaktu respons (total)27.60sโฆ
Trik anti-AI
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)1.91sWaktu respons (maks)2.74sWaktu respons (total)3.82s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)6.65sWaktu respons (maks)6.65sWaktu respons (total)6.65s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.89sWaktu respons (maks)1.89sWaktu respons (total)1.89s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)1.17sWaktu respons (maks)1.44sWaktu respons (total)2.33s
Kecerdasan umum
: 4.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.26sWaktu respons (maks)2.26sWaktu respons (total)2.26s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.67sWaktu respons (maks)1.67sWaktu respons (total)1.67s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.82sWaktu respons (maks)3.52sWaktu respons (total)5.65s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.33sWaktu respons (maks)3.33sWaktu respons (total)3.33s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 8Waktu respons (rata-rata)3.77sWaktu respons (maks)11.07sWaktu respons (total)37.66sโฆ
Trik anti-AI
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)2.37sWaktu respons (maks)3.39sWaktu respons (total)4.75s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.98sWaktu respons (maks)4.98sWaktu respons (total)4.98s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.78sWaktu respons (maks)5.78sWaktu respons (total)5.78s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)2.24sWaktu respons (maks)2.24sWaktu respons (total)2.24s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.27sWaktu respons (maks)3.27sWaktu respons (total)3.27s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.48sWaktu respons (maks)1.48sWaktu respons (total)1.48s
Pemecahan teka-teki
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.05sWaktu respons (maks)2.08sWaktu respons (total)4.10s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)11.07sWaktu respons (maks)11.07sWaktu respons (total)11.07s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 7Tidak mengikuti instruksi: 2Waktu respons (rata-rata)2.01sWaktu respons (maks)6.81sWaktu respons (total)34.09sโฆ
Trik anti-AI
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)1.10sWaktu respons (maks)2.08sWaktu respons (total)4.39s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.47sWaktu respons (maks)2.47sWaktu respons (total)2.47s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.69sWaktu respons (maks)2.46sWaktu respons (total)3.38s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)1.14sWaktu respons (maks)1.63sWaktu respons (total)3.41s
Kecerdasan umum
: 4.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.19sWaktu respons (maks)1.19sWaktu respons (total)1.19s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.18sWaktu respons (maks)6.81sWaktu respons (total)8.36s
Pemecahan teka-teki
: 8.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.71sWaktu respons (maks)5.96sWaktu respons (total)8.14s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.76sWaktu respons (maks)2.76sWaktu respons (total)2.76s
Trik anti-AI
: 3.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 2Jawaban salah: 2Waktu respons (rata-rata)7.63sWaktu respons (maks)12.26sWaktu respons (total)30.54s
Gabungan
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)115.89sWaktu respons (maks)115.89sWaktu respons (total)115.89s
Parsing dan ekstraksi data
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)9.42sWaktu respons (maks)16.20sWaktu respons (total)18.84s
Spesifik domain
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)1.61sWaktu respons (maks)1.77sWaktu respons (total)4.83s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.86sWaktu respons (maks)2.86sWaktu respons (total)2.86s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.52sWaktu respons (maks)1.99sWaktu respons (total)3.04s
Pemecahan teka-teki
: 8.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)7.37sWaktu respons (maks)10.78sWaktu respons (total)22.10s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)11.85sWaktu respons (maks)11.85sWaktu respons (total)11.85s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 6Tidak mengikuti instruksi: 4Waktu respons (rata-rata)2.25sWaktu respons (maks)14.63sWaktu respons (total)35.99sโฆ
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.28sWaktu respons (maks)3.28sWaktu respons (total)3.28s
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.11sWaktu respons (maks)1.47sWaktu respons (total)2.21s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)6.48sWaktu respons (maks)14.63sWaktu respons (total)19.43s
Kecerdasan umum
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)821msWaktu respons (maks)821msWaktu respons (total)821ms
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.07sWaktu respons (maks)1.07sWaktu respons (total)1.07s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.89sWaktu respons (maks)1.89sWaktu respons (total)1.89s
Trik anti-AI
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)25.50sWaktu respons (maks)37.73sWaktu respons (total)51.00s
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)65.96sWaktu respons (maks)65.96sWaktu respons (total)65.96s
Parsing dan ekstraksi data
: 3.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)21.42sWaktu respons (maks)21.42sWaktu respons (total)21.42s
Spesifik domain
: 5.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)204.02sWaktu respons (maks)204.02sWaktu respons (total)204.02s
Kecerdasan umum
: 4.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)17.51sWaktu respons (maks)17.51sWaktu respons (total)17.51s
Kepatuhan instruksi
: 8.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)11.90sWaktu respons (maks)11.90sWaktu respons (total)11.90s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)33.30sWaktu respons (maks)33.30sWaktu respons (total)33.30s
Trik anti-AI
: 6.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Format tambahan: 1Jawaban salah: 1Waktu respons (rata-rata)3.46sWaktu respons (maks)4.38sWaktu respons (total)13.86s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)5.54sWaktu respons (maks)7.51sWaktu respons (total)11.08s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Format tambahan: 1Waktu respons (rata-rata)24.67sWaktu respons (maks)35.28sWaktu respons (total)74.02s
Kecerdasan umum
: 5.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)6.40sWaktu respons (maks)6.40sWaktu respons (total)6.40s
Kepatuhan instruksi
: 8.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.63sWaktu respons (maks)5.46sWaktu respons (total)9.26s
Pemecahan teka-teki
: 7.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 2Waktu respons (rata-rata)5.01sWaktu respons (maks)5.49sWaktu respons (total)15.03s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 9Tidak mengikuti instruksi: 1Waktu respons (rata-rata)3.36sWaktu respons (maks)13.73sWaktu respons (total)57.15sโฆ
Trik anti-AI
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)1.32sWaktu respons (maks)3.89sWaktu respons (total)5.30s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)6.22sWaktu respons (maks)6.22sWaktu respons (total)6.22s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.57sWaktu respons (maks)1.83sWaktu respons (total)3.14s
Spesifik domain
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)905msWaktu respons (maks)1.10sWaktu respons (total)2.71s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)803msWaktu respons (maks)803msWaktu respons (total)803ms
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)8.81sWaktu respons (maks)13.73sWaktu respons (total)17.61s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.67sWaktu respons (maks)3.67sWaktu respons (total)3.67s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 6Tidak mengikuti instruksi: 4Waktu respons (rata-rata)15.05sWaktu respons (maks)50.92sWaktu respons (total)150.55sโฆ
Gabungan
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)31.18sWaktu respons (maks)31.18sWaktu respons (total)31.18s
Parsing dan ekstraksi data
: 6.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.98sWaktu respons (maks)1.98sWaktu respons (total)1.98s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)50.92sWaktu respons (maks)50.92sWaktu respons (total)50.92s
Kecerdasan umum
: 4.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)7.90sWaktu respons (maks)7.90sWaktu respons (total)7.90s
Kepatuhan instruksi
: 9.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.63sWaktu respons (maks)7.63sWaktu respons (total)7.63s
Pemanggilan alat
: 9.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.91sWaktu respons (maks)6.91sWaktu respons (total)6.91s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 10Waktu respons (rata-rata)2.40sWaktu respons (maks)6.70sWaktu respons (total)40.85sโฆ
Trik anti-AI
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)2.43sWaktu respons (maks)6.70sWaktu respons (total)9.73s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)6.59sWaktu respons (maks)6.59sWaktu respons (total)6.59s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.82sWaktu respons (maks)1.97sWaktu respons (total)3.63s
Spesifik domain
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)1.33sWaktu respons (maks)1.53sWaktu respons (total)4.00s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.45sWaktu respons (maks)3.45sWaktu respons (total)3.45s
Kepatuhan instruksi
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.06sWaktu respons (maks)1.09sWaktu respons (total)2.12s
Pemecahan teka-teki
: 5.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)2.46sWaktu respons (maks)4.23sWaktu respons (total)7.37s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.94sWaktu respons (maks)3.94sWaktu respons (total)3.94s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 10Tidak mengikuti instruksi: 1Waktu respons (rata-rata)888msWaktu respons (maks)4.39sWaktu respons (total)15.10sโฆ
Trik anti-AI
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)582msWaktu respons (maks)844msWaktu respons (total)2.33s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.39sWaktu respons (maks)4.39sWaktu respons (total)4.39s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)652msWaktu respons (maks)660msWaktu respons (total)1.30s
Spesifik domain
: 5.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)495msWaktu respons (maks)642msWaktu respons (total)1.49s
Kecerdasan umum
: 5.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)615msWaktu respons (maks)615msWaktu respons (total)615ms
Kepatuhan instruksi
: 8.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)672msWaktu respons (maks)785msWaktu respons (total)1.34s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.91sWaktu respons (maks)1.91sWaktu respons (total)1.91s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 9Tidak mengikuti instruksi: 2Waktu respons (rata-rata)3.89sWaktu respons (maks)47.43sWaktu respons (total)66.07sโฆ
Trik anti-AI
: 3.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)1.43sWaktu respons (maks)4.39sWaktu respons (total)5.71s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)47.43sWaktu respons (maks)47.43sWaktu respons (total)47.43s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.16sWaktu respons (maks)1.42sWaktu respons (total)2.33s
Spesifik domain
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)485msWaktu respons (maks)549msWaktu respons (total)1.45s
Kecerdasan umum
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.19sWaktu respons (maks)1.19sWaktu respons (total)1.19s
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)809msWaktu respons (maks)983msWaktu respons (total)1.62s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.30sWaktu respons (maks)2.30sWaktu respons (total)2.30s
Gabungan
: 4.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)60.39sWaktu respons (maks)60.39sWaktu respons (total)60.39s
Parsing dan ekstraksi data
: 4.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)7.48sWaktu respons (maks)7.48sWaktu respons (total)7.48s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Kedaluwarsa: 1Waktu respons (rata-rata)237.27sWaktu respons (maks)237.27sWaktu respons (total)237.27s
Kecerdasan umum
: 3.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)6.63sWaktu respons (maks)6.63sWaktu respons (total)6.63s
Kepatuhan instruksi
: 8.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)4.64sWaktu respons (maks)4.64sWaktu respons (total)4.64s
Pemecahan teka-teki
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Jawaban salah: 1Waktu respons (rata-rata)11.54sWaktu respons (maks)17.37sWaktu respons (total)23.08s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)15.35sWaktu respons (maks)15.35sWaktu respons (total)15.35s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 9Tidak mengikuti instruksi: 2Waktu respons (rata-rata)4.58sWaktu respons (maks)15.17sWaktu respons (total)77.92sโฆ
Trik anti-AI
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)3.81sWaktu respons (maks)6.85sWaktu respons (total)15.23s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)15.17sWaktu respons (maks)15.17sWaktu respons (total)15.17s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)8.49sWaktu respons (maks)14.02sWaktu respons (total)16.98s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)2.33sWaktu respons (maks)2.94sWaktu respons (total)6.99s
Kecerdasan umum
: 6.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.71sWaktu respons (maks)2.71sWaktu respons (total)2.71s
Kepatuhan instruksi
: 6.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.82sWaktu respons (maks)2.92sWaktu respons (total)5.65s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.02sWaktu respons (maks)6.02sWaktu respons (total)6.02s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 10Tidak mengikuti instruksi: 1Waktu respons (rata-rata)3.71sWaktu respons (maks)46.00sWaktu respons (total)63.06sโฆ
Trik anti-AI
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)1.59sWaktu respons (maks)3.60sWaktu respons (total)6.38s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)46.00sWaktu respons (maks)46.00sWaktu respons (total)46.00s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.01sWaktu respons (maks)1.06sWaktu respons (total)2.02s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)465msWaktu respons (maks)492msWaktu respons (total)1.39s
Kecerdasan umum
: 5.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.12sWaktu respons (maks)1.12sWaktu respons (total)1.12s
Kepatuhan instruksi
: 4.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)585msWaktu respons (maks)715msWaktu respons (total)1.17s
Pemecahan teka-teki
: 5.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)982msWaktu respons (maks)1.36sWaktu respons (total)2.95s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.04sWaktu respons (maks)2.04sWaktu respons (total)2.04s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 9Tidak mengikuti instruksi: 2Waktu respons (rata-rata)2.31sWaktu respons (maks)6.58sWaktu respons (total)39.25sโฆ
Trik anti-AI
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)1.80sWaktu respons (maks)2.62sWaktu respons (total)7.19s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)6.58sWaktu respons (maks)6.58sWaktu respons (total)6.58s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.39sWaktu respons (maks)1.42sWaktu respons (total)2.78s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)1.78sWaktu respons (maks)2.49sWaktu respons (total)5.34s
Kecerdasan umum
: 4.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.44sWaktu respons (maks)2.44sWaktu respons (total)2.44s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.51sWaktu respons (maks)2.95sWaktu respons (total)5.02s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.39sWaktu respons (maks)4.39sWaktu respons (total)4.39s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 10Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.43sWaktu respons (maks)2.89sWaktu respons (total)24.27sโฆ
Trik anti-AI
: 3.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)1.21sWaktu respons (maks)2.58sWaktu respons (total)4.85s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.89sWaktu respons (maks)2.89sWaktu respons (total)2.89s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.04sWaktu respons (maks)1.06sWaktu respons (total)2.08s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)1.07sWaktu respons (maks)1.54sWaktu respons (total)3.22s
Kecerdasan umum
: 4.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.78sWaktu respons (maks)1.78sWaktu respons (total)1.78s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.07sWaktu respons (maks)1.17sWaktu respons (total)2.15s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.75sWaktu respons (maks)2.75sWaktu respons (total)2.75s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 10Tidak mengikuti instruksi: 2Waktu respons (rata-rata)1.70sWaktu respons (maks)9.39sWaktu respons (total)28.82sโฆ
Trik anti-AI
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)788msWaktu respons (maks)1.34sWaktu respons (total)3.15s
Gabungan
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)9.39sWaktu respons (maks)9.39sWaktu respons (total)9.39s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.43sWaktu respons (maks)1.45sWaktu respons (total)2.86s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)540msWaktu respons (maks)649msWaktu respons (total)1.62s
Kecerdasan umum
: 5.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.51sWaktu respons (maks)2.51sWaktu respons (total)2.51s
Kepatuhan instruksi
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)815msWaktu respons (maks)973msWaktu respons (total)1.63s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.54sWaktu respons (maks)3.54sWaktu respons (total)3.54s
Trik anti-AI
: 5.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)2.67sWaktu respons (maks)5.03sWaktu respons (total)10.66s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)25.25sWaktu respons (maks)25.25sWaktu respons (total)25.25s
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)1.23sWaktu respons (maks)1.96sWaktu respons (total)2.46s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Jawaban salah: 1Waktu respons (rata-rata)6.11sWaktu respons (maks)13.72sWaktu respons (total)18.34s
Kecerdasan umum
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.05sWaktu respons (maks)2.05sWaktu respons (total)2.05s
Kepatuhan instruksi
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.38sWaktu respons (maks)1.61sWaktu respons (total)2.75s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.50sWaktu respons (maks)3.50sWaktu respons (total)3.50s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 9Tidak mengikuti instruksi: 2Waktu respons (rata-rata)2.89sWaktu respons (maks)8.21sWaktu respons (total)49.05sโฆ
Trik anti-AI
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)2.84sWaktu respons (maks)4.15sWaktu respons (total)11.35s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.89sWaktu respons (maks)4.89sWaktu respons (total)4.89s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.47sWaktu respons (maks)2.48sWaktu respons (total)4.95s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)1.97sWaktu respons (maks)2.65sWaktu respons (total)5.92s
Kecerdasan umum
: 4.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.18sWaktu respons (maks)2.18sWaktu respons (total)2.18s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.13sWaktu respons (maks)2.53sWaktu respons (total)4.27s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)8.21sWaktu respons (maks)8.21sWaktu respons (total)8.21s
Trik anti-AI
: 5.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)5.51sWaktu respons (maks)6.59sWaktu respons (total)11.02s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)3.22sWaktu respons (maks)3.22sWaktu respons (total)3.22s
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.82sWaktu respons (maks)4.82sWaktu respons (total)4.82s
Spesifik domain
: 7.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)744msWaktu respons (maks)744msWaktu respons (total)744ms
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.59sWaktu respons (maks)1.59sWaktu respons (total)1.59s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)888msWaktu respons (maks)888msWaktu respons (total)888ms
Pemanggilan alat
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)7.05sWaktu respons (maks)7.05sWaktu respons (total)7.05s
Trik anti-AI
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)597msWaktu respons (maks)866msWaktu respons (total)2.39s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)6.48sWaktu respons (maks)6.48sWaktu respons (total)6.48s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)601msWaktu respons (maks)634msWaktu respons (total)1.20s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)611msWaktu respons (maks)616msWaktu respons (total)1.83s
Kecerdasan umum
: 5.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)541msWaktu respons (maks)541msWaktu respons (total)541ms
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.79sWaktu respons (maks)4.79sWaktu respons (total)4.79s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 12Waktu respons (rata-rata)10.83sWaktu respons (maks)42.13sWaktu respons (total)108.27sโฆ
Trik anti-AI
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)6.24sWaktu respons (maks)11.38sWaktu respons (total)12.48s
Gabungan
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)19.16sWaktu respons (maks)19.16sWaktu respons (total)19.16s
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)42.13sWaktu respons (maks)42.13sWaktu respons (total)42.13s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)4.38sWaktu respons (maks)4.38sWaktu respons (total)4.38s
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.00sWaktu respons (maks)4.00sWaktu respons (total)4.00s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.67sWaktu respons (maks)2.67sWaktu respons (total)2.67s
Pemecahan teka-teki
: 3.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)4.73sWaktu respons (maks)7.81sWaktu respons (total)9.45s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)13.99sWaktu respons (maks)13.99sWaktu respons (total)13.99s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 10Tidak mengikuti instruksi: 2Waktu respons (rata-rata)3.04sWaktu respons (maks)8.91sWaktu respons (total)51.75sโฆ
Trik anti-AI
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)3.02sWaktu respons (maks)8.17sWaktu respons (total)12.07s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)8.91sWaktu respons (maks)8.91sWaktu respons (total)8.91s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.26sWaktu respons (maks)4.66sWaktu respons (total)6.52s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)877msWaktu respons (maks)894msWaktu respons (total)2.63s
Kecerdasan umum
: 4.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.86sWaktu respons (maks)2.86sWaktu respons (total)2.86s
Pemecahan teka-teki
: 5.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)3.30sWaktu respons (maks)4.81sWaktu respons (total)9.91s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)6.67sWaktu respons (maks)6.67sWaktu respons (total)6.67s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 10Tidak mengikuti instruksi: 2Waktu respons (rata-rata)629msWaktu respons (maks)1.72sWaktu respons (total)10.70sโฆ
Trik anti-AI
: 3.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)395msWaktu respons (maks)769msWaktu respons (total)1.58s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.72sWaktu respons (maks)1.72sWaktu respons (total)1.72s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)822msWaktu respons (maks)1.08sWaktu respons (total)1.64s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)367msWaktu respons (maks)388msWaktu respons (total)1.10s
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)729msWaktu respons (maks)729msWaktu respons (total)729ms
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)380msWaktu respons (maks)380msWaktu respons (total)759ms
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.40sWaktu respons (maks)1.40sWaktu respons (total)1.40s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 9Tidak mengikuti instruksi: 4Waktu respons (rata-rata)8.86sWaktu respons (maks)24.97sWaktu respons (total)150.70sโฆ
Trik anti-AI
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)7.43sWaktu respons (maks)16.69sWaktu respons (total)29.72s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)19.98sWaktu respons (maks)19.98sWaktu respons (total)19.98s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)7.92sWaktu respons (maks)13.23sWaktu respons (total)15.84s
Spesifik domain
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)6.23sWaktu respons (maks)14.38sWaktu respons (total)18.70s
Kecerdasan umum
: 4.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)24.97sWaktu respons (maks)24.97sWaktu respons (total)24.97s
Pemanggilan alat
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)16.00sWaktu respons (maks)16.00sWaktu respons (total)16.00s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 12Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.94sWaktu respons (maks)7.58sWaktu respons (total)19.44sโฆ
Trik anti-AI
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)1.34sWaktu respons (maks)1.83sWaktu respons (total)2.67s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)7.58sWaktu respons (maks)7.58sWaktu respons (total)7.58s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.27sWaktu respons (maks)1.27sWaktu respons (total)1.27s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)637msWaktu respons (maks)637msWaktu respons (total)637ms
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)909msWaktu respons (maks)909msWaktu respons (total)909ms
Pemecahan teka-teki
: 3.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)1.30sWaktu respons (maks)1.54sWaktu respons (total)2.60s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.51sWaktu respons (maks)2.51sWaktu respons (total)2.51s
Gabungan
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)41.03sWaktu respons (maks)41.03sWaktu respons (total)41.03s
Parsing dan ekstraksi data
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)21.95sWaktu respons (maks)24.88sWaktu respons (total)43.89s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 2Jawaban salah: 1Waktu respons (rata-rata)19.00sWaktu respons (maks)21.63sWaktu respons (total)38.01s
Kecerdasan umum
: 3.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)38.70sWaktu respons (maks)38.70sWaktu respons (total)38.70s
Pemanggilan alat
: 4.7 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)12.05sWaktu respons (maks)12.05sWaktu respons (total)12.05s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)45.14sWaktu respons (maks)45.14sWaktu respons (total)45.14s
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.32sWaktu respons (maks)1.32sWaktu respons (total)1.32s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)962msWaktu respons (maks)962msWaktu respons (total)962ms
Kecerdasan umum
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.34sWaktu respons (maks)1.34sWaktu respons (total)1.34s
Kepatuhan instruksi
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)7.71sWaktu respons (maks)14.65sWaktu respons (total)15.42s
Pemecahan teka-teki
: 3.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)22.86sWaktu respons (maks)42.58sWaktu respons (total)45.73s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.47sWaktu respons (maks)2.47sWaktu respons (total)2.47s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 12Tidak mengikuti instruksi: 1Waktu respons (rata-rata)592msWaktu respons (maks)1.27sWaktu respons (total)10.07sโฆ
Trik anti-AI
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)483msWaktu respons (maks)716msWaktu respons (total)1.93s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)606msWaktu respons (maks)606msWaktu respons (total)606ms
Parsing dan ekstraksi data
: 7.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)667msWaktu respons (maks)819msWaktu respons (total)1.33s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)534msWaktu respons (maks)733msWaktu respons (total)1.60s
Kecerdasan umum
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)628msWaktu respons (maks)628msWaktu respons (total)628ms
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)551msWaktu respons (maks)622msWaktu respons (total)1.10s
Pemecahan teka-teki
: 3.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)533msWaktu respons (maks)637msWaktu respons (total)1.60s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.27sWaktu respons (maks)1.27sWaktu respons (total)1.27s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 10Tidak mengikuti instruksi: 3Waktu respons (rata-rata)1.17sWaktu respons (maks)2.52sWaktu respons (total)19.82sโฆ
Trik anti-AI
: 3.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)929msWaktu respons (maks)1.55sWaktu respons (total)3.72s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.52sWaktu respons (maks)2.52sWaktu respons (total)2.52s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.30sWaktu respons (maks)1.58sWaktu respons (total)2.61s
Spesifik domain
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)937msWaktu respons (maks)1.25sWaktu respons (total)2.81s
Kecerdasan umum
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.82sWaktu respons (maks)1.82sWaktu respons (total)1.82s
Kepatuhan instruksi
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)728msWaktu respons (maks)731msWaktu respons (total)1.46s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)2.32sWaktu respons (maks)2.32sWaktu respons (total)2.32s
Trik anti-AI
: 3.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)1.71sWaktu respons (maks)3.79sWaktu respons (total)6.84s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)5.91sWaktu respons (maks)5.91sWaktu respons (total)5.91s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)847msWaktu respons (maks)1.09sWaktu respons (total)1.69s
Spesifik domain
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)464msWaktu respons (maks)622msWaktu respons (total)1.39s
Kecerdasan umum
: 4.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)552msWaktu respons (maks)552msWaktu respons (total)552ms
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)514msWaktu respons (maks)582msWaktu respons (total)1.03s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)1.27sWaktu respons (maks)1.27sWaktu respons (total)1.27s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 9Tidak mengikuti instruksi: 5Waktu respons (rata-rata)11.57sWaktu respons (maks)81.80sWaktu respons (total)127.32sโฆ
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)4.28sWaktu respons (maks)4.28sWaktu respons (total)4.28s
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)81.80sWaktu respons (maks)81.80sWaktu respons (total)81.80s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)638msWaktu respons (maks)638msWaktu respons (total)638ms
Kecerdasan umum
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.39sWaktu respons (maks)1.39sWaktu respons (total)1.39s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.64sWaktu respons (maks)2.64sWaktu respons (total)2.64s
Gabungan
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Pemanggilan alat tidak valid: 1Waktu respons (rata-rata)65.57sWaktu respons (maks)65.57sWaktu respons (total)65.57s
Parsing dan ekstraksi data
: 6.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban: 1Waktu respons (rata-rata)1.51sWaktu respons (maks)1.51sWaktu respons (total)1.51s
Kecerdasan umum
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)18.14sWaktu respons (maks)18.14sWaktu respons (total)18.14s
Kepatuhan instruksi
: 6.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.97sWaktu respons (maks)2.97sWaktu respons (total)2.97s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)15.95sWaktu respons (maks)15.95sWaktu respons (total)15.95s
Trik anti-AI
: 5.1 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 2Jawaban salah: 1Waktu respons (rata-rata)34.44sWaktu respons (maks)57.86sWaktu respons (total)103.31s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Spesifik domain
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 3Waktu respons (rata-rata)137.75sWaktu respons (maks)202.61sWaktu respons (total)413.24s
Kecerdasan umum
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Waktu respons (rata-rata)226.38sWaktu respons (maks)226.38sWaktu respons (total)226.38s
Kepatuhan instruksi
: 6.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kedaluwarsa: 1Waktu respons (rata-rata)17.15sWaktu respons (maks)28.54sWaktu respons (total)34.29s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)4.31sWaktu respons (maks)4.31sWaktu respons (total)4.31s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 12Tidak mengikuti instruksi: 2Waktu respons (rata-rata)1.76sWaktu respons (maks)5.51sWaktu respons (total)17.56sโฆ
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.33sWaktu respons (maks)3.33sWaktu respons (total)3.33s
Parsing dan ekstraksi data
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)943msWaktu respons (maks)943msWaktu respons (total)943ms
Spesifik domain
: 5.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)1.06sWaktu respons (maks)1.06sWaktu respons (total)1.06s
Kecerdasan umum
: 4.4 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.08sWaktu respons (maks)1.08sWaktu respons (total)1.08s
Kepatuhan instruksi
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)923msWaktu respons (maks)923msWaktu respons (total)923ms
Pemecahan teka-teki
: 3.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)1.28sWaktu respons (maks)1.36sWaktu respons (total)2.56s
Pemanggilan alat
: 2.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)5.51sWaktu respons (maks)5.51sWaktu respons (total)5.51s
Trik anti-AI
: 3.2 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)1.19sWaktu respons (maks)2.73sWaktu respons (total)4.76s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)2.87sWaktu respons (maks)2.87sWaktu respons (total)2.87s
Spesifik domain
: 5.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)564msWaktu respons (maks)564msWaktu respons (total)564ms
Kecerdasan umum
: 4.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.67sWaktu respons (maks)1.67sWaktu respons (total)1.67s
Kepatuhan instruksi
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)857msWaktu respons (maks)955msWaktu respons (total)1.71s
Pemecahan teka-teki
: 3.6 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)1.38sWaktu respons (maks)1.74sWaktu respons (total)2.75s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)2.28sWaktu respons (maks)2.28sWaktu respons (total)2.28s
Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 12Tidak mengikuti instruksi: 3Waktu respons (rata-rata)1.39sWaktu respons (maks)3.84sWaktu respons (total)23.70sโฆ
Trik anti-AI
: 3.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 4Waktu respons (rata-rata)1.18sWaktu respons (maks)1.81sWaktu respons (total)4.70s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)3.84sWaktu respons (maks)3.84sWaktu respons (total)3.84s
Parsing dan ekstraksi data
: 6.5 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 1Waktu respons (rata-rata)1.11sWaktu respons (maks)1.25sWaktu respons (total)2.23s
Spesifik domain
: 2.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)926msWaktu respons (maks)959msWaktu respons (total)2.78s
Kecerdasan umum
: 3.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)1.31sWaktu respons (maks)1.31sWaktu respons (total)1.31s
Pemanggilan alat
: 10.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak ada jawaban gagal.Waktu respons (rata-rata)3.40sWaktu respons (maks)3.40sWaktu respons (total)3.40s
Trik anti-AI
: 3.3 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 3Waktu respons (rata-rata)471msWaktu respons (maks)872msWaktu respons (total)1.41s
Gabungan
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms
Parsing dan ekstraksi data
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)714msWaktu respons (maks)987msWaktu respons (total)1.43s
Spesifik domain
: 5.9 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Jawaban salah: 1Waktu respons (rata-rata)287msWaktu respons (maks)334msWaktu respons (total)860ms
Kecerdasan umum
: 4.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Tidak mengikuti instruksi: 1Waktu respons (rata-rata)395msWaktu respons (maks)395msWaktu respons (total)395ms
Kepatuhan instruksi
: 4.8 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Jawaban salah: 2Waktu respons (rata-rata)1.09sWaktu respons (maks)1.90sWaktu respons (total)2.18s
Pemanggilan alat
: 3.0 Tes dianggap lulus penuh hanya jika semua run-nya lulus.Kesalahan API: 1Waktu respons (rata-rata)0msWaktu respons (maks)0msWaktu respons (total)0ms