AI BENCHY
Bandingkan Grafik Metodologi
โค๏ธ Made by XCS
AD
Track all your projects in one dashboard. Get ๐Ÿ“Šstats, ๐Ÿ”ฅheatmaps and ๐Ÿ‘€recordings in one self-hosted dashboard.
uxwizz.com

#45

Trinity Large Preview

Arcee AI ยท Rilis: 2026-01-27 ยท arcee-ai/trinity-large-preview::none

Skor Rata-rata

4.2

Biaya per hasil

0.000

Konsistensi

9.6

Total Biaya

$0.000

Tes benar

Tes Salah: 11

Tingkat lulus per percobaan: 33.3%

Tes tidak stabil

1

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

3.15s

Waktu respons (maks): 8.91s

Waktu respons (total): 50.46s

Jawaban salah: 9 Tidak mengikuti instruksi: 2

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Perbandingan Cepat

Rincian Kategori

Kategori Skor Rata-rata Konsistensi Tes benar
Anti-AI Tricks 10.0 10.0
Combined 10.0 10.0
Data parsing and extraction 9.9 10.0
Domain specific 4.0 10.0
General Intelligence 3.0 9.9
Instructions following 3.5 6.7
Puzzle Solving 4.0 10.0
Tool Calling 10.0 10.0