#130
Arcee AI
Rilis: 2026-01-27
Diuji pada: 2026-05-08 15:30
arcee-ai/trinity-large-preview::none
4.8
Konsistensi
8.9
10.0
$0.001
Total token output
2,190
Total token input
0
Harga input
$0.150 / 1M
Harga output
$0.450 / 1M
Tes tidak stabil
3
Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).
Riwayat run
| Diuji pada | Skor | Keandalan | Tes benar | Total Biaya | Bandingkan |
|---|---|---|---|---|---|
| 2026-05-22 00:42 Suite berubah | 4.8 | 10.0 | $0.001 | Bandingkan | |
| 2026-05-08 15:30 Suite berubah | 4.8 | 10.0 | $0.001 | Run saat ini | |
| 2026-04-23 10:54 Run pertama yang tercatat | 5.3 | T/A | $0.000 | Bandingkan |
Run ini menggunakan suite benchmark yang berbeda. Perhatikan perubahan suite saat membaca pergerakan historis.
Perbandingan run
| Run | Skor | Konsistensi | Keandalan | Tes benar | Tes tidak stabil | Total token output | Total token input | Total Biaya | Waktu respons (rata-rata) |
|---|---|---|---|---|---|---|---|---|---|
| 2026-05-08 15:30 · Suite berubah | 4.8 | 8.9 | 10.0 | 4/19 | 3 | 2,190 | 0 | $0.001 | 3.03s |
| 2026-04-23 10:54 · Run pertama yang tercatat | 5.3 | 9.6 | T/A | 5/18 | 1 | 1,985 | 0 | $0.000 | 5.07s |
| Selisih | -0.6 | -0.7 | -1 | +2 | +205 | 0 | +$0.001 | -2037ms |
Kedua run ini menggunakan suite benchmark yang berbeda, jadi selisihnya mencerminkan perubahan model sekaligus perubahan suite.
Grafik
Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.
Skor vs Total Biaya
Waktu respons (rata-rata)
Skor vs Waktu respons (rata-rata)
Total token output
Skor vs Total token output
Perbandingan Cepat
Trinity Large PreviewnonevsMiniMax M2.7mediumTrinity Large PreviewnonevsDeepSeek V3.2noneTrinity Large PreviewnonevsGrok 4.20noneTrinity Large PreviewnonevsQwen3.5-122B-A10BnoneTrinity Large Previewnonevsgpt-oss-120bnoneTersedia gratisTrinity Large PreviewnonevsGLM 5 TurbononeTrinity Large PreviewnonevsGemini 3 Flash PreviewmediumTrinity Large PreviewnonevsGemini 3.5 FlashhighTrinity Large PreviewnonevsRing-2.6-1TmediumTrinity Large PreviewnonevsGemini 3.5 Flashlow
Rincian Kategori
| Kategori | Skor | Konsistensi | Tes benar |
|---|---|---|---|
| Trik anti-AI | 3.1 | 10.0 | |
| Pemrograman | 4.9 | 3.2 | |
| Gabungan | 3.0 | 10.0 | |
| Parsing dan ekstraksi data | 10.0 | 10.0 | |
| Spesifik domain | 5.3 | 10.0 | |
| Kecerdasan umum | 4.5 | 10.0 | |
| Kepatuhan instruksi | 3.4 | 6.2 | |
| Pemecahan teka-teki | 3.6 | 7.7 | |
| Pemanggilan alat | 10.0 | 10.0 | |
| Pengetahuan umum | 3.0 | 10.0 |