#84

Cobuddy

Baidu Rilis: 2026-05-06 Diuji pada: 2026-05-06 11:30 baidu/cobuddy::medium

Ringkasan

Cobuddy mendapat skor 6.0 di AI BENCHY dan berada di peringkat #84. Model ini memiliki reliabilitas 9.9, tingkat keberhasilan 53.7%, total biaya $0.000, dan waktu respons rata-rata 35.89s.

Yang membuat Cobuddy unik: Total biaya benchmark-nya sangat rendah untuk kisaran skornya.

Skor

6.0

Konsistensi

7.6

Keandalan

9.9

Total biaya (harga saat ini)

$0.000

Total token output

88,220

Total token input

Harga input

$0.000 / 1M

Harga output

$0.000 / 1M

Tes benar

Tes Salah: 11

Tingkat lulus per percobaan: 53.7%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

35.89s

Waktu respons (maks): 309.02s

Waktu respons (total): 646.00s

Jawaban salah: 6 Tidak mengikuti instruksi: 4 Pemanggilan alat tidak valid: 1

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#84 Cobuddy

medium

No endpoints found for baidu/cobuddy:free.

Biaya: $0.000
Waktu: 0.1s
Token: 0 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-06-04 13:47 Tes baru ditambahkan	5.6	10.0	$0.000	Bandingkan
2026-05-22 00:23 Suite berubah	5.7	9.9	$0.000	Bandingkan
2026-05-06 11:30 Run pertama yang tercatat	6.0	9.9	$0.000	Run saat ini

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

CobuddymediumTersedia gratisvsDeepSeek V4 Flashnone CobuddymediumTersedia gratisvsKimi K2.5none CobuddymediumTersedia gratisvsMiMo-V2.5-Pronone CobuddymediumTersedia gratisvsGemini 3.5 Flashhigh CobuddymediumTersedia gratisvsGemini 3 Flash Previewmedium CobuddymediumTersedia gratisvsNemotron 3 Ultra 550b A55bmediumTersedia gratis CobuddymediumTersedia gratisvsGPT-5.5low

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	8.7	7.9
Pemrograman	4.3	1.1
Gabungan	3.0	10.0
Parsing dan ekstraksi data	6.3	5.8
Spesifik domain	2.9	7.2
Kecerdasan umum	4.2	9.9
Kepatuhan instruksi	9.8	10.0
Pemecahan teka-teki	3.7	6.8
Pemanggilan alat	10.0	10.0

Cobuddy

Hamster playing table tennis

#84 Cobuddy

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan