#22

Seed-2.0-Lite

Bytedance Seed Rilis: 2026-02-14 Diuji pada: 2026-05-22 00:37 bytedance-seed/seed-2.0-lite::medium

(medium) (none)

Ringkasan

Seed-2.0-Lite mendapat skor 8.1 di AI BENCHY dan berada di peringkat #22. Model ini memiliki reliabilitas 10.0, tingkat keberhasilan 75.0%, total biaya $0.153, dan waktu respons rata-rata 36.79s.

Yang membuat Seed-2.0-Lite unik: Total biaya benchmark-nya sangat rendah untuk kisaran skornya.

Skor

8.1

Konsistensi

8.9

Keandalan

10.0

Total biaya (harga saat ini)

$0.153

Total token output

70,569

Total token input

Harga input

$0.250 / 1M

Harga output

$2.000 / 1M

Tes benar

Tes Salah: 7

Tingkat lulus per percobaan: 75.0%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

36.79s

Waktu respons (maks): 168.71s

Waktu respons (total): 735.86s

Jawaban salah: 5 Tidak mengikuti instruksi: 2

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#22 Seed-2.0-Lite

medium

Biaya: $0.005
Waktu: 86.7s
Token: 2,354 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-07-16 23:12 Tes baru ditambahkan	7.9	10.0	$0.234	Bandingkan
2026-06-04 14:30 Tes baru ditambahkan	8.2	10.0	$0.175	Bandingkan
2026-05-22 00:37 Uji ulang	8.1	10.0	$0.153	Run saat ini
2026-04-11 01:44 Run pertama yang tercatat	8.6	T/A	$0.121	Bandingkan

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Seed-2.0-LitemediumvsGPT-5.6 Terrahigh Seed-2.0-LitemediumvsQwen3.7 Plusmedium Seed-2.0-LitemediumvsKimi K3max Seed-2.0-LitemediumvsQwen3.6 Plusmedium Seed-2.0-LitemediumvsInklingmedium Seed-2.0-LitemediumvsGLM 5.2medium Seed-2.0-LitemediumvsGLM 5.2high Seed-2.0-LitemediumvsGPT-5.6 Terramedium Seed-2.0-LitemediumvsGPT-5.2 Chatnone Seed-2.0-LitemediumvsClaude Sonnet 4.6medium

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	8.3	10.0
Pemrograman	7.0	9.7
Gabungan	10.0	10.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	5.9	7.2
Kecerdasan umum	6.7	3.6
Kepatuhan instruksi	10.0	10.0
Pemecahan teka-teki	9.0	7.9
Pemanggilan alat	10.0	10.0
Pengetahuan umum	3.0	10.0

Seed-2.0-Lite

Hamster playing table tennis

#22 Seed-2.0-Lite

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan