AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Owl Alpha

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-04-30

Metrik	DeepSeek V3.2 DeepSeek V3.2 none Rilis: 2025-12-01	Owl Alpha Owl Alpha none Rilis: 2026-04-30

Metrik	DeepSeek V3.2 DeepSeek V3.2 none Rilis: 2025-12-01	Owl Alpha Owl Alpha none Rilis: 2026-04-30
Skor	6.0	6.0
Peringkat	#85	#87
Keandalan	T/A	10.0
Konsistensi	8.6	9.1
Tes benar
Tingkat lulus per percobaan	46.3%	46.3%
Tes tidak stabil	3	2
Total Run	52	54
Biaya per hasil	0.225	0.000
Total Biaya	$0.016	$0.000
Harga input	$0.252 / 1M	$0.000 / 1M
Harga output	$0.378 / 1M	$0.000 / 1M
Token output	8,378	1,671
Token penalaran	0	0
Waktu respons (rata-rata)	12.07s	7.07s
Waktu respons (maks)	115.89s	32.27s
Waktu respons (total)	217.28s	127.23s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	3.2	9.8	0.0%	0		7.63s	1,419	0
Owl Alpha	3.4	7.9	16.7%	1		2.78s	57	0

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	2.4	1.3	33.3%	1		7.63s	553	0
Owl Alpha	10.0	10.0	100.0%	0		32.27s	450	0

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
Owl Alpha	3.0	10.0	0.0%	0		21.74s	315	0

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
Owl Alpha	10.0	10.0	100.0%	0		3.60s	246	0

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	3.0	10.0	0.0%	0		1.52s	18	0
Owl Alpha	5.3	10.0	33.3%	0		3.00s	27	0

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	10.0	10.0	100.0%	0		2.86s	67	0
Owl Alpha	4.3	10.0	0.0%	0		4.61s	80	0

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
Owl Alpha	6.4	10.0	50.0%	0		2.63s	63	0

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	8.5	7.5	88.9%	1		7.37s	1,136	0
Owl Alpha	5.9	7.2	55.6%	1		4.43s	202	0

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
Owl Alpha	10.0	10.0	100.0%	0		22.78s	231	0

Perbandingan Cepat

Ganti Pasangan Perbandingan

gpt-oss-120bmediumTersedia gratisvsOwl Alphanone DeepSeek V3.2nonevsLaguna Xs.2mediumTersedia gratis DeepSeek V3.2nonevsgpt-oss-120bmediumTersedia gratis DeepSeek V3.2nonevsOwl Alphamedium Owl AlphanonevsLaguna Xs.2mediumTersedia gratis Mistral Small 4mediumvsOwl Alphanone DeepSeek V3.2nonevsLaguna M.1mediumTersedia gratis MiniMax M2.5mediumTersedia gratisvsOwl Alphanone DeepSeek V3.2nonevsMistral Small 4medium Owl AlphanonevsLaguna M.1mediumTersedia gratis DeepSeek V3.2nonevsMiniMax M2.5mediumTersedia gratis DeepSeek V3.2nonevsGPT-5 Nanomedium