AI BENCHY Compare

Trinity Large Preview vs DeepSeek: DeepSeek V3.2

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-06-03

Metrik	Trinity Large Preview Trinity Large Preview none Rilis: 2026-01-27	DeepSeek V3.2 DeepSeek V3.2 none Rilis: 2025-12-01

Metrik	Trinity Large Preview Trinity Large Preview none Rilis: 2026-01-27	DeepSeek V3.2 DeepSeek V3.2 none Rilis: 2025-12-01
Skor	4.7	5.4
Peringkat	#148	#130
Keandalan	10.0	10.0
Konsistensi	9.3	7.5
Tes benar
Tingkat lulus per percobaan	23.3%	41.7%
Tes tidak stabil	2	6
Total Run	60	60
Biaya per hasil	0.017	0.296
Total Biaya	$0.008	$0.017
Harga input	$0.243 / 1M	$0.229 / 1M
Harga output	$0.243 / 1M	$0.344 / 1M
Total token input	29,828	53,408
Token output	2,169	11,159
Token penalaran	0	0
Waktu respons (rata-rata)	2.98s	14.43s
Waktu respons (maks)	14.34s	115.89s
Waktu respons (total)	56.57s	288.55s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	3.1	10.0	0.0%	0		2.07s	651	550	0
DeepSeek V3.2	3.2	8.0	8.3%	1		9.35s	494	1,073	0

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	4.0	6.6	16.7%	1		14.34s	738	397	0
DeepSeek V3.2	3.1	5.4	16.7%	1		20.87s	4,690	4,522	0

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	3.0	10.0	0.0%	0		8.91s	12,053	294	0
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	29,843	2,887	0

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	6,900	186	0
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	7,890	1,710	0

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	738	25	0
DeepSeek V3.2	2.9	7.2	11.1%	1		4.17s	624	21	0

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	4.5	10.0	0.0%	0		873ms	498	104	0
DeepSeek V3.2	4.7	1.6	66.7%	1		9.32s	314	43	0

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	3.5	10.0	0.0%	0		822ms	678	63	0
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	627	66	0

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	3.6	7.7	11.1%	1		1.97s	669	265	0
DeepSeek V3.2	7.6	7.2	77.8%	1		6.91s	424	298	0

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	6,699	267	0
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	8,319	522	0

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	3.0	10.0	0.0%	0		777ms	204	18	0
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	183	17	0

Perbandingan Cepat

Ganti Pasangan Perbandingan

Trinity Large PreviewnonevsQwen3 Coder Nextmedium DeepSeek V3.2nonevsMistral Small 4medium DeepSeek V3.2nonevsMiniMax M2.7medium DeepSeek V3.2nonevsMiniMax M2.5medium DeepSeek V3.2nonevsElephant Alphamedium Trinity Large PreviewnonevsGLM 4.7 Flashmedium CobuddymediumvsDeepSeek V3.2none Trinity Large PreviewnonevsQwen3.5-9Bmedium DeepSeek V3.2nonevsOwl Alphamedium DeepSeek V3.2nonevsgpt-oss-120bmediumTersedia gratis Trinity Large PreviewnonevsElephant Alphamedium DeepSeek V3.2nonevsNemotron 3 SupermediumTersedia gratis