AI BENCHY Compare

Trinity Large Preview vs MiniMax: MiniMax M2.7

Ringkasan

Perbandingan benchmark Trinity Large Preview vs MiniMax M2.7: MiniMax M2.7 unggul dalam skor rata-rata dengan 5.2 vs 5.0. Trinity Large Preview memiliki biaya benchmark lebih rendah di $0.008 vs $0.104. Trinity Large Preview lebih cepat di 2.98s vs 38.18s, dengan tingkat keberhasilan 22.2% vs 46.0%.

Model yang direkomendasikan: Trinity Large Preview - Its score stays close to the best score here (5.0 vs 5.2), while costing about 13.4x less than MiniMax M2.7.

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-06-12

Metrik	Trinity Large Preview Trinity Large Preview none Rilis: 2026-01-27	MiniMax M2.7 MiniMax M2.7 medium Rilis: 2026-03-18

Metrik	Trinity Large Preview Trinity Large Preview none Rilis: 2026-01-27	MiniMax M2.7 MiniMax M2.7 medium Rilis: 2026-03-18
Skor	5.0	5.2
Peringkat	#142	#134
Keandalan	10.0	10.0
Konsistensi	9.3	6.8
Tes benar
Tingkat lulus per percobaan	22.2%	46.0%
Tes tidak stabil	2	8
Total Run	63	63
Biaya per hasil	0.017	2.494
Total Biaya	$0.008	$0.104
Harga input	$0.243 / 1M	$0.250 / 1M
Harga output	$0.243 / 1M	$1.000 / 1M
Total token input	29,828	34,371
Token output	2,169	8,981
Token penalaran	0	89,812
Waktu respons (rata-rata)	2.98s	38.18s
Waktu respons (maks)	14.34s	196.21s
Waktu respons (total)	56.57s	763.60s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#142 Trinity Large Preview

none

No showcase result has been generated for this model yet.

Cost: $0.000
Time: -
Tokens: 0 tok

#134 MiniMax M2.7

medium

Cost: $0.022
Time: 22.8s
Tokens: 9,250 tok

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	3.1	10.0	0.0%	0		2.07s	651	550	0
MiniMax M2.7	7.9	6.3	83.3%	2		40.32s	654	3,010	17,716

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	3.7	7.7	11.1%	1		14.34s	738	397	0
MiniMax M2.7	5.7	9.1	33.3%	0		101.89s	2,961	1,231	38,841

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	3.0	10.0	0.0%	0		8.91s	12,053	294	0
MiniMax M2.7	4.7	1.6	66.7%	1		41.03s	14,233	369	4,480

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	6,900	186	0
MiniMax M2.7	6.3	5.8	66.7%	1		21.95s	7,152	187	5,882

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	738	25	0
MiniMax M2.7	3.0	10.0	0.0%	0		19.00s	245	8	2,796

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	4.5	10.0	0.0%	0		873ms	498	104	0
MiniMax M2.7	3.9	2.5	33.3%	1		38.70s	486	92	5,204

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	3.5	10.0	0.0%	0		822ms	678	63	0
MiniMax M2.7	3.8	5.8	33.3%	1		12.80s	687	350	2,600

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	3.6	7.7	11.1%	1		1.97s	669	265	0
MiniMax M2.7	5.9	7.2	55.6%	1		24.87s	675	362	7,840

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	6,699	267	0
MiniMax M2.7	4.7	1.6	66.7%	1		12.05s	7,067	304	1,001

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Trinity Large Preview	3.0	10.0	0.0%	0		777ms	204	18	0
MiniMax M2.7	3.0	10.0	0.0%	0		22.77s	211	3,068	3,452

Perbandingan Cepat

Ganti Pasangan Perbandingan

MiniMax M2.7mediumvsQwen3.6 35B A3Bnone MiniMax M2.7mediumvsMistral Small 4none MiniMax M2.7mediumvsQwen3 Coder Nextnone Trinity Large PreviewnonevsCobuddymedium MiniMax M2.7mediumvsMiMo-V2.5none DeepSeek V3.2nonevsMiniMax M2.7medium MiniMax M2.7mediumvsQwen3.5-9Bnone MiniMax M2.7mediumvsQwen3.5-122B-A10Bnone Trinity Large PreviewnonevsMistral Small 4medium MiniMax M2.7mediumvsGPT-5.4 Mininone MiniMax M2.7mediumvsGrok 4.20none MiniMax M2.7mediumvsGLM 5 Turbonone