Bandingkan Grafik Metodologi

Bahasa:

❤️ Made by XCS

AI BENCHY Compare

Trinity Large Preview vs xAI: Grok 4.1 Fast

Bandingkan:

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-03-06

Metrik	Trinity Large Preview none Rilis: 2026-01-27 Tersedia gratis	xAI: Grok 4.1 Fast medium Rilis: 2025-11-19
Peringkat	#45	#30
Skor Rata-rata	4.2	6.2
Konsistensi	9.6	7.9
Biaya per hasil	0.000	0.563
Total Biaya	$0.000	$0.051
Tes benar
Tingkat lulus per percobaan	33.3%	66.7%
Tes tidak stabil	1	4
Total Run	48	48
Token output	1,837	1,183
Token penalaran	0	83,875
Waktu respons (rata-rata)	3.15s	26.35s
Waktu respons (maks)	8.91s	121.79s
Waktu respons (total)	50.46s	237.11s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor Rata-rata vs Waktu respons (rata-rata)

Rincian Kategori

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
xAI: Grok 4.1 Fast	10.0	10.0	100.0%	0		5.65s	102	4,021

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
xAI: Grok 4.1 Fast	10.0	10.0	100.0%	0		37.64s	261	12,272

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
xAI: Grok 4.1 Fast	9.9	10.0	100.0%	0		6.63s	180	5,409

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
xAI: Grok 4.1 Fast	4.0	4.4	66.7%	2		121.79s	11	37,657

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
xAI: Grok 4.1 Fast	3.0	9.9	0.0%	0		16.25s	127	3,456

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
xAI: Grok 4.1 Fast	5.5	10.0	50.0%	0		5.30s	55	3,489

Puzzle Solving	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
xAI: Grok 4.1 Fast	4.0	7.2	44.4%	1		8.08s	187	6,086

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
xAI: Grok 4.1 Fast	10.0	1.6	33.3%	1		27.71s	260	11,485

Perbandingan Cepat

Ganti Pasangan Perbandingan

Qwen3.5 Plus 2026-02-15nonevsGrok 4.1 Fastmedium Grok 4.1 FastmediumvsGLM 5none Trinity Large PreviewnoneTersedia gratisvsMiniMax M2.5medium Claude Sonnet 4.6nonevsGrok 4.1 Fastmedium DeepSeek V3.2nonevsGrok 4.1 Fastmedium Trinity Large PreviewnoneTersedia gratisvsQwen3 Coder Nextmedium Trinity Large PreviewnoneTersedia gratisvsgpt-oss-120bmediumTersedia gratis Gemini 3.1 Flash Lite PreviewnonevsGrok 4.1 Fastmedium Qwen3.5-FlashnonevsGrok 4.1 Fastmedium Gemini 2.5 FlashnonevsGrok 4.1 Fastmedium Gemini 3 Flash PreviewnonevsGrok 4.1 Fastmedium Trinity Large PreviewnoneTersedia gratisvsMercury 2medium