Bandingkan Grafik

Bahasa:

❤️ Made by XCS

AI BENCHY Compare

Arcee AI: Trinity Large Preview (free) vs Google: Gemini 3.1 Pro Preview

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-03-03

Metrik	Arcee AI: Trinity Large Preview (free) none Rilis: 2026-01-27 Tersedia gratis	Google: Gemini 3.1 Pro Preview medium Rilis: 2026-02-19
Peringkat	#33	#2
Skor Rata-rata	4.34	9.36
Konsistensi	9.97	10.00
Biaya per hasil	0.000	2.443
Total Biaya	$0.000	$0.318
Tes benar	5/14	13/14
Tingkat lulus per percobaan	35.7%	92.9%
Tes tidak stabil	0	0
Token output	1,415	1,000
Token penalaran	0	22,936

Rincian Kategori

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Token output	Token penalaran
Arcee AI: Trinity Large Preview (free)	1.00	10.00	0.0%	0		587	0
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		106	2,533

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Token output	Token penalaran
Arcee AI: Trinity Large Preview (free)	9.88	10.00	100.0%	0		186	0
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		292	3,164

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Token output	Token penalaran
Arcee AI: Trinity Large Preview (free)	4.00	10.00	33.3%	0		21	0
Google: Gemini 3.1 Pro Preview	7.00	10.00	66.7%	0		18	10,688

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Token output	Token penalaran
Arcee AI: Trinity Large Preview (free)	2.00	9.79	0.0%	0		63	0
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		72	2,436

Puzzle Solving	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Token output	Token penalaran
Arcee AI: Trinity Large Preview (free)	4.00	9.99	33.3%	0		291	0
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		238	3,133

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Token output	Token penalaran
Arcee AI: Trinity Large Preview (free)	10.00	10.00	100.0%	0		267	0
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		274	982

Perbandingan Cepat

Ganti Pasangan Perbandingan

Trinity Large Preview (free)noneTersedia gratisvsGLM 4.7 Flashmedium Trinity Large Preview (free)noneTersedia gratisvsQwen3 Coder Nextmedium Trinity Large Preview (free)noneTersedia gratisvsMiniMax M2.5medium Trinity Large Preview (free)noneTersedia gratisvsgpt-oss-120bmediumTersedia gratis Trinity Large Preview (free)noneTersedia gratisvsQwen3.5-Flashmedium Trinity Large Preview (free)noneTersedia gratisvsGPT-5 Nanomedium Trinity Large Preview (free)noneTersedia gratisvsQwen3.5-35B-A3Bmedium Trinity Large Preview (free)noneTersedia gratisvsMiMo-V2-Flashmedium Claude Opus 4.6mediumvsTrinity Large Preview (free)noneTersedia gratis Trinity Large Preview (free)noneTersedia gratisvsSeed-2.0-Minimedium Trinity Large Preview (free)noneTersedia gratisvsKimi K2.5medium Trinity Large Preview (free)noneTersedia gratisvsGrok 4.1 Fastmedium