Compară Grafice

Limbă:

❤️ Made by XCS

AI BENCHY Compare

Arcee AI: Trinity Large Preview (free) vs MoonshotAI: Kimi K2.5

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-03

Metrică	Arcee AI: Trinity Large Preview (free) none Lansare: 2026-01-27 Disponibil gratuit	MoonshotAI: Kimi K2.5 none Lansare: 2026-01-27
Rang	#33	#35
Scor mediu	4.34	4.07
Consistență	9.97	8.92
Cost per rezultat	0.000	0.232
Cost total	$0.000	$0.010
Teste corecte	5/14	4/14
Rată de trecere pe încercare	35.7%	35.7%
Teste instabile	0	2
Tokenuri de ieșire	1,415	1,915
Tokenuri de raționament	0	0

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Arcee AI: Trinity Large Preview (free)	1.00	10.00	0.0%	0		587	0
MoonshotAI: Kimi K2.5	2.67	7.86	11.1%	1		363	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Arcee AI: Trinity Large Preview (free)	9.88	10.00	100.0%	0		186	0
MoonshotAI: Kimi K2.5	5.50	5.81	83.3%	1		995	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Arcee AI: Trinity Large Preview (free)	4.00	10.00	33.3%	0		21	0
MoonshotAI: Kimi K2.5	4.00	10.00	33.3%	0		29	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Arcee AI: Trinity Large Preview (free)	2.00	9.79	0.0%	0		63	0
MoonshotAI: Kimi K2.5	5.00	9.99	50.0%	0		61	0

Puzzle Solving	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Arcee AI: Trinity Large Preview (free)	4.00	9.99	33.3%	0		291	0
MoonshotAI: Kimi K2.5	2.00	9.92	0.0%	0		247	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Tokenuri de ieșire	Tokenuri de raționament
Arcee AI: Trinity Large Preview (free)	10.00	10.00	100.0%	0		267	0
MoonshotAI: Kimi K2.5	10.00	10.00	100.0%	0		220	0

Comparație rapidă

Schimbă perechea de comparație

Kimi K2.5nonevsGLM 4.7 Flashmedium Trinity Large Preview (free)noneDisponibil gratuitvsGLM 4.7 Flashmedium Kimi K2.5nonevsQwen3 Coder Nextmedium Trinity Large Preview (free)noneDisponibil gratuitvsQwen3 Coder Nextmedium Trinity Large Preview (free)noneDisponibil gratuitvsMiniMax M2.5medium Trinity Large Preview (free)noneDisponibil gratuitvsgpt-oss-120bmediumDisponibil gratuit Trinity Large Preview (free)noneDisponibil gratuitvsQwen3.5-Flashmedium Trinity Large Preview (free)noneDisponibil gratuitvsGPT-5 Nanomedium MiniMax M2.5mediumvsKimi K2.5none Kimi K2.5nonevsgpt-oss-120bmediumDisponibil gratuit Trinity Large Preview (free)noneDisponibil gratuitvsQwen3.5-35B-A3Bmedium Trinity Large Preview (free)noneDisponibil gratuitvsMiMo-V2-Flashmedium