Comparar Gráficos

Idioma:

❤️ Made by XCS

AI BENCHY Compare

Arcee AI: Trinity Large Preview (free) vs Google: Gemini 3.1 Pro Preview

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-03

Métrica	Arcee AI: Trinity Large Preview (free) none Lançamento: 2026-01-27 Disponível grátis	Google: Gemini 3.1 Pro Preview medium Lançamento: 2026-02-19
Posição	#33	#2
Pontuação média	4.34	9.36
Consistência	9.97	10.00
Custo por resultado	0.000	2.443
Custo total	$0.000	$0.318
Testes corretos	5/14	13/14
Taxa de acerto por tentativa	35.7%	92.9%
Testes instáveis	0	0
Tokens de saída	1,415	1,000
Tokens de raciocínio	0	22,936

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tokens de saída	Tokens de raciocínio
Arcee AI: Trinity Large Preview (free)	1.00	10.00	0.0%	0		587	0
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		106	2,533

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tokens de saída	Tokens de raciocínio
Arcee AI: Trinity Large Preview (free)	9.88	10.00	100.0%	0		186	0
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		292	3,164

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tokens de saída	Tokens de raciocínio
Arcee AI: Trinity Large Preview (free)	4.00	10.00	33.3%	0		21	0
Google: Gemini 3.1 Pro Preview	7.00	10.00	66.7%	0		18	10,688

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tokens de saída	Tokens de raciocínio
Arcee AI: Trinity Large Preview (free)	2.00	9.79	0.0%	0		63	0
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		72	2,436

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tokens de saída	Tokens de raciocínio
Arcee AI: Trinity Large Preview (free)	4.00	9.99	33.3%	0		291	0
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		238	3,133

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tokens de saída	Tokens de raciocínio
Arcee AI: Trinity Large Preview (free)	10.00	10.00	100.0%	0		267	0
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		274	982

Comparação rápida

Trocar par de comparação

Trinity Large Preview (free)noneDisponível grátisvsGLM 4.7 Flashmedium Trinity Large Preview (free)noneDisponível grátisvsQwen3 Coder Nextmedium Trinity Large Preview (free)noneDisponível grátisvsMiniMax M2.5medium Trinity Large Preview (free)noneDisponível grátisvsgpt-oss-120bmediumDisponível grátis Trinity Large Preview (free)noneDisponível grátisvsQwen3.5-Flashmedium Trinity Large Preview (free)noneDisponível grátisvsGPT-5 Nanomedium Trinity Large Preview (free)noneDisponível grátisvsQwen3.5-35B-A3Bmedium Trinity Large Preview (free)noneDisponível grátisvsMiMo-V2-Flashmedium Claude Opus 4.6mediumvsTrinity Large Preview (free)noneDisponível grátis Trinity Large Preview (free)noneDisponível grátisvsSeed-2.0-Minimedium Trinity Large Preview (free)noneDisponível grátisvsKimi K2.5medium Trinity Large Preview (free)noneDisponível grátisvsGrok 4.1 Fastmedium