Comparar Gráficos Metodologia

Idioma:

❤️ Made by XCS

AI BENCHY Compare

Trinity Large Preview vs Google: Gemini 3.1 Pro Preview

Comparar:

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-06

Métrica	Trinity Large Preview none Lançamento: 2026-01-27 Disponível grátis	Google: Gemini 3.1 Pro Preview medium Lançamento: 2026-02-19
Posição	#45	#2
Pontuação média	4.2	9.4
Consistência	9.6	10.0
Custo por resultado	0.000	3.417
Custo total	$0.000	$0.513
Testes corretos
Taxa de acerto por tentativa	33.3%	93.8%
Testes instáveis	1	0
Execuções totais	48 (16 x 3)	48 (16 x 3)
Tokens de saída	1,837	1,521
Tokens de raciocínio	0	35,656
Tempo de resposta (médio)	3.15s	16.60s
Tempo de resposta (máx.)	8.91s	40.61s
Tempo de resposta (total)	50.46s	149.36s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação média vs Tempo de resposta (médio)

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
Google: Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.52s	106	2,533

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
Google: Gemini 3.1 Pro Preview	9.0	10.0	100.0%	0		40.61s	432	9,281

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
Google: Gemini 3.1 Pro Preview	9.9	10.0	100.0%	0		7.72s	279	3,904

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
Google: Gemini 3.1 Pro Preview	7.0	10.0	66.7%	0		32.73s	18	12,424

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
Google: Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
Google: Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
Google: Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
Google: Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982

Comparação rápida

Trocar par de comparação

Trinity Large PreviewnoneDisponível grátisvsMiniMax M2.5medium Trinity Large PreviewnoneDisponível grátisvsQwen3 Coder Nextmedium Trinity Large PreviewnoneDisponível grátisvsgpt-oss-120bmediumDisponível grátis Trinity Large PreviewnoneDisponível grátisvsMercury 2medium Trinity Large PreviewnoneDisponível grátisvsGLM 4.7 Flashmedium Trinity Large PreviewnoneDisponível grátisvsQwen3.5-35B-A3Bmedium Trinity Large PreviewnoneDisponível grátisvsGPT-5 Nanomedium Trinity Large PreviewnoneDisponível grátisvsGPT-5 Minimedium Gemini 3.1 Pro PreviewmediumvsGPT-5.2 Chatnone Trinity Large PreviewnoneDisponível grátisvsGrok 4.1 Fastmedium Gemini 3.1 Pro PreviewmediumvsGPT-5.3 Chatnone Trinity Large PreviewnoneDisponível grátisvsKimi K2.5medium