Comparar Gráficos Metodologia

Idioma:

❤️ Made by XCS

AI BENCHY Compare

Trinity Large Preview vs OpenAI: GPT-5.4

Comparar:

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-06

Métrica	Trinity Large Preview none Lançamento: 2026-01-27 Disponível grátis	OpenAI: GPT-5.4 none Lançamento: 2026-03-05
Posição	#45	#44
Pontuação média	4.2	4.5
Consistência	9.6	8.9
Custo por resultado	0.000	1.562
Custo total	$0.000	$0.094
Testes corretos
Taxa de acerto por tentativa	33.3%	41.7%
Testes instáveis	1	2
Execuções totais	48 (16 x 3)	48 (16 x 3)
Tokens de saída	1,837	1,819
Tokens de raciocínio	0	0
Tempo de resposta (médio)	3.15s	1.48s
Tempo de resposta (máx.)	8.91s	2.89s
Tempo de resposta (total)	50.46s	23.64s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação média vs Tempo de resposta (médio)

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
OpenAI: GPT-5.4	3.0	9.9	0.0%	0		1.78s	184	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0

Comparação rápida

Trocar par de comparação

MiniMax M2.5mediumvsGPT-5.4none Trinity Large PreviewnoneDisponível grátisvsMiniMax M2.5medium Trinity Large PreviewnoneDisponível grátisvsQwen3 Coder Nextmedium Mercury 2mediumvsGPT-5.4none Trinity Large PreviewnoneDisponível grátisvsgpt-oss-120bmediumDisponível grátis GPT-5.4nonevsQwen3 Coder Nextmedium GPT-5.4nonevsQwen3.5-35B-A3Bmedium Trinity Large PreviewnoneDisponível grátisvsMercury 2medium Trinity Large PreviewnoneDisponível grátisvsGLM 4.7 Flashmedium Trinity Large PreviewnoneDisponível grátisvsQwen3.5-35B-A3Bmedium Trinity Large PreviewnoneDisponível grátisvsGPT-5 Nanomedium GPT-5.4nonevsGLM 4.7 Flashmedium