Comparar Gráficos Metodologia

Idioma:

❤️ Made by XCS

AI BENCHY Compare

Trinity Large Preview vs OpenAI: GPT-5 Nano

Comparar:

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-06

Métrica	Trinity Large Preview none Lançamento: 2026-01-27 Disponível grátis	OpenAI: GPT-5 Nano medium Lançamento: 2025-08-07
Posição	#45	#34
Pontuação média	4.2	5.5
Consistência	9.6	7.0
Custo por resultado	0.000	0.856
Custo total	$0.000	$0.060
Testes corretos
Taxa de acerto por tentativa	33.3%	60.4%
Testes instáveis	1	6
Execuções totais	48	48
Tokens de saída	1,837	4,386
Tokens de raciocínio	0	142,080
Tempo de resposta (médio)	3.15s	47.94s
Tempo de resposta (máx.)	8.91s	204.02s
Tempo de resposta (total)	50.46s	431.47s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação média vs Tempo de resposta (médio)

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
OpenAI: GPT-5 Nano	7.0	10.0	66.7%	0		37.73s	1,107	19,968

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
OpenAI: GPT-5 Nano	10.0	10.0	100.0%	0		65.96s	578	17,984

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
OpenAI: GPT-5 Nano	10.0	1.7	50.0%	2		21.42s	453	10,560

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
OpenAI: GPT-5 Nano	4.0	4.4	55.6%	2		204.02s	237	64,448

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
OpenAI: GPT-5 Nano	3.0	10.0	0.0%	0		17.51s	202	4,608

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
OpenAI: GPT-5 Nano	9.0	6.8	83.3%	1		11.90s	382	4,096

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
OpenAI: GPT-5 Nano	4.0	7.2	44.4%	1		19.81s	869	13,440

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
OpenAI: GPT-5 Nano	10.0	10.0	100.0%	0		33.30s	558	6,976

Comparação rápida

Trocar par de comparação

DeepSeek V3.2nonevsGPT-5 Nanomedium GPT-5 NanomediumvsQwen3.5-Flashnone Gemini 2.5 FlashnonevsGPT-5 Nanomedium Trinity Large PreviewnoneDisponível grátisvsMiniMax M2.5medium GPT-5 NanomediumvsGLM 5none GPT-5 NanomediumvsQwen3.5-122B-A10Bnone GPT-5 NanomediumvsQwen3.5-27Bnone GPT-5 NanomediumvsQwen3.5 Plus 2026-02-15none Trinity Large PreviewnoneDisponível grátisvsQwen3 Coder Nextmedium GPT-5 NanomediumvsQwen3.5-35B-A3Bnone Trinity Large PreviewnoneDisponível grátisvsgpt-oss-120bmediumDisponível grátis Trinity Large PreviewnoneDisponível grátisvsMercury 2medium