Comparar Gráficos

Idioma:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: GPT-5 Mini vs Qwen: Qwen3 Coder Next

Comparar:

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-05

Métrica	OpenAI: GPT-5 Mini medium Lançamento: 2025-08-07	Qwen: Qwen3 Coder Next none Lançamento: 2026-02-03
Posição	#31	#49
Pontuação média	6.1	3.6
Testes corretos
Consistência	8.9	10.0
Custo por resultado	1.401	0.226
Custo total	$0.113	$0.007
Taxa de acerto por tentativa	62.2%	20.0%
Testes instáveis	2	0
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
Tokens de saída	5,477	2,874
Tokens de raciocínio	46,912	0
Tempo de resposta (médio)	25.92s	12.82s
Tempo de resposta (máx.)	88.15s	45.14s
Tempo de resposta (total)	388.79s	115.42s

Melhores modelos por pontuação

Tempo de resposta (médio)

Pontuação vs custo total

Pontuação média vs Tempo de resposta (médio)

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
OpenAI: GPT-5 Mini	7.0	9.6	66.7%	0		16.45s	1,645	5,824
Qwen: Qwen3 Coder Next	2.3	10.0	0.0%	0		4.39s	1,315	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
OpenAI: GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	754	11,520
Qwen: Qwen3 Coder Next	10.0	10.0	0.0%	0		45.14s	317	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
OpenAI: GPT-5 Mini	9.9	10.0	100.0%	0		12.58s	453	3,200
Qwen: Qwen3 Coder Next	5.4	10.0	50.0%	0		1.32s	246	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
OpenAI: GPT-5 Mini	10.0	7.2	22.2%	1		44.63s	293	14,016
Qwen: Qwen3 Coder Next	4.0	10.0	33.3%	0		962ms	26	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
OpenAI: GPT-5 Mini	7.5	6.6	83.3%	1		15.66s	318	4,992
Qwen: Qwen3 Coder Next	4.5	10.0	0.0%	0		7.71s	63	0

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
OpenAI: GPT-5 Mini	4.3	9.8	33.3%	0		14.09s	1,527	5,760
Qwen: Qwen3 Coder Next	1.3	10.0	0.0%	0		22.86s	652	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
OpenAI: GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	487	1,600
Qwen: Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	255	0

Comparação rápida

Trocar par de comparação

GPT-5 MinimediumvsGLM 5none Qwen3 Coder NextnonevsGLM 4.7 Flashmedium GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none Claude Sonnet 4.6nonevsGPT-5 Minimedium Gemini 2.5 FlashnonevsGPT-5 Minimedium DeepSeek V3.2nonevsGPT-5 Minimedium Gemini 3 Flash PreviewnonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5-122B-A10Bnone GPT-5 MinimediumvsQwen3.5-Flashnone GPT-5 MinimediumvsQwen3.5-27Bnone MiniMax M2.5mediumvsQwen3 Coder Nextnone Gemini 3.1 Flash Lite PreviewnonevsGPT-5 Minimedium