Comparar Gráficos Metodologia

Idioma:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.5-35B-A3B

Comparar:

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-06

Métrica	Google: Gemini 3.1 Flash Lite Preview none Lançamento: 2026-03-03	Qwen: Qwen3.5-35B-A3B medium Lançamento: 2026-02-24
Pontuação média	7.4	5.8
Posição	#21	#34
Testes corretos
Consistência	9.6	6.7
Custo por resultado	0.142	4.189
Custo total	$0.015	$0.336
Taxa de acerto por tentativa	71.1%	80.0%
Testes instáveis	1	6
common.totalRuns	45 (15 x 3)	45 (15 x 3)
Tokens de saída	4,646	5,475
Tokens de raciocínio	0	165,513
Tempo de resposta (médio)	1.37s	44.84s
Tempo de resposta (máx.)	3.39s	106.00s
Tempo de resposta (total)	20.53s	672.55s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação média vs Tempo de resposta (médio)

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	6.0	7.8	55.6%	1		1.16s	1,086	0
Qwen: Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.75s	429	36,235

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	10.0	10.0	0.0%	0		3.20s	339	0
Qwen: Qwen3.5-35B-A3B	10.0	1.6	66.7%	1		75.34s	775	12,485

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	9.9	10.0	100.0%	0		1.22s	399	0
Qwen: Qwen3.5-35B-A3B	5.5	5.9	83.3%	1		59.33s	235	19,493

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	4.0	10.0	33.3%	0		942ms	568	0
Qwen: Qwen3.5-35B-A3B	10.0	4.4	44.5%	2		88.34s	41	46,368

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.13s	574	0
Qwen: Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	97	17,361

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		972ms	898	0
Qwen: Qwen3.5-35B-A3B	4.0	4.4	77.8%	2		31.58s	3,589	32,206

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Google: Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.39s	782	0
Qwen: Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	309	1,365

Comparação rápida

Trocar par de comparação

Qwen3.5-35B-A3BmediumvsGLM 5none Gemini 3.1 Flash Lite PreviewnonevsGLM 5medium Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2-Flashmedium Gemini 3.1 Flash Lite PreviewnonevsStep 3.5 FlashmediumDisponível grátis Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewnone DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewnone Seed-2.0-MinimediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-Flashmedium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.2medium Gemini 2.5 FlashnonevsQwen3.5-35B-A3Bmedium DeepSeek V3.2nonevsQwen3.5-35B-A3Bmedium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.4medium