AI BENCHY Compare

Poolside: Laguna XS 2.1 vs Qwen: Qwen3.7 Plus

Resumo

Comparação benchmark Laguna XS 2.1 vs Qwen3.7 Plus: Qwen3.7 Plus lidera na pontuação média com 7.2 vs 7.0. Qwen3.7 Plus tem menor custo de benchmark com $0.023 vs $0.036. Qwen3.7 Plus é mais rápido com 2.85s vs 30.08s, com taxas de acerto de 44.4% vs 47.6%.

Modelo recomendado: Qwen3.7 Plus - Tem a melhor pontuação aqui (7.2) e custa cerca de 1.6x menos que Laguna XS 2.1.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-07-02

Métrica	Laguna XS 2.1 Laguna XS 2.1 medium Lançamento: 2026-07-02 Disponível grátis	Qwen3.7 Plus Qwen3.7 Plus none Lançamento: 2026-06-03

Métrica	Laguna XS 2.1 Laguna XS 2.1 medium Lançamento: 2026-07-02 Disponível grátis	Qwen3.7 Plus Qwen3.7 Plus none Lançamento: 2026-06-03
Pontuação	7.0	7.2
Posição	#67	#62
Confiabilidade	10.0	10.0
Consistência	9.6	10.0
Testes corretos
Taxa de acerto por tentativa	44.4%	47.6%
Testes instáveis	1	0
Execuções totais	63	63
Custo por resultado	0.392	0.276
Custo total	$0.036	$0.023
Preço de entrada	$0.060 / 1M	$0.320 / 1M
Preço de saída	$0.120 / 1M	$1.280 / 1M
Total de tokens de entrada	45,324	42,510
Tokens de saída	25,761	6,578
Tokens de raciocínio	268,677	0
Tempo de resposta (médio)	30.08s	2.85s
Tempo de resposta (máx.)	155.23s	29.38s
Tempo de resposta (total)	631.77s	59.86s

Geração showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#67 Laguna XS 2.1

medium

Custo: $0.001
Tempo: 30.6s
Tokens: 4,678 tok

#62 Qwen3.7 Plus

none

Custo: $0.019
Tempo: 213.5s
Tokens: 11,960 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Laguna XS 2.1	4.8	10.0	25.0%	0		41.96s	774	353	73,090
Qwen3.7 Plus	6.5	10.0	50.0%	0		1.38s	696	349	0

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Laguna XS 2.1	5.5	10.0	33.3%	0		70.35s	7,995	23,767	83,258
Qwen3.7 Plus	5.5	10.0	33.3%	0		2.15s	7,911	639	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Laguna XS 2.1	9.6	10.0	100.0%	0		13.43s	18,033	507	5,908
Qwen3.7 Plus	10.0	10.0	100.0%	0		29.38s	14,952	4,505	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Laguna XS 2.1	10.0	10.0	100.0%	0		4.50s	7,734	234	3,129
Qwen3.7 Plus	10.0	10.0	100.0%	0		1.43s	7,794	243	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Laguna XS 2.1	2.9	7.2	11.1%	1		65.66s	834	17	91,533
Qwen3.7 Plus	3.0	10.0	0.0%	0		868ms	789	18	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Laguna XS 2.1	5.0	10.0	0.0%	0		4.15s	537	119	1,375
Qwen3.7 Plus	5.3	10.0	0.0%	0		1.33s	522	78	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Laguna XS 2.1	9.8	10.0	100.0%	0		2.57s	753	82	1,844
Qwen3.7 Plus	6.3	10.0	50.0%	0		929ms	711	72	0

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Laguna XS 2.1	5.3	10.0	33.3%	0		3.43s	771	357	3,355
Qwen3.7 Plus	7.7	10.0	66.7%	0		1.71s	714	443	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Laguna XS 2.1	10.0	10.0	100.0%	0		3.01s	7,638	309	748
Qwen3.7 Plus	10.0	10.0	100.0%	0		3.54s	8,211	222	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Laguna XS 2.1	3.0	10.0	0.0%	0		10.88s	255	16	4,437
Qwen3.7 Plus	3.0	10.0	0.0%	0		1.21s	210	9	0

Comparação rápida

Trocar par de comparação

Gemma 4 26B A4BmediumDisponível grátisvsQwen3.7 Plusnone Laguna XS 2.1mediumDisponível grátisvsStep 3.7 Flashhigh Gemini 3.5 FlashnonevsLaguna XS 2.1mediumDisponível grátis Qwen3.7 PlusnonevsStep 3.7 Flashhigh Qwen3.7 PlusnonevsGLM 5.1medium Laguna XS 2.1mediumDisponível grátisvsGLM 5.2none DeepSeek V4 PrononevsLaguna XS 2.1mediumDisponível grátis Gemini 3 Flash PreviewnonevsLaguna XS 2.1mediumDisponível grátis Kimi K2.7 CodemediumvsQwen3.7 Plusnone Claude Opus 4.8nonevsLaguna XS 2.1mediumDisponível grátis Qwen3.7 PlusnonevsGrok 4.20medium Laguna XS 2.1mediumDisponível grátisvsQwen3.7 Maxnone