AI BENCHY Compare

Google: Gemma 4 26B A4B vs Inception: Mercury 2

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-19

Métrica	Gemma 4 26B A4B Gemma 4 26B A4B none Lançamento: 2026-04-03 Disponível grátis	Mercury 2 Mercury 2 medium Lançamento: 2026-02-24

Métrica	Gemma 4 26B A4B Gemma 4 26B A4B none Lançamento: 2026-04-03 Disponível grátis	Mercury 2 Mercury 2 medium Lançamento: 2026-02-24
Pontuação	6.3	6.3
Posição	#89	#87
Confiabilidade	10.0	10.0
Consistência	9.1	8.7
Testes corretos
Taxa de acerto por tentativa	49.1%	50.9%
Testes instáveis	2	3
Execuções totais	57	57
Custo por resultado	0.063	0.616
Custo total	$0.005	$0.050
Preço de entrada	$0.060 / 1M	$0.250 / 1M
Preço de saída	$0.330 / 1M	$0.750 / 1M
Tokens de saída	1,796	3,994
Tokens de raciocínio	0	52,081
Tempo de resposta (médio)	6.28s	2.23s
Tempo de resposta (máx.)	57.10s	14.63s
Tempo de resposta (total)	119.39s	40.10s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemma 4 26B A4B	8.3	10.0	75.0%	0		1.28s	230	0
Mercury 2	6.9	9.9	50.0%	0		1.12s	2,546	2,609

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemma 4 26B A4B	4.7	1.6	66.7%	1		7.07s	448	0
Mercury 2	10.0	10.0	100.0%	0		1.53s	249	2,213

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemma 4 26B A4B	3.0	10.0	0.0%	0		30.53s	309	0
Mercury 2	10.0	10.0	100.0%	0		3.28s	268	4,887

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemma 4 26B A4B	10.0	10.0	100.0%	0		1.70s	285	0
Mercury 2	7.3	5.9	83.3%	1		1.11s	183	1,656

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemma 4 26B A4B	3.6	7.2	22.2%	1		2.49s	27	0
Mercury 2	2.9	7.2	11.1%	1		6.48s	41	30,754

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemma 4 26B A4B	4.0	10.0	0.0%	0		3.54s	85	0
Mercury 2	4.8	10.0	0.0%	0		821ms	137	542

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemma 4 26B A4B	6.3	10.0	50.0%	0		1.08s	75	0
Mercury 2	10.0	10.0	100.0%	0		1.07s	14	958

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemma 4 26B A4B	6.2	10.0	33.3%	0		739ms	114	0
Mercury 2	3.8	7.3	22.2%	1		934ms	354	2,758

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemma 4 26B A4B	10.0	10.0	100.0%	0		57.10s	210	0
Mercury 2	10.0	10.0	100.0%	0		1.89s	180	1,956

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Gemma 4 26B A4B	3.0	10.0	0.0%	0		778ms	13	0
Mercury 2	3.0	10.0	0.0%	0		2.58s	22	3,748

Comparação rápida

Trocar par de comparação

Gemma 4 26B A4BnoneDisponível grátisvsGPT-5 Nanomedium Gemini 2.5 FlashnonevsMercury 2medium Mercury 2mediumvsMiMo-V2-Omninone DeepSeek V4 PrononevsMercury 2medium Mercury 2mediumvsGLM 5none Gemma 4 26B A4BnoneDisponível grátisvsNemotron 3 SupermediumDisponível grátis Gemma 4 26B A4BnoneDisponível grátisvsGrok 4.1 Fastmedium Mercury 2mediumvsQwen3.5 Plus 2026-02-15none Gemma 4 26B A4BnoneDisponível grátisvsOwl Alphamedium Seed-2.0-LitenonevsMercury 2medium Mercury 2mediumvsGLM 5V Turbonone Mercury 2mediumvsQwen3.5-Flashnone