Claude Opus 4.8 vs Gemma 4 26B A4B (medium)

Modelo recomendado Claude Opus 4.8

Tem a melhor pontuação aqui (7.3) e responde cerca de 21.1x mais rápido que Gemma 4 26B A4B (medium).

Comparação detalhada

Métrica	Claude Opus 4.8 Claude Opus 4.8 none Lançamento: 2026-05-28	Gemma 4 26B A4B Gemma 4 26B A4B medium Lançamento: 2026-04-03 Disponível grátis

Métrica	Claude Opus 4.8 Claude Opus 4.8 none Lançamento: 2026-05-28	Gemma 4 26B A4B Gemma 4 26B A4B medium Lançamento: 2026-04-03 Disponível grátis
Pontuação	7.3	6.6
Posição	#74	#104
Confiabilidade	10.0	9.4
Consistência	9.2	9.2
Testes corretos
Taxa de acerto por tentativa	63.6%	66.7%
Testes instáveis	2	2
Execuções totais	66	66
Custo por resultado	8.969	0.643
Custo total	$1.166	$0.096
Preço de entrada	$5.000 / 1M	$0.120 / 1M
Preço de saída	$25.000 / 1M	$0.350 / 1M
Total de tokens de entrada	149,206	77,550
Tokens de saída	16,797	28,036
Tokens de raciocínio	0	219,491
Tempo de resposta (médio)	4.91s	103.83s
Tempo de resposta (máx.)	35.03s	912.19s
Tempo de resposta (total)	108.03s	2180.47s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

SVG inválido

Categoria:

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	6.5	10.0	50.0%	0		3.40s	834	1,472	0
Gemma 4 26B A4B	10.0	10.0	100.0%	0		6.20s	816	1,142	3,045

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	5.5	10.0	33.3%	0		3.29s	10,590	1,332	0
Gemma 4 26B A4B	2.9	10.0	0.0%	0		272.54s	5,062	14,838	44,567

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	9.8	10.0	100.0%	0		26.38s	111,760	11,949	0
Gemma 4 26B A4B	6.3	10.0	50.0%	0		492.87s	54,390	5,451	132,113

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	7.3	5.8	83.3%	1		1.77s	10,503	308	0
Gemma 4 26B A4B	10.0	10.0	100.0%	0		16.51s	8,334	1,567	2,827

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	5.3	7.2	44.4%	1		1.70s	975	61	0
Gemma 4 26B A4B	2.9	4.4	22.2%	2		23.62s	516	2,469	7,105

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	10.0	10.0	100.0%	0		3.48s	708	230	0
Gemma 4 26B A4B	10.0	10.0	100.0%	0		29.76s	567	25	5,075

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	9.9	10.0	100.0%	0		1.37s	909	95	0
Gemma 4 26B A4B	10.0	10.0	100.0%	0		17.54s	777	887	4,470

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	7.7	10.0	66.7%	0		2.74s	894	783	0
Gemma 4 26B A4B	10.0	10.0	100.0%	0		5.79s	801	410	2,128

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	10.0	10.0	100.0%	0		5.35s	11,775	355	0
Gemma 4 26B A4B	10.0	10.0	100.0%	0		9.01s	6,096	450	1,256

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	3.0	10.0	0.0%	0		3.41s	258	212	0
Gemma 4 26B A4B	3.0	10.0	0.0%	0		180.87s	191	797	16,905

Trocar par de comparação