Claude Opus 4.8 (medium) vs Gemini 3.5 Flash (medium)

Modelo recomendado Gemini 3.5 Flash (medium)

Tem a melhor pontuação aqui (9.1) e custa cerca de 3.0x menos que Claude Opus 4.8 (medium).

Comparação detalhada

Métrica	Claude Opus 4.8 Claude Opus 4.8 medium Lançamento: 2026-05-28	Gemini 3.5 Flash Gemini 3.5 Flash medium Lançamento: 2026-05-19

Métrica	Claude Opus 4.8 Claude Opus 4.8 medium Lançamento: 2026-05-28	Gemini 3.5 Flash Gemini 3.5 Flash medium Lançamento: 2026-05-19
Pontuação	8.8	9.1
Posição	#19	#14
Confiabilidade	10.0	10.0
Consistência	9.6	9.7
Testes corretos
Taxa de acerto por tentativa	84.9%	87.9%
Testes instáveis	1	1
Execuções totais	66	66
Custo por resultado	10.724	3.374
Custo total	$1.931	$0.642
Preço de entrada	$5.000 / 1M	$1.500 / 1M
Preço de saída	$25.000 / 1M	$9.000 / 1M
Total de tokens de entrada	138,451	69,747
Tokens de saída	40,766	2,166
Tokens de raciocínio	9,075	57,436
Tempo de resposta (médio)	12.49s	8.20s
Tempo de resposta (máx.)	70.54s	76.68s
Tempo de resposta (total)	274.72s	180.47s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

medium

Categoria:

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	10.0	10.0	100.0%	0		3.95s	834	1,179	478
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.09s	492	171	3,385

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	10.0	10.0	100.0%	0		15.33s	10,590	9,945	1,381
Gemini 3.5 Flash	7.9	7.5	77.8%	1		12.63s	8,118	461	24,939

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	9.9	10.0	100.0%	0		54.29s	101,005	19,531	4,762
Gemini 3.5 Flash	10.0	10.0	100.0%	0		44.36s	45,684	516	8,835

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	7.1	5.6	83.3%	1		12.29s	10,503	481	312
Gemini 3.5 Flash	10.0	10.0	100.0%	0		4.07s	7,548	279	3,784

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	5.3	10.0	33.3%	0		14.59s	975	7,477	900
Gemini 3.5 Flash	7.7	10.0	66.7%	0		5.24s	633	12	8,047

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	10.0	10.0	100.0%	0		2.46s	708	237	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.52s	486	115	1,144

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	10.0	10.0	100.0%	0		3.32s	909	373	320
Gemini 3.5 Flash	9.9	10.0	100.0%	0		2.70s	615	71	2,855

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	10.0	10.0	100.0%	0		3.95s	894	791	483
Gemini 3.5 Flash	7.7	10.0	66.7%	0		2.38s	558	295	2,747

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	10.0	10.0	100.0%	0		8.96s	11,775	301	225
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.81s	5,457	234	455

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Claude Opus 4.8	3.0	10.0	0.0%	0		6.14s	258	451	214
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.75s	156	12	1,245

Trocar par de comparação