Navegação
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.5 vs Mimo V2 PRO

Resumo

Comparação benchmark GPT-5.5 vs Mimo V2 PRO: GPT-5.5 lidera na pontuação média com 9.3 vs 6.7. Mimo V2 PRO tem menor custo de benchmark com $0.333 vs $0.907. GPT-5.5 é mais rápido com 9.76s vs 22.16s, com taxas de acerto de 85.7% vs 73.0%.

Modelo recomendado: GPT-5.5 - Tem a melhor pontuação aqui (9.3) e responde cerca de 2.3x mais rápido que Mimo V2 PRO.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-18

Métrica GPT-5.5 GPT-5.5 low Lançamento: 2026-04-24 Mimo V2 PRO Mimo V2 PRO medium Lançamento: 2026-03-18
Pontuação 9.3 6.7
Posição #4 #77
Confiabilidade 10.0 9.6
Consistência 10.0 8.0
Testes corretos
Taxa de acerto por tentativa 85.7% 73.0%
Testes instáveis 0 5
Execuções totais 63 63
Custo por resultado 5.035 2.450
Custo total $0.907 $0.333
Preço de entrada $5.000 / 1M $2.653 / 1M
Preço de saída $30.000 / 1M $2.653 / 1M
Total de tokens de entrada 34,209 40,961
Tokens de saída 2,046 2,518
Tokens de raciocínio 22,460 81,801
Tempo de resposta (médio) 9.76s 22.16s
Tempo de resposta (máx.) 56.19s 136.29s
Tempo de resposta (total) 204.92s 443.22s

Geração showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#4 GPT-5.5

low
Custo
$0.068
Tempo
37.0s
Tokens
2,339 tok

#77 Mimo V2 PRO

medium
This model has been deprecated. It is recommended to migrate to xiaomi/mimo-v2.5-pro
Custo
$0.000
Tempo
0.1s
Tokens
0 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
Mimo V2 PRO 10.0 10.0 100.0% 0 2.86s 621 251 1,154
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
Mimo V2 PRO 6.0 7.4 55.6% 1 94.21s 4,787 527 37,424
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
Mimo V2 PRO 4.7 1.6 66.7% 1 64.71s 17,028 380 14,186
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
Mimo V2 PRO 7.3 5.8 83.3% 1 17.20s 7,746 260 7,484
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Mimo V2 PRO 5.3 10.0 33.3% 0 8.82s 525 170 2,158
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
Mimo V2 PRO 10.0 10.0 100.0% 0 4.92s 492 184 400
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
Mimo V2 PRO 9.9 10.0 100.0% 0 3.36s 672 83 667
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
Mimo V2 PRO 6.4 4.4 77.8% 2 5.08s 660 372 1,622
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
Mimo V2 PRO 10.0 10.0 100.0% 0 8.19s 8,220 263 864
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840
Mimo V2 PRO 3.0 10.0 0.0% 0 82.71s 210 28 15,842

Comparação rápida

Trocar par de comparação