Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.5 vs Mimo V2 Omni

Resumo

Comparação benchmark GPT-5.5 vs Mimo V2 Omni: GPT-5.5 lidera na pontuação média com 9.3 vs 6.8. Mimo V2 Omni tem menor custo de benchmark com $0.683 vs $0.907. GPT-5.5 é mais rápido com 9.76s vs 41.16s, com taxas de acerto de 85.7% vs 55.6%.

Modelo recomendado: GPT-5.5 - Tem a melhor pontuação aqui (9.3) e responde cerca de 4.2x mais rápido que Mimo V2 Omni.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-18

Métrica GPT-5.5 GPT-5.5 low Lançamento: 2026-04-24 Mimo V2 Omni Mimo V2 Omni medium Lançamento: 2026-03-18
Pontuação 9.3 6.8
Posição #4 #73
Confiabilidade 10.0 10.0
Consistência 10.0 8.7
Testes corretos
Taxa de acerto por tentativa 85.7% 55.6%
Testes instáveis 0 3
Execuções totais 63 55
Custo por resultado 5.035 7.334
Custo total $0.907 $0.683
Preço de entrada $5.000 / 1M $1.722 / 1M
Preço de saída $30.000 / 1M $1.722 / 1M
Total de tokens de entrada 34,209 37,007
Tokens de saída 2,046 1,952
Tokens de raciocínio 22,460 357,306
Tempo de resposta (médio) 9.76s 41.16s
Tempo de resposta (máx.) 56.19s 299.23s
Tempo de resposta (total) 204.92s 823.26s

Geração showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#4 GPT-5.5

low
Custo
$0.068
Tempo
37.0s
Tokens
2,339 tok

#73 Mimo V2 Omni

medium
This model has been deprecated. It is recommended to migrate to xiaomi/mimo-v2.5
Custo
$0.000
Tempo
0.1s
Tokens
0 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
Mimo V2 Omni 10.0 10.0 100.0% 0 2.75s 621 269 1,701
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
Mimo V2 Omni 3.3 6.5 11.1% 1 183.89s 4,787 292 174,314
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
Mimo V2 Omni 10.0 10.0 100.0% 0 25.87s 15,060 380 8,673
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
Mimo V2 Omni 10.0 10.0 100.0% 0 3.04s 6,002 155 591
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Mimo V2 Omni 3.0 10.0 0.0% 0 47.89s 735 155 68,398
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
Mimo V2 Omni 5.4 2.5 66.7% 1 3.61s 492 136 492
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
Mimo V2 Omni 8.3 10.0 50.0% 0 4.99s 470 49 515
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
Mimo V2 Omni 5.9 7.2 55.6% 1 2.38s 410 210 860
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
Mimo V2 Omni 10.0 10.0 100.0% 0 13.98s 8,220 303 3,461
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840
Mimo V2 Omni 3.0 10.0 0.0% 0 234.19s 210 3 98,301

Comparação rápida

Trocar par de comparação